カテゴリー
1年ほど画像生成AIを体験してきてわかったことや失敗したことを記載します。
エロ画像に限らずではありますが、できるかぎり自分が思った通りの画像を手にしたいですよね。
解像度は適切なものがあります。
SDというものがあって、SD1.5だと解像度が低いため、大きいのを作ると壊れる。
エラーの生成と向き合いすぎていると時間の無駄なので、できれば高解像度に対応したものを使いたい。
SD1.5→SDXL1.0→Pony→Illustrious
と、主に使うモデルを変えていった。今のパソコンのままならこれが限界かも?新しくて高負荷処理に耐えられるものが欲しい。
SD1.5は古いキャラとかがいる。利用者の多いモデルは、LoRAが多い。
よく使われているトレンドに切り替えるのが吉かなと思う。
最初は少なかったIllustriousは半年くらいで新しいLoRaがたくさん揃うようになった。
また、導入が難しいものは流行らないので使えない。流行っていて、少し難しいのがいいみたい。
以下導入の流れとか
1年体験してみて色々わかった。
一つ画像作るのに、数分かかる。とか、モデルがよく分からないだとか。
いろおろやっているうちに何がどういうことだということがわかった。
ある程度作れるようになるのに、1週間くらいかかった。環境設定してた土日は昼がつぶれた。
ただし、よく見るアニメとかのイラストはしくみがよくわからなかったので、作れず。
最初は怖い写真が出てきてびっくり。girlだけだったのに。
プロンプトなど覚えて色々できるようになった。
まずは環境
とにかく生成する。
が、そもそも、それよか前にどういったものなの?といったところ。
そこからじゃないと実現しません。
ソフトを入れる、設定するのはぼんやりとわかりますよね。その前にまずパソコンから。グラボ積んでますか?適切なもの、ゲーミング用でもいいので、画像処理に特化したパーツが搭載されてないとだめ。
高いけど、ないなら買う。
事務用のパソコンは使えません。※グラボ積んでる事務用とか、未来のパソコンとかは無しね。
なので、ある程度処理できそうなものを搭載しているものを買う。
どれくらいの解像度で、組み合わせがどれくらいか紹介している文献などがあるのでまず調べてね。
あとは予算とにらめっこして、ほどほどの性能のもので、ほどほどの画像が手に入れられるハードを準備。
あ、あと大事なことだけれども、ストレージは読み書き処理速度が速いものを選ぶ。そして、モデルというデータを追加するから、容量は大きい方が良い。
OSとソフトでカツカツにならないように余裕持っているのかいいと思う。2025年現在でできれば1TBのM.2.とかかいいなあと思う。容量はほんとなら2TB欲しい。
生成した画像データは、ハードディスクとかに移せばいい。けど、モデルのデータなども重いから、メインストレージに余裕があるといい。
ちなみに、ハードディスク上での処理だと遅くてありえない。だから、M.2.という話をしてる。やってみればわかる。
グラボ積んでても、ストレージが遅いと意味なくなるのよね。
ソフト入れる
Stability Matrixとか、Stable Diffusionとかで出てきます。
本読んだほうが間違いなく早くできるので、数千円なので買ってやったほうが早い。
そんなこんなで、何時間かやってれば生成環境が整う。
- インストール
- LoRa入れる
- 生成する
の流れ。Stability Matrixはソフト一式なのでカンタン。
モデルというのがある
なにそれ?早く作りたい、せいせいしたいんやけどという焦る気持ちがあるけど、ちゃんと環境作らないとできないのよね。
モデルというのは、Check pointsというデータ。基礎データで、これを切り替えて画風のベースを都度都度変える。
いくつも持っておけるけど、基本的には混ぜて使わない。
これをベースに、着せ替えするだとか、画風を変化させるとか、あるいはポーズを決めさせるものを追加する。それをLoRa:ローラっていう。
こっちは複数指定できるし、混ぜられる。一つも使わなくてもいい。
LoRa
ローラはキャラクターや画風、ポーズとか、背景などのそれに特化したデータ。Check Pointsの補助、補正的に使う。
強度も変えられるので、ベースに近いものや、全く違うものを使える。
ただし、相性や互換性とかがある。
互換性
いちばん分かり易い話として、写真・フォト系とイラストやアニメってあります。けれども、すべて描けるわけではないのです。得意不得意があるのです。
そのため、アニメ系ならばそれが得意なモデルを入れておいて、LoRAでさらに補正する。
SD1.5というのがあったけどどうやら古そうだった。何かというと解像度が低い。
なので、大きいのを作ろうとすると、顔が2つになったり、体がおかしくなった。エラーとか破綻ってやつ。
モデルに種類があることに気づいた
3ヶ月くらいしてなんとなく、モデルに種類があったり、互換性や解像度の高いのがあるのがわかった。
SD1.5だと512pxくらい。なのでそれよりでかいと破綻する。気づいても何がいいのかなかなか分からない。pixivに上げるにはきつい。アイコン作れるか作れないかくらい。
さらに高解像度のモデル。
SDXL系。1024px。お絵かきイラストとしてはいいサイズ。LoRAも多い。美しい。
Illustrious。1536pxまで引き上げ。もう、美しいですね。アニメのキャラとかなら配信サイズのキャプチャくらいなので見分けがつかない。
容量でかい
Check Pointsは容量がでかい。いくつも入れたいけれども、数ギガとか数十ギガとかある。10種類くらいストックするとストレージの容量に余裕がなくなります。
さらにLoRaはもっとたくさんいれるので、それも余裕もっておくこと。LoRaはCheck Pointsと比べれば容量は少ない。
自動繰り返し生成
最初は、破綻やプロンプトと戦ってた。そして、生成ごとにボタン押して生成していた。
実は、右クリックすると繰り返し自動生成できる機能がある。