【メモ】年末年始にKrita aiを試した＆じげんの考察

Krita ai diffusion を試してみてました。

https://github.com/Acly/krita-ai-diffusion

sd1.5ならリアルタイム生成にも十分耐えられる。範囲生成もできてうまあじ。

コンペ用の画作りなら十分できそうかも。

キャラデザについては……未だ困難。

AIにキャラデザさせるのではなく、画力がない人でも最低限デザインが人に伝わるキャラクターラフをAIパワーで作れる、そんなAIキャラデザを夢見てるんだけどうーん……。

パーツを変わった形にすると全然対応できない。勝手にいい感じにしすぎてしまうのも問題。

いい感じにされてしまうと(こっちでよくね？)になってひっぱられかねないからなぁ……

それを許容すると、自分の愛着という面でもよくない。

脱線！ AIいい感じにしすぎ問題について。

たとえば、SunoAIで遊んでた時、歌詞を入れて生成された良曲より、頭の中にある歌の鼻歌からできた曲のほうが愛着が湧くことに気づいたんですよね。

自動生成という点では誤差だと思うんだけど、頭の中に元からあるものかないものかで捉え方が自然と変わる。

前者は知らん他人の曲、後者は他人がカバーした曲、みたいに思えるんですよね。(さすがに自作とは感じないけど)

キャラデザだってたぶん、AIがいい感じにしたやつを許容しても、愛着不足でだんだん微妙に思えてくるんですよね。

だから事前にラフして固めておく作業も結局必要そう。

でもやっぱり変なパーツは補正してくれない問題があるからなあ……そこが画力なくて一番困るところだから一番手助けしてほしいところなのに。

とりあえずさっくり作ったシルエット画像で諸々足していけないかは試したい。

男女共用になるようにしたけどちょっとラインが女性的すぎた？あまり加筆すると再生成の精度に関わるから難しい…

ちなみにkritaではランダムノイズ使えなかった。キャンパス画像取り込み時に再スケーリング？とかが入っているっぽい。ノイズブラシ……創ろうと思ってたのに……つら味

画像生成AIのおかげで、人間には知覚できないだけで4次元以上は折り畳まれているというよくわからんワードを理解しつあります。

画像生成AIで起きていることは、たとえばモデルA・モデルBが生成したイラストが２次元上はそっくりでも、多次元になればまったく別物。

ぶっちゃけ、4D Golf(ゲーム)を見たらわかりやすい。

折り畳まれている次元が見えてない、4D Golfでいうところの通常の３次元が私たちの視界。

画像生成イラストも、次元が折り畳まれていて、2次元だけが見えている。

だから、視覚上の同一性はあまり当てにならない。

だからなんだって話なんですけど、生成イラストの複雑さと棚ぼたで次元の話を理解しつつあるという……

画像生成イラストを学んで画力ではなく物理学力・哲学力が上がってしまった。