世間には、画像AI生成を憎む人がいます。
それは仕方ないと思うのですが、中には誤解に基づく非難もあります。
そのひとつが、
「AIは、学習していない画像は出力できない」
というものです。
先日、以下のようなコメントを目にしました。
(これ以前にも同じ趣旨のコメントを見ました)
AIで生成の子どもの性的虐待画像サイト運営か 19か国25人逮捕 | NHK現時点では画像の学習なしに無からAIで画像を作ることは不可能。AIで性的虐待画像を作ったということは、元ネタになるリアルの画像を学習させたものだろう。なら逮捕されて然るべき
2025/03/01 11:59
このコメントにたくさんの☆がついているところを見ると、大勢の人が同様の理解をしているのだと思います。
私も、仕事柄、児童虐待は絶対に許せないと思っていますし、実在児童ポルノの製造・流通・販売に関わった連中は厳罰に処されるべきだと思います。
しかし、
「児童ポルノを生成できるAIは児童ポルノを学習したのだろう」
というのは誤りです。
上のコメントに、私は以下のように書きました。
『AIで生成の子どもの性的虐待画像サイト運営か 19か国25人逮捕 | NHK』へのコメントリアル性犯罪には厳罰で臨むべきですが、生成AIは「幼児期のフリーレン」「ねんどろいどドナルドトランプ」等の画像も生成できます。従って「元になった実在児童ポルノがあるはず」という推測は妥当性を欠きます。
2025/03/01 19:53
画像生成AIは、過去に存在したことのないカテゴリの絵も生成することができるのです。
言うだけでは信憑性に乏しいので、実際にやってみましょう。
(以下の画像は、Stable Diffusionを使用して生成しています。SD1.5)
幼少期のフリーレン。



フリーレン様にも幸せな子ども時代があったのでしょうか。
これまでのところ、同作のフリーレンは、1000年前、フランメの弟子だった頃のシーンでも今とあんまり変わらない頭身で、こういう「幼少期のフリーレン」は存在しません。
しかし、AIはその絵を描くことができます。
ねんどろトランプ。


もちろんこのような商品は発売されていませんが、AIはそれっぽいものを出力することができます。
つまるところ、「ねんどろいど」という概念と「ドナルドトランプ」という概念を学習すれば、その双方を組み合わせた画像を出力できてしまうのですね。
だから、
「AIは学習していないものは描けない」
というのは必ずしも正しくないなのです。
「知らない概念当てクイズ」
もう少し別な観点から。
クイズをします。
まず、サンプル画像として、Stable Diffusion(モデルはbluepencil)に4種類の無作為文字列をプロンプトとして渡し、それぞれ4枚ずつ絵を描いてもらいます。
文字列は、パスワード生成ツールを使って作りました。
人間には、それぞれの無作為文字列画像の違いが見分けられるでしょうか。
1つめ。これは「fXSCL8VV」の絵です。
なるほど、fXSCがL8でVVしている感じですね。
続いて「UsgUedZw」の絵。
これは……ちょっと難しい概念ですが、UsgとUedがZwだということなのでしょうか。
そして「e8uz1PTC」。
これはe8のuz1が…ってもういいですか。
最後に「6gmh85yl」。
それでは問題です。
下の4枚の絵は、上と同じお題で追加で1枚ずつAI生成したものです。
それぞれ、どれがfXSCL8VV、UsgUedZw、e8uz1PTC、6gmh85ylだかおわかりでしょうか。
正解はこちら。
……簡単だったかも知れません。
無作為文字列でありながら、それぞれ特有の個性、共通した雰囲気を持った絵になるのがおわかりと思います。
同じプロンプトから似たような絵が出てくるのは当然と言えば当然なのかも知れませんが、それでは、最初の「fXSCL8VV」、あれは何の絵なのか? というと、的確に言い表す言葉がなく、「fXSCL8VVの絵」としか形容できないように思えます。
2枚目のUsgUedZwには、かなり具体的な物体も描かれています。
人間の作った画像を学習したAIから、ある程度見知った物体が出てくるのは当然のことではあります。
しかし、ではあの4+1枚の絵に共通する要素は何なのか……と考えると、それは「UsgUedZwである」としか言えないでしょう。
なんか知らんが妙にかわいい。
人間がAIに
「こういう絵をfXSCL8VVというんだよ」
「これはUsgUedZwだよ」
と教えたわけではもちろんないけれど、AIの中ではそれが一定の(人間にも識別可能な)カテゴリとして存在しているわけです。*1
言い換えると、人間がまだ名付けていない概念(ベクトル、と言うべきなんですか?)が、AIの中には生まれている、と言えるかも知れません。
そう考えると、「幼少期のフリーレン」や「ねんどろトランプ」以上に奇妙な、まだ誰も思いついていない絵のカテゴリを指し示すプロンプトも、AIの中に無数に存在していることになります。
画像生成AIは、確かに、過去に人間が作った画像を学習しています。
しかし、にもかかわらず、AIは、人間が学習させたことのない画像、人間が名付けていないカテゴリの画像を生成することが可能なのです。
わかるものもわからない。
余談ながら。
普通に見慣れたものが出てくる無作為文字列もあります。
bluepencilは女の子の絵が得意なモデルなので、女の子が出てくることが多いですが、全然そうではないこともあり、これが本当によくわからない。
黄色いレーシングカーが出てくる「rCZ2psiu」とか、デフォルメ調の鳥が出てくる「cOQvJFsc」とか、髪が紫のネコミミ娘(SF風)が出てくる「HCHvAU2n」とか、なんでそれがその文字列に紐付いてるのか全然わからない。
思えば、Googleのディープラーニングが「猫の概念」を自力で発見した、と言われたのが2012年のことです。
一方で、その「Googleの猫」は、我々が知っている「猫」と同じものなのか? という疑問を呈する人もいました。
もし、「Googleの猫」が、私たちの知る「猫」とは似て非なる、AI独自の概念だとするならば、「cOQvJFscの鳥」もまた、私たちの知る鳥とは似て非なる存在なのかも知れません。
cOQvJFscの例。試すたびに色々な種類の鳥が出てくるが、飛んでいることはない。
*1:なお、この記事中の画像は全てStable Diffusion Web UI(AUTOMATIC1111版)で作成しています。checkpointはbluepencilです。異なるcheckpointでも似通った方向性になるようですが、逆に、同じcheckpointでも、ComfyUIでは若干ニュアンスが異なる結果になるようです。SDXLモデルは全く異なります。