結局AIがやってるのってコラージュなのかどうなの?
■ このスレッドは過去ログ倉庫に格納されています
サンプル画像がないと描けないならやっぱりサンプル画像を抽出加工して貼り付けてるに過ぎないと思うんだよなあ
その辺詳しい奴説明してよ まあ人間の絵も所詮は過去のインプットを元に生成されてるに過ぎないけど >>3
まず端的に端折って言うなら
1ピクセル単位の移動で周り数百ピクセルに影響を与えるマスクのような枠の中で幾万通りもの可変なブラシを使って描いてるようなもの
なので絵をそのまま切り取ったコラージュではない
元データが必要なのはピクセルやピクセル群の接続等の関係性を特徴として記録する必要があるから
分からないところあったら言ってくれ あれって結局ノイズ除去機なんよ
細かいノイズを除去できるAIを最初に作ってどんどん濃いノイズを除去できるようにしていって最終的にただのノイズなのに勝手にAIが解釈してなんか絵を作れるようにする >>9
Diffusionの説明だけだと変な誤解が生まれないだろうか? >>10
変な誤解って?
俺はAIの専門家じゃないからなんなら俺が誤解しているかもしれん 最近latent diffusionの論文読んだけど面白かったね
もっとこれまでに拡散モデル使われても良さそうなもんだけど AIの解説本読んだ
ディープラーニングはすごい!けど
ディープラーニングを超える技術が出てこない限り
行き詰まるっぽいな >>13
ん〜?
AI「目と目の間に鼻があって
その下に口があって〜」
って感じか? >>11
ノイズからの段階的な復元過程を既存技術を使ってAI的に上手くやるというのは正しい
けどDiffusionが出る前のVAEやGAN系統の技術でも精度は低いながらも同様の画像生成は出来た
のでその中身がどうなってるか分からないとコラージュでない説明にならないような?
いやあいつらもノイズから生成はしてたか…ごめん問題ないかも >>13
AIくんの中身は例えば最小で隣接3x3ピクセルくらい程度しか覗かずにその小さな枠の中で画像を見て特徴を覚えたりしてる
ので例えば64x64ピクセルのコラージュ用画像とかをそのままストックしているわけではないんだ >>17
考えているっていうか
顔のデータベースがあって
それを元に顔を作っている 顔の画像を何千枚も取り込んで
「目は二つある」
「目と目の間に鼻がある」
「鼻の下には口がある」
とかそういう法則?を作成して
それを元に画像を作るのがAIなんじゃないの NovelAIはCLIPの系統だからVAE使ってるはずだけど潜在変数にまで落とされた情報がデータベースかと言うとそうであるような違うような… >>20
ピクセルの接続性を顔の特徴として記録しているというのはそうなんだけど
その言い方だと顔の画像そのものを一杯溜め込んでるみたいだでちょっとどうかな
それやってるのはVAEもConv2Dも使ってない初期のモデルだ >>18
難しい
じゃあ細切れにしたデータをつなげて描いてるの? ノイズの中でここアレっぽいよなって認識した箇所を徐々にソレっぽく塗り替えて知ってる形に寄せていってる
NovelAIのはその寄せに行く形を入力した言葉で制限する機能も備えてるから指示できる
って言えば分かりやすいのか >>25
そうといえばそうなんだけど
データの保持の仕方が一般的に考えられる切り取った写真みたいな感じじゃないんだ
ここはちょっと説明し難いな
まずこのピクセルの周りにエッジが立ってる、次にエッジとエッジが隣接してるから線だ、細かい線と線が角度を変えながら繋がってるからアーチだ
とかそういうのを言葉でもコードでもなく画像から得た値の塊として記録したり取り出してる AIくんは最初は「線であること」が何なのかも知らない
だからデタラメなノイズの塊の組み合わせに適当な名前を付けて遊んでる
「この#@$%で$<%@@なところは##!+$だ」
これを意味のある言葉が結びついた画像とともに教え込んでいくことで
「もしかしてこの形の曲線の塊はオッパイと呼ぶべきものなのか……?」
と学習するわけよ ちなみに偶に誤解している人が居るけど
一般的に画像生成サービスとして公開されてる画像生成AIくんは「既に学習済みモデル」を使ってる
なのでユーザが画像生成するたびにそれも覚えちゃうなんて事はない
NovelAIはちゃんと運営の選んだ画像から学習した固定されたモデルで勝手に馬鹿になったりはしないです >>29
まだ起きてるから些細でも気になってる事あったら聞くが >>32
画像に任意の割合でノイズ載せて何%かだけ似た画像作る機能がある
言葉から生成して偶然似たんじゃなくてそっちの機能で意図的に薄く改変してる
言葉のみからの生成はtxt2Img
元画像の改変機能はimg2img
と呼ばれててこれはimg2Img使ってるはず >>32
・たまたま
・指定した画像を起点に新たな絵を生成する機能を利用した
大方このどっちかだと思う >>32
今見ると元の絵もハンコ絵過ぎて個性ないね😙 どっちもAIタグつけてるからどっちもAIかと思ったけど違うのか >>33
img2imgの機能はまあわかるんだけど
ただ仕組みを聞くとものっそい細かく数値化して分解して一から組み立て直してる訳だから
このレベルの丸かぶりが発生するのなんかおかしい
おかしくない? >>38
構図は似てるけど細かい点を見ると結構違うよ だからコラージュじゃなくてパクリってだけだから
構図や構造を学習してるんだろ 構図や構造をパクってる絵をコラージュとは言いません。 >>38
1からというよりはノイズを載せてボカした所を似た形の何かに見立てて何度も描き直してるからそういうことができる
全体的にふやかしてふやけた所を描き直してる
元がノイズから人が描けるんだから当然ノイズ混じってふやかしてボケた画像からも絵が描ける
ボンヤリと元ネタが残ってるから似る >>42
波、雲、乳の形が少し見ただけでも違うのがわかる
コラ等の明らかな不正はしてないだろうと思う >>44
なんだ1からじゃないのか
マジでコラージュじゃん >>46
1から描く機能と改変機能が別々に存在する
1から描くときは完全などどめ色のノイズから作ってる
改変は元ネタを割合で混ぜてるという違い >>44
>>46
あー
img2imgはちょっとあれだな
元画像使っちゃってるのか 今作ったけど
シード固定してサンプリング低くで止めれば何やってるかわかりやすいよ
これがimg2Img
https://i.imgur.com/MTbhm4Z.jpg 制作ちゅうのイラストを先に完成させた問題。
あと、2、3件、具体的なパクリ疑惑で話題になった件があったが
いずれもimg2Imgで元絵から生成されたものと思われる。
「コレを参考に絵を作れ」という指示をしてるわけで
要は人間が故意にパクらせているだけなのよね 割合高めてもモラル的にはいかんな
他人の絵をアップロードすること自体ダメだった気もするけど
まあとにかくワード生成とか自分の絵を元にするなら著作権的には何やっても問題なさそう?てのが分かったありがとう >>52
俺もそのように考えてるからトレース切り貼りしてる!って決めつけて食わず嫌いしてる人勿体ないなと思ってる
まぁ学習元データが完全クリアでないと言う主張も分かるけどそれはAIに限ったことじゃないから置いておくとして
気をつけたいのはうっかり版権キャラに特徴的なワードを入力すると名前入れてなくても意図せずキャラが似てしまう可能性とかはある
例えば「蝶の髪飾り(butterfly hair ohnament)」って入れるとキャラの顔まで胡蝶しのぶに寄る
みたいな可能性が無いとは言い切れない
実際に確認したわけじゃなくて飽くまでも可能性だけど ■ このスレッドは過去ログ倉庫に格納されています