一例だが街を散策するゲームでコンビニで「歯ブラシがほしい」っていえば、仕様になくても画像生成駆使して歯ブラシのモデルを作ってプレイヤーに販売するとかできると思う

で、歯ブラシを他のキャラクターの口に押し当てる
ゲームはこの情報を「プレイヤーがアイテム『歯ブラシ』をキャラ『A』の口に押し当てた」として言語モデルへ入力
言語モデルは『プレイヤーが歯磨きを行おうとしている』と判断して、その場でモデルとキャラクターの反応を生成できる
突然歯磨きをされたキャラは、口から涎を垂らしながら『突然押さえて歯を磨こうとするなんて頭おかしいじゃないの!?』と憤るだろう
この応用で滅茶苦茶自由度の高いゲームが作れるはずだ