自分のパソコンで動かすChatGPTみたいなやつ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:35:30.869

すごい
ChatGPTで断られるエッチなリクエストも受け入れてくれる

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:35:51.482

nvidia？

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:36:17.907

>>2
いや、Macだよ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:36:58.523

みせて

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:37:27.268

わかった、画像用意するからちょっとまってて

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:38:59.246

さっきやってたなりきりエロチャ
https://i.imgur.com/YrDkPWv.png

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:39:40.488

🐮がスレ立てる時代か

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:40:11.357

>>7
そうだよ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:40:48.227

家畜は黙って食われとけよ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:41:30.387

>>9
まあそう言うなよ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:42:30.161

エロチャに限らず割となんでもプロンプト通るから面白い

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:46:33.411

文章系もローカル環境でやれる奴あるのか
AIのべりすと使ってたわ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:48:24.689

>>12
AIのべりすとは日本語LLM業界そのものを盛り上げてくれたけど、ローカルで動く最新のAIはあれとは一線を画す性能あると思う
無料のChatGPTより優秀なのも今だと結構あるし

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:49:16.027

最近出てきたモデルのうち
CohereのCommand R plus
Llama 3 70B
は有料版のChatGPTと同等レベルの性能がある

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:51:21.880

サンクス調べてみるわ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:53:44.143

もしそいつら動かすVRAMが足りなければ、LightChatAssistantとか軽量なモデルも何個も出てるから、色々遊んでみて欲しい

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:54:37.222

大規模LLMってローカルで動かせるん？
あんまり詳しくないけど膨大なVRAMないと厳しいイメージ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 20:55:54.359

俺が今使ってるやつは確かにデカくてVRAM 56GBくらい必要
でも、8GB程度でもかなり高性能なのが今年になってバンバン出てきたんよ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:00:52.920

数十Bレベルだとまず普通のPCでは動かんよな
パラメータ数に対する精度は学習データの質に左右されるとかなんとか

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:00:58.732

>>18
openAIとかMicrosoftが出してる奴はそうだよね
ちょっと前に日本語特化のLLMが超省メモリで家庭用でも動かせるどうのこうのって見た

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:05:09.381

>>19
でかいモデルほど学習データセットはでかくなるな
データの質に関しては、Fineweb含め高品質なデータセットがパブリックになってるから、ある程度敷居は下がってるんじゃないかな

>>20
Microsoftは最近軽量モデルで盛り上がってたね、phy-3ってやつ
なんかスマートフォンとかで動かしてる人もいた気がする

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:05:54.845

>>18
グラボ何使ってんんだ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:07:40.669

>>6
下から五番目よく見たらどういう体勢なんだよｗｗｗｗｗ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:09:04.821

>>22
Mac Studioの64GBモデルで、グラボは載せてないよ
Apple siliconはunified memoryっていうアーキテクチャで、RAMとVRAMが共有になってるから割と安くでかいモデルのGPU推論ができる
もちろんNVidiaより計算能力は低いけど、普通にチャットするレベルならあんまり気にならない速度で結果出るよ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:09:58.673

Llama 3 70B調べたら
VRAM8G、メモリ64G必要みたいだからうちのPCだとギリギリだな
インスコ自体はツールでかんたんそうだけど

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:10:22.513

>>23
そこは俺もん？って思った
まあ時々こういうのはある

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:13:01.711

>>24
ほえー
俺RTX3060 VRAM12GB でメインメモリ64GBなんだがWindowsではメインメモリをVRAM化できないのかな悲しい

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:13:06.283

>>25
試してダメっぽかったら小さいバージョン(Llama 3 8B)ってのもある
あと、CohereのCommand R(plusがつかない無印)ってやつはその間くらいの大きさで、かなり優秀

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:14:36.796

>>27
今はVRAMとメインメモリにモデルを分散する仕組みが開発されたから、計算は遅いける動かせるよ(途中までGPUで計算して、残りをCPUに計算させる)

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:24:17.426

>>28
サンクス
取りあえずLM Studio使ってLlama3系試してみるわ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:26:31.285

>>30
それがいいと思う

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 21:57:20.086

一応、ChatGPTでコード書かせる人は多いと思うけど、ローカルでもこういうことができる
https://i.imgur.com/gCGdFqy.png

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 22:29:37.153

Llama 3って日本語に弱いとかない？

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 22:52:24.679

まだ人いたのか
>>33
Llama 3は公式では英語のみってことになってるけど、日本語も結構流暢だよ

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 22:55:01.323

学習セットの95%が英語コーパスという話だけど、そもそもの母数が15兆トークンとか言う意味わからん数値になってるから、日本語コーパスもそれなりに入ってたんだと思う

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 23:17:42.736

日本語の会話だとこんな感じ
https://i.imgur.com/M4v9pcY.png

**平岡一族** ◆lQvwmSuS2w · 2024/05/03(金) 23:36:02.816

名探偵コナンでコンピュータに自分のお母さんの名前つけてずっと話しかけてる香具師いたけどそんな感じ?

**以下、5ちゃんねるからVIPがお送りします** · 2024/05/03(金) 23:39:24.603

それは知らんけど、今の技術ならそれくらいはできるんじゃないか？