ビットコインを深層強化学習でやる方法wwww
■ このスレッドは過去ログ倉庫に格納されています
とりあえずagent57という手法に注目してるのだけど 俺ノートPCしか持ってなくてGPUも内蔵のものしかないからコスパ良く学習できる手法を取りたい ビットコの取引データは過去5年分くらいなら取引所から取得できる
こいつを加工して環境の状態としよう
つまり前処理ってやつだな >>7
価格が完全にランダムに動くなら学習できない
でももし何らかの複雑な関係性があるなら学習可能 アビトラBOTの方が簡単で確実だよ
元本ないと利益もゴミだけど >>12
アビトラは試したけど儲かるどころか損した
ping早くないとちょっとの遅れで損する >>14
とりあえず機械学習の本読んでpytorchを書いてみてるレベル
プログラミングは昔からやってる 俺がちょっと調べたところによると、状態は時間ごとに区切るよりも価格の変動で区切る方が良いらしい
つまり1分ごとに価格を入力するよりかは価格が決まった幅以上動いたら入力するという感じ どういう環境にしたらいいかな
(価格、前回のイベントからの時間、前回からの出来高)
こんな感じか? せっかくニューラルネットワーク使うのにパラメータ3つってしょぼ過ぎるよな
もっと増やすか とりあえずhohetoさんとUKIさんろAlpacaジャパンのtomoさんをフォローしとけよ 市場の「勢い」とか「雰囲気」的なものを感じ取れるといいな
入力のパラメータとして直近1秒、1分、3分、5分…の平均出来高や平均価格上昇を入れるのはどうだろう >>23
深層強化学習最強の現代でそれ以外の方法をお知りのようなら教えて頂きたいよ >>32
あー、こういうのは有用かもしれんね
けどこれ含めAIに自力で学習してもらおう アルパカの人は機械学習とか投資ロジックのいろはを無料で公開したり
無料のディスコードで勉強会やったりしてるからそっちのほうが回答あるかなと思ってね とりま環境決めよう
(1)現在の価格[$]
浮動小数点数1つで表す
(2)直近の価格の変動率
沢山の浮動小数点数で表す
以下の期間の平均を入れる
1s,5s,10s,30s,1m,3m,5m,10m,20m,40m,1h,1.5h,3h,
5h,12h,1d,2d,4d,1w,2w,3w,1month,2month
(3)直近の出来高の平均
沢山の浮動小数点数で表す
上の期間だけ入れる RNNを使えばこんなに変動率は要らないかもな
つーか価格を入力するより前回のイベントからの変動幅を入れるべきだな…
あと自分のポジも入れるべきだろうか イベントをトリガーする幅は何ドルがいいかな
20ドルくらいか? ポジもとりあえず突っ込むか
で、不要なパラメータは埋め込み関数で無視してもらおう 報酬は利確時の利益でいいと思うなぁ個人的には
報酬は疎になるけど、agent57を採用すれば内発的報酬も加わるので学習が進まない事は回避出来そう エージェントの行動
(1)ホールド
何もしない
(2)資産のn%でロング
n=10,20,…,90,100
(3)資産のn%でショート
n=10,20,…,90,100
レバは掛けないっつー事でいいかね
どうしよ レバ掛けてもいいけど強制ロスカありにするか?
強制ロスカ食らったら報酬を負のデカい値にすりゃ何とかなるかな…むずい いややっぱレバは2倍までとかにするか
上限決めないとロング連発して賭けに出るとかやりそうだし つーか行動が多いと学習が進まなくなる可能性ありそう
行動はもっと減らそう
n=10,30,50
これでいい 環境の状態を再考
(1)前回のイベントからの変動幅[$]
浮動小数点数1つで表す
(2)直近の価格の変動率
沢山の浮動小数点数で表す
以下の期間の平均を入れる
1s,5s,10s,30s,1m,3m,5m,10m,20m,40m,1h,1.5h,3h,
5h,12h,1d,2d,4d,1w,2w,3w,1month,2month
(3)直近の出来高の平均
沢山の浮動小数点数で表す
上の期間だけ入れる
(4)現在の価格[$]
(5)自分のポジション
購入価格[$]と数量[%]、含み益[$]の組で表す
複数ポジションある場合は統合して入力 行動に関して思ったのは、NNの出力を各行動に対してone-hotにするより
その時々で最適なポジションの数量を1つの浮動小数点数で出してくれた方が良くねぇかって事だな
離散化はNNとは別にやればいいかも 普通にニュースとかイーロンのツイートとかの要素の方が遥かにでかいんだから学習しようないだろ 放置しとくならレバは掛けるな
仕事中や睡眠中の知らん間にどっかの国でビットコイン取引停止とか逆に通貨認定されたりしたらそのまま死亡までありえるだろ >>51
そういう影響でかい人も1人じゃないから平均化されるんだろ >>53
影響でかい人が100人もいないのが問題なんだろう >>52
うーん確かに…
まぁしかし放置とは言っても毎日確認すると思うし2倍までなら許容できる気もする
原資10万で始める予定なんで無くなっても別に…というね >>55
平時の内に変な過学習してかつ意外と儲けてたりしたタイミングから延々と値崩れし続けた時に値が下がってるからレバ掛けて買う→更に下がったから損切りする、更に下がってるからレバ掛けて買う→更に下がったから損切する、みたいな事を超速で繰り返すみたいな事されたらそれはもう2倍とか強制とかで止められない死への直行便が出来上がったりしかねないだろ >>51
ファンダは学習しようがないけど、なんかファンダ出たときに市場が変な動きするわけだからその予兆を読んでもらいたい >>56
過学習はテストでチェックするので大丈夫だと思う
まぁレバかけないモデルとかけるモデルどっちも作って比較が丸いかな あー
予想だけで学習させて行けそうと思ったら実際の売買で走らせる感じなのか 予想ってのがよく分からんけど、例えば2019年のデータだけ抜かして学習させて、最後に2019年のデータで取引のシミュレーションをして
そこで儲かれば実際の取引でも行けるだろうということ バックテストして少ロットで動かすトライ・アンド・エラーしかないよねきっと ■ このスレッドは過去ログ倉庫に格納されています