X



スクレイピングやる時って生IP→tor→串にして30秒に1回程度ならなんの問題もないか?
■ このスレッドは過去ログ倉庫に格納されています
0001以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:12:28.261ID:NTF35gC30
リスクとかない?
0002以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:12:57.145ID:H4QChXMN0
ビビりすぎだろ
0003以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:15:13.162ID:NTF35gC30
そこまで問題ない感じか?
0004以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:21:48.777ID:OVVLwpV20
警察が本気で追ったらこういう怪しいスレとかSNSの発言とかが洗われてそこから特定とかは余裕でされるよ
スクレイピングされるサービスが通報するかどうかは知らんけど
0005以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:26:11.398ID:k6t8cb4b0
あからさまに怪しいアクセスなら遮断とかも簡単にできるしね
0006以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:31:06.909ID:fnWwyvomM
1秒に1回が逮捕されるライン?
図書館のやつWikipediaで見た
0007以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:43:18.917ID:NTF35gC30
どうやって洗うんだ?
0008以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:44:52.308ID:NTF35gC30
図書館のやつ怖いよな( ´・ω・`)
0009以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:46:52.635ID:cbGEpkqr0
タイムリーだな。
俺もスクレイピングしてる。
javascriptでやてるけどawaitとかasyncの関係ないとこでもたついてる。
全部逐次処理にすりゃええやんって思うわ
0010以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:49:38.528ID:NTF35gC30
ライブラリ何使ってんの?
puppeteerとかcheerioとか?
0011以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:50:48.516ID:H4QChXMN0
お前一人の力でサーバーダウンさせられるとでも思い込んでるのか
0012以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:51:35.980ID:cbGEpkqr0
puppeteerや。
playrightとかphpかpythonでやってたけど
なんかぱぺてーあやってる。
0013以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 22:59:22.495ID:NTF35gC30
ダウンはなくてもアクセスしにくくなったら問題になるとかないのかな
あと著作権とか心配や
0014以下、5ちゃんねるからVIPがお送りします
垢版 |
2024/04/12(金) 23:00:35.248ID:cbGEpkqr0
googleで検索してページ移って〜内容を〜っていうのは使えるかも。
ただpandasを封印されるからそこは痛い。
あとちょっと重い。ヘッドレスにした方がええかもな…
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況