スクレイピングやる時って生IP→tor→串にして30秒に1回程度ならなんの問題もないか?

■ このスレッドは過去ログ倉庫に格納されています
0001以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:12:28.261ID:NTF35gC30
リスクとかない?

0002以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:12:57.145ID:H4QChXMN0
ビビりすぎだろ

0003以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:15:13.162ID:NTF35gC30
そこまで問題ない感じか?

0004以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:21:48.777ID:OVVLwpV20
警察が本気で追ったらこういう怪しいスレとかSNSの発言とかが洗われてそこから特定とかは余裕でされるよ
スクレイピングされるサービスが通報するかどうかは知らんけど

0005以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:26:11.398ID:k6t8cb4b0
あからさまに怪しいアクセスなら遮断とかも簡単にできるしね

0006以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:31:06.909ID:fnWwyvomM
1秒に1回が逮捕されるライン?
図書館のやつWikipediaで見た

0007以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:43:18.917ID:NTF35gC30
どうやって洗うんだ?

0008以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:44:52.308ID:NTF35gC30
図書館のやつ怖いよな( ´・ω・`)

0009以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:46:52.635ID:cbGEpkqr0
タイムリーだな。
俺もスクレイピングしてる。
javascriptでやてるけどawaitとかasyncの関係ないとこでもたついてる。
全部逐次処理にすりゃええやんって思うわ

0010以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:49:38.528ID:NTF35gC30
ライブラリ何使ってんの?
puppeteerとかcheerioとか?

0011以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:50:48.516ID:H4QChXMN0
お前一人の力でサーバーダウンさせられるとでも思い込んでるのか

0012以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:51:35.980ID:cbGEpkqr0
puppeteerや。
playrightとかphpかpythonでやってたけど
なんかぱぺてーあやってる。

0013以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 22:59:22.495ID:NTF35gC30
ダウンはなくてもアクセスしにくくなったら問題になるとかないのかな
あと著作権とか心配や

0014以下、5ちゃんねるからVIPがお送りします2024/04/12(金) 23:00:35.248ID:cbGEpkqr0
googleで検索してページ移って〜内容を〜っていうのは使えるかも。
ただpandasを封印されるからそこは痛い。
あとちょっと重い。ヘッドレスにした方がええかもな…

■ このスレッドは過去ログ倉庫に格納されています