プログラミングでウェブスクレイピング詳しいやついる?
■ このスレッドは過去ログ倉庫に格納されています
ブラウザのF12で見れるHTMLにはあるタグがスクレイピングしたHTMLで見つからないんだが? JavaScriptで動的に作られるページなんでしょ UserAgentで表示するサイト切り替えてるんだよ ソースのHTMLとデベロッパーツールのElementsには違いが出る場合がある
最初に読み込まれた文書の構成がjsで書き換わるような場合は
単純なスクレイピングではjsが実行されず参照したい要素が存在しないことがある 動的生成されるやつだよ
クライアントサイドレンダリングだとjs実行しなきゃレンダリングされない つまりjsの機能を呼び出さないといけないってことか… クライアントサイドレンダリングの場合JSONやらなんやらでデータのやり取りしてたりするしネットワークタブでJSONやり取りしてるところ見つけてそこからリソース引っ張ったほうがはやい ■ このスレッドは過去ログ倉庫に格納されています