AWSに詳しいやつちょっと来いや

**以下、5ちゃんねるからVIPがお送りします** · 2022/11/18(金) 02:51:16.861

200万/月のwebページを保存して分析したいんだが何使うべき？

**以下、5ちゃんねるからVIPがお送りします** · 2022/11/18(金) 02:53:50.773

選択肢としてはこんなもんかなぁと

1.lambdaでhtmlを取ってきてS3に保存
2.lambdaでhtml取ってきて加工して必要な部分だけDynamodbに保存
3.ec2とauroraで頑張ってaurora に保存

**以下、5ちゃんねるからVIPがお送りします** · 2022/11/18(金) 02:54:31.023

HTMLというかテキストだけでいいの？

**以下、5ちゃんねるからVIPがお送りします** · 2022/11/18(金) 02:56:44.838

>>3
そうだね
イメージ的にはTwitterのツイートをユーザー、文章、投稿日、いいね数、リツイート数、、、を取ってきて後で分析したいみたいなイメージ

**以下、5ちゃんねるからVIPがお送りします** · 2022/11/18(金) 02:57:57.468

ちなみにhtmlの容量は全て20KBぐらいに揃ってる

**以下、5ちゃんねるからVIPがお送りします** · 2022/11/18(金) 02:58:52.584

最初、全部取ってきてS3突っ込んどけばええやろって思ってlambda書いてS3に打ち込んでたらめっちゃ課金されたから改善したい

**以下、5ちゃんねるからVIPがお送りします** · 2022/11/18(金) 03:00:34.802

よく考えると2000万 × 20KB = 400GBなんだよなぁ
これに加えてS3のput_objectはいっばいやると課金もエグい

**以下、5ちゃんねるからVIPがお送りします** · 2022/11/18(金) 03:03:50.929

直接TwitterのAPI叩けばいいじゃん
できんのか知らんけど