awssummit2018 memo
読みたいニュースとは
野次馬のダイナミクスを数学的に表現
記事ベクトル周りの密度の高いものを推薦
clickログ
ユーザーベクトル生成
記事ベクトル
記事の推薦アルゴリズムで使う行列データ
関数で済むならそれがいちばんいい
... が 関数のマネージメントのデファクトがまだない
と思う人がコンテナを使う
なぜ関数ではなくコンテナ? → ツールが揃ってなくて運用が大変
ECS
Kubernets
→ ECSより難しい
→ KBSとECS両方知っておくと安心
担当: 5人 1TB/day ログ
m4.2xlarge x20 EMR Redshift → 48TB
EMRの起動が遅い(起動に30分以上かかる)
Hiveが遅い
バッチ処理
エンジニア以外の人へのデータ開放
→ どちらもECSで運用
集計クエリが複雑
データの信頼性