データ基盤選定

データ基盤選定

弊社も今後、データを活用していくのですが、その上で重要な基盤の選定があります。
もともと、AWSのEMRで進める予定でしたが運用費及び管理するためのスキル伝播を考えるとコストが高いという判断になりました。
右往左往しながら決めていったので記事にしたいと思います。

概要

本題は費用を抑える。
ただし、この費用はシステム費用だけでなく、人件費等も考慮する。
また、データ活用時期(本稼働)を早くすること。

検討

当初、AWSで再構築を考えたがTreasureDataを教えていただき、
AWSとTreasureDataの2案で検討することとなった

案1 AWS

image04

メリット
今後のデータ増加にも耐えられそうであり、実質システム費用が削減される

デメリット
新たに技術調査するポイントが多数出てくること、関連してデータを活用する開始時期が後ろにたおれてしまう

案2 TreasureData

image01

メリット
導入が容易でAWSに比べると技術調査が少なくてすむ。そのため、データ活用時期を早くすることが可能。

デメリット
システム費用自体が高い。

結果

案2のTreasureDataを採用しました。

技術調査が少なくて済むためデータ活用を早く行えると判断しました。関連して人の冗長化を進めていくにあたり、案1に比べれば敷居が低いため、
時間(実質、人件費)を抑えることが可能と考えてます。

まとめ

システム費用だけでなく、見えない費用をある程度考慮したうえで検討することがポイントでした。
ただ、この選択が正しいかどうかはこれからわかってくるということになりますが。。。

コメント