和歌山のプログラミング・システム開発ならシステムキューブ
Amazonが12月1日の新サービス発表イベントの一つにAmazon Athenaを発表しました。
Amazon AthenaはAmazon独自のデータベースサービスです。クラウドストレージS3上にあるテキストで構成されたデータに、直接クエリを発行し結果を得られます。
CSVやjson形式など一般に用いられるプレーンなテキストファイルをデータとして読み込み、標準的なSQLを発行することによって結果を得ることができます。
S3をデータ保管場所とし、AmazonのクラウドをRDBとしてそのデータセンターのもつ処理速度や安価なストレージを活用できるものです。
利用料としてはデータの処理量となっています。公式では1TBのスキャンにつき5ドルということです。結果が1TBではなくクエリによる1TBのテーブル走査あたりでということのようです。
規模の大きいテーブル同士を結合した場合など、スキャンの単位が大きくなります。扱うデータ量と回数によってはそれなりの金額になることが予想されます。
このサービス内容で大量のテキストデータをS3に移行すれば、別途データベースエンジンを用いず、すぐにデータの解析などが可能になります。
もちろんJDBCなどを介しアプリケーションや他のRDBとの連携も可能です。
テキストデータからすぐにデータベースの取り扱いができると、サーバログやその他ログデータなどから素早くデータを取り出すことができます。
ギガバイト以上規模を持つデータの解析などでも、オンプレミスに高度な設備を持つことなくクラウドでの処理が可能になり、設備などのコストを削減することもできるかもしれません。
同様のサービスとして先発のGoogle BigQueryなどがあります。クラウドコンピューティングの大容量、高速処理などを様々な形で提供するサービスが競争と共に生まれていきます。