top of page
ビッグデータソリューション
大規模データを利活用するためのソリューション
並列分散処理フレームワーク基盤上にシステムを構築することで、大規模データの格納や高速な処理を可能とします。 スケーラビリティを活かして、運用が開始した後に処理データ量や処理時間に応じて、簡単に大容量化・高速化の拡張ができます。 そのため、スモールスタートによるハード面でのリスクを軽減します。
課題を解決
-
同業他社が大規模データを利用して高価値サービスを提供し始めた
-
取引増加に伴って取引データが増加してきた。日次処理が24時間で収まらなくなりそう
-
履歴データなどからマーケティング分析をしたいが、データ大きくて集計できない
上記のようなデータ活用の課題に対して、 オープンソースソフトウェアHadoopによる 並列分散処理フレームワーク基盤を利用したシステムのご利用を解決策としてご提案します。
Hadoopの特長
・大規模なデータを複数サーバで並列処理するためのフレームワークで、商用利用もできる無償のオープンソースソフトウェアとして配布されています。
・高いスケーラビリティがHadoopの強みです。
各データノードに、データを分割して格納し、分割データを並列処理を行います。手に入りやすい一般的なサーバをデータノードとして追加するだけで、容量や処理性能を向上することができます。
・分割したデータを並列処理するので、どのような形式の構造化/非構造化データに対しても、複雑な処理を高速に実行することができます。
・Hadoopの得意分野は、テラバイトのデータを扱う一括した処理となります。また、比較的小さなサイズのデータであれば、データベースで処理可能となるため、Hadoopを導入するメリットは少なくなります。
bottom of page