top of page
長方形

ビッグデータソリューション

大規模データを利活用するためのソリューション

並列分散処理フレームワーク基盤上にシステムを構築することで、大規模データの格納や高速な処理を可能とします。 スケーラビリティを活かして、運用が開始した後に処理データ量や処理時間に応じて、簡単に大容量化・高速化の拡張ができます。 そのため、スモールスタートによるハード面でのリスクを軽減します。

課題を解決

  • 同業他社が大規模データを利用して高価値サービスを提供し始めた

  • 取引増加に伴って取引データが増加してきた。日次処理が24時間で収まらなくなりそう

  • 履歴データなどからマーケティング分析をしたいが、データ大きくて集計できない

上記のようなデータ活用の課題に対して、 オープンソースソフトウェアHadoopによる 並列分散処理フレームワーク基盤を利用したシステムのご利用を解決策としてご提案します。

Hadoopの特長

・大規模なデータを複数サーバで並列処理するためのフレームワークで、商用利用もできる無償のオープンソースソフトウェアとして配布されています。
・高いスケーラビリティがHadoopの強みです。

各データノードに、データを分割して格納し、分割データを並列処理を行います。手に入りやすい一般的なサーバをデータノードとして追加するだけで、容量や処理性能を向上することができます。

無題1.png
無題.png

・分割したデータを並列処理するので、どのような形式の構造化/非構造化データに対しても、複雑な処理を高速に実行することができます。

・Hadoopの得意分野は、テラバイトのデータを扱う一括した処理となります。また、比較的小さなサイズのデータであれば、データベースで処理可能となるため、Hadoopを導入するメリットは少なくなります。

bottom of page