オンラインストレージ・クラウド
用語集

ビッグデータ

ビッグデータ(big data)とは、従来のコンピューター・システムでは解析や処理が難しい大規模なデータ群を表すIT用語です。

単に大量のデータを指すのではなく、種類や形式、頻度、速さなどといった要素も含まれるのが特徴です。

しかし、実はビッグデータの明確な定義はなく、複雑な構造を持つ非構造化データとして扱われるのが一般的です。

構造化データと非構造化データとは

測定・記録値などの数値データを一定の規則に従ってデータベースに格納し、意味付けをして、有益な情報として活用するためのデータを「構造化データ」と呼びます。

ExcelやCSVなどといったデータ形式が、その代表的な例です。

集計などの処理およびデータ分析がしやすいという特徴があり、別名「定型データ」とも呼ばれます。

一方、テキスト、画像、音声などのデータは構造が複雑で、構造化データのように、処理や解析が容易ではありません。

これらのように、構造化データに分類されないデータを「非構造化データ」あるいは「非定型データ」といいます。

非構造化データは、規則性があるもの・規則性がないものに大別されます。

規則性がある非構造化データは、XML(Extensible Markup Language)やJSON(JavaScript Object Notation)などで、構造データ同様、データ分析が可能です。

また、メールの文章などのテキスト、画像ファイルといったデータは、規則性がない非構造データに分類されます。

ビッグデータ解析の技術により、規則性がない非構造データに規則性を見いだすことが可能になると期待されています。

ビッグデータの活用例

IT技術の進歩・普及により、デジタルデータの量や種類は増加し続けています。

加えて、それらは非構造化データであることがほとんどで、従来のデータベース管理システムでは分析が困難です。

しかし、こういったビッグデータに規則性や法則性を見いだすことで、企業活動、さらには社会全体にとって有用な情報や新しい知識を得られる可能性があり、Hadoopなどの分析基盤や、分析ツールを使ったビッグデータ活用がすでに始まっています。

具体的には、需要予測にもとづく効率的な供給管理システムの開発、顧客行動分析による経営戦略の構築、精度の高い選挙結果予測などといったビッグデータの活用事例があります。

また、ビッグデータを活用する組織や団体は、民間企業から国の行政機関や地方自治体までさまざまです。

ビッグデータを活用する動向は、日本国内に限ったことではありません。

世界中でビッグデータの重要性が認識されており、高度な意思決定や効率的な企業活動に役立てる傾向が強くなっています。

ビッグデータ解析の技術開発も進んでおり、今後ますますビッグデータ活用の動きが加速すると考えられます。

散在した資料データ・PDFを一元管理するコツ

日々の業務に役立つ資料を無料でご用意しております。ぜひ無料ダウンロードし、情報収集や業務改善、社内資料などにお役立てください!

資料を
ダウンロード
キーワードから探す
セキュアSAMBAの資料をダウンロードする
セキュアSAMBAを無料で試してみるZ