💻 ITパスポート | テクノロジ系

ビッグデータとは?

従来のデータベースでは扱えない、膨大で多様・高速なデータの集まり。3つのV(量・種類・速度)がキーワード。

🎬 こんなシーンを想像
スマホを使うたびに、あなたの位置情報・検索履歴・購買履歴・SNSの投稿が記録される。世界中の何十億人が同じことをしている。Excelで処理しようとしたら……一瞬でフリーズ。
…この「普通のDBでは無理なデータの洪水」こそビッグデータ!
📊 ビッグデータの3V Big Data Volume 量(大量) Variety 種類(多様) Velocity 速度(高速)
🗄️

Volume(量)

ペタバイト・エクサバイト級の巨大なデータ量

🎭

Variety(種類)

テキスト・画像・音声・センサーなど多様な形式

Velocity(速度)

リアルタイムに生成・処理が求められる高速性

🔄 ビッグデータの活用フロー
① データ収集
IoTセンサー・SNS・ログ・購買履歴などから膨大なデータを集める。
② データ蓄積(データウェアハウス・データレイク)
大量データを整理して格納。RDBでは難しいため分散ストレージを使う。
③ データ分析(データマイニング・機械学習)
パターン・相関を掘り出し、傾向や予測モデルを作る。
④ 意思決定・サービス改善
分析結果をもとにレコメンド・需要予測・異常検知などに活用する。
⚠️ ひっかけ注意ポイント
「量が多ければビッグデータ」は不正確
Volume だけでなくVariety(多様性)とVelocity(速度)もセット。「3V」が揃って初めてビッグデータの特徴。
データウェアハウスとの混同
データウェアハウスは「分析用に整理されたDB」。ビッグデータは「量・種類・速度が従来を超えるデータ全般」の概念。上位の言葉。
データマイニングとの混同
データマイニングはビッグデータを分析する手法の一つ。ビッグデータ自体ではない。
判断のコツ
「量・多様・高速」「従来DBでは扱えない」→ ビッグデータ。分析手法名が出たらビッグデータではなくその手法名。
🧠 覚え方(無理やりゴロ)
「べ(Volume)らぼうに多い・バ(Variety)ラバラ種類・バビ(Velocity)ューン速い」
V・V・V の3つが揃ってビッグデータ!

「データの洪水」=量・種類・速度すべて桁違い。
3V を覚えたら試験の選択肢はすぐ絞れる。