令和元年秋期試験問題 午前問63
問63解説へ
企業がマーケティング活動に活用するビッグデータの特徴に沿った取扱いとして,適切なものはどれか。
- ソーシャルメディアで個人が発信する商品のクレーム情報などの,不特定多数によるデータは処理の対象にすべきではない。
- 蓄積した静的なデータだけでなく,Webサイトのアクセス履歴などリアルタイム性の高いデータも含めて処理の対象とする。
- データ全体から無作為にデータをサンプリングして,それらを分析することによって全体の傾向を推し量る。
- データの正規化が難しい非構造化データである音声データや画像データは,処理の対象にすべきではない。
正解 イ問題へ
広告
解説
ビッグデータとは、典型的なデータベースソフトウェアが把握し、蓄積し、運用し、分析可能なサイズを超えるほど巨大なデータ群を示す言葉です。一般的には数十テラバイトから数ペタバイトのデータがビッグデータとして扱われます。
ビッグデータが持つ特性として「3つのV」があります。
ビッグデータの特性を踏まえて各記述の正誤を判断します。
ビッグデータが持つ特性として「3つのV」があります。
- Volume … データ容量
- 膨大なデータ量
- Variety … データの多様性
- テキスト、画像、音声といった多様な種類・形式のデータを含む
- Velocity … データ生成速度・頻度
- リアルタイムで収集できるデータ・秒単位など高頻度のデータ
ビッグデータの特性を踏まえて各記述の正誤を判断します。
- 1日に何億回も発生するSNSへの投稿を分析することで、市場の反応を分析したり商品改善につなげたりすることが行われています。
- 正しい。アクセス履歴やセンサーネットワークで刻々と取得されるデータなどのリアルタイム性の高いデータも処理対象とします。
- ビッグデータの処理ではサンプリングは行わず、対象となるデータ全体を統計学的手法や数学的手法を用いて分析します。
- ビッグデータは単にデータ量が多いというだけではなく、扱うデータ種類の多さに特徴があります。分析対象には数値や文字列に加え、画像や音声などのマルチメディアデータ、電子メール、センサーの情報、サーバログ、JSONやXMLなどの非構造化データなど多種多様なデータも含まれます。
広告