基本情報技術者令和6年 [科目A]問15

問15

ビッグデータ分析の前段階として,非構造化データを構造化データに加工する処理を記述している事例はどれか。
  • 関係データベースに蓄積された大量の財務データから必要な条件に合致するデータを抽出し,利用者が扱いやすい表計算ソフトウェアデータに加工する。
  • 個人情報を含むビッグデータを更に利活用するために,特定の個人を識別することができないように匿名化加工する。
  • 住所データ項目の中にある,"ヶ"と"が"の混在や,丁番地の表記不統一を,標準化された表記へ統一するために加工する。
  • ソーシャルメディアの口コミを機械学習によって単語ごとに分解し,要約を作り,分析可能なデータに加工し,関係データベースに保管する。

分類

ストラテジ系 » 企業活動 » 業務分析・データ利活用

正解

解説

構造化データは、あらかじめ決められた形式やフォーマットに従って格納されたデータです。関係データベースや表計算ソフトのデータなど、データの格納方式が明確に決まっているデータがこれに該当します。一方、非構造化データは特定の形式がなく、元の形のまま保存されるデータです。これにはテキスト、画像、動画、音声などが含まれます。また、JSONやXMLのようにデータの形式が決まっているものの、様々なデータを含めることができるものは半構造化データと呼ばれます。
  • 関係データベース内のデータ、表計算ソフトウェアデータはともに構造化データです。よって、構造化データから構造化データに加工していることになります。
  • ビッグデータは一般に多種多様な形式のデータを含むため非構造化データです。匿名化加工はデータの内容を変更するものであり、格納形式は変更されないため、データ形式は非構造化データのままで変わりません。
  • 住所データは、事前に定義された形式のデータなので構造化データです。表記方法の統一加工はデータの内容を変更するものであり、格納形式は変更されないため、データ形式は構造化データのままで変わりません。
  • 正しい。ソーシャルメディアの口コミは非構造化データ、関係データベース内のデータは構造化データです。よって、非構造化データから構造化データに加工していることになります。
© 2010-2024 基本情報技術者試験ドットコム All Rights Reserved.

Pagetop