令和6年試験問題 [科目A]問15

令和6年試験問題　[科目A]問15

ビッグデータ分析の前段階として，非構造化データを構造化データに加工する処理を記述している事例はどれか。

関係データベースに蓄積された大量の財務データから必要な条件に合致するデータを抽出し，利用者が扱いやすい表計算ソフトウェアデータに加工する。
個人情報を含むビッグデータを更に利活用するために，特定の個人を識別することができないように匿名化加工する。
住所データ項目の中にある，"ヶ"と"が"の混在や，丁番地の表記不統一を，標準化された表記へ統一するために加工する。
ソーシャルメディアの口コミを機械学習によって単語ごとに分解し，要約を作り，分析可能なデータに加工し，関係データベースに保管する。

分野：ストラテジ系
中分類：企業活動
小分類：業務分析・データ利活用

解説

構造化データは、あらかじめ決められた形式やフォーマットに従って格納されたデータです。関係データベースや表計算ソフトのデータなど、データの格納方式が明確に決まっているデータがこれに該当します。一方、非構造化データは特定の形式がなく、元の形のまま保存されるデータです。これにはテキスト、画像、動画、音声などが含まれます。また、JSONやXMLのようにデータの形式が決まっているものの、様々なデータを含めることができるものは半構造化データと呼ばれます。

関係データベース内のデータ、表計算ソフトウェアデータはともに構造化データです。よって、構造化データから構造化データに加工していることになります。
ビッグデータは一般に多種多様な形式のデータを含むため非構造化データです。匿名化加工はデータの内容を変更するものであり、格納形式は変更されないため、データ形式は非構造化データのままで変わりません。
住所データは、事前に定義された形式のデータなので構造化データです。表記方法の統一加工はデータの内容を変更するものであり、格納形式は変更されないため、データ形式は構造化データのままで変わりません。
正しい。ソーシャルメディアの口コミは非構造化データ、関係データベース内のデータは構造化データです。よって、非構造化データから構造化データに加工していることになります。

令和6年試験問題 [科目A]問15

前の問題次の問題

令和6年試験問題　[科目A]問15