開発ツール/プラットフォーム 開発ツール/プラットフォーム記事一覧へ

[新製品・サービス]

データ匿名化ツール新版「Insight Data Masking 3.4」、メインフレームの固定長データをマスク可能に

2023年11月2日(木)日川 佳三(IT Leaders編集部)

インサイトテクノロジーは2023年10月31日、データ匿名化ツールの新版「Insight Data Masking Ver.3.4」をリリースした。個人情報などを含む本番データをマスキング(匿名化)してテスト/分析用データを生成する。新版では、メインフレームのクラウド移行を想定し、メインフレーム特有の固定長ファイルや文字コード(EBCDIC)の要件に準拠したテストデータを生成できるようにした。

 インサイトテクノロジーの「Insight Data Masking」は、個人情報などを含む本番データをマスキング(匿名化)してテスト/分析用データを生成するソフトウェアである(関連記事データ匿名化ツール新版「Insight Data Masking 2.8」、AzureやSQL Serverで利用可能に)。

 Insight Data Maskingは、データに含まれる住所、電話番号、名前、クレジットカード番号などを識別・検出してマスキングする。データのユニーク性や参照整合性(論理的特性)と、データの種類や分布(統計的特性)を維持したまま変換する。これにより、本番データと同等に使えるマスキングデータが得られる。以下のように、データのマスキング方法を複数用意している。

(1)データベース(Oracle Database、PostgreSQL、MySQL)に接続して、これらのデータを直接マスキング
(2)マスク対象データを渡してマスク後のデータを取得するWeb API
(3)データ複製ツール「Qlik Replicate」のアドオンプログラムとしてデータ複製時にマスキング

図1:メインフレームの固定長データを匿名化できるようになった(出典:インサイトテクノロジー)
拡大画像表示

 新版のVer.3.4では、メインフレームのクラウド移行を想定し、メインフレーム特有の固定長ファイルや文字コード(EBCDIC)の要件に準拠したテストデータを生成できるようにした(図1)。

 (1)固定長データを匿名化できるようにした。固定長データは文字情報の桁数が決まっており、その桁数の中で、1~8桁が購入日、9~12桁が伝票番号といったようにデータ項目を決まった位置に配置している。固定長ファイルをマスクする場合、マスキング後にデータの長さや桁ごとに特有のルールを維持して変換する必要がある。新版では、桁数の長さを変えないだけでなく、桁ごとのルールを考慮してマスキングする。

 (2)メインフレームでは、固定長ファイルの既存レコードを条件によって読み替えて、新しい情報として既存システムに保存する「マルチレイアウト」の仕組みがある。これが動作するようにマスクするには、どのレコードがどのタイプであるかを識別し、適切なマスキングルールを適用する必要がある。新版では、レコードの定義をJSONで行えるため、構成が複雑なマルチレイアウトに対応する。

 (3)メインフレーム特有の文字コードとしてEBCDICがあるが、他のシステムとのデータ連携時に文字コードの互換性が課題となる。新版では、EBCDICデータをマスクする際に文字コードをUTF-8に変換でき、匿名化したデータをクラウド上のデータ活用基盤へと連携させやすくなった。

関連キーワード

インサイトテクノロジー / 匿名加工 / 開発テスト / マスキング

関連記事

トピックス

[Sponsored]

データ匿名化ツール新版「Insight Data Masking 3.4」、メインフレームの固定長データをマスク可能にインサイトテクノロジーは2023年10月31日、データ匿名化ツールの新版「Insight Data Masking Ver.3.4」をリリースした。個人情報などを含む本番データをマスキング(匿名化)してテスト/分析用データを生成する。新版では、メインフレームのクラウド移行を想定し、メインフレーム特有の固定長ファイルや文字コード(EBCDIC)の要件に準拠したテストデータを生成できるようにした。

PAGE TOP