製品の特徴

機能2 重複チェック機能

機能概要

さらに「DBTrimmer Ver1.0」は、データ表記統一後、顧客ごとに並び替えが行われたデータベースに対し、重複データチェックを行ない、ヒットしたデータの情報をログファイルに出力します。また、不要な重複データを自動で削除する「名寄せ」機能や、重複チェック結果を表す削除フラグをデータベースに一括付加する機能も提供し、名寄せ作業効率の飛躍的なアップを実現することができます。

重複データの検索精度を上げるための配慮が施されています

会社名の "株式会社"、"(株)"、"有限会社"、"(有)" などの文字列は内部で省略してチェックが可能、住所データの「丁目」、「番地」、「号」などといった特定文字を内部でハイフンに置き換えてチェック、異種同意語テーブルに指定された、異なる 2 つの文字列を同一文字列と判断してチェックが可能など、検索精度をあげるために、DBTrimmer 内部でデータ表記を整えて重複チェックを行ないます。

▼ 重複データと判断するデータ例

A. 福井県福井市和田東1丁目222番
B. 福井県福井市和田東1−222

B. の住所データは、住所の "丁目"、"番地" などの特定文字がハイフンで登録されていますが、DBTrimmerは、A. と B. を同一の住所と判断します。

C. 0776-21-9008
D. 0776−21−9008

一方は半角数字、もう一方は全角数字で登録されていますが、DBTrimmer は、C. と D. を同一データと判断します。

E. アドバンスソフトウェア株式会社
F. アドバンスソフトウェア
G. アドバンスソフトウェア(株)

会社名の "株式会社" が省略されていたり、(株)と省略文字列で登録されていますが、DBTrimmer は、いずれも同一データを判断します。

H. アドバンスソフトウェア
I. アドバンス技研

例えば異種同意語テーブルに、"アドバンスソフトウェア=アドバンス技研" と登録し、重複チェック時、異種同意語テーブルを使用することで、登録した異なる 2 つの文字列を同一文字列と判断することができます。

重複チェック結果、重複しているデータは、ログファイルに出力されます

重複チェック結果、重複データと判断されたレコードの行 No. や、実際にチェックされたデータ内容、削除フラグが出力されますので、このログファイルを見ながら、重複チェック処理を行ったデータベースから削除対象レコードを容易に見つけ出すことができます。
ログファイルはテキスト形式のため、Windows のメモ帳といったテキストエディタで開くことができます。

さらに、重複チェックと同時に重複データの「名寄せ」を自動で行うこともできます

DBTrimmer の名寄せ機能は、直接データベースの重複データを削除する方法 (*1) と、自社で安全かつ慎重に名寄せを行う配慮として、データに削除フラグを付加する方法の 2 種類の名寄せ機能 (*1) を提供します。

*1 Excel は、この機能に対応していません。

▼ 削除フラグ付加イメージ(例、Excel)

削除フラグ 「1」=重複データと判断されたレコード

重複チェック後、名寄せ作業を行うと、次のようなメリットがあります

重複データの情報が出力されたログファイルや削除フラグを見ながらの名寄せ作業により、従来の重複チェック作業の負担を軽減します。重複データの削除により、同一人物への同一 DM の発送、 FAX や E-Mail の 2 重送信、2 重の電話営業といった無駄なマーケティングコストを削減します。データベースのサイズダウンや、顧客データごとに出力する帳票の印刷ページ数を縮小することができます。