元外資系コンサルのガラクタ箱

データチェックの基礎知識その3縦と横を何であわせるか

データチェックの基礎知識第3弾です。改行コードと区切り文字によりファイルごとの縦と横は特定できました。本記事では縦と横を突き合わせていきます。

縦(レコード)をあわせる

今度は、ファイル同士の突き合わせ方法です。縦を特定するためには、ファイルごとのレコードを特定するキー項目が何かを確認します。一つの項目で一意(一行)に決まることもあれば、複数項目が合わさって一つに決まることもあります。

ファイル同士のレコードを比較するには、レコード同士を突き合わせるためのキー項目が必要になります。これはファイル同士のデータモデルによります。1対1であればファイルごとの主キーを使って突き合わせます。1対多もしくは多対1の場合は、多側から1を特定するキー項目(外部キーと呼びます)を使います。

ファイル間が多対多の場合は中間に関連づけを行うテーブルがありますので、それをベースに突き合わせます。

横(カラム)をあわせる

レコードを突き合わせたら、カラムを合わせます。ファイルレイアウト定義により、どの項目とどの項目が同じ内容なのかを確認します。桁数やデータ型、備考を参考に項目マッピングを行います。場合によっては、一つの項目の先頭数桁を切り取ったり、いくつかの項目を結合して突き合わせることもあります。

次回は正しくなかった場合の原因解析の方法を紹介します。

データチェックの基礎知識その4 差異が発生した時の分析方法

 

Posted from SLPRO X for iPhone.

mhisaeda

電子書籍「システム導入のためのデータ移行ガイドブック」著者。

新卒から外資系コンサルティングファームに所属。15年に渡り販売物流、特にCRM領域のコンサルティングに従事。 100名を超えるプロジェクトのPMOなど全体を推進していく役回りや、ユーザ企業への出向を通じた実務経験を持つ。

このブログでは、自身がかき集めた知識や経験を共有する。クライアントへの提案やソリューション開発に直結しないガラクタのようなもの。将来再利用する自分のために。同じような悩みを抱える誰かのためにブログ「元外資系コンサルのガラクタ箱」を運営。

カテゴリー

モバイルバージョンを終了