データチェックの基礎知識第3弾です。改行コードと区切り文字によりファイルごとの縦と横は特定できました。本記事では縦と横を突き合わせていきます。
縦(レコード)をあわせる
今度は、ファイル同士の突き合わせ方法です。縦を特定するためには、ファイルごとのレコードを特定するキー項目が何かを確認します。一つの項目で一意(一行)に決まることもあれば、複数項目が合わさって一つに決まることもあります。
ファイル同士のレコードを比較するには、レコード同士を突き合わせるためのキー項目が必要になります。これはファイル同士のデータモデルによります。1対1であればファイルごとの主キーを使って突き合わせます。1対多もしくは多対1の場合は、多側から1を特定するキー項目(外部キーと呼びます)を使います。
ファイル間が多対多の場合は中間に関連づけを行うテーブルがありますので、それをベースに突き合わせます。
横(カラム)をあわせる
レコードを突き合わせたら、カラムを合わせます。ファイルレイアウト定義により、どの項目とどの項目が同じ内容なのかを確認します。桁数やデータ型、備考を参考に項目マッピングを行います。場合によっては、一つの項目の先頭数桁を切り取ったり、いくつかの項目を結合して突き合わせることもあります。
次回は正しくなかった場合の原因解析の方法を紹介します。
Posted from SLPRO X for iPhone.