データの集計加工を自動化できると、その時間を節約でき、より付加価値の高い仕事に時間を使うことができるようになります。
SQLプログラミングからセルフサービスデータ分析へ という記事を書きました。私はマーケティング・営業企画の部門で数字の集計を担当しているため、業務システムからダウンロードしたデータを集計する作業をを自動化したいなと思い取り組んでみたのですが、難航しています。
なんだかんだ時間がなくなって手作業を続けちゃってます
アルテリックスというデータ加工ツールを使って前回分の手順をワークフローで登録してみたものの、今回それを使おうとするといろいろうまくいきませんでした。
アルテリックスとは何か
アルテリックス(Alteryx)は、ユーザが自身で行えるセルフサービス型のデータ分析ツールです。
公式サイト:セルフサービスデータ分析プラットフォーム | Alteryx
ツールのイメージを知るのに、Alteryx社の動画デモも参考になります。
データを抽出して、集計や加工などの処理を行い、出力するところまでの一連を、グラフィカルなツールで登録して自動で実行させることができます。
自動化を試みた作業について
「2種類のファイルをダウンロードして、Excelでいくつかの加工をして、最終的にGoogleスプレッドシートで共有する」という作業を自動化しようと試みたのですが、うまくいきませんでした。
なお、ツールとして機能が足りないということが言いたいのではありません。ツールを導入すれば簡単に自動化できるわけではないことと、同じようなことを自動化したい人のための参考事例になればと記事を書いています。
レイアウトの月ずれ問題
今回登録したワークフローがそのまま使えなかった理由の1つが月ずれ。
インプットとなる元データは、システムからダウンロードすると当月から12ヶ月分が項目1〜項目12という形で並びます。ただし、集計対象は今年の会計年度分のみです。
そのため、月が変わると使う項目が変わります。同じ項目を固定でとっていると、ワークフローは動きません。
手補正データとの突き合わせ
次にネックになったのがダウンロードデータより優先する、手動で補正したデータ。
打合せなどを通じて手補正したものは、最新版でダウンロードしたインプットデータよりも優先します。
なので手補正対象データを保持しておいて、ワークフローの中で突合せて反映が必要になります。
ほかにもいろいろやってることがある
他にもこまごまとした作業はいくつかありました。値がなかったら隣の項目から引っ張って値を埋めたりとか、列順を並び替えたりとか、合計列をつけたり、単純な割り算項目を追加したり。
終わりに
なるべく手作業なくしてファイル指定して実行ボタン押すだけくらいにしたいのですがまだ先は長そうです。
Excelでの作業とは別に、Googleスプレッドシートに貼り付けた後にも関数集計や前回比較もやっているため、全体感をもって設計しなおすともう少しシンプルにできそうな気もします。
また改善できたら共有します!