見出し画像

データを扱うときの気をつけポイント

仕事をしていると、えらい人から「分析しておいて」とか「データ出してもらえる?」とか、そういうシチュエーションあるじゃないですか。

場合によっては、自分でデータを分析して仮説を説いちゃうこともあるかもしれない。逆パターンで、出てきたデータや分析結果を見る機会もあるかもしれない。

そんな時のいくつかのポイントをnoteにまとめておこうかなって思ったわけです。結構「当たり前」なポイントばかりですが。そして、これがすべてではないので、そこは要注意だよ!

サマリーデータは検証をしよう!

会議で1,000件以上の細かいデータを見せられると「うえぇぇ」ってなりますよね。なので、だいたい資料化する時にはサマリー(要約)したデータを載せます。そうしたら、「うえぇぇ」ってならない場をつくることができます。

なので、データを集計する時は、最初からサマリーデータを出力しようとしちゃいます。

  1. データが欲しいぞ

  2. サマって出力

そのサマリーデータが100%間違っていないならそれでもぜんぜんオッケー。ただ、あんまり触ったことがないデータなら、いきなりサマって出すのは以下の理由でおすすめしません。

  1. 間違った集計をしているのに気づけない

  2. 詳細データに含まれる特異点を見逃す

ひとつめは、間違った集計をしている可能性です。例えば、売上のデータを集計していた場合、返金されたデータの取り除かず集計しちゃったとかですね。500万円売れました!って報告して、実は300万円は返金されてたとか、しゃれにならないですよねぇ。

ふたつめは、サマリーデータだけでは、その間に起こった事件はもみ消されたり、思わぬ好機(オポチュニティ)を見逃してしまったりすることもあります。例えば、今月の売上が1,000万円、先月も1,000万円だったとします。「売上は横ばいです」…と資料化します。

しかし、これを事業別に分けるとこうだったわけです。

事業Aが先月比50%で大幅ダウン。対して事業Cは、250%アップです。サマリーデータだけでは、以下の点を見逃しています。

  1. 事業Aに何か問題が起きて売上が大きく下がった

  2. 事業Cに何か好機が起きて売上が大きく上がった

わかりやすいような例にしました。(まぁ、事業別で集計するのは普通にやると思いますが…。)サマリーデータだけ見ていると詳細データにある好機を見逃すことはあり得ます。

例えば、事業Cは、販売している商品が100個あったとして、先月までほとんど売れていなかった商品がバズってたくさん売れたのが要因の場合は、1商品単位での詳細データを見なければ気づけないですね。

なので、おすすめのサマリーデータの作り方はどちらかだと良いでしょう。

パターンA

  1. データが欲しいぞ

  2. 詳細データを出力

  3. 詳細データを元にサマる

パターンB

  1. データが欲しいぞ

  2. サマって出力

  3. 詳細データも別で出力して検証

詳細データともつけ合わせて検証を入れるのがよいです。

詳細データがあれば、えらい人に「なんで売上は横ばいだったの?」というツッコミにも華麗に返せますし、なんなら「売上は横ばいですが、事業Aではこういう理由で今月売上が下がっていますが、来月には問題解消が見込め売上も回復。事業Bではこういう理由で売上が上がっており、継続して売上を上げるためには…。」みたいな話をすることもできます。

ちなみに、私はパターンAがほとんどです。加工していないデータを出してから、Excelなりのpivotテーブルで集計します。サマリーで気づいた点があったら、加工してないデータで詳細を調べたりします。

加工していないデータを抽出する時も、いきなり全部出力するのではなく、1商品単位とか、1アカウント単位とか、なるべく目検で確認できる小さいデータ量で抽出条件が間違っていないことを確認します。

データを依頼主に提出する時にも、サマリーと詳細データをセットで渡すことで、相手が深掘りできるようにしたりします。実データの検証、大事。

パーセンテージだけで表現するのは危険

成長率や前年比、前月比などの「率」をパーセンテージで表現することは多くあります。ただ、その場合は実数値も見た方がいいです。

実数値がないとこうなりますね。パッと見、カテゴリAは減少。カテゴリCが増加です。めっちゃカテゴリCが伸びてるじゃん!ってなりますね。

ただ、実数値を加えてみましょう。

カテゴリAが40万円の減少。カテゴリBが100万円の増加。カテゴリCは1万円の増加。さて、どのカテゴリのインパクトが大きいでしょうか。

200%成長のカテゴリCより、カテゴリAの20%減の方が金額的には一番インパクトが大きいです。10%成長しかしていなさそうなカテゴリBですが、伸長していますが、カテゴリAのマイナス分をカバーできるほどの伸長ではなかった…。

グラフにするともう少し視覚的に分かる。カテゴリCは200%成長ですが、グラフにすると見えないレベルです。

パーセンテージで増減を見る時には、合わせて実数値の増減も確認するのをおすすめします。インパクトが大きい方への施策や対策が優先度は高いはずです。実数値、大事。

比べるデータはなるべく同じ状況下のものと比べる

データを見る上で「対比」というのは、非常に重要です。比べる対象があることで、進捗を把握することができる。ビジネスは対比と言っても過言ではない(言い過ぎ)

商品別での売上の実数値です。対比は、前月の売上と比較した例です。パッと見、商品Aが減少。商品Bが増加。商品Cは横ばいですね。前月との比較だと、この通りなのでしょう。

しかし、加えて前年の実数値と比率を加えてみました。どうでしょう?

答えを言ってしまうと、この商品群は、年末年始に売れる商品群という想定です。勘が良い方は、項目に◯月って入っていたことで気づいたかも知れません。

前年比を出すことで、季節性による動き(トレンド)が見えるようになります。

ほとんどサービスでこの季節性はあるでしょう。クリスマスがあるから12月は売れるとか、入学準備で3月は売れるとか。前月比ではこのような季節性のある動きが考慮できませんね。

商品Aは前年比も前年比も50%減なので、何か大きな問題がありそうです。去年の1月も売れていたので、年間通して売れなくなっている可能性がありますね。

商品Bは、前年比と横ばいなので、変化がなく、継続して売れている商品なのかも知れません。商品Cは前月比だと横ばいに見えてますが、前年比だと2倍売れています。年間を通して成長している商品なのかも知れません。

ここまで見ると「かも知れません」と言っているのは、12月の前年比か、通年での推移を出すと確証に変わるでしょう。

重要はポイントは、前月比の比較だけでは、見えてこない部分があり、判断を見誤ることがあるということです。比較は、なるべく同じ状況下のデータと比較するのが良いということですね。

「対比する対象は、それでいいのか?」と、己に問うといいでしょう。比べる対象を選ぶの、大事。


すごく当たり前のことを並べさせてもらいました。なんでこんなnoteを書いたのかというと、この映画を観たから。

「次の人に伝えていく」というような(温泉)シーンがあり、自分の中にある当たり前と思っていることでも、なんかの役に立つのかな…と思ったのです。なでしこ、成長したなぁ。

今なら(2022年12月現在)なら、アマプラでプレミアム会員なら観れるのでゆるキャン△好きの人はぜひ!

ちなみに、カバー画像はNovelAI Diffusionでつくりましたとさ。おしまい。