データ分析で具体的にデータを活用する方法【実践編】
データ分析で具体的にデータを活用する方法を知りたい方へ
現在、データ分析を始めたいけど、データをどうやって活用したらいいか方法とか具体的に知りたい。
あと、便利な手法とかあればついでに知りたい。
と考えていませんか?
本記事では、下記の内容を解説します。
この記事を書いている私は、データ分析歴10年。機械学習を使った受注予測(発注自動化)の仕組みを作って運用したり。日本の分析企業数社(A社、B社、N社など)や大学の研究機関とデータを活用する仕事をしてきた実績があります。
なので、記事の信頼性の担保につながると思います。
1.データ分析でデータを活用する具体的な方法(3ステップ)
1.相手の立場や視点になって考える(目的、背景、仮説)
2.今あるデータを正しく理解し最大限できることを考える(5W2h、基礎調査)
3.情報を加工・生成する(分析手法)
ステップ1)相手の立場や視点になって考える
まず、第一に相手(依頼者や会社)の立場や視点になって考えること。
この視点がないと、思い込みで情報を作ったり、無価値な情報を提供してしまうことにもつながりかねません。
具体的に相手(依頼者や会社)の立場や視点をどう理解するのか?
私は以下の3つの質問をすることで理解を深めています。
・背景(物事の背後にある事情)
・仮説(想定している)
これ、分析する人がしっかり理解することが第一に大切です。
私は補助的に無料のGoogleフォームという機能を使って企業の依頼の案件をまとめています。
依頼
依頼者名:
タイトル:短く簡潔に
目的:行動のねらい
背景:物事の背後にある事情
仮説:依頼者が考えている仮説があれば
納期:いつまでに必要か
その他:上記以外あれば何でもコメントください
(Googleアカウントがあればだれでも作れます)
なぜ依頼の「目的」だけでなく「背景、仮説」まで聞くのか?
それは相手の立場や視点で見たときに、本当に大切なことはなにか探るためです。
それを知らないと本当に依頼者にとって価値あるデータ分析で情報をつくることはできません。
他にも、このツールを使うメリットとしては、依頼内容がGoogleスプレットシートで表にまとまり、チームで対応するときも個人の進捗状況管理、タスク管理に活用できることです。
ただし、ツールは補助的に使うものです。一番は対面。電話、メールやチャットなどもコミュニケーション強化で利用します。依頼が複数件の重なる場合もありますので、依頼のレベル感(緊急度や重要度)に合わせて対応を変えましょう。
ここまでがステップ1になります。
ステップ2)今あるデータを正しく理解して最大限できることを考える
今あるデータを正しく理解して最大限できることを考える。
データを正しく理解しないと正しい情報は提供できません。
正しく理解ができれば、依頼に対して最短の工程で対応ができます。
また、今あるデータには出来ないといったことも分かるため、
これから足していくべきデータは何か?ということも明らかになります。
では、データを正しく理解するためには具体的にはどうするのか?
「5W2H」を使ってデータ項目を分類します。
物販企業(販売視点)を【例】にすると
いつ :日付(受注、出荷、返品、商品掲載、etc)
どこから:注文チャネル(ネットA、ネットB、CC、etc)
なぜ :広告(サイト、TV、媒体、etc)
だれが :顧客、紹介者、メーカー
なにを :商品
どうやって:配送方法、支払方法、レビュー
いくら :商品価格、原価、コスト
FP会社(契約視点)を【例】にすると
いつ :日付、(申込、セミナー、面談、キャンセル、etc)
どこから:申込チャネル(ネットA、媒体、etc)
なぜ :きっかけ(サイト、TV、媒体、etc)
だれが :顧客、FP講師
なにを :サービス(保険、投資、介護)
どこで :場所(セミナー、申込)
いくら :申込金額、手数料、コスト
もし当てはまらないデータがあれば、今ないデータということです。
上記はあくまでも一例です。事業形態や視点によっては、軸を付け足す場合もある。
上記の「5W2H」を理解したら、次は最大限できることを考えれるようになるために、今あるデータ項目の傾向を基礎の分析で把握に努めます。
今あるデータの傾向をみる
これは、初めから難解な分析ことをする必要はありません。
単純に集計でデータの傾向をみることが重要です。
まず、1つの軸でデータの中身とレコード件数の把握する。
注文ルートを例にした場合
1:ネットA 13,000件 2:媒体 5,000件 3:電話 100件
のようにまずは行数を把握すること。
ここで不必要なデータ項目は排除して考えることが重要です。
次に、「いくら」項目を別の軸で集計する
「いつ」軸×「いくら」項目
「なぜ」軸×「いくら」項目
「どこで」軸×「いくら」項目
etc
「いくら」という項目は企業のKPI指標に沿っているかを確認すること。
なぜなら、企業の数字感と乖離していないか確認するため、データの全体感が正しいことをまず把握しましょう。
さらに、大枠の傾向があったものを固定にしてクロス集計をする
例:いつ=1年とかに固定して
「どこで」×「なにを」×「いくら」項目
「どこから」×「なぜ」×「いくら」項目
「どこから」×「なぜ」×「誰」項目
etc
あ、これかなり重要です!高度な分析手法や統計スキルや統計ソフトを使う分析者の中には、基礎分析での傾向把握に時間をかけずに機械まかせにして、データの理解が乏しいまま分析に入る人が結構います。データの傾向をよく理解せず投入して迷走している状況を何回も見てきました。
データの基礎調査は、これでもか、というくらいやること。しっかり傾向をつかんでから分析に望むことが重要です。
データができる背景まで真の理解ができることが理想です。
ここまでがステップ2になります。
ステップ3)材料から情報を生成する
ステップ1でゴールを明確にし、ステップ2で今あるデータの理解ができたうえで、ステップ3では以下の手法を使って情報を生成します。
★手法↓↓↓
【顧客分析】
デシル分析 | 全顧客を10等分してそこから有益な情報を得ようとする方法 |
RFM分析 | Recency (最新購買日)、Frequency (購買頻度)、Monetary (購買金額)の3つの指標で顧客分けて分析する方法 |
CBI分析 | カテゴリ、ブランド、アイテム軸などの軸でみる方法 |
CPA分析 | 顧客獲得単価=獲得金額÷コスト |
LTV分析 | Life Time Value(ライフ タイム バリュー)の略、「顧客生涯価値」を図る分析法 |
AIDMA分析 | 消費者の購買決定プロセスを分析法 |
ロジスティック回帰 | 効率の良いターゲティング順を決める手法(回帰モデル) |
【商品・情報分析】
ABC分析 | 売上の高い順に商品を並べ3つに分類して傾向を把握する分析法 |
併売分析 | バスケット分析(アソシエーション)分析 |
主要因分析 | なんの要素が効いているのか |
分類回帰分析 | 確率の問題で使う。受注予測で利用 |
時系列分析 | 時系列で変動がある問題で使う |
クラスタ分析 | グループ分けに最適です。レコメンデーション(この商品はおすすめ)として利用します。 |
以上がステップ3です。
それぞれ、詳細のスキル活用方法は今後のブログで紹介できたらいいなと思っています。
2.データ分析でデータを活用するときにセットでやるべきこと
データ分析依頼があったら、最初から提出する資料を作る
なぜかというと、1依頼1資料(エクセル)が非常に効率的だからです。
具体的には、ファイル名を以下の規約で作成します。
YYYYMMDD_依頼タイトル_依頼者名.xlsx
YYYYMMDD:いつ依頼を受けたのか
依頼タイトル:簡潔でわかりやすく記載する
依頼者名:依頼者の名前を記載する
後日にファイルを見返して使うこともあります。後から見たときに検索しやすいようにしましょう。
大規模プロジェクトの場合でも、プロジェクトを細分化して上記のように個々対応するのが理想です。
分析資料の中身の作り方
上記ファイルを作ったらまず、シート名「依頼」を記載します。
1.エクセルのシート「依頼」
なぜ「依頼」かというと、依頼者の視点を見失わないため
このシートの内容には、1-1の依頼内容を書き出します。
タイトル、依頼者名、依頼日、納期、目的、背景、仮説
さらに+自分の「仮説」+抽出に必要な「番号など」についてもここに明記しましょう。
2.エクセルのシート「加工」
次に、データベースやBI、分析ツールから必要なデータを「加工」シートに貼り付けます。
エクセルのシート名 例:「加工」「〇〇データ1」「〇〇データ2」
複数シートを作る場合、シート名はあいまいなものをつけず、より具体的に記した方が作業効率が向上します。
3.エクセルのシート「報告」
最後に加工した情報を「報告」シートに情報をまとめます。
依頼者が一目見てわかるよう1集計1メッセージを心掛けましょう。
また、理解を早めるためにグラフなども活用しましょう。
エクセルのシート例:「依頼」「受注データ1」「顧客データ2」「加工→」「報告」
もし、パワポ形式での報告が必要であれば、「報告」からコピペするイメージです。
分析資料の実例
私が使っているレポートのテンプレを公開します。※ざっくりイメージです。
・データ分析でデータを活用する具体的な方法まとめ
・相手の立場や視点になって考える(目的、背景、仮説)
・今あるデータを正しく理解し最大限できることを考える(5W2h、基礎調査)
・情報を加工・生成する(分析手法)
・データ分析依頼があった際の、資料の作り方
を紹介させていただきました。
多変量解析やパイソンを使って分析をしたいという人も、まずは、上記の考えが非常に重要です。
ってかコロナはやく収束してほしいです。