f:id:millebon:20210411113646p:plain

単回帰分析もまずは散布図を描くことから始める！

前々回、前回と相関分析を取り扱いましたが、今回は単回帰分析を用いてHRの課題に取り組みたいと思います。

お題は以下の通りです。

組織構造にとらわれずに人や情報を結び付けるような振る舞いを行うことで、その人のイノベーションを起こす力にどう影響があるのでしょうか？

イノベーションは、新しい情報と情報のぶつかり合いから始まるというようなことはよく言われることです。

組織の壁を越えてネットワークや情報を広げるような人はイノベーション力の高い人なのかということです。

ただ、ここではあくまでもケーススタディなので、こういうような課題があった時に統計的にどう分析し、提案できるかが重要だということですね。

今回は単回帰分析を用います。

単回帰分析とは、説明変数が1つのみで被説明変数を説明する方法です。

今回ですと被説明変数はイノベーションを起こす力で、説明変数は組織構造にとらわれず人や情報を結び付けるような振る舞いということになります。説明変数が1つなので単回帰分析です。

単回帰分析は必ずしも直線ばかりではないですが、一般的には　Y=α＋βxで示されるような直線で示す分析で使われています。

何はともあれ、単回帰分析を使えるかどうかは”可視化して使えそうかどうか”を確認することが重要ですね。

このためにはまず散布図を描いてみましょう。

Pythonでのコードは以下の通りです。

>|python|
from matplotlib import pyplot as plt
fig, ax = plt.subplots()
ax.scatter(Innov_TI["MEANTI"], Innov_TI["MEANINNOVATION"])
plt.show()
||<

注意：

既にデータを読み込み、データフレームInnov_TIに2変数を入れ込んでいます。

”MEANTI”:各社員の組織構造にとらわれず人や情報を結び付けるような振る舞いを数値化したものの列名

"MEANINNOVATION"：各社員のイノベーションを起こす力を数値化したものの列名

すると以下のような散布図が出力されます。

f:id:millebon:20210411132849p:plain — 散布図

何となく、相関性がありかつ線が引けそうな気はしますね

ただ、何となく引けそうなだけで単回帰分析をしていいのか？？という疑問（というよりびびり？）があるのですが、AIHRの”Statistics in HR”という講義では単回帰分析を実施するための条件として以下のようなことが書かれていました。

矢印以下には一応検証結果を載せています。

説明変数・被説明変数、ある区間（割合）内にあること＝＞散布図からするとこちらは大丈夫そうです。
両方の変数が直線的な関係であること＝＞こちらも散布図から大丈夫そうですね。
重要な外れ値がないこと＝＞こちらも大丈夫そうでした。外れ値については前々回のブログで書いていますのでこちらをご参照ください。
双方が正規分布にほぼ従うこと=>①ヒストグラムを書いて形状確認②歪度を出して確認。こちらも大丈夫そうです。
変数の大小にかかわらず誤差がほぼ同じであること＝＞こちらも図を見る限り変数が大きい、小さいからといって誤差に違いはないような？？なのでOK？

単回帰分析を実施！

単回帰分析をPythonで行うのはとても簡単です。

説明変数をx, 被説明変数をyとしてstatsmodelで以下のように書けば単回帰分析を行ってくれます。

>|python|
y,x = df['MEANINNOVATION'],df['MEANTI']
from statsmodels.formula.api import ols
formula = 'y ~ x'
res = ols(formula, data=df).fit()
||<

実際の値を見るためには以下のとおり"変数.params"で出力します。

>|python|
res.params
||<

でてきた結果は

intercept 1.276089

x:0.575717

でした。

これは

Y=1.276089＋0.575717x

という式が欠けるということですので、

x（組織構造にとらわれず人や情報を結び付けるような振る舞いの数値化）の値がわかれば、Y（イノベーションを起こす力）の値も推測できるということになります。

お題（＝組織構造にとらわれずに人や情報を結び付けるような振る舞いを行うことで、その人のイノベーションを起こす力にどう影響があるのでしょうか？）に対する答えとしては

組織構造にとらわれず人や情報を結び付けるような振る舞いはイノベーションを起こす力を0.57増加させることになる。

ということでしょうか？

さて、この単回帰分析を”適切な分析？”としていえるかどうかはさらに細かい分析が必要になります。

そのための結果は"変数.summary()"で出力します。

>|python|
res.summary()
||<

以下のような結果が出てきます。

f:id:millebon:20210411140857p:plain — 単回帰分析の結果

決定済み係数の大小はあまり問題ではない？？

いろいろ数値が出てくるのですが、見るべきところとしてよく言われるのが①各パラメーターの被説明変数に対する説明度合（赤字部分）と②推定式の当てはまりの良さ（決定係数、調整済み決定係数）です。

①はそれぞれのパラメータがゼロとは有意に異なる（＝意味があるパラメータである）ということの判断値です。p値（その確率）がある程度小さい（1%、5%）数値である必要があります。こちらは満たしていますね。

②は、この推定式で被説明変数がどれだけ説明できるかという割合です（R-squaredが決定係数、Adj.R-squaredが自由度修正済み決定係数）。ずっとこちらの係数を上げるようモデルを作ることが重要だと思っていたのですが、最近読んだ「実証分析のための計量経済学」という本で以下のような記述にあたりました。

決定係数は大きいほど望ましいのは事実ですが、ミクロデータ（＝観測単位からなる個票データ）を用いた実証分析では決定係数に注目することは少なく、むしろ各説明変数の統計的有意性やパラメータの大きさに着目することの方が一般的です。

人事で扱うデータはほとんどミクロデータなのですが、、決定係数は考えなくっていいということ？？

と思うと分析は楽なのですが、説明するときに「40％程度しか説明できない式です」ということで納得してもらえるのでしょうか。。

ちなみにこちらの本は、実証分析結果をどう解釈するのかを理解するにあたってとても役に立ちました。

おすすめです。

実証分析のための計量経済学

作者:山本勲
発売日: 2015/10/21
メディア: 単行本

2021-04-03

ピープル・アナリティクスケーススタディ：複数の変数の相関係数を一度に出力！

ピープル・アナリティクス-Pythonで分析

相関係数を一度に出力する方法
p値も一緒に出力したいのなら・・

f:id:millebon:20210403144640p:plain

相関係数を一度に出力する方法

前回はネットワーキングとイノベーションに相関性があるかということで1対1の相関係数を算出しました。

今回のお題は「イノベーションを予測する変数を複数の中から選択せよ」というものです。

複数の変数には仕事のコミットメント、社員のやる気、キャリア意識、組織へのコミットメント、自主性、他者と連携を促す活動。。などいくつかあります。

お題に出てくる変数の種類はともかく、何が望ましい行動（今回であればイノベーション）をもたらす要因がなにかということを特定するのは人事としてはやりたいことの一つですね。

相関係数をPythonで出すだけなら前回と同じようにPandasを使って”データフレーム名.corr”で一度に出力することができます。

>|python|
import pandas as pd
df=pd.read_excel('AIHR_Statistics_dataset_2018.xlsx')
net=df.loc[:,["MEANINNOVATION", "MEANNORMCOMMIT", "MEANTI","MEANENGAGEMENT", "MEANPERSONALINIT","CSMnetworking","MEANCSM","MEANORGCOMMITMENT","MEANPROFCOMMIT","MEANTIMEPRESSURE","CLAGE","CLWORKEXP","CLGENDER"]]
cor=net.corr()
cor
||<

注：netでもともとのデータに入っていた列の中で関係のありそうな変数のみを抽出しています。

結果はこんな感じです。横にもそれぞれの変数の相関係数がでていますが、今回はInnovation（変数名:MEANINNOVATION)にかかる相関だけ見たいので割愛しています）

f:id:millebon:20210403150823p:plain

とても簡単ですね。簡単すぎて怖いくらいです。。

可視化の方法としては①ヒートマップ、②散布図があります。

ヒートマップはSeabornを使えば、先ほどのcor変数を入れ込むだけで簡単に作れます。

>|python|
import seaborn as sns 
sns.heatmap(cor, vmax=1, vmin=-1, center=0)
||<

ちょっと変数も多くてわかりにくいのですが、赤・青色とも薄い方が相関性が強いので、MEANTIやMEANPERSONALINIT、CSMNetworkingやMEANCSM、CLGENDERあたりが他よりも強いのかな。。という感じです。（今回は手法の説明がメインなのでそれぞれの変数がどういう意味を持つかは気にしないでください。。）

ヒートマップ出力結果

f:id:millebon:20210403151455p:plain

一方散布図はSeabornのペアプロット図を出力する1行を書けば一気に表示されますが、また見にくいです。。

>|Python|
sns.pairplot(net)
||<

ペアプロット出力結果

f:id:millebon:20210403152134p:plain

MEANINNVOATIONと他の変数の相関関係を観たいのであれば、matplotlibでPythonで出すだけなら前回と同じようにPandasを使って”データフレーム名.corr”で一度に出力することができます。

>|Python|
from matplotlib import pyplot as plt
for col in ([ "MEANNORMCOMMIT", "MEANTI","MEANENGAGEMENT", "MEANPERSONALINIT","CSMnetworking","MEANCSM","MEANORGCOMMITMENT","MEANPROFCOMMIT","MEANTIMEPRESSURE","CLAGE","CLWORKEXP","CLGENDER"]):
 net.plot(col, 'MEANINNOVATION', kind='scatter')
||<

以下出力結果の一部です。スクロールしていけば各変数とMEANINNOVATIONの相関性について大きな散布図で確認できます。

散布図出力結果（一部）

f:id:millebon:20210403152740p:plain

p値も一緒に出力したいのなら・・

こんなに簡単に出ると「これでいいのかしら？」と思ってしまうのが世の常（？）

そもそもこの相関係数が有意であるかどうかを確認しようと相関係数のp値も出すこととしました。

参考にさせていただいたのはこちらのブログです。

lognowa.com

ただし、こちらのプログラムは欠損値があるとうまくいかないので、元のnetというデータから年齢で欠損値があった2行を除いたnet_wnullというデータを作成して回しています。

>|Python|
#p値の検出
import itertools
import numpy as np
from scipy.stats import pearsonr 
for i, j in itertools.combinations(net_wnull, 2): #組み合わせでforループを実行
 x = net_wnull.loc[:,[i]].values
 y = net_wnull.loc[:,[j]].values
 a, b = pearsonr(np.ravel(x), np.ravel(y)) # リストを整形し相関係数:aとp値:bの計算
 if b.round(10) < 0.10: # p値 < 0.10print("=" * 45)
 print(i + "----" + j)
 print("相関係数:", a.round(4))
 print("p値:", b.round(4))
||<

MEANINNOVATIONとの相関結果はこんな感じです。そもそもP値が0.1より小さいものに絞っているため、元の変数よりも少ない結果になっています。

MEANINNOVATION----MEANTI　相関係数: 0.6484　p値: 0.0
MEANINNOVATION----MEANPERSONALINIT　相関係数: 0.3147　p値: 0.0038
MEANINNOVATION----CSMnetworking　相関係数: 0.4498　p値: 0.0
MEANINNOVATION----MEANCSM　相関係数: 0.3899 p値: 0.0003
MEANINNOVATION----CLGENDER　相関係数: -0.3473　p値: 0.0013

結論としては

　イノベーションと関係がありそうな変数は

　正の相関性があるものは　MEANTI, MEANPERSONALIT, CSMnetworking, MEANCSMの4つ、負の相関はCLGENDERの1つという感じですね。

次の作業としては前回行ったように、この絞られた変数の外れ値を確認して再度相関関係を回すといいのでしょう。

今回はここまでで。。

2021-03-28

ピープル・アナリティクスケーススタディ：相関性をPythonで検証！

ピープル・アナリティクス-Pythonで分析

今回のお題
前提に必要な検証を実施
外れ値を外して相関係数を出しなおす

f:id:millebon:20210327194603p:plain

今回のお題

前回に引き続きに引き続き、AIHR内の”Statistics in HR”にある人事に関する課題を統計で解決するという課題に取り組みたいと思います。

お題は、社員のネットワーキング活動とイノベーション（技術革新力）に関係性はあるかということです。

ネットワーキング活動が活発である社員がイノベーションをより生み出しているなら、会社としてはネットワーキング活動を促進していくといいのではという一つの仮説ができます。

こういう仮説に対する取り組みも人事としてはぜひしてみたいですよね。

データは前回と同様、社員の属性（年齢、所属、在籍年数、性別、年齢、学歴。。）やパフォーマンスなどの人事データとともに、社員同士でネットワーキング活動やイノベーションにつながる活動、などを評価した結果が入っています。

今回利用する統計分析手法は”ピアソンの相関係数”です。

ちなみに相関とは、字のごとく2つの変数（項目）の互いの関係です（統計検定2級教科書より）。

相関があるからといって因果関係があるといえるわけではないのですが、少なくとも関係性を統計的に見いだせることから、その2つの関係についてより考察するべきかどうかの判断材料にはなります。

相関性を表すのによく使われるのが、ピアソンの相関関数です。2つの変数にたいして共分散という値を出しそれを双方の標準偏差で割ります。

ピアソンの相関係数は-1から１の間をとり

　0.1-0.3 弱い相関性、0.3-0.5　中程度の相関性、0.5以上　強い相関性

というのが目安のようです。

　値がマイナスだと同じ基準で負の相関性があるということですね。

ちなみに、ピアソンの相関係数を出すのはPythonではとても簡単です。

Pandasを使って”データフレーム名.corr”で相関係数が出ます

>|python|
import pandas as pd 
innov_2.corr(method="pearson")
||<

＊innov_2はデータからネットワーキングと、イノベーションの指標を取り出したデータフレームです。

*相関係数を出す手法としてmethod="perason"を入れましたが入れなくても結果は同じでした。

結果はこんな感じ。まあ中程度の相関性があるというのが最初の結果ですね。

f:id:millebon:20210328085538p:plain

前提に必要な検証を実施

ただ、前回でも同様、そもそもピアソンの相関係数を使っていいのかという前提条件の検証が必要になります。

ピアソンの相関係数で必要なのは次の2つだということです。

1．各変数が正規分布に従っているか

2．変数が連続か

１については前回でもみましたが1）各変数でヒストグラムを書く　2）歪度を出す

というような方法があります。

　今回はネットワーキングの指標である”CSMnetworking"でのヒストグラムと歪度を出してみましょう。

>|python|
import matplotlib.pyplot as plt
innov_2["CSMnetworking"].hist()
||<

結果

f:id:millebon:20210328090633p:plain

うーん、少しいびつな感じですね。

>|python|
from scipy.stats import skew
innov_skew = skew(innov_2["CSMnetworking"])
print(innov_skew)
||<

上記で出た歪度も‐1.10。解説によると-1から1に入るのが適切だということなので、データを調整した方がいいのではということでした。

２については散布図を描いてみるのが一番いいということですね。

>|python|
innov_2.plot.scatter(x='CSMnetworking',y='MEANINNOVATION', alpha=0.5)
||<

f:id:millebon:20210328091159p:plain

こんな感じなので、まあ連続的といえます。

実際、相関関数は”目で確かめる”のが直感的に手っ取り早いです。散布図を描いて相関性がありそうかをつかんだうえで実際の統計手法を駆使するのがよさそうですね。

外れ値を外して相関係数を出しなおす

このように変数の正規分布に「？」がある場合、一つの手法として外れ値を外すという考え方があるそうです。

まず外れ値があるかということを確認するために箱ひげ図を描いてみましょう

>|python|
Networking=innov_2["CSMnetworking"]
plt.figure(figsize = (12,8))
plt.boxplot(Networking)
plt.show()
||<

f:id:millebon:20210328091747p:plain

こんな感じになりました。

ここでは箱ひげ図の詳細の説明は省略しますが、箱の上辺（第3四分位数）+1.5＊四分位範囲（箱の範囲）、下辺（第1四分位数）＋1.5＊四分位範囲から出たグラフ上の「○」を通常「外れ値」として取り扱います。

これをまず取り除いてそのあとイノベーションの評価を表す項目と再度相関係数を出すことにします。

>|python|
q1 = Networking.quantile(0.25)
q3 = Networking.quantile(0.75)
iqr = (q3 - q1)*1.5
limit=q1-iqr
||<

上記の内容を図で書くとこんな感じです。やはり図式化すると分かりやすいですね。

f:id:millebon:20210328093739p:plain

もともとネットワーキングとイノベーションの2変数を"innov_2"というデータフレームに入れていたので、ネットワーキングの変数である”CSMnetworking"から外れ値を除いたもので再度相関係数を出します。

>|python|
innov_2_woutliner=innov_2[innov_2["CSMnetworking"]>limit]
innov_2_woutliner.corr()
||<

結果は、ん？？相関性が下がった？？

f:id:millebon:20210328094232p:plain

勝手に相関性が上がると思い込んでいた私は「何かまずかっただろうか」と検証しましたが、答え合わせのビデオも同じ結果でした。。

いずれにせよデータを丁寧に取り扱うことは大事ですね。

2021-03-21

ピープル・アナリティクスケーススタディ：違う2グループの差をPythonで検証！

ピープル・アナリティクス-Pythonで分析

今回のお題
Pythonで結果はすぐ出ますが、その前提条件を確認するのが大事
前提に必要な条件を検証
参考リンク

f:id:millebon:20210321082614p:plain

今回のお題

ピープル・アナリティクスで統計を使って分析をしたいと考えても、どういう風に使えばいいのかがなかなか思いつきません。

今AIHRの”Statistics in HR”というオンライン講座で人事、ピープル・アナリティクスで活用できる統計を学んでいます。

この講座のいいところは、実際に実用できそうなケースが課題として与えられ、それに対する回答ビデオも用意されているところです。

ただ、若干難儀なのは、回答ビデオがSPSSかRを使ったもので、私が多少なりとも知識のあるPythonではないこと。。

Rをダウンロードしてやってみようとも思ったのですが、今後もPythonを使いたいと考えるとPythonで検証し、答え合わせや検証方法の参考としてビデオを見ることにしました。

今回のお題はこんな感じです。

利用できるデータ（エクセル）に含まれている内容

社員同士でのやる気、イノベーションにつながる行動、知識共有、ネットワーキング活動などを社員同士で評価した調査結果
社員の属性（年齢、所属、在籍年数、性別、年齢、学歴。。）やパフォーマンスなどの人事データ

人事マネージャーは「35歳未満の社員の方がイノベーションにつながる活動をより多くするので35歳未満の社員を採用する」ことを提案

現場のマネージャーはその主張に懐疑的なため、統計的に結果を提示することが必要

です。

人事を経験された方であればイノベーションという活動でなくても、年齢などグループによる差が実際に起きているのかということを知りたい場面があるかと思います。

では実際にどうやったのかを見ていきましょう

注意：データはAIHRに帰属しているため、考え方及びPythonでのプログラミングのみをいかに記述していきます。

Pythonで結果はすぐ出ますが、その前提条件を確認するのが大事

このお題で調べたいことは

”35歳未満のグループ”と”35歳以上のグループ”でイノベーションに対する行動が違うのか？

ということです。

幸いデータには年齢と、社員同士で行ったイノベーションに対する行動の評価がありますので、今回は、これを利用します。

また、少し統計を勉強されたことがあるのであれば、「対応のないt検定で検証できるのでは？」というアイデアも浮かぶかと思います。

ただ、そのアイデアが浮かんでもそれでいいのか自信を持てなかったりするんですよね。。そういう点で実際課題を与えられて「対応のないt検定でやるといいですよ」といわれると、同じようなケースに適用してみようという自信になるかと思います！

対応のないt検定自体の結果自体を出すのはpythonでは全く難しくありません。

注意：途中データの検証等行っていますが、そちらは今回省いています。

1）まずデータを読み込む（斜字がプログラミングです。'AIHR_Statistics_dataset_2018.xlsx'はデータセット名です）

　　import pandas as pd

　　data=pd.read_excel('AIHR_Statistics_dataset_2018.xlsx')

2）必要なデータセットのみ抜き出し、innov_1と命名（'CLAGE'が年齢、’MEANINNOVATION'がイノベーションに対する行動評価の平均です）。

　　innov_1=data.loc[:,["CLAGE","MEANINNOVATION"]]
　　innov_1.head()

3）35歳未満（innov_y)、35歳以上の(innov_s)の2グループを作る。

　　innov_y=innov_1.loc[innov_1['CLAGE']<35]

　　innov_s=innov_1.loc[innov_1['CLAGE']>=35]

4）それぞれのグループのMEANINNOVATIONデータを取り出す。

　　dataA=innov_y['MEANINNOVATION']
　　dataB=innov_s['MEANINNOVATION']

5）scipyにあるstats.ttest_ind関数を用いて検証（equal_var=Falseとしてそれぞれの分散は等しくないとしています）

　　from scipy.stats import ttest_ind

　　ttest_ind(dataA, dataB,equal_var=False)

結果は以下の通りでP値が0.13と高いため、2つのグループでは差がないと判断できたということになります。

　Ttest_indResult(statistic=-1.5276548241734522, pvalue=0.13083247153227473)

ただ、こんなに簡単に出てくると”これでいいの？？”と不安になります。

実はその前に、そもそも「対応のないt検定を使っていいのか」という前提を確認しないといけないんですね。

今回の課題で、その前提と前提の検証方法が明確になったので非常にすっきりしました。

前提に必要な条件を検証

回答ビデオによると検証しないといけないことは4つあります。

1.従属変数（＝今回の場合イノベーションに対する評価の平均）が正規分布(Normally Distributed)かどうか

こちらはヒストグラムを書いて確認します。Pythonのmatplotlibを使いました。（”innov”という変数は”MEANINNOVATION"の値だけを取り出すために作っています）

　import matplotlib.pyplot as plt

　innov=data.loc[:, ["MEANINNOVATION"]]

　innov.hist()

でてきたグラフはこんな感じで、（解説によると）ほぼ正規分布といえるということでした。

f:id:millebon:20210321092643p:plain

ほかの確認方法としては”尖度”を出すという方法です。グラフの左右へのゆがみを確認するというものですね。

Pythonでは以下のように実装しました。

　from scipy.stats import skew
　innov_skew = skew(innov)
　print(innov_skew)

結果は0.1722。解説によると、「正規分布といえる」としていいということです。

補足：正規性を検定方法で検出する方法を見つけましたので以下のブログをご参考にしてください。

millebon.hatenablog.com

2.従属変数が連続的な値かどうか

　こちらは1のヒストグラムを見ても連続的な値とわかるので特に検証する必要はありません。

3. 比較する２つの対象グループ分散は同一かどうか

こちらはルビーン検定というものを用いました。ここで出たP値は0.102。帰無仮説「2グループ間の偏差の絶対値の平均はたがいに等しい（＝分散が等しい）」という仮説を棄却できないP値なので、同一といえるということです。

　from scipy.stats import levene
　stat, p = levene(dataA, dataB, center='median')
　p

　ということは、

　前提の前のt検定で分散が等しくないと仮定していたのを修正しなきゃ！

　となりequal_var=True　としてみました。

　　ttest_ind(dataA, dataB,equal_var=True)

としてもP値は0.102なので結局2つのグループの平均には差が認められないということになったんですけどね。

4.比較する２つの対象グループは独立しているかどうか

　今回のグループは35歳未満と35歳以上のグループなのでそもそも重ならないですよね。なので、お互いグループとして独立しているといえます。

参考リンク

t検定については「ハンバーガー統計学」が役に立ちます。以前お世話になったサイトですが、今回また新たに参考にさせてもらいました。

どの検定手法を使うべきかは以下のサイト（英語ですが）が役に立ちます。残念ながらどのPythonコードを使うべきかはこちらにはないのですが。。（SAS, SPSS, Rを使う方にはいいのではないでしょうか）

stats.idre.ucla.edu

Pythonでの統計手法のCheat Sheeは別途見つけました。今回は過去勉強した内容などを探しながらコードを書きましたが、今後はこちらが参考になりそうです。

2021-03-13

パフォーマンスの分布は釣り鐘型ではなくロングテール型？

ピープル・アナリティクス

パフォーマンスと評価の分布が一致しない？
欧米トップ企業が評価をなくした理由はここにあった
分析を行うにあたっては要注意？

f:id:millebon:20210313093503p:plain

パフォーマンスと評価の分布が一致しない？

会社でパフォーマンスが高い人、平均的な人、低い人はそれぞれどれくらいの割合でいるのでしょうか？

私の頭の中では勝手に「平均的な人は一番多くて、高い人は少数、低い人も少数かな」みたいなイメージがありました。

いわゆる統計学的に言うと「正規分布（下のような釣り鐘型）」です。

f:id:millebon:20210313111935p:plain

多くの企業では人事評価には5段階、もしくは3段階や7段階といった奇数で真ん中の数字の評価が多く、平均から数字が大きい・小さくなればなるほど少なくなるという評価なのではないでしょうか？

実は、パフォーマンスの分布は正規分布ではなく、「ロングテール型」であるという調査結果をまとめた記事を見つけて衝撃を受けました。

Forbes.comというアメリカの有名な経済雑誌の「フォーブス」のサイトに掲載され、誰でも無料に読めますので、英語ですが是非読んでみてください。

>www.forbes.com

ロングテール型というのは以下のような形です。（自作なので見にくくてすみません。。）

f:id:millebon:20210313112758p:plain

ロングテールは、マーケティングでよく使われていますが、パフォーマンスに当てはめると以下のような感じです。

非常に優秀な少数のトップパフォーマー（パフォーマンスの高い人）がいる。
平均亭なパフォーマンスの人は非常に多くて、その中でも幅がある。
パフォーマンスの低い人は非常に少数。

欧米トップ企業が評価をなくした理由はここにあった

もちろん、すべての企業・職業がロングテール型かというとそうではありません。

伝統的な製造業や身体を駆使するサービス業ではパフォーマンスの差にそこまでの差は出せないでしょう。

一方、クリエイティビティや画期的なイノベーションを起こすことが必要な分野においては、一部の優秀な人のアイデアやそれを実現する力がビジネスの成功に大きく左右します。

いわゆる芸術家やスポーツ選手、音楽家の間では一部の天才がいるのと同じような分布になるというのですね。

現在のデジタルトランスフォーメーションが主流の市場で日本企業が勝てないのは、そうしたトップパフォーマーたちを見出し、うまく活用することができないからかもしれませんね。

この考え方を企業が採用し、評価するようになるとトップパフォーマーだけでなく、”平均パフォーマー”についても朗報です。

何故ならパフォーマンスの低い人は非常に少なく、比較的多くの高いパフォーマー（グラフの右側）がいるとなると、企業は”評価の低い人”を見つけ出そうとするのではなく、どうしたらみんながハイパフォーマーになるかという視点をもって、チームワークや人材育成に注力する結果になりうるかもしれないからです。

以前ブログで紹介した”ハーバードの個性学入門”で紹介した平均という思考を捨て個々人を重要視するという考えに通じますね。

millebon.hatenablog.com

また評価を受け取るというのは、私たちの脳を”恐怖心に陥れるか戦闘モード”にし、業績評価というのはパフォーマンスを低下させるというという調査結果もあります。

欧米トップ企業（マイクロソフト、IBM、アクセンチュア、GEなど）は年間の業績評価をやめているのもこういう背景があるのかもしれませんね。

分析を行うにあたっては要注意？

ピープルアナリティクスの分析では、パフォーマンスに影響する要素は何かということを調べるのは一大テーマとなります。

今改めて統計学をおさらいしていますが多くの分析手法は正規分布に従うということを前提になっています。

いまAIHRの "HR statistics"をオンライン受講中ですが以下の通り主な分析手法は正規分布であることが前提。

Tテスト（2つのグループ間における平均の違いの有意性を調べる）
単回帰分析（1変数を1変数で分析）
重回帰分析（複数変数で1変数を分析）

どのように分析するのがいいのか、統計初心者の私には謎が深まるばかりです。。

2021-03-06

AI HR / myHRfuture: ピープル・アナリティクスやHRテクノロジーについて学べる学習プラットフォーム

資格・学習法

ピープル・アナリティクスについての本はありますが・・
AI HR / myHRfutureを使ってみました！

f:id:millebon:20210306133004p:plain

ピープル・アナリティクスについての本はありますが・・

ピープル・アナリティクスとは「人材マネジメントにまつわる様々なデータを活用して、人材マネジメントの意思決定の精度向上や業務の効率化、従業員への提供価値方法を実現する手法（「ピープル・アナリティクスの教科書」(日本能率協会マネジメントセンター刊）」です。

これだけデータやAIがマーケティングやセールス、製造現場を変えている中、人材育成や組織でもデータを活用していこうというものですね。

個人的にこの分野に興味を持ってから、アマゾンなどで本を探し何冊かの本を読みました。

以下のような本を読みましたが、「もっとより突っ込んで勉強したい！」と思った時に日本語ではなかなか学習ツールがないんですよね。。

ピープルアナリティクスの教科書

HRテクノロジーで人事が変わる

発売日: 2018/08/30
メディア: Kindle版

データ・ドリブン人事戦略データ主導の人事機能を組織経営に活かす

作者:バーナード・マー
発売日: 2019/06/19
メディア: 単行本

ということで、英語で検索してみるとあるじゃあないですか！！

昨年末ググッっていて面白そうだなと思った2つのラーニングプラットフォームがありました。

AI HRとｍｙHRfutureです。

どちらも一度試してみて、今はAIHRの18か月受講し放題コースを受けています。

今日はこの二つを使って感じた特徴などをご紹介しますね。

AI HR / myHRfutureを使ってみました！

AIHR

www.aihr.com

AIHRはオランダをベースにした会社が提供している、HR（人事）向けにアナリティクス（分析）やデジタルに関するオンライントレーニングプラットフォームです。

コースは以下のようなものが20種類以上あります。それぞれのコースの学習時間は短いもので8時間、長いもので40時間程度あります。

ダイバーシティ＆インクルージョン
ピープルアナリティクス
デジタルHR
HRビジネスパートナー2.0
HRの指標・レポーティング
ブロックチェーンとHR
能力開発
採用
デジタルトランスフォーメーション

AIHRのいいところをまとめると

それぞれのコースの内容が体系立ててよく作られており、比較的じっくりそのテーマについて学べる
レクチャーだけでなく参考資料やお役立ちリンクも提供
スタッフがメールや電話でアドバイスを提供してくれる
学習者（各国のHR担当者）やスタッフに質問やアドバイスを求められることができる（そこまで活発な議論ではないですが。。）

一方、デメリットとしては

1コースそれなりのお値段がする（4,00USドル（4.3万円）～1000USドル（11万程）程度）
18か月無制限無制限コース（1,797USドル(19万円程度））が一番お得だが、一気に投資をするにはそれなりの覚悟がいる

というところでしょうか。

なので、比較的アプローチしやすいmyHRfutureを受講してから、「気に入らなければ2か月以内だったら全額返金してくれるし」ということで受講を決めました。

今受講して2か月程度たちますが、学びがいろいろあり満足しています。

myHRfuture

www.myhrfuture.com

myHRfutureはInsight222というイギリスベースのコンサルティング会社が運営しているオンラインラーニングプラットフォームです。

扱うテーマはAIHRとほぼ変わりませんが、AIHRのように講座としてまとまっているのではなく、細かいモジュール（1つ数時間程度）を自分の好みに合わせて受講していくというような感じです。

myHRfutureのいいところは

1か月32ドル（3,500円程度）、1年320ドル（35,000円程度）とお手軽な値段で受講ができる。
1か月単位での申し込みの場合いつでもやめることができる
モジュールが細かいため、興味のある分野だけを気軽に学ぶことができる

一方デメリットは

モジュールが短いため、体系的な知識やスキルを得られた感じがしない

ということです。

ある程度ピープルアナリティクスやデジタルの基礎がある人には少しずつアップデートができていいのかもしれません。私はより体系的に学ぶことが必要だと思ったので、1か月いくつかのモジュールを受けてから退会しました。

とはいうものの、無料でも見られるいいコンテンツもおおくあるので、ニュースレターは購読中です。特にPodCastでは世界の一流企業のHRリーダーのデジタル戦略などが聞けるので英語の勉強もかねておすすめです。

www.myhrfuture.com

これからはAIHRで学んだことなどからピープルアナリティクスについて書ければいいなと思っています。

2021-02-27

ブログの内容を刷新します！

雑感

f:id:millebon:20210227131534p:plain

気づいたら、ブログを書いて早3年近くが経ちます。

アクセス回数は気にならないと言えばうそになります。

ただそれよりも、ブログというアウトプットを通じて、読書やハーバードビジネスレビューなどの記事への理解に役に立っているという方が大きいです。

この3年を通じていろいろ自分の興味がかなり変わってきました。というよりも、こうしたいという方向性が見えたという方が正しいと思います。

それは

　　データとハートを重要視した組織・人材づくりに役に立ちたい！

ということです。

この15年近く人事マネージャーとして働いてきて思うのが「直感・経験とデータのバランスの重要さ」です。

ただ、人事の分野では人事部やリーダーの勘・経験（時には感情）で意思決定が行われ、人事の分野ではまだデータが十分に活用されているとはいえません。

データから見た世の中は、人の直感とはかなり異なるものだということはFactfulness（ファクトフルネス）でも書かれていたところです。

　millebon.hatenablog.com

かといってデータだけですべてが解決するのか、というとそうではないと思います。いろんなものがデータ化・自動化する中で、一人一人の成長こそが企業においては成長の鍵であり、より個々人に応じたの対応が求められると思います。

昨年からコーチングを学び始め、「相手ファースト」の考え方がいかに重要かを感じました。

ということで今後ブログでは以下のようなテーマをメインに扱っていきたいなと思っています。

　１．ピープルアナリティクスのトレンド・実例

　２．データを扱うための統計手法・プログラミング・アプリケーションの活用

　３．コーチングについて

　４．趣味について（登山・ジョギング）

どうぞよろしくお願いいたします！

2021-02-13

「超訳　易経」から生き方のヒントを学ぶ-万物の変化と自然の原理にしたがうことの大切さ-

読書・記事読書・記事-その他

「易」とは変化すること
「易の三義」・陰陽
「龍」の話から成長の過程での接し方を学ぶ

f:id:millebon:20210213142542g:plain

Vectorjuice - jp.freepik.com によって作成された woman ベクトル

「易」とは変化すること

コロナ禍で良かったなと思う一つのことがリモートで様々な勉強会に参加できたこと。

コロナ前は、ネットで探したセミナーを見て「参加したいな」と思ってもほとんどが東京であきらめていました。

昨年末からふとした縁で参加している勉強会で「易経」についての紹介があり、早速取り寄せて読んでみることに。

いろいろな本が出ていますが、その会でおすすめされた竹村亜希子さんの「超訳　易経陽」と「超訳　易経　陰」を読みました。

超訳易経陽―乾為天

作者:竹村亞希子
発売日: 2020/02/15
メディア: 単行本（ソフトカバー）

超訳易経陰―坤為地ほか

作者:竹村亞希子
発売日: 2020/09/28
メディア: 単行本（ソフトカバー）

易経は占いの書として発祥し、一説によると約5000年前に記されたといわれているそうです。

「易（えき）」というと私は占いよりも「た易い（たやすい）」といったイメージの方が強いのですが、「変化」を意味するそうです。

ちまに「易」という字は、蜥蜴（トカゲ）－光の変化によって日に12回体の色を変えるところからきているということでした。面白いですね。

「易の三義」・陰陽

私がこの本を読んでみようと思ったのは、勉強会で紹介された「易の三義」、すなわち易という字の3つの意味でした。それは「変易（へんえき）」「不易（ふえき）」「易簡（簡易）（いかん・かんえき）」の3つで以下のような意味があるということです。

1．変易：「変化」という意味でこの世のすべてのものごと、人も物も自然もひと時足りも変化しないものはなく、常に変化をし続けているということ。

2．不易：「不変」という意味。その変化には必ず、春夏秋冬の季節の巡り、朝昼晩という1日の巡りなど一定不変の「変わらない」法則性があるということ。

３．易簡（簡易）：「易しい、簡単」という意味。「変易」「不易」があらわす変化と不変の法則に基づいてものごとは変化していることを私たち人間が理解できたなら、何事もわかりやすくなり、悩み事や問題もスムーズになり、あらゆる意味で行きやすくなるということ。

この「易の三義」を聞いて、「まさにそうだ」と思っていたことを端的に表してくれていたのですごく衝撃を受けました。

5000年も前から人はこのような原則を知っていたのですね！でもどれだけの人がこれを実践できているかは（自分も含め）「？」です。

むしろ今コロナでのさまざまな意見の分断を見るといかに実践するのが難しいかということでしょう。

また、易経の原理原則にあるのが「陰と陽」だということなのです。「陰と陽」とは互いに対立する属性を持った二つの気のことで、あらゆる事象はすべて陰と陽で成り立っているということなんですね。

一般的に「陽＝プラス」「陰＝マイナス」といったイメージがありますが、両方重要だという考えに基づいています。

例えば陰陽を説明する代表例が「地（＝陰）」と「天（＝陽）」。天の日差しを浴びて大地の万物は育ちますが、かといって万物は住む大地がなければ育つことはできません。

つい私たちは「どちらかが正しい」「どちらかが間違っている」とか、「どちらかがいい」「どちらかが悪い」と二元論で考えてしまいますが、両方大事だと考えられる視点を持つと違った視点から物事が考えらえる感じがします。

「龍」の話から成長の過程での接し方を学ぶ

さて、「易経」には64の物語があり、「超訳　易経　陽－乾為天」ではその中の一つ「龍」のお話、もう一つの「陰」の本では他の物語を紹介しています。

龍のお話はリーダーがたどっていく道筋のお話といわれ、6つの龍の段階を示しています。内容を見るとリーダーだけでなく人生全体、何かを学ぶときの過程でも当てはまるのではないかと思います。

潜龍：地中深くの暗い淵に潜み隠れている龍。まだ世の中に認められるような力もなく、地に潜んで志を培うとき • 潜龍：地中深くの暗い淵に潜み隠れている龍。まだ世の中に認められるような力もなく、地に潜んで志を培うとき。
見龍：明るい地上に現れ、世の中が見えるようになる。修養の始めとして、師を見習って物事の基本を学ぶ。
乾惕（けんてき）：毎日同じことを繰り返して修養に励む。わざと応用を身に着け、日進月歩の成長をするとき。
躍龍：修養を極め、リーダーになる一歩手前の段階。独自性をもって、今まさに大空へ登ろうと躍り上がる。
飛龍：天を翔け、雲を呼び、雨を降らす。リーダーとしての能力を発揮し、志を達成。
亢龍（こうりゅう）：高ぶる龍という意味。高みに登りすぎた龍は、力が衰えて下り龍になる。

最後が「亢龍（こうりゅう）（力の衰えた龍）」というのが事実をグサッと指してくれる感じがします。

また、それぞれの段階でどのようにふるまうかのアドバイスもあります。

例えば絶好調である「飛龍」の時には、「周りの人から学ぶことができれば長くとどまることが可能」。「飛龍から亢龍に没落する」は人の意見に耳を傾けること、クレームに対して改めること、反省すること、労力を惜しむことをけちることから始まる。。頭の痛い話ですよね。

このような古典で現在に通じる原理原則を教えられると、人間は理解よりも実行の方が難しいことを改めて感じさせられます。

ちなみに陰にあったいくつか物語は難しくて1回読んだだけでは理解できなかったので、また時間をおいてじっくり読んでみたいと思っています。

2021-01-30

2021年以降働き方はどう変わる？②：ハーバードビジネスレビューの記事から学ぶ

読書・記事読書・記事-働き方

労働時間＝仕事の価値・量という呪縛から解放されるかどうか？
ワクチン接種で企業が訴えられる？
この記事を読んで

f:id:millebon:20210130084317j:plain

Freepik - jp.freepik.com によって作成された health ベクトル

労働時間＝仕事の価値・量という呪縛から解放されるかどうか？

先週からの続きで9つのトレンドのうち、気になった残り２つについてご紹介したいと思います。

millebon.hatenablog.com

５．Flexibility will shift from location to time. (勤務場所ではなく労働時間に対する柔軟性に移行する）

こちらもテレワークが2020年で根付いた、勤務場所の柔軟性は確保されたという前提でのお話ですね。

筆者の所属するGartner社の調査によると会社で週40時間固定の勤務の場合、ハイパフォーマーは40％であるのに対し、場所や時間に柔軟性を持たせるとその割合は55%にまで高まるというのです。（本調査のプレスリリースはこちらから（英語です））

この結果より働き場所や時間に柔軟性を持たせると社員にとってだけでなく、企業にとってもいいということなんですね。

こちらは日本の制度とは隔世の感があります。事務職でも管理職を除いては労働時間に基づいた給与が支払われています。また、過労死問題などから企業はいつ仕事を始めて終えているのか把握をすることが義務付けられています（興味のある方はガイドをこちらからご参照ください）。

よく政府のガイドでは労働時間は”使用者の指揮命令下に置かれている”という言葉を用いられています。柔軟性とは対極的な考え方ですね😅。

ワクチン接種で企業が訴えられる？

６．Leading companies wil make bulk purchases of the Covid vaccine for employees- and will be sued over Covid vaccine requirements. (大企業は社員向けにワクチンを大量購入し、またワクチン接種の義務付けにより訴訟を起こされる）

企業がワクチンを購入するという前段の下りは日本では起こりえないことかと思いますが、後半は日本でもワクチン接種が一般に開始されたときに起こりうる問題ではないでしょうか？

サービス業など人と近い距離で接する必要がある仕事、現場でなければ行えない仕事では、「ワクチンを受けてもらう」ということを雇用の前提として考える企業も多いでしょう。

ただ、ワクチンの接種自体は個人の意思を尊重することになるでしょうから、ワクチンを受けないことにより採用しない、もしくは解雇するということが許されるのかどうかというところですね。

筆者は、こうした訴訟が起こることでワクチンが普及しても職場への復帰は緩やかに進むだろうといっています。

ちなみに日本では昨年12月にトレンドリサーチが行った調査によると、承認後すぐに受けたい人は2割、受けたくない人も2割います。実際接種が始まるとどうなるかはわかりませんが、受けない従業員に対して企業の対応が少なからず問われることになるかと思います。

trend-research.jp

この記事を読んで

このトレンドは調査結果から今年以降このようなことが起こるのではという予測なので、実際にどこまで実現するかどうかわかりません。

一方、日本ではこういう予測までに至るのが難しく、これを機にどこまで働き方が変わるのか、会社は社員とどう向き合うべきかという方向が見えていないような気がします。

とはいってもこのトレンドが日本に無関係かというとそうではないと思います。柔軟な働き方になればなるほど勤務地としての国の意味が薄れてくるでしょうから。

2021年どのような年になるか、楽しみですね😊。

2021-01-23

2021年以降働き方はどう変わる？①：ハーバードビジネスレビューの記事から学ぶ

読書・記事読書・記事-働き方

アメリカではコロナ収束後もリモート可能が前提？
2021年以降の働き方のトレンド9つ
テレワークの普及により男女の賃金格差が広がる？

f:id:millebon:20210123082757g:plain

Freepik - jp.freepik.com によって作成された medical ベクトル

アメリカではコロナ収束後もリモート可能が前提？

2020年はコロナによって働き方が大きく変わった人も多いのではないでしょうか？

私もその一人でこれほど家にこもり、働くことになるとは思いませんでした。

年末にはワクチンが承認され明るい兆しも出てきていますが、落ち着いた後テレワークはどうなるのでしょうか？

コロナ禍で継続的にテレワークの実態調査を行っているパーソル研究所によるとコロナ収束後もテレワークを希望している社員は78.6％と調査を重ねるごとに希望する割合が上がってきています。

prtimes.jp

といいつつ、同調査の3割の企業は「収束後は全員出社に戻す」と回答しているので、日本ではテレワークがどれだけ継続するかは疑問なところはあります。

そうした中、ハーバードビジネスレビュー（HBR）で2021年以降の働き方の9つのトレンドを紹介した記事がありましたのでこちらをご紹介したいと思います。

タイトルは”9 Trends Tha Will Shape Work in 2021 and Beyond(2021年以降の働き方の9つのトレンド）"です。

hbr.org

＊記事の購読は定期購読者以外は3本まで無料。その後は1記事当たり約9ドル課金されます。

筆者はGartner社という世界的な調査・コンサルティング会社のHR部門の調査部長です。2020年にはコロナでリモートワークをする労働者が大幅に増加したという変化ががありましたが、2021年以降変化はさらに続くと予想しています。

2021年以降の働き方のトレンド9つ

9つのトレンドは以下の通りです。コロナの影響が大きいことはもちろんですが、コロナ以降のリモートワークが前提だというところもまた興味深いですね。

Employers will shift from managing the employee experience to managing the life experience of their employees. (企業は働き方におけ会社での働き方だけでなく社員の生活全体を考慮する方向に移行する）
More companies will adopt stances on current societal and political debates. (より多くの企業が現在の社会・政治的議論に対して行動をとる）
The gender-wage gap will continue to increase as employees return to the office. (社員が出社できるようになると男女間での賃金格差が広がる）
New regulations will limit employee monitoring. (社員の（遠隔）監視を制限する規制が導入される）
Flexibility will shift from location to time. (勤務場所ではなく労働時間に対する柔軟性に移行する）
Leading companies wil make bulk purchases of the Covid vaccine for employees- and will be sued over Covid vaccine requirements. (大企業は社員向けにワクチンを大量購入し、またワクチン接種の義務付けにより訴訟を起こされる）
Mental health support is the new normal. (社員のメンタルヘルスへの支援が普通になる）
Employers will look to 'rent' talent to fill the skills gap. (企業は不足するスキルを補うために、人材を”借りる”）
States will compete to attract individual talent rather than trying to get companies to relocate. （州政府は企業誘致ではなく個人の移住誘致を競い合う）

テレワークの普及により男女の賃金格差が広がる？

9つの中で私が注目したのは赤字の3つです。

３．The gender-wage gap will continue to increase as employees return to the office. (社員が出社できるようになると男女間での賃金格差が広がる）

この理由は以下の通りです。

普通出社できるようになりテレワークが選択制になった場合、会社に戻る割合は男性の方が多くなる。

↓

上司は会社で仕事をする社員の方が、テレワークで働く社員よりもパフォーマンスが高い社員だと考えている。

↓

男性の給与が高くなる。

ということなのです。日本でも同じような傾向や上司の考え方がありそうですよね。

ただ、パフォーマンスの調査の結果は逆だというのです。

テレワークの社員の方が5%オフィスワーカーよりもハイパフォーマーである確率が高いというのです。

となると本当はパフォーマンスが高い社員が在宅かどうかにより不当な評価をされることにつながりかねません。

日本ではテレワークに対するパフォーマンスに疑義を抱いている上司はさらに多いと思いますし、そういう点でテレワークをするかしないかによる評価の違いには注視する必要がありそうですね。

次回は残り2つのトレンドについてもう少し深彫りをしたいと思います。

日々学び、感謝し、成長する

データとハートを活かす人事を目指した成長奮闘記（？）です

ピープル・アナリティクスケーススタディ：単回帰分析に挑戦！

単回帰分析もまずは散布図を描くことから始める！

単回帰分析を実施！

決定済み係数の大小はあまり問題ではない？？

ピープル・アナリティクスケーススタディ：複数の変数の相関係数を一度に出力！

相関係数を一度に出力する方法

p値も一緒に出力したいのなら・・

ピープル・アナリティクスケーススタディ：相関性をPythonで検証！

今回のお題

前提に必要な検証を実施

外れ値を外して相関係数を出しなおす

ピープル・アナリティクスケーススタディ：違う2グループの差をPythonで検証！

今回のお題

Pythonで結果はすぐ出ますが、その前提条件を確認するのが大事

前提に必要な条件を検証

参考リンク

パフォーマンスの分布は釣り鐘型ではなくロングテール型？

パフォーマンスと評価の分布が一致しない？

欧米トップ企業が評価をなくした理由はここにあった

分析を行うにあたっては要注意？

AI HR / myHRfuture: ピープル・アナリティクスやHRテクノロジーについて学べる学習プラットフォーム

ピープル・アナリティクスについての本はありますが・・

AI HR / myHRfutureを使ってみました！

ブログの内容を刷新します！

「超訳　易経」から生き方のヒントを学ぶ-万物の変化と自然の原理にしたがうことの大切さ-

「易」とは変化すること

「易の三義」・陰陽

「龍」の話から成長の過程での接し方を学ぶ

2021年以降働き方はどう変わる？②：ハーバードビジネスレビューの記事から学ぶ

労働時間＝仕事の価値・量という呪縛から解放されるかどうか？

ワクチン接種で企業が訴えられる？

この記事を読んで

2021年以降働き方はどう変わる？①：ハーバードビジネスレビューの記事から学ぶ

アメリカではコロナ収束後もリモート可能が前提？

2021年以降の働き方のトレンド9つ

テレワークの普及により男女の賃金格差が広がる？