ケンドールの順位相関係数

ケンドールの順位相関係数(けんどーるのじゅんいそうかんけいすう、ケンドールのタウ係数、: Kendall rank correlation coefficient)は、順位(Ranking)間の相関計測に用いられ、相関の強さを表す。言い換えれば、それは複数のデータ間(cross tabulations)の関連性(association)の強さを表す。1938年にモーリス・ケンドール(Maurice Kendall)によって開発された。

順位相関を計測する別の方法としてはスピアマンの順位相関係数があるが、両者はほぼ同じ傾向を示す[1]

定義

順位データ x = (x1, …, xn) と y = (y1, …, yn) とのケンドールの順位相関係数 τ は次で定義される[2]

τ = K L ( n 2 ) K = # { { i , j } ( [ n ] 2 ) x i x j ,   y i y j } L = # { { i , j } ( [ n ] 2 ) ¬ ( x i x j ,   y i y j ) } {\displaystyle {\begin{aligned}\tau &={\frac {K-L}{\binom {n}{2}}}\\K&=\#\left\{\,\{i,j\}\in {\binom {[n]}{2}}\mid x_{i}\lessgtr x_{j},\ y_{i}\lessgtr y_{j}\,\right\}\\L&=\#\left\{\,\{i,j\}\in {\binom {[n]}{2}}\mid \neg (x_{i}\lessgtr x_{j},\ y_{i}\lessgtr y_{j})\,\right\}\end{aligned}}}

ここで K(または L )は n 項目から2項目を選んだときに順位関係が一致(または不一致)する組の数である。τ の分母は二項係数である。# は元の個数(濃度)を表す。また [ n ] := { 1 , , n } {\displaystyle [n]:=\{1,\dotsc ,n\}} であり、集合 X自然数 k に対して ( X k ) {\displaystyle {\binom {X}{k}}} Xk 個の元からなる部分集合全体を表す。 {\displaystyle \lessgtr } は < または > を表し(複号同順)、 ¬ {\displaystyle \neg } は否定を表す。

特性

ケンドールの順位相関係数 τ は以下の特性を持つ。

  • 順位が完全に一致している(すなわち L = 0)ならば τ = +1 である。
  • 順位が完全に一致していない(すなわち K = 0)ならば τ = −1 である。
  • 他のすべての場合には係数の値は−1と+1の間にあり、値の増加は相関の増大を意味する。順位が完全に独立しているなら、係数の値は0である。

参考文献

  • 脇本和昌『身近なデータによる統計解析入門』森北出版、1973年。ISBN 4627090307。http://ebsa.ism.ac.jp/ebooks/ebook/1321 
  • Abdi, H. (2007) Kendall rank correlation. In N.J. Salkind (Ed.): Encyclopedia of Measurement and Statistics. Thousand Oaks (CA): Sage. [3]
  • Kendall, M. (1948) Rank Correlation Methods, Charles Griffin & Company Limited
  • Kendall, M. (1938) "A New Measure of Rank Correlation", Biometrika, 30, 81-89.

脚注

  1. ^ 脇本 1973, p. 24.
  2. ^ 脇本 1973, p. 23.
  3. ^ The Kendall Rank Correlation Coefficient

関連項目

外部リンク

  • 棄却限界値の数表Pestman, Wiebe R. (2009). Mathematical statistics. de Gruyter Textbook (Second ed.). Walter de Gruyter. ISBN 978-3-11-020852-8. MR2516478. Zbl 1251.62001. https://books.google.com/books?id=9QHcJ8WQQ5UC 
  • Why Kendall tau?
  • Online software: computes Kendall's tau rank correlation
  • Test for Association/Correlation Between Paired Samples—R言語ではcor.test(x, y, method="kendall")で τ が計算できる
標本調査
要約統計量
連続確率分布
位置
分散
モーメント
カテゴリデータ
推計統計学
仮説検定
パラメトリック
ノンパラメトリック
その他
区間推定
モデル選択基準
その他
ベイズ統計学
確率
その他
相関
モデル
回帰
線形
非線形
時系列
分類
線形
二次
非線形
その他
教師なし学習
クラスタリング
密度推定(英語版)
その他
統計図表
生存分析
歴史
  • 統計学の創始者
  • 確率論と統計学の歩み
応用
出版物
  • 統計学に関する学術誌一覧
  • 重要な出版物
全般
その他
カテゴリ カテゴリ