ノンパラメトリック手法

ノンパラメトリック: non-parametric)な手法とは、統計学において、少数のパラメータ母数: 母集団を規定する量)で表現されるモデル確率分布を使用する物をパラメトリックな手法と呼ぶが、そうで無い手法をノンパラメトリックな手法という。回帰・分類・密度推定(英語版)仮説検定などそれぞれの統計学の分野でノンパラメトリックな手法がある。ノンパラメトリック検定は、特定のパラメトリックな確率分布に依存しない仮説検定 (distribution-free test) である[1]

適用と目的

ノンパラメトリック手法は順序尺度、例えばレストランの人気ランキングなどを分析する際によく使われる。ランキングには順序が反映されるものの、はっきりとした数値(比率尺度間隔尺度)を提供されない尺度である。尺度水準という点で、ノンパラメトリック手法は順序尺度に基づくものである。データの順序尺度に基づくソートした結果があれば、経験累積分布関数を作ることが出来、ノンパラメトリック検定ではそれを利用する。

ノンパラメトリック手法はパラメトリック手法と比べて、母集団の分布などの前提を必要としない。そのためノンパラメトリック手法は広きにわたり適用できる(汎用性がある)。事前に詳しい事が解っていないデータや、社会科学心理学におけるアンケート調査の分析などにおいて、ノンパラメトリック手法は広く使用されている。

ノンパラメトリック検定は、対応するパラメトリック検定(もし前提条件が満たされていれば)と比べて「パワー」が弱い。つまりパラメトリック検定と同じ「信頼」を得ようとした場合、ノンパラメトリック手法ではより多くの標本数を要することになる。パラメトリックとノンパラメトリックには、頑強性と効率性の間でのトレードオフが生じている訳である。ただし、例えば正規分布の場合、最善はパラメトリック検定のt検定であるが、ノンパラメトリック検定のウィルコクソンの符号順位検定を用いても、必要なデータ数は π / 3 {\displaystyle \pi /3} = 約1.05 倍であり、5%程度多めに標本が必要なだけである[2]

生態学などにおいて少数の標本しか調査できない場合など、ノンパラメトリック分析が多く使われる。ただし、パラメトリックの代替手法としてノンパラメトリック手法を使用した場合、根本的な帰無仮説が全く異なることに注意しなければならない。例えば独立二群のt検定の帰無仮説はμ1μ2であるのに対し、それに対応するマン・ホイットニーのU検定ではP(xi>yj)=0.5である。

各種のノンパラメトリック手法

ソフトウェア

  • R言語 - 各種のノンパラメトリック検定を含む統計解析ができるフリーの統計環境。
  • js-STAR[3] - フリーの分散分析ツールであるが、χ2検定や直接確率計算、Q検定なども行うことができる。
  • Excel NAG統計解析アドイン[4] - Microsoft Excelにノンパラメトリック統計関数を追加する。

脚注

  1. ^ JIS Z 8101-1 : 1999 統計用語記号 − 第1部:確率及び一般統計用語 2.58 分布によらない検定, 日本規格協会, http://kikakurui.com/z8/Z8101-1-1999-01.html
  2. ^ 村上秀俊『ノンパラメトリック法 (統計解析スタンダード)』朝倉書店、2015年、107頁。ISBN 4254128525。 
  3. ^ “js-STAR 2012”. 2013年8月9日閲覧。
  4. ^ “Excel NAG 統計解析アドイン”. 日本ニューメリカルアルゴリズムズグループ株式会社. 2013年8月9日閲覧。

参考文献

関連項目

標本調査
要約統計量
連続確率分布
位置
分散
モーメント
カテゴリデータ
推計統計学
仮説検定
パラメトリック
ノンパラメトリック
その他
区間推定
モデル選択基準
その他
ベイズ統計学
確率
その他
相関
モデル
回帰
線形
非線形
時系列
分類
線形
二次
非線形
その他
教師なし学習
クラスタリング
密度推定(英語版)
その他
統計図表
生存分析
歴史
  • 統計学の創始者
  • 確率論と統計学の歩み
応用
出版物
  • 統計学に関する学術誌一覧
  • 重要な出版物
全般
その他
カテゴリ カテゴリ