予測区間

予測区間（よそくくかん）とは統計学用語で、母集団を仮定した上で、将来観察されるであろう標本値（現在は測定できない）に対して「どの範囲にあると予測されるか」を示すものである。

これに対し、信頼区間とは、母集団の母数（標本から測定できない）に対して「どの範囲にあると推定できるか」を示すものである。混同しないように注意。

例

正規分布に従う母集団から標本を抽出したとしよう。母集団の平均と標準偏差は不明である（標本から推定できるのみ）。n を標本サイズ、 μと σ を母集団の平均と標準偏差とし、 X₁, ...,X_n を現在までの標本として、これから次の観察値X_n+1 を予測したい。現在までの標本の平均および分散を

{\overline {X}}_{n}=(X_{1}+\cdots +X_{n})/n

S_{n}^{2}={1 \over n-1}\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}

とする。ここで次の数値：

{T_{n-1}}\sim {X_{n+1}-{\overline {X}}_{n} \over {\sqrt {S_{n}^{2}+S_{n}^{2}/n}}}={X_{n+1}-{\overline {X}}_{n} \over S_{n}{\sqrt {1+1/n}}}

を考えると、これはスチューデントのt分布（自由度 n − 1 ）に従うことが示される。従って

\Pr \left({\overline {X}}_{n}-T_{a}S_{n}{\sqrt {1+(1/n)}}\leq X_{n+1}\leq {\overline {X}}_{n}+T_{a}S_{n}{\sqrt {1+(1/n)}}\,\right)=p

とすれば、T_a は自由度 n − 1 のt分布における 100((1 + p)/2)パーセント点である。そして

{\overline {X}}_{n}\pm T_{a}{S}_{n}{\sqrt {1+(1/n)}}

という数値が X_n+1 に対する100p%予測区間の境界を表す。

例えば p = 0.95 とすれば、95%予測区間ということになる。

ポータル数学

位置	平均算術幾何調和中央値分位数順序統計量最頻値階級値
分散	範囲偏差偏差値標準偏差標準誤差変動係数決定係数相関係数自己相関共分散自己共分散分散共分散行列百分率統計的ばらつき
モーメント	分散歪度尖度

カテゴリデータ

パラメトリック	t検定ウェルチのt検定 F検定 Z検定二項検定ジャック-ベラ検定シャピロ–ウィルク検定分散分析共分散分析
ノンパラメトリック	ウィルコクソンの符号順位検定マン・ホイットニーのU検定カイ二乗検定イェイツのカイ二乗検定累積カイ二乗検定フィッシャーの正確確率検定尤度比検定 G検定アンダーソン–ダーリング検定コルモゴロフ–スミルノフ検定カイパー検定マンテル検定コクラン・マンテル・ヘンツェルの統計量
その他	帰無仮説対立仮説有意棄却

区間推定

モデル選択基準

その他

確率	主観確率ベイズ確率事前確率事後確率最大事後確率
その他	ベイズ推定ベイズ因子

モデル

線形	リッジ回帰ラッソ回帰エラスティックネット
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシン射影追跡回帰
時系列	自己回帰モデル自己回帰移動平均モデル ARCHモデル対移動平均比率法トレンド定常傾向推定共和分構造変化

分類

線形	線形判別分析ロジスティック回帰 <! -- 名前に回帰とついていますが確率を回帰する分類手法です --> 単純ベイズ分類器単純パーセプトロン線形サポートベクターマシン
二次	二次判別分析
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシンベイジアンネットワーク隠れマルコフモデル
その他	二項分類多クラス分類第一種過誤と第二種過誤