非線形回帰

回帰分析
統計学

モデル
線形回帰線形単回帰（英語版）多項式回帰一般線形モデル
一般化線形モデル離散選択（英語版）ロジスティック回帰多項ロジット（英語版）混合ロジット（英語版）プロビット（英語版）多項プロビット（英語版）順序ロジット（英語版）順序プロビット（英語版）ポアソン（英語版）
多水準モデル（英語版）固定効果（英語版）変量効果混合モデル
非線形回帰ノンパラメトリック（英語版）セミパラメトリック（英語版）ロバスト（英語版）分位点（英語版）等調（英語版）主成分（英語版）最小角度（英語版）局所折れ線（英語版）
変数誤差（英語版）
推定
最小二乗法線形（英語版）非線形
普通（英語版）加重（英語版）一般化（英語版）
部分総最小二乗法（英語版）非負（英語版）リッジ回帰正則化（英語版）
最小絶対偏差（英語版）繰返し加重（英語版）ベイズ（英語版）ベイズ多変量（英語版）
背景
回帰検証（英語版）平均応答と予測応答（英語版）誤差と残差適合度（英語版）スチューデント化残差ガウス＝マルコフの定理
表話編歴

統計学において、非線形回帰（ひせんけいかいき、英: Nonlinear regression）は、観測から得られたデータがモデルパラメータの非線形結合であり、1つ以上の独立した変数に依存する関数によってモデル化される回帰分析の一形式である。データは逐次近似法によって当て嵌められる。

一般

非線形回帰において、

\mathbf {y} \sim f(\mathbf {x} ,{\boldsymbol {\beta }})

という形式の統計モデルは独立変数のベクトルxとその関連した観測された従属変数yを結び付ける。関数fはパラメータβのベクトルの要素において非線形であるが、その他の点では任意である。例えば、酵素の反応速度論に対するミカエリス・メンテンモデルは2つのパラメータと1つの独立変数を持ち、これらはfによって結び付けられる:^{[注釈 1]}。

f(x,{\boldsymbol {\beta }})={\frac {\beta _{1}x}{\beta _{2}+x}}

この関数は、2つのβの線形結合として表わすことができないため、非線形である。

系統誤差が独立変数中に存在するかもしれないが、その取扱いは回帰分析の対象範囲外である、もし独立変数に誤差があるとすると、これは変数誤差モデル（英語版）であり、これも対象範囲外である。

非線形関数のその他の例には、指数関数、対数関数（英語版）、三角関数、冪関数、ガウス関数、ローレンツ曲線がある。指数関数または対数関数といった一部の関数は、それらが線形となるように変換することができる。そのように変換された時、標準的な線形回帰を行うことができるが、注意深く適用しなければならない。より詳細については線形化§変換を見よ。

一般に非線形回帰には線形回帰に存在するような、最良の当て嵌めパラメータに関する閉形式の式は存在しない。大抵は、最良のパラメータを決定するために数値的最適化アルゴリズムが適用される。ここでも線形回帰と対照的に、最適化される関数には多くの極小点（ローカルミニマム）が存在する可能性があり、最小点（グローバルミニマム）でさえも偏った（英語版）推定値を与える可能性がある。実際上は、二乗和の最小値を探るために、最適化アルゴリズムと併せて、パラメータの推定値が使われる。

非線形データモデリングに関する詳細については、最小二乗法および非線形最小二乗法を見よ。

回帰統計値

この手順の根底にある仮定は、このモデルが線形関数、すなわち一次のテイラー級数

f(x_{i},{\boldsymbol {\beta }})\approx f(x_{i},0)+\sum _{j}J_{ij}\beta _{j}

によって近似できるというものである。上式において $J_{ij}={\frac {\partial f(x_{i},{\boldsymbol {\beta }})}{\partial \beta _{j}}}$ 。最小二乗推定量は以下の式で与えられる。

{\hat {\boldsymbol {\beta }}}\approx \mathbf {(J^{T}J)^{-1}J^{T}y} .

非線形回帰統計値は計算され、線形回帰統計値と同じように使われるが、式ではXの位置にJを使用している。線形近似はこの統計値へ偏り（バイアス）を導入する。したがって、非線形モデルから導き出された統計値を解釈するためには普段よりもより注意が必要である。

普通最小二乗法と加重最小二乗法

最良適合曲線はしばしば、残差二乗和を最小化するものであると想定される。これは普通最小二乗（英語版）（OLS）アプローチである。しかしながら、従属変数が一定の分散を持たない場合は、加重残差二乗和が最小化されるだろう（加重最小二乗法（英語版）を見よ）。それぞれの重みは理想的には観測値の分散の逆数と等しくなるべきであるが、反復加重最小二乗アルゴリズムでは、重みは繰り返し毎に再計算することができる。

線形化

変換

一部の非線形回帰問題は、モデル定式化の適切な変換によって線形領域へと移すことができる。

例えば、パラメータaおよびbと乗法誤差項Uを持つ非線形問題

y=ae^{bx}U\,\!

を考える。両辺の対数を取ると、この式は

\ln {(y)}=\ln {(a)}+bx+u,\,\!

となる。上式において、u = ln(U)である。この式はxに関するln(y) の線形回帰によって未知のパラメータの推定ができることを示唆している。この線形回帰の計算は反復的最適化を必要としない。しかしながら、非線形変換の使用には注意が必要である。データ値の影響は変化し、モデルの誤差構造と全ての推論結果の解釈も同様に変化する。これらは望ましくない効果である。その一方で、誤差の最大の源が何かに依存して、非線形変換はガウス関数的に誤差をばらまく。そのため非線形変換を実行するかどうかの選択はモデル情報の熟慮に基づかなければならない。

ミカエリス・メンテン反応速度論では、反応速度の逆数1/vに対して基質濃度の逆数1/[S] をプロットする線形のラインウィーバー＝バークプロット

{\frac {1}{v}}={\frac {1}{V_{\max }}}+{\frac {K_{m}}{V_{\max }[S]}}

がよく使われてきた。しかしながら、ラインウィーバー＝バークプロットはデータの誤差に非常に敏感であり、特定の範囲の独立変数 [S] でデータの当て嵌めに強く偏っているため、その使用は断固として推奨されない。

指数型分布族に属する誤差分布では、リンク関数が一般化線形モデルの枠組みの下でパラメータを変換するために使われうる。

分割回帰

詳細は「分割回帰」を参照

独立変数（説明変数、X）は複数のクラスまたは区分へと分割することができ、区分ごとに線形回帰を実行することができる。信頼度分析を伴う分割回帰では従属変数（説明変数、Y）が様々な区分において異なる振る舞いをする結果が得られるかもしれない^[1]。

右図は、土壌塩分（X）がマスタードの収量（Y）に最初は、「臨界値」または「閾値」まで、影響を与えず、その後は収量に負の影響を与えることを示す^[2]。

出典

^ R.J.Oosterbaan, 1994, Frequency and Regression Analysis. In: H.P.Ritzema (ed.), Drainage Principles and Applications, Publ. 16, pp. 175-224, International Institute for Land Reclamation and Improvement (ILRI), Wageningen, The Netherlands. ISBN 90-70754-33-9 . Download as PDF : [1]
^ R.J.Oosterbaan, 2002. Drainage research in farmers' fields: analysis of data. Part of project “Liquid Gold” of the International Institute for Land Reclamation and Improvement (ILRI), Wageningen, The Netherlands. Download as PDF : [2]. The figure was made with the SegReg program, which can be downloaded freely from [3]

注

^ このモデルは生化学の慣習では以下のように表記される:
$v={\frac {V_{\max }\ [{\mbox{S}}]}{K_{m}+[{\mbox{S}}]}}$

関連項目

位置	平均算術幾何調和中央値分位数順序統計量最頻値階級値
分散	範囲偏差偏差値標準偏差標準誤差変動係数決定係数相関係数自己相関共分散自己共分散分散共分散行列百分率統計的ばらつき
モーメント	分散歪度尖度

カテゴリデータ

頻度
分割表

推計統計学

仮説検定

パラメトリック	t検定ウェルチのt検定 F検定 Z検定二項検定ジャック-ベラ検定シャピロ–ウィルク検定分散分析共分散分析
ノンパラメトリック	ウィルコクソンの符号順位検定マン・ホイットニーのU検定カイ二乗検定イェイツのカイ二乗検定累積カイ二乗検定フィッシャーの正確確率検定尤度比検定 G検定アンダーソン–ダーリング検定コルモゴロフ–スミルノフ検定カイパー検定マンテル検定コクラン・マンテル・ヘンツェルの統計量
その他	帰無仮説対立仮説有意棄却

区間推定

モデル選択基準

その他

ベイズ統計学

確率	主観確率ベイズ確率事前確率事後確率最大事後確率
その他	ベイズ推定ベイズ因子

相関

モデル

回帰

線形	リッジ回帰ラッソ回帰エラスティックネット
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシン射影追跡回帰
時系列	自己回帰モデル自己回帰移動平均モデル ARCHモデル対移動平均比率法トレンド定常傾向推定共和分構造変化

分類

線形	線形判別分析ロジスティック回帰 <! -- 名前に回帰とついていますが確率を回帰する分類手法です --> 単純ベイズ分類器単純パーセプトロン線形サポートベクターマシン
二次	二次判別分析
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシンベイジアンネットワーク隠れマルコフモデル
その他	二項分類多クラス分類第一種過誤と第二種過誤

教師なし学習

クラスタリング	k平均法（k-means++法） DBSCAN
密度推定（英語版）	カーネル密度推定（カーネル）
その他	主成分分析独立成分分析自己組織化写像