Określoność formy

Określoność formy – właściwość formy kwadratowej Q ( x ) {\displaystyle Q(\mathbf {x} )} określonej na rzeczywistej przestrzeni liniowej V {\displaystyle V} [a].

  • Jeżeli forma przyjmuje wartości tego samego znaku dla wszystkich punktów x {\displaystyle \mathbf {x} } przestrzeni liniowej, to nazywa się ją określoną.
  • Jeżeli forma przyjmuje wartości tego samego znaku albo zeruje się dla niektórych punktów x {\displaystyle \mathbf {x} } przestrzeni liniowej, to nazywa się ją półokreśloną.
  • Jeżeli forma przyjmuje dla jednych punktów x {\displaystyle \mathbf {x} } wartości dodatnie, a dla innych ujemne, to nazywa się ją nieokreśloną.

Rodzaje form określonych

Spośród form określonych i półokreślonych wyróżnia się następujące typy:

jeżeli dla każdego x 0 {\displaystyle \mathbf {x} \neq \mathbf {0} } jest

  • Q ( x ) > 0 {\displaystyle Q(\mathbf {x} )>0} – formę nazywa się dodatnio określoną (dodatnia),
  • Q ( x ) < 0 {\displaystyle Q(\mathbf {x} )<0} – formę nazywa się ujemnie określoną (ujemna),
  • Q ( x ) 0 {\displaystyle Q(\mathbf {x} )\geqslant 0} – formę nazywa się nieujemnie określoną (nieujemna; dodatnio półokreślona),
  • Q ( x ) 0 {\displaystyle Q(\mathbf {x} )\leqslant 0} – formę nazywa się niedodatnio określoną (niedodatnia; ujemnie półokreślona).

Uwaga: Znaki elementów macierzy nie mają bezpośredniego związku z określonością macierzy (patrz przykłady poniżej).

Macierze odpowiadające formom

(1) Formie kwadratowej Q {\displaystyle Q} (i zapisanej w postaci symetrycznej – patrz niżej) zdefiniowanej na przestrzeni n-wymiarowej można przypisać macierz w następujący sposób

Q ( x ) Q ( x 1 , , x n ) = i = 1 n j = 1 n a i j x i x j = x T A x , {\displaystyle Q(\mathbf {x} )\equiv Q(x_{1},\dots ,x_{n})=\sum _{i=1}^{n}\sum _{j=1}^{n}a_{ij}{x_{i}}{x_{j}}=\mathbf {x} ^{\text{T}}A\,\mathbf {x} ,}

gdzie x = [ x 1 , , x n ] {\displaystyle \mathbf {x} =[x_{1},\dots ,x_{n}]} jest dowolnym wektorem o n {\displaystyle n} współrzędnych x 1 , , x n , {\displaystyle x_{1},\dots ,x_{n},} takich że nie wszystkie współrzędne są równe zeru; indeks górny T {\displaystyle ^{\mathrm {T} }} oznacza transpozycję; A = [ a i j ] {\displaystyle A=[a_{ij}]} oznacza macierz symetryczną n × n . {\displaystyle n\times n.}

Uwaga: Zakłada się, że forma ma postać symetryczną, tj. a i j = a j i . {\displaystyle a_{ij}=a_{ji}.} Jeżeli by tak nie było, to łatwo nadać formie postać symetryczną zastępując współczynniki formy a i j , a j i {\displaystyle a_{ij},a_{ji}} przez ich średnie arytmetyczne, tj. przyjmując

a i j = a j i = ( a i j + a j i ) / 2. {\displaystyle a'_{ij}=a'_{ji}=(a_{ij}+a_{ji})/2.}

Przy takiej zamianie forma nie ulegnie zmianie, a tylko przegrupowane zostają jej wyrazy.

(2) Macierz A {\displaystyle A} jest

  • diagonalna, gdy forma zawiera wyłącznie wyrazy z kwadratami zmiennych,
  • ma wyrazy pozadiagonalne, gdy forma zawiera składniki z iloczynami dwóch różnych zmiennych.

(3) Def. Macierze formy nazywa się macierzami określonymi/nieokreślonymi itd. jeżeli odpowiadają formom określonym/nieokreślonym itd.

Formy zdegenerowane/niezdegenerowane

Def. 1. Formę nazywamy zdegenerowaną, jeżeli jest równa zero dla wszystkich wartości x . {\displaystyle \mathbf {x} .}

Def. 2. Formę nazywamy niezdegenerowaną, jeżeli istnieje choć jedna wartość x , {\displaystyle \mathbf {x} ,} dla której forma jest różna od zera.

Tw. 1. Forma jest zdegenerowana, jeżeli wyznacznik macierzy formy jest równy zeru.

Formy dwuliniowe

Tw. 2. Każdej formie kwadratowej Q ( x ) {\displaystyle Q(x)} odpowiada wzajemnie jednoznacznie symetryczna forma dwuliniowa B ( x , x ) {\displaystyle B(x,x)} określona na tej samej przestrzeni, tak że zachodzą związki

Q ( x ) = B ( x , x ) , {\displaystyle Q(x)=B(x,x),}
B ( x , y ) = B ( y , x ) = 1 2 ( Q ( x + y ) Q ( x ) Q ( y ) ) . {\displaystyle B(x,y)=B(y,x)={\tfrac {1}{2}}(Q(x+y)-Q(x)-Q(y)).}

Def. 3. Formę symetryczną dwuliniową nazywa się określoną, nieokreśloną, półokreśloną itd. odpowiednio do odpowiadającej jej formy kwadratowej.

Tw. 3. Jeżeli forma kwadratowa Q {\displaystyle Q} jest zadana za pomocą symetrycznej formy dwuliniowej B ( x , y ) {\displaystyle B(\mathbf {x} ,\mathbf {y} )} wzorem

Q ( x ) = B ( x , x ) , {\displaystyle Q(\mathbf {x} )=B(\mathbf {x} ,\mathbf {x} ),}

to macierze tych form są równe.

Wynika stąd, że ma sens mówienie nie tylko o określoności (lub jej braku) macierzy form kwadratowych, ale i o określoności dowolnych form dwuliniowych symetrycznych.

Każda macierz kwadratowa może więc być macierzą pewnej formy kwadratowej bądź dwuliniowej symetrycznej.

Twierdzenie o dodatniej określoności

Forma kwadratowa o współczynnikach rzeczywistych lub zespolonych zapisana w postaci symetrycznej jest dodatnio określona, jeżeli wszystkie minory główne jej macierzy, obliczane po przekątnej od lewego rogu, są dodatnie. Np. macierz

Q = [ q 11 q 12 q 13 q 21 q 22 q 23 q 31 q 32 q 33 ] {\displaystyle \mathbf {Q} ={\begin{bmatrix}q_{11}&q_{12}&q_{13}\\q_{21}&q_{22}&q_{23}\\q_{31}&q_{32}&q_{33}\end{bmatrix}}}

będzie dodatnio określona, jeżeli:

| q 11 q 12 q 13 q 21 q 22 q 23 q 31 q 32 q 33 | > 0 , | q 11 q 12 q 21 q 22 | > 0 , q 11 > 0. {\displaystyle {\begin{vmatrix}q_{11}&q_{12}&q_{13}\\q_{21}&q_{22}&q_{23}\\q_{31}&q_{32}&q_{33}\end{vmatrix}}>0,\;{\begin{vmatrix}q_{11}&q_{12}\\q_{21}&q_{22}\end{vmatrix}}>0,\;q_{11}>0.}

Twierdzenie powyższe można zastosować do:

  • sprawdzenia, czy dana macierz jest dodatnio określona
    • np. stosując do Przykładów 1, 2 – poniżej widać natychmiast, że macierz P jest określona dodatnio, a macierz N – nie,
  • nałożenia warunków, ograniczających możliwe rozwiązania (np. L. Landau, J. Lifszyc, Teoria pola, s. 286).

Przykłady

Poniższe przykłady pokazują, że znaki elementów macierzy nie mają bezpośredniego związku z określonością macierzy.

Przykład 1. Macierz rzeczywista, symetryczna, dodatnio określona

P = [ 2 1 0 1 2 1 0 1 2 ] {\displaystyle \mathbf {P} ={\begin{bmatrix}2&-1&0\\-1&2&-1\\0&-1&2\end{bmatrix}}}
Dowód: Dla dowolnej macierzy kolumnowej X = [ x y z ] {\displaystyle X={\begin{bmatrix}x\\y\\z\end{bmatrix}}} jest
X P X T = [ x y z ] [ 2 1 0 1 2 1 0 1 2 ] [ x y z ] = [ 2 x y x + 2 y z y + 2 z ] [ x y z ] = 2 x 2 x y x y + 2 y 2 y z y z + 2 z 2 . {\displaystyle {\begin{aligned}\\\mathbf {X} \,\mathbf {P} \,\mathbf {X} ^{T}&={\begin{bmatrix}x&y&z\end{bmatrix}}{\begin{bmatrix}2&-1&0\\-1&2&-1\\0&-1&2\end{bmatrix}}{\begin{bmatrix}x\\y\\z\end{bmatrix}}\\&={\begin{bmatrix}2x-y&-x+2y-z&-y+2z\end{bmatrix}}{\begin{bmatrix}x\\y\\z\end{bmatrix}}\\&={\begin{matrix}2x^{2}-xy-xy+2y^{2}-yz-yz+2z^{2}.\end{matrix}}\end{aligned}}}

Oznacza to, że odpowiadająca tej macierzy forma kwadratowa P {\displaystyle P} ma wzór

P ( x ) = 2 x 2 2 x y + 2 y 2 2 y z + 2 z 2 = x 2 + ( x y ) 2 + ( y z ) 2 + z 2 , {\displaystyle P(\mathbf {x} )=2x^{2}-2xy+2y^{2}-2yz+2z^{2}=x^{2}+(x-y)^{2}+(y-z)^{2}+z^{2},}

gdzie x = ( x , y , z ) . {\displaystyle \mathbf {x} =(x,y,z).} Widać stąd, że forma P ( x ) {\displaystyle P(\mathbf {x} )} jest nieujemna, gdyż dana jest jako suma kwadratów, a ta nie jest nigdy mniejsza od zera. Ponadto forma ta jest niezdegenerowana, gdyż zeruje się tylko, gdy x = 0 . {\displaystyle \mathbf {x} =\mathbf {0} .} Forma P ( x ) {\displaystyle P(\mathbf {x} )} jest więc dodatnio określona, cnd.

Uwaga:

Dodatnią określoność łatwo stwierdzić, licząc minory główne (por. Twierdzenie powyżej lub Kryterium Sylvestera).

Przykład 2. Macierz rzeczywista, symetryczna, określona niedodatnio

N = [ 1 1 1 1 2 0 1 0 2 ] . {\displaystyle \mathbf {N} ={\begin{bmatrix}-1&-1&1\\-1&-2&0\\1&0&-2\end{bmatrix}}.}
Dowód: Wykonując obliczenia jak w Przykładzie 1 łatwo przekonać się, że odpowiadająca tej macierzy forma kwadratowa N {\displaystyle N} ma postać
N ( x ) = x 2 2 x y + 2 x z 2 y 2 2 z 2 = ( x + y z ) 2 ( y + z ) 2 , {\displaystyle N(\mathbf {x} )=-x^{2}-2xy+2xz-2y^{2}-2z^{2}=-(x+y-z)^{2}-(y+z)^{2},}
gdzie x = ( x , y , z ) . {\displaystyle \mathbf {x} =(x,y,z).} Z postaci formy widać, że jest niedodatnia i przyjmuje zero wyłącznie dla x = ( 2 t , t , t ) , {\displaystyle \mathbf {x} =(-2t,t,-t),} gdzie t R . {\displaystyle t\in \mathbb {R} .} Dlatego forma N ( x ) {\displaystyle N(\mathbf {x} )} jest niedodatnio określona, cnd.

Uwaga, przekształcenie wzoru formy kwadratowej, do postaci sumy bądź różnicy kwadratów, nie jest najprostszym sposobem badania określoności formy, w wielu przypadkach może okazać się pomocne Kryterium Sylvestera.

Przykład 3. Macierz rzeczywista, symetryczna, nieokreślona

Q = [ 1 3 2 3 2 0 2 0 1 ] . {\displaystyle \mathbf {Q} ={\begin{bmatrix}1&3&-2\\3&-2&0\\-2&0&1\end{bmatrix}}.}
Dowód: Można sprawdzić bezpośrednim rachunkiem, że macierzy Q {\displaystyle \mathbf {Q} } odpowiada forma kwadratowa
Q ( x ) = x 2 2 y 2 + z 2 + 6 x y 4 x z , {\displaystyle Q(\mathbf {x} )=x^{2}-2y^{2}+z^{2}+6xy-4xz,}
gdzie x = ( x , y , z ) , {\displaystyle \mathbf {x} =(x,y,z),}
Forma ta jest nieokreślona, gdyż
  • przyjmuje wartości zarówno dodatnie, jak i ujemne, np.:
    1. jeśli x = ( 0 , 1 , 1 ) , {\displaystyle \mathbf {x} =(0,1,1),} to Q ( x ) = 1 , {\displaystyle Q(\mathbf {x} )=-1,}
    2. jeśli x = ( 2 , 1 , 0 ) , {\displaystyle \mathbf {x} =(2,1,0),} to Q ( x ) = 14 , {\displaystyle Q(\mathbf {x} )=14,}
  • jest niezdegenerowana, tj. dla wszystkich x 0 {\displaystyle \mathbf {x} \neq \mathbf {0} } jest Q ( x ) 0. {\displaystyle Q(\mathbf {x} )\neq 0.}

Przykład 4. Macierz jednostkowa w przestrzeni rzeczywistej lub zespolonej – jest dodatnio określona.

(1) Macierz jednostkowa I = [ 1 0 0 1 ] {\displaystyle I={\begin{bmatrix}1&0\\0&1\end{bmatrix}}} jest określona dodatnio. Jeśli jest to macierz formy określonej na przestrzeni rzeczywistej, to dla dowolnych wektorów mamy

X T I X = [ x y ] [ 1 0 0 1 ] [ x y ] = x 2 + y 2 . {\displaystyle X^{\textsf {T}}IX={\begin{bmatrix}x&y\end{bmatrix}}{\begin{bmatrix}1&0\\0&1\end{bmatrix}}{\begin{bmatrix}x\\y\end{bmatrix}}=x^{2}+y^{2}.}

(2) Jeśli jest to macierz formy określonej na przestrzeni zespolonej, to dla dowolnego wektora zespolonego mamy

X H I X = [ x y ] [ 1 0 0 1 ] [ x y ] = x x + y y = | x | 2 + | y | 2 . {\displaystyle X^{\mathrm {H} }IX={\begin{bmatrix}x^{*}&y^{*}\end{bmatrix}}{\begin{bmatrix}1&0\\0&1\end{bmatrix}}{\begin{bmatrix}x\\y\end{bmatrix}}=x^{*}x+y^{*}y=|x|^{2}+|y|^{2}.}

Ponieważ wektor jest niezerowy, to x {\displaystyle x} albo y {\displaystyle y} musi być niezerowe, więc macierz jest dodatnio określona.

Twierdzenia

(1) Wszystkie formy dodatnio/ujemnie określone na tej samej przestrzeni wymiaru n {\displaystyle n} są równoważne formie kwadratowej diagonalnej, składającej się z sumy n {\displaystyle n} kwadratów[b].

(2) Określoność formy nie zależy od wyboru współrzędnych (choć postać formy zależy od wyboru współrzędnych). Oznacza to, że wszystkie wartości własne dodatnio określonej formy są dodatnie.

(3) Wynika stąd, że formy/macierze dodatnio określone są:

  • nieosobliwe, tzn. mają niezerowy wyznacznik (będący iloczynem wszystkich wartości własnych),
  • a zatem odwracalne,
  • ponadto forma/macierz odwrotna do danej też jest dodatnio określona[c],
  • suma form/macierzy dodatnio określonych także jest dodatnio określona[d].

(4) Analogiczne twierdzenia są słuszne dla macierzy ujemnie określonych.

(5) Ponadto słuszne są twierdzenia:

  • symetryczna[e] macierz dodatnio określona A {\displaystyle \mathbf {A} } ma rozkład Choleskiego, tzn. istnieje macierz odwracalna L , {\displaystyle \mathbf {L} ,} dla której A = L L T {\displaystyle \mathbf {A} =\mathbf {LL} ^{\mathrm {T} }} (symetria i dodatnia określoność – to warunki konieczne i dostateczne),
  • dla nieosobliwej/odwracalnej macierzy rzeczywistej A {\displaystyle \mathbf {A} } iloczyny A T A {\displaystyle \mathbf {A} ^{\mathrm {T} }\mathbf {A} } oraz A A T {\displaystyle \mathbf {AA} ^{\mathrm {T} }} są dodatnio określone[f],
  • wynika stąd, że dodatnio określona jest forma/macierz jednostkowa[g],
  • wszystkie wartości własne formy/macierzy zerowej są równe zeru, dlatego jest ona jednocześnie określona nieujemnie i niedodatnio – jest to jedyna forma/macierz o tej własności.

Zobacz też

Zastosowania

Uwagi

  1. Bądź ogólniej: przestrzeni liniowej nad ciałem uporządkowanym; w szczególności nie nad ciałem liczb zespolonych. Można rozpatrywać inne uogólnienia, np. formy hermitowskie określone na przestrzeniach liniowych nad liczbami zespolonymi i o wartościach rzeczywistych (czy w ciele uporządkowanym). Macierz takiej formy powinna być wtedy nie symetryczna a hermitowska.
  2. Formy kwadratowe Q 1 {\displaystyle Q_{1}} i Q 2 {\displaystyle Q_{2}} określone odpowiednio na V 1 {\displaystyle V_{1}} i V 2 {\displaystyle V_{2}} nazywa się równoważnymi, jeżeli istnieje taki izomorfizm (liniowy) C : V 1 V 2 , {\displaystyle \mathrm {C} \colon V_{1}\to V_{2},} który spełniałby Q 2 ( C x ) = Q 1 ( x ) . {\displaystyle Q_{2}(\mathrm {C} \mathbf {x} )=Q_{1}(\mathbf {x} ).}
  3. Zgodnie z twierdzeniem Cauchy’ego wyznacznik macierzy odwrotnej jest odwrotnością macierzy wyjściowej, odwrotność dodatniej liczby również jest dodatnia.
  4. Jeśli A {\displaystyle A} oraz B {\displaystyle B} są dodatnio określone, A ( x ) > 0 {\displaystyle A(\mathbf {x} )>0} oraz B ( x ) > 0 {\displaystyle B(\mathbf {x} )>0} dla x 0 , {\displaystyle \mathbf {x} \neq \mathbf {0} ,} to A + B {\displaystyle A+B} również jest dodatnio określona, ponieważ ( A + B ) ( x ) = A ( x ) + B ( x ) > 0 {\displaystyle (A+B)(\mathbf {x} )=A(\mathbf {x} )+B(\mathbf {x} )>0} dla x 0 . {\displaystyle \mathbf {x} \neq \mathbf {0} .}
  5. Ogólniej: hermitowska, wtedy transpozycję we wzorze należy zastąpić sprzężeniem hermitowskim.
  6. Dla niezerowej macierzy kolumnowej X {\displaystyle \mathbf {X} } zachodzi X T ( A T A ) X = ( A X ) T A X , {\displaystyle \mathbf {X} ^{\mathrm {T} }(\mathbf {A} ^{\mathrm {T} }\mathbf {A} )\mathbf {X} =(\mathbf {AX} )^{\mathrm {T} }\mathbf {AX} ,} równe po współrzędnych A X A X = A X 2 , {\displaystyle \mathbf {AX} \cdot \mathbf {AX} =\|\mathbf {AX} \|^{2},} skąd norma macierzowa A X > 0 {\displaystyle \|\mathbf {AX} \|>0} (norma Frobeniusa indukowana ze standardowego iloczynu skalarnego macierzy) musi być nieujemna, ponieważ nieosobliwość/odwracalność macierzy A {\displaystyle \mathbf {A} } jest równoważna A X Θ {\displaystyle \mathbf {AX} \neq \mathbf {\Theta } } (gdyż X Θ ; {\displaystyle \mathbf {X} \neq \mathbf {\Theta } ;} norma mogłaby się zerować, tylko gdy A X = Θ {\displaystyle \mathbf {AX} =\mathbf {\Theta } } ). Podobnie X T ( A A T ) X = ( A T X ) T A T X , {\displaystyle \mathbf {X} ^{\mathrm {T} }(\mathbf {AA} ^{\mathrm {T} })\mathbf {X} =(\mathbf {A} ^{\mathbf {T} }\mathbf {X} )^{\mathrm {T} }\mathbf {A} ^{\mathbf {T} }\mathbf {X} ,} równe po współrzędnych ( A T X ) ( A T X ) = A T X 2 , {\displaystyle (\mathbf {A} ^{\mathbf {T} }\mathbf {X} )\cdot (\mathbf {A} ^{\mathbf {T} }\mathbf {X} )=\|\mathbf {A} ^{\mathbf {T} }\mathbf {X} \|^{2},} oznacza A T X > 0 {\displaystyle \|\mathbf {A} ^{\mathbf {T} }\mathbf {X} \|>0} z tym samym uzasadnieniem końcowym.
  7. Ze względu na równości I = I T I = I I T . {\displaystyle \mathbf {I} =\mathbf {I} ^{\mathrm {T} }\mathbf {I} =\mathbf {II} ^{\mathrm {T} }.}

Bibliografia

  • H. Guściora, M. Sadowski, Repetytorium z algebry liniowej, Państwowe Wydawnictwo Naukowe, Warszawa 1979, s. 123–138.
  • T. Trajdos, Matematyka dla inżynierów, PWN, Warszawa 1974, s. 73–77.
  • p
  • d
  • e
Niektóre
typy macierzy
Cechy niezależne
od bazy
Cechy zależne
od bazy
Operacje
na macierzach
jednoargumentowe
dwuargumentowe
Niezmienniki
liczbowe
inne
Inne pojęcia