Macierz Grama

Ten artykuł dotyczy macierzy (abstrakcyjnego) iloczynu skalarnego. Zobacz też: macierze ogólnych form dwuliniowej lub półtoraliniowej (bądź hermitowskiej).

Macierz Grama – macierz związana z układem wektorów danej przestrzeni unitarnej, ułatwiająca opis tej przestrzeni; nosi ona nazwisko duńskiego matematyka Jørgena Pedersena Grama.

Choć zwykle wykorzystuje się do tego celu objętości prostopadłościanów wielowymiarowych, to do zdefiniowania miary Lebesgue’a na przestrzeni euklidesowej (a dokładniej przy określaniu miary zewnętrznej, która jest krokiem pośrednim) można użyć objętości równoległościanów wielowymiarowych (wyznaczanych przez dany układ wektorów) definiowanej za pomocą macierzy Grama. Objętość równoległościanu pojawia się także przy całkowaniu przez podstawienie (zamianie zmiennych) w całce Lebesgue’a, często jako tzw. forma objętości (antysymetryczna forma wieloliniowa najwyższego rzędu w danej przestrzeni liniowej), czyli zorientowany element objętości.

Jednym z najistotniejszych praktycznych zastosowań tej macierzy kwadratowej jest możliwość stwierdzenia, czy dany układ k {\displaystyle k} wektorów przestrzeni n {\displaystyle n} -wymiarowej jest liniowo niezależny – macierz ta musi mieć dodatni wyznacznik (dla k = n {\displaystyle k=n} wystarczy sprawdzić niezerowość wyznacznika samego układu wektorów) – geometrycznie odpowiada to sprawdzeniu, czy dany układ wektorów rozpina równoległościan o dodatniej objętości; kryterium to wykorzystuje się m.in. określania sterowalności i obserwowalności liniowego układu sterowania.

Definicja

Niech dany będzie układ A = { a 1 , , a k } {\displaystyle A=\{\mathbf {a} _{1},\dots ,\mathbf {a} _{k}\}} wektorów n {\displaystyle n} -wymiarowej przestrzeni unitarnej ( V , , ) {\displaystyle (V,\langle \cdot ,\cdot \rangle )} nad ciałem liczb rzeczywistych bądź zespolonych. Wektory układu A {\displaystyle A} wyrażone w bazie B {\displaystyle B} można wpisać jako kolumny macierzy A {\displaystyle \mathbf {A} } (zob. wektory kolumnowe)[a].

Macierzą Grama związaną z układem A {\displaystyle A} bądź macierzą A {\displaystyle \mathbf {A} } nazywa się macierz kwadratową stopnia k {\displaystyle k} nad ciałem liczb rzeczywistych

G ( A ) = G ( A ) = G ( a 1 , , a k ) := [ a i , a j ] i j . {\displaystyle G(\mathbf {A} )=G(A)=G(\mathbf {a} _{1},\dots ,\mathbf {a} _{k}):={\big [}\langle \mathbf {a} _{i},\mathbf {a} _{j}\rangle {\big ]}_{ij}.}

Wyznacznik tej macierzy nazywa się wyznacznikiem Grama wspomnianego układu wektorów (wspomnianej macierzy),

g ( A ) = g ( A ) = g ( a 1 , , a k ) := det G ( A ) . {\displaystyle g(\mathbf {A} )=g(A)=g(\mathbf {a} _{1},\dots ,\mathbf {a} _{k}):=\det G(A).}

Własności

 Zobacz też: liniowa niezależność.

W przypadku rzeczywistym z symetryczności dwuliniowego iloczynu skalarnego wynika x i , x j = x j , x i {\displaystyle \langle \mathbf {x} _{i},\mathbf {x} _{j}\rangle =\langle \mathbf {x} _{j},\mathbf {x} _{i}\rangle } (w przypadku zespolonym x i , x j = x j , x i ¯ {\displaystyle \langle \mathbf {x} _{i},\mathbf {x} _{j}\rangle ={\overline {\langle \mathbf {x} _{j},\mathbf {x} _{i}\rangle }}} na mocy hermitowskości półtoraliniowego iloczynu skalarnego) dla dowolnych i , j , {\displaystyle i,j,} a więc macierz Grama również jest symetryczna (hermitowska, czyli samosprzężona). Niżej przedstawiono własności w przypadku zespolonym; dla przypadku rzeczywistego wystarczy pominąć kreski nad elementami i macierzami oznaczające sprzężenie zespolone, a sprzężoną hermitowsko macierz A {\displaystyle \mathbf {A} ^{\star }} należy traktować jak macierz transponowaną A T . {\displaystyle \mathbf {A} ^{\mathrm {T} }.}

Dla dowolnej macierzy A {\displaystyle \mathbf {A} } zachodzi

G ( A ) = A A o r a z G ( A T ) = A A , {\displaystyle G(\mathbf {A} )=\mathbf {A} ^{\star }\mathbf {A} \quad \mathrm {oraz} \quad G\left(\mathbf {A} ^{\mathrm {T} }\right)=\mathbf {AA} ^{\star },}

tzn. A A {\displaystyle \mathbf {A} ^{\star }\mathbf {A} } oraz A A {\displaystyle \mathbf {AA} ^{\star }} są macierzami Grama układu wektorów A {\displaystyle A} wpisanego odpowiednio jako kolumny i wiersze macierzy A {\displaystyle \mathbf {A} } [b].

Jeśli k = n , {\displaystyle k=n,} czyli A {\displaystyle \mathbf {A} } jest kwadratowa, to wyznacznik macierzy Grama jest nieujemną wielkością rzeczywistą, gdyż

g ( A ) = det ( A A ) = det ( A T ¯ ) det ( A ) = det ( A ) ¯ det ( A ) = | det ( A ) | 2 0. {\displaystyle g(\mathbf {A} )=\det(\mathbf {A} ^{\star }\mathbf {A} )=\det \left({\overline {\mathbf {A} ^{\mathrm {T} }}}\right)\det(\mathbf {A} )={\overline {\det(\mathbf {A} )}}\det(\mathbf {A} )={\big |}\det(\mathbf {A} ){\big |}^{2}\geqslant 0.}

Układ A {\displaystyle A} jest liniowo niezależny wtedy i tylko wtedy, gdy wyznacznik G ( A ) > 0 {\displaystyle G(A)>0} [c].

O tym, które z macierzy hermitowskich (symetrycznych) są macierzami Grama, czy też dokładniej: czy istnieje taka przestrzeń unitarna, dla której dana macierz hermitowska (symetryczna) jest macierzą Grama pewnej bazy tej przestrzeni, mówi kryterium Sylvestera. Formalnie warunek ten umożliwia sprawdzenie, czy dana macierz dwuliniowej formy hermitowskiej (symetrycznej) jest dodatnio określona – forma ta wówczas jest iloczynem skalarnym na tej przestrzeni.

Objętość

 Zobacz też: równoległościan wielowymiarowy, wyznacznik i orientacja.

Niech dany będzie liniowo niezależny układ wektorów A = { a 1 , , a k } {\displaystyle A=\{\mathbf {a} _{1},\dots ,\mathbf {a} _{k}\}} przestrzeni unitarnej V {\displaystyle V} wymiaru n . {\displaystyle n.} Jeśli R ( A ) {\displaystyle \mathrm {R} (A)} oznacza k {\displaystyle k} -wymiarowy równoległościan rozpięty na A , {\displaystyle A,} to jego k {\displaystyle k} -wymiarową objętością nazywa się liczbę

| R ( A ) | k = g ( A ) . {\displaystyle {\big |}\mathrm {R} (A){\big |}_{k}={\sqrt {g(A)}}.}

Ponadto przyjmuje się | R ( A ) | l = 0 {\displaystyle |\mathrm {R} (A)|_{l}=0} dla l > k {\displaystyle l>k} oraz | R ( A ) | l = {\displaystyle |\mathrm {R} (A)|_{l}=\infty } dla l < k . {\displaystyle l<k.}

Niech A = { a 1 , , a k 1 } . {\displaystyle A'=\{\mathbf {a} _{1},\dots ,\mathbf {a} _{k-1}\}.} Jeśli c {\displaystyle \mathbf {c} } jest rzutem prostopadłym wektora a k {\displaystyle \mathbf {a} _{k}} na dopełnienie ortogonalne l i n ( A ) {\displaystyle \mathrm {lin} (A')^{\perp }} podprzestrzeni rozpiętej przez A , {\displaystyle A',} to wtedy

g ( A ) = g ( A ) c 2 {\displaystyle g(A)=g(A')\cdot \|\mathbf {c} \|^{2}} [d].

Dla przestrzeni rzeczywistych twierdzenie to można wysłowić w przypadku dwuwymiarowym w następujący sposób: pole równoległoboku równe jest iloczynowi długości podstawy i wysokości; w przypadku trójwymiarowym: objętość równoległościanu jest równa iloczynowi pola podstawy i wysokości. W ogólności zaś:

| R ( A ) | k = | R ( A ) | k 1 c . {\displaystyle {\big |}\mathrm {R} (A){\big |}_{k}={\big |}\mathrm {R} (A'){\big |}_{k-1}\cdot \|\mathbf {c} \|.}

Zgodnie z uwagami z poprzedniej sekcji, jeśli V = R n {\displaystyle V=\mathbb {R} ^{n}} ze standardowym iloczynem skalarnym, to dla dowolnej macierzy odwracalnej A = [ a i j ] {\displaystyle \mathbf {A} =[a_{ij}]} moduł wyznacznika

| det A | = g ( a 1 , , a n ) , {\displaystyle |\det \mathbf {A} |={\sqrt {g(\mathbf {a} _{1},\dots ,\mathbf {a} _{n})}},}

gdzie a j = ( a 1 j , , a n j ) {\displaystyle \mathbf {a} _{j}=(a_{1j},\dots ,a_{nj})} dla j = 1 , , n {\displaystyle j=1,\dots ,n} można jest n {\displaystyle n} -wymiarową objętością równoległościanu w R n {\displaystyle \mathbb {R} ^{n}} rozpiętego na kolumnach bądź wierszach macierzy A . {\displaystyle \mathbf {A} .} Biorąc pod uwagę orientację bazy a 1 , , a n {\displaystyle \mathbf {a} _{1},\dots ,\mathbf {a} _{n}} wyznacznik det A {\displaystyle \det \mathbf {A} } należy interpretować jako n {\displaystyle n} -wymiarową zorientowaną objętość wspomnianego równoległościanu. Jeśli macierz A {\displaystyle \mathbf {A} } nie jest odwracalna, to jej wiersze (i kolumny) są liniowo zależne, skąd det A = 0. {\displaystyle \det \mathbf {A} =0.} Analogiczną interpretację uzyskuje się w przypadku przestrzeni V = C n . {\displaystyle V=\mathbb {C} ^{n}.}

Iloczyn wektorowy

Wybór iloczynu skalarnego i orientacji w n {\displaystyle n} -wymiarowej przestrzeni liniowej V {\displaystyle V} nad R {\displaystyle \mathbb {R} } umożliwia podanie metody dopełniania liniowo niezależnego układu n 1 {\displaystyle n-1} wektorów do bazy tej przestrzeni. Iloczynem wektorowym liniowo niezależnego układu A = { a 1 , , a n 1 } {\displaystyle A'=\{\mathbf {a} _{1},\dots ,\mathbf {a} _{n-1}\}} nazywa się taki wektor b {\displaystyle \mathbf {b} } zorientowanej przestrzeni unitarnej rzeczywistej, że

  • jeśli A {\displaystyle A'} jest liniowo zależny, to b = 0 , {\displaystyle \mathbf {b} =\mathbf {0} ,}
  • jeśli A {\displaystyle A'} jest liniowo niezależny, to b l i n ( A ) {\displaystyle \mathbf {b} \in \mathrm {lin} (A')^{\perp }} oraz b = g ( A ) , {\displaystyle \|\mathbf {b} \|={\sqrt {g(A')}},} przy czym baza { A , b } {\displaystyle \{A',\mathbf {b} \}} jest dodatnio zorientowana.

Innymi słowy wektor b , {\displaystyle \mathbf {b} ,} oznaczany zwykle a 1 × × a n 1 , {\displaystyle \mathbf {a} _{1}\times \ldots \times \mathbf {a} _{n-1},} jest prostopadły do każdego z wektorów układu A , {\displaystyle A',} jego moduł jest równy objętości równoległoboku rozpiętego na A , {\displaystyle A',} a dołączony na końcu A {\displaystyle A'} tworzy z wektorami tego układu bazę dodatnio zorientowaną.

Uogólnienia

W przypadku zespolonych przestrzeni unitarnych iloczyn skalarny jest dodatnio określoną (a stąd niezdegenerowaną) półtoraliniową formą hermitowską (tzn. samosprzężoną), w przestrzeniach rzeczywistych iloczyn skalarny jest dodatnio określoną dwuliniową formą symetryczną. Rezygnując z warunku dodatniej określoności i hermitowskości (bądź symetryczności) można rozpatrywać przestrzeń z formą półtoraliniową (dwuliniową) – macierzy Grama odpowiada wtedy macierz tej formy w ustalonej bazie. Przestrzeń liniową z symetryczną formą dwuliniową nazywa się przestrzenią ortogonalną. Badanie form kwadratowych pochodzących od form dwuliniowych umożliwia przykładowo klasyfikację właściwych hiperpowierzchni właściwych stopnia 2 nazywanych kwadrykami, w tym hiperpowierzchni właściwych przestrzeni euklidesowych wymiaru 2 i 3, tzn. pewnych krzywych w przestrzeni R 2 {\displaystyle \mathbb {R} ^{2}} oraz pewnych powierzchni w R 3 . {\displaystyle \mathbb {R} ^{3}.}

Iloczyn mieszany trzech wektorów trójwymiarowej przestrzeni liniowej można zdefiniować za pomocą wyznacznika macierzy, w której wektory te są kolumnami (bądź wierszami) albo niezależnie od układu współrzędnych za pomocą iloczynu zewnętrznego {\displaystyle \wedge } tych wektorów. Podobnie dla równoległościanu zorientowanego

R ( a 1 , , a n ) = a 1 a n {\displaystyle \mathrm {R} (\mathbf {a} _{1},\dots ,\mathbf {a} _{n})=\mathbf {a} _{1}\wedge \ldots \wedge \mathbf {a} _{n}}

można określić również jego n {\displaystyle n} -wymiarową objętość wzorem

| R ( a 1 , , a n ) | n = a 1 a n , {\displaystyle {\big |}\mathrm {R} (\mathbf {a} _{1},\dots ,\mathbf {a} _{n}){\big |}_{n}=\|\mathbf {a} _{1}\wedge \ldots \wedge \mathbf {a} _{n}\|,}

skąd wartość wyznacznika Grama można określić niezależnie od współrzędnych wektorów jako

g ( a 1 , , a n ) = a 1 a n 2 . {\displaystyle g(\mathbf {a} _{1},\dots ,\mathbf {a} _{n})=\|\mathbf {a} _{1}\wedge \ldots \wedge \mathbf {a} _{n}\|^{2}.}

Uwagi

  1. Każdy z wektorów układu A {\displaystyle A} można wyrazić w bazie ortonormalnej B = { b 1 , , b n } , {\displaystyle B=\{\mathbf {b} _{1},\dots ,\mathbf {b} _{n}\},} tzn. a j = i = 1 n a i j b i {\displaystyle \mathbf {a} _{j}=\sum _{i=1}^{n}a_{ij}\mathbf {b} _{i}} dla j = 1 , , k . {\displaystyle j=1,\dots ,k.} Wówczas A = [ a i j ] {\displaystyle \mathbf {A} =[a_{ij}]} jest macierzą typu n × k . {\displaystyle n\times k.}
  2. Niech wektory a 1 , , a k {\displaystyle \mathbf {a} _{1},\dots ,\mathbf {a} _{k}} wyrażone w bazie ortonormalnej b 1 , , b n {\displaystyle \mathbf {b} _{1},\dots ,\mathbf {b} _{n}} odpowiadają kolumnom macierzy A . {\displaystyle \mathbf {A} .} Ponieważ b i , b j = 1 {\displaystyle \langle \mathbf {b} _{i},\mathbf {b} _{j}\rangle =1} dla i = j {\displaystyle i=j} oraz b i , b j = 0 {\displaystyle \langle \mathbf {b} _{i},\mathbf {b} _{j}\rangle =0} w pozostałych przypadkach, to
    a r , a s = i = 1 n a i r b i , j = 1 n a j s b j = i , j = 1 n a i r a j s ¯ b i , b j = i = 1 n a i r a i s ¯ {\displaystyle \langle \mathbf {a} _{r},\mathbf {a} _{s}\rangle =\left\langle \sum _{i=1}^{n}\mathbf {a} _{ir}\mathbf {b} _{i},\sum _{j=1}^{n}\mathbf {a} _{js}\mathbf {b} _{j}\right\rangle =\sum _{i,j=1}^{n}\mathbf {a} _{ir}{\overline {\mathbf {a} _{js}}}\langle \mathbf {b} _{i},\mathbf {b} _{j}\rangle =\sum _{i=1}^{n}\mathbf {a} _{ir}{\overline {\mathbf {a} _{is}}}} jest wyrazem r s {\displaystyle rs} macierzy A A . {\displaystyle \mathbf {A} ^{\star }\mathbf {A} .}
  3. Niech Y {\displaystyle Y} będzie podprzestrzenią unitarną rozpiętą przez układ wektorów A = { a 1 , , a k } {\displaystyle A=\{\mathbf {a} _{1},\dots ,\mathbf {a} _{k}\}} o współrzędnych w bazie ortonormalnej B = { b 1 , , b n } . {\displaystyle B=\{\mathbf {b} _{1},\dots ,\mathbf {b} _{n}\}.} Jeśli układ A {\displaystyle A} jest liniowo niezależny, to k = n , {\displaystyle k=n,} a więc jest on bazą przestrzeni Y {\displaystyle Y} i macierz A {\displaystyle \mathbf {A} } jest odwracalna, gdyż A = M ( i d ) A B . {\displaystyle \mathbf {A} =\mathrm {M} (\mathrm {id} )_{A}^{B}.} Stąd det A 0 , {\displaystyle \det \mathbf {A} \neq 0,} czyli G ( A ) = | det A | 2 > 0. {\displaystyle G(A)=|\det \mathbf {A} |^{2}>0.} Z drugiej strony jeśli układ A {\displaystyle A} jest liniowo zależny, to liniowo zależne są również kolumny A . {\displaystyle \mathbf {A} .} Z interpretacji mnożenia macierzy metodą współczynniki-wektory kolumny macierzy A A {\displaystyle \mathbf {A} ^{\star }\mathbf {A} } są kombinacjami liniowymi kolumn macierzy A , {\displaystyle \mathbf {A} ,} skąd wynika, że kolumny A A {\displaystyle \mathbf {A} ^{\star }\mathbf {A} } również są liniowo zależne, a więc G ( A ) = 0. {\displaystyle G(A)=0.}
  4. Niech W = l i n ( A ) , {\displaystyle W=\mathrm {lin} (A'),} wtedy V = W W . {\displaystyle V=W\oplus W^{\perp }.} Niech a k = b + c , {\displaystyle \mathbf {a} _{k}=\mathbf {b} +\mathbf {c} ,} gdzie b W , {\displaystyle \mathbf {b} \in W,} zaś c W . {\displaystyle \mathbf {c} \in W^{\perp }.} Wówczas wyrazy postaci b + c , {\displaystyle \langle \mathbf {b} +\mathbf {c} ,\cdot \rangle } w ostatnim wierszu oraz wyrazy postaci , b + c {\displaystyle \langle \cdot ,\mathbf {b} +\mathbf {c} \rangle } w ostatniej kolumnie rozkładają się na sumy b , + c , {\displaystyle \langle \mathbf {b} ,\cdot \rangle +\langle \mathbf {c} ,\cdot \rangle } oraz , b + , c . {\displaystyle \langle \cdot ,\mathbf {b} \rangle +\langle \cdot ,\mathbf {c} \rangle .} Składniki zawierające b {\displaystyle \mathbf {b} } można pominąć przy liczeniu wyznacznika, gdyż ostatni wiersz je zawierający jest kombinacją liniową pierwszych k 1 {\displaystyle k-1} wierszy macierzy G ( A ) {\displaystyle \mathbf {G} (A)} (gdyż b {\displaystyle \mathbf {b} } jest kombinacją liniową A {\displaystyle A'} ), podobnie ma się rzecz z ostatnią kolumną. W związku z tym
    G ( A ) = [ a 1 , a 1 a 1 , a k 1 c , a 1 a k 1 , a 1 a k 1 , a k 1 c , a k 1 c , a 1 c , a k 1 c , c ] , {\displaystyle \mathbf {G} (A)=\left[{\begin{matrix}\langle \mathbf {a} _{1},\mathbf {a} _{1}\rangle &\dots &\langle \mathbf {a} _{1},\mathbf {a} _{k-1}\rangle &\langle \mathbf {c} ,\mathbf {a} _{1}\rangle \\\vdots &\ddots &\vdots &\vdots \\\langle \mathbf {a} _{k-1},\mathbf {a} _{1}\rangle &\dots &\langle \mathbf {a} _{k-1},\mathbf {a} _{k-1}\rangle &\langle \mathbf {c} ,\mathbf {a} _{k-1}\rangle \\\langle \mathbf {c} ,\mathbf {a} _{1}\rangle &\dots &\langle \mathbf {c} ,\mathbf {a} _{k-1}\rangle &\langle \mathbf {c} ,\mathbf {c} \rangle \end{matrix}}\right],}
    a ponieważ c a i , {\displaystyle \mathbf {c} \perp \mathbf {a} _{i},} czyli c , a i = 0 {\displaystyle \langle \mathbf {c} ,\mathbf {a} _{i}\rangle =0} dla i = 1 , , k 1 , {\displaystyle i=1,\dots ,k-1,} to G ( A ) = G ( A ) c 2 . {\displaystyle G(A)=G(A')\cdot \|\mathbf {c} \|^{2}.}

Bibliografia