Iloczyn skalarny


Iloczyn skalarny w encyklopedii

Z Wikipedii, wolnej encyklopedii Przejdź do nawigacji Przejdź do wyszukiwania

Spis treści

Iloczyn skalarny – pewna forma dwuliniowa na danej przestrzeni liniowej, tj. dwuargumentowa funkcja o szczególnych własnościach przyporządkowująca dwóm wektorom danej przestrzeni liniowej wartość skalarną. Czasami spotyka się również nazwę iloczyn wewnętrzny, który zwykle odnosi się jednak do ogólnych iloczynów skalarnych wprowadzanych w abstrakcyjnych przestrzeniach liniowych nazywanych wtedy przestrzeniami unitarnymi; przestrzenie afiniczne z wyróżnionym iloczynem skalarnym nazywa się przestrzeniami euklidesowymi.

Zasadniczym celem wprowadzania iloczynu skalarnego w danej przestrzeni liniowej jest wprowadzenie na niej geometrii euklidesowej, w szczególności kąta między dwoma wektorami, co umożliwia mówienie o ich prostopadłości (nazywanej w tym kontekście ich ortogonalnością, która jest nieznacznym uogólnieniem) oraz obrotu. Iloczyn skalarny stanowi więc pomost między geometrią syntetyczną a geometrią analityczną. Ponieważ trójwymiarowa przestrzeń euklidesowa jest dobrym przybliżeniem świata rzeczywistego w skali makroskopowej, to iloczyn skalarny w niej określony znajduje zastosowanie w fizyce klasycznej, np. mechanice klasycznej (branie rzutów wektora siły wypadkowej jest tego przykładem); z kolei w mechanice kwantowej rozpatruje się (nieskończeniewymiarowe) przestrzenie Hilberta, czyli przestrzenie liniowe (nieskończonego wymiaru) z iloczynem skalarnym i dodatkową strukturą topologiczną (zob. Uogólnienia). Przykładowo praca mechaniczna W {\displaystyle W} to wielkość fizyczna wyrażająca się jako iloczyn skalarny siły F {\displaystyle \mathbf {F} } oraz przemieszczenia r . {\displaystyle \mathbf {r} .}

W artykule opisano iloczyn skalarny określony na rzeczywistych przestrzeniach współrzędnych[1] R n {\displaystyle \mathbb {R} ^{n}} oraz M a t n × 1 ( R ) {\displaystyle \mathrm {Mat} _{n\times 1}(\mathbb {R} )} wymiaru n , {\displaystyle n,} wraz z ortonormalną bazą standardową, nazywany też zwykłym, standardowym (w przestrzeniach afinicznych nazywa się go także euklidesowym); niżej określenia te będą pomijane (użyto notacji ustalonej w artykule o przestrzeniach współrzędnych[2]). Uogólnienia opisano w oddzielnej sekcji.

Definicja i własności | edytuj kod

 Zobacz też: forma dwuliniowa.

Standardowy iloczyn skalarny definiuje się wzorem

a b = a 1 b 1 + + a n b n , {\displaystyle \mathbf {a} \cdot \mathbf {b} =a_{1}b_{1}+\dots +a_{n}b_{n},}

w zapisie macierzowym (przy użyciu mnożenia macierzy) ma on postać

A B = A T B , {\displaystyle \mathbf {A} \cdot \mathbf {B} =\mathbf {A} ^{\mathrm {T} }\mathbf {B} ,}

gdzie A T {\displaystyle \mathbf {A} ^{\mathrm {T} }} oznacza transpozycję macierzy A . {\displaystyle \mathbf {A} .} Wzór ten jest użyteczny także w ogólnym przypadku[3], lecz w przypadku przestrzeni liniowych wzór ten opisuje formę dwuliniową, tj. funkcję R n × R n R , {\displaystyle \mathbb {R} ^{n}\times \mathbb {R} ^{n}\to \mathbb {R} ,} mającą szereg własności, które służą często jako abstrakcyjna, tzn. niezależna od współrzędnych, definicja iloczynu skalarnego (zob. przestrzeń unitarna). Wśród najważniejszych można wymienić:

  • przemienność (symetryczność), a b = b a , {\displaystyle \mathbf {a} \cdot \mathbf {b} =\mathbf {b} \cdot \mathbf {a} ,}
  • rozdzielność względem dodawania wektorów (dwuaddytywność), a ( b + c ) = a b + a c , {\displaystyle \mathbf {a} \cdot (\mathbf {b} +\mathbf {c} )=\mathbf {a} \cdot \mathbf {b} +\mathbf {a} \cdot \mathbf {c} ,} ( a + b ) c = a c + b c , {\displaystyle (\mathbf {a} +\mathbf {b} )\cdot \mathbf {c} =\mathbf {a} \cdot \mathbf {c} +\mathbf {b} \cdot \mathbf {c} ,}
  • zgodność z mnożeniem przez skalar (dwujednorodność)[4], ( r a ) b = a ( r b ) = r ( a b ) , {\displaystyle (r\mathbf {a} )\cdot \mathbf {b} =\mathbf {a} \cdot (r\mathbf {b} )=r(\mathbf {a} \cdot \mathbf {b} ),}
  • niezdegenerowanie, z warunku a b = 0 {\displaystyle \mathbf {a} \cdot \mathbf {b} =0} dla każdego b {\displaystyle \mathbf {b} } wynika a = 0 , {\displaystyle \mathbf {a} =\mathbf {0} ,} co wynika m.in. z tego, że w R {\displaystyle \mathbb {R} } nie ma dzielników zera
  • dodatnia określoność a a > 0 {\displaystyle \mathbf {a} \cdot \mathbf {a} >0} dla a 0 . {\displaystyle \mathbf {a} \neq \mathbf {0} .} bo a 1 2 + + a n 2 > 0 , {\displaystyle a_{1}^{2}+\dots +a_{n}^{2}>0,} o ile a i 0 {\displaystyle a_{i}\neq 0} dla pewnego i, co wynika z własności liczb rzeczywistych R {\displaystyle \mathbb {R} } (kwadrat liczby niezerowej jest dodatni, suma liczb dodatnich jest dodatnia)

Jeśli a b = 0 , {\displaystyle \mathbf {a} \cdot \mathbf {b} =0,} to wektory a {\displaystyle \mathbf {a} } oraz b {\displaystyle \mathbf {b} } nazywa się ortogonalnymi. Wprost z definicji wynika, że jeśli choć jeden czynnik jest wektorem zerowym, to iloczyn skalarny również jest zerowy; może się jednak zdarzyć, iż a b = 0 , {\displaystyle \mathbf {a} \cdot \mathbf {b} =0,} choć a 0 {\displaystyle \mathbf {a} \neq \mathbf {0} } oraz b 0 {\displaystyle \mathbf {b} \neq \mathbf {0} } (zob. Przykłady); mówi się wtedy czasem o prostopadłości tych wektorów. Wektory zerowe są więc jedynym elementem odróżniającym ortogonalność od prostopadłości (geometrycznie wektor zerowy odpowiada punktowi, można więc uważać, że dowolny punkt jest prostopadły do wektora, odcinka czy prostej); w oznaczeniach nie odróżnia się zwykle jednego pojęcia od drugiego, oznaczając oba symbolem a b . {\displaystyle \mathbf {a} \perp \mathbf {b} .}

Wynika stąd, że iloczyn skalarny, w przeciwieństwie do mnożenia liczb, nie ma własności skracania (tj. z równości x y = x z {\displaystyle xy=xz} nie wynika y = z , {\displaystyle y=z,} o ile tylko x 0 {\displaystyle x\neq 0} ). Otóż jeśli a b = a c , {\displaystyle \mathbf {a} \cdot \mathbf {b} =\mathbf {a} \cdot \mathbf {c} ,} to z prawa rozdzielności zachodzi a ( b c ) = 0 , {\displaystyle \mathbf {a} \cdot (\mathbf {b} -\mathbf {c} )=0,} co jest możliwe wtedy, gdy są ortogonalne (tj. jeden z tych wektorów jest zerowy: a = 0 {\displaystyle \mathbf {a} =\mathbf {0} } lub b = c {\displaystyle \mathbf {b} =\mathbf {c} } bądź są one prostopadłe, tzn. a ( b c ) {\displaystyle \mathbf {a} \perp (\mathbf {b} -\mathbf {c} )} ).

Przykłady | edytuj kod

Iloczyn skalarny dwóch trójwymiarowych wektorów ( 1 , 3 , 5 ) {\displaystyle ({\color {RoyalPurple}1},{\color {RoyalPurple}3},{\color {RoyalPurple}-5})} oraz ( 4 , 3 , 1 ) {\displaystyle ({\color {Maroon}4},{\color {Maroon}-3},{\color {Maroon}-1})} wynosi

( 1 , 3 , 5 ) ( 4 , 3 , 1 ) = 1 4 + 3 ( 3 ) + ( 5 ) ( 1 ) = 0 , {\displaystyle ({\color {RoyalPurple}1},{\color {RoyalPurple}3},{\color {RoyalPurple}-5})\cdot ({\color {Maroon}4},{\color {Maroon}-3},{\color {Maroon}-1})={\color {RoyalPurple}1}\cdot {\color {Maroon}4}+{\color {RoyalPurple}3}\cdot ({\color {Maroon}-3})+({\color {RoyalPurple}-5})\cdot ({\color {Maroon}-1})=0,}

choć żaden z tych wektorów nie jest zerowy – oznacza to, że wektory te są ortogonalne (prostopadłe).

W jednowymiarowej przestrzeni R {\displaystyle \mathbb {R} } iloczyn skalarny dany jest jako zwykłe mnożenie. Innym przykładem iloczynu skalarnego jest tzw. iloczyn wewnętrzny Frobeniusa, który jest iloczynem skalarnym na przestrzeni macierzy ustalonego typu danym „po współrzędnych”, tj. jako suma iloczynów odpowiadających sobie elementów tych macierzy (macierze dwuwymiarowe są więc traktowane jak „długie” wektory jednowymiarowe).

Interpretacja geometryczna | edytuj kod

|A|•cos(θ) jest rzutem A na B

Iloczyn skalarny umożliwia wprowadzenie „długości” wektora, tj. jego modułu lub normy, mianowicie

| a | = a a = a 1 2 + + a n 2 , {\displaystyle |\mathbf {a} |={\sqrt {\mathbf {a} \cdot \mathbf {a} }}={\sqrt {a_{1}^{2}+\dots +a_{n}^{2}}},}

przy czym wielkość ta jest poprawnie zdefiniowana, gdyż wyrażenie podpierwiastkowe jest nieujemne; jest to standardowa „długość” wektora dana z kilkukrotnego zastosowania twierdzenia Pitagorasa.

Kąt θ {\displaystyle \theta } między wektorami a {\displaystyle \mathbf {a} } oraz b {\displaystyle \mathbf {b} } dany jest wzorem

θ = arccos a b | a | | b | , {\displaystyle \theta =\arccos \;{\frac {\mathbf {a} \cdot \mathbf {b} }{|\mathbf {a} ||\mathbf {b} |}},}

gdzie arccos {\displaystyle \arccos } oznacza funkcję arcus cosinus (odwrotną do funkcji cosinus). Otóż jeśli wektory a , b {\displaystyle \mathbf {a} ,\mathbf {b} } leżą względem siebie pod kątem θ , {\displaystyle \theta ,} a wektor c {\displaystyle \mathbf {c} } jest dany jako c = a b , {\displaystyle \mathbf {c} =\mathbf {a} -\mathbf {b} ,} dzięki czemu wektory te tworzą trójkąt, to zgodnie z twierdzeniem cosinusów dla tego trójkąta zachodzi

| c | 2 = | a | 2 + | b | 2 2 | a | | b | cos θ , {\displaystyle |\mathbf {c} |^{2}=|\mathbf {a} |^{2}+|\mathbf {b} |^{2}-2|\mathbf {a} ||\mathbf {b} |\cos \theta ,}

a ponieważ kwadrat modułu jest równy iloczynowi skalarnemu wektora przez siebie, to

c c = a a + b b 2 | a | | b | cos θ , {\displaystyle \mathbf {c} \cdot \mathbf {c} =\mathbf {a} \cdot \mathbf {a} +\mathbf {b} \cdot \mathbf {b} -2|\mathbf {a} ||\mathbf {b} |\cos \theta ,}

skoro jednak c = a b , {\displaystyle \mathbf {c} =\mathbf {a} -\mathbf {b} ,} to także

c c = ( a b ) ( a b ) , {\displaystyle \mathbf {c} \cdot \mathbf {c} =(\mathbf {a} -\mathbf {b} )\cdot (\mathbf {a} -\mathbf {b} ),}

czyli

c c = a a + b b 2 ( a b ) {\displaystyle \mathbf {c} \cdot \mathbf {c} =\mathbf {a} \cdot \mathbf {a} +\mathbf {b} \cdot \mathbf {b} -2(\mathbf {a} \cdot \mathbf {b} )}

na mocy prawa rozdzielności. Porównując pierwsze i trzecie równanie na c c , {\displaystyle \mathbf {c} \cdot \mathbf {c} ,} otrzymuje się

a a + b b 2 ( a b ) = a a + b b 2 | a | | b | cos θ , {\displaystyle \mathbf {a} \cdot \mathbf {a} +\mathbf {b} \cdot \mathbf {b} -2(\mathbf {a} \cdot \mathbf {b} )=\mathbf {a} \cdot \mathbf {a} +\mathbf {b} \cdot \mathbf {b} -2|\mathbf {a} ||\mathbf {b} |\cos \theta ,}

co po redukcji wyrazów podobnych i skróceniu czynnika ( 2 ) {\displaystyle (-2)} daje

a b = | a | | b | cos θ . {\displaystyle \mathbf {a} \cdot \mathbf {b} =|\mathbf {a} ||\mathbf {b} |\cos \theta .}

Wielkość | a | cos θ {\displaystyle |\mathbf {a} |\cos \theta } jest równa długości (modułowi) rzutu wektora a {\displaystyle \mathbf {a} } na wektor b , {\displaystyle \mathbf {b} ,} stąd powyższy wzór umożliwia geometryczną interpretację iloczynu skalarnego jako iloczynu długości tego rzutu przez długość b . {\displaystyle \mathbf {b} .} Z postaci tej można dużo łatwiej odczytać, iż (niezerowe) wektory prostopadłe, tj. takie, dla których θ {\displaystyle \theta } jest nieparzystą wielokrotnością 90 , {\displaystyle 90^{\circ },} mają iloczyn skalarny równy zeru.

Uogólnienia | edytuj kod

Przestrzenie liniowe | edytuj kod

 Zobacz też: przestrzeń liniowabaza.

Opisane w artykule własności geometryczne wynikają w dużej mierze z ustalenia bazy ortonormalnej, jaką jest baza standardowa. W gruncie rzeczy pojęcie prostopadłości ma sens geometryczny i przy podanej definicji wymaga bazy standardowej, z kolei ortogonalność jest definiowana za pomocą iloczynu skalarnego i pokrywa się z prostopadłością w przypadku użycia bazy standardowej. Różnice między tymi pojęciami często rozmywa się, bo dowolna przestrzeń liniowa skończonego wymiaru ma tę samą strukturę, co przestrzeń współrzędnych o tej samej liczbie wymiarów (przestrzenie te są izomorficzne).

Innym zagadnieniem jest trudność definiowania pojęć geometrycznych (nawet w przypadku przestrzeni współrzędnych) w przypadku więcej niż trzech wymiarów – iloczyn skalarny jest wygodnym sposobem wprowadzenia zarówno długości (tj. normy), jak i kąta. Struktura unitarna (tj. obecność iloczynu skalarnego) czyni z przestrzeni liniowej przestrzeń unormowaną, która z kolei wprowadza w niej strukturę metryczną (pojęcie odległości). Stopniowe odrzucanie dodatkowych struktur umożliwiło wyabstrahowanie uogólnień pojęć długości i odległości w postaci normy i metryki.

Z interpretacji geometrycznej wynika, iż standardowy iloczyn skalarny jest niezmienniczy ze względu na izometrie: obroty, odbicia (w przypadku przestrzeni afinicznych: przekształcenia afiniczne zachowujące początek przestrzeni). Przekształcenia liniowe, które zachowują powyższe własności, a w ogólności: przekształcenia, które zachowują iloczyn skalarny, nazywa się przekształceniami unitarnymi lub ortogonalnymi, a macierze tych przekształceńmacierzami unitarnymi lub ortogonalnymi. Innymi słowy przekształcenia unitarne przeprowadzają bazy ortonormalne na bazy ortonormalne, tj. zachowują normy wektorów (są izometriami) i kąty między nimi (są przekształceniami równokątnymi zachowującymi orientację), w szczególności mają jednostkowy wyznacznik i ślad równy stopniowi macierzy.

Przestrzenie unitarne | edytuj kod

 Osobny artykuł: przestrzeń unitarna.

Przestrzeń wielomianów jednej zmiennej bądź przestrzeń funkcyjną funkcji całkowalnych z kwadratem o wartościach rzeczywistych określonych na odcinku jednostkowym mają nieskończone bazy (różnych mocy; są one izomorficzne z przestrzeniami współrzędnych odpowiednio: nieskończoną i uogólnioną, zob. przykłady przestrzeni liniowych), jednak możliwe jest w nich określenie iloczynu skalarnego: odpowiednio wzorem f g = f i g i , {\displaystyle \mathrm {f} \cdot \mathrm {g} =\sum f_{i}g_{i},} gdzie h = h 0 + h 1 X + h 2 X 2 + {\displaystyle \mathrm {h} =h_{0}+h_{1}X+h_{2}X^{2}+\dots } jest wielomianem zmiennej X , {\displaystyle X,} przy czym suma ta jest zawsze skończona (z definicji wielomianu), oraz f g = f ( x ) g ( x ) d x {\displaystyle f\cdot g=\int f(x)g(x)\;\mathrm {d} x} (całka istnieje z założenia).

Z powodu możliwości pomylenia zwykłego iloczynu funkcji z ich iloczynem skalarnym ten drugi oznacza się zwykle symbolami:

  • s , t {\displaystyle \langle s,t\rangle } lub ( s , t ) {\displaystyle (s,t)} (identycznie oznacza się np. przedziały bądź pary uporządkowane – z kontekstu wynika znaczenie symboli)
  • s | t {\displaystyle \langle s|t\rangle } lub ( s | t ) {\displaystyle (s|t)}

Reprezentacja macierzowa | edytuj kod

 Zobacz też: macierz formy dwuliniowejmacierz Grama.

Iloczyn skalarny, jak każdą formę dwuliniową, można przedstawić w postaci macierzy; przykładowo niech E = { E 1 , , E n } {\displaystyle E=\{\mathbf {E} _{1},\dots ,\mathbf {E} _{n}\}} będzie bazą (niekoniecznie standardową) przestrzeni M a t n × 1 ( R ) . {\displaystyle \mathrm {Mat} _{n\times 1}(\mathbb {R} ).} Iloczyn skalarny wektorów (kolumnowych) tej przestrzeni dany jest wtedy jako

A B = A E M B E , {\displaystyle \mathbf {A} \cdot \mathbf {B} =\mathbf {A} _{E}\mathbf {M} \mathbf {B} ^{E},}

gdzie V E {\displaystyle \mathbf {V} ^{E}} oznacza wektor kolumnowy, a V E {\displaystyle \mathbf {V} _{E}} to wektor wierszowy współrzędnych wektora (kolumnowego) V {\displaystyle \mathbf {V} } wyrażonych w bazie E {\displaystyle E} [5], zaś macierz M {\displaystyle \mathbf {M} } stopnia n {\displaystyle n} jest reprezentacją macierzową iloczynu skalarnego (która musi być dodatnio określona i symetryczna) w bazie E {\displaystyle E} opisywanego wzorem

M = E 1 E 1 E 1 E n E n E 1 E n E n ; {\displaystyle \mathbf {M} ={\begin{bmatrix}\mathbf {E} _{1}\cdot \mathbf {E} _{1}&\dots &\mathbf {E} _{1}\cdot \mathbf {E} _{n}\\\vdots &\ddots &\vdots \\\mathbf {E} _{n}\cdot \mathbf {E} _{1}&\dots &\mathbf {E} _{n}\cdot \mathbf {E} _{n}\end{bmatrix}};}

w szczególności jeśli E {\displaystyle E} jest bazą standardową, to M = I {\displaystyle \mathbf {M} =\mathbf {I} } jest macierzą jednostkową, co prowadzi przedstawionego w sekcji Definicja wzoru dla macierzy.

Zobacz też | edytuj kod

Przypisy | edytuj kod

  1. Wektory w przestrzeni współrzędnej (jak w dowolnej przestrzeni liniowej) zaczepione są w jej początku (zob. wektor zerowy); można także rozpatrywać przestrzenie afiniczne, w których wektory zaczepione mogą być w dowolnych punktach, jednak iloczyn skalarny może być obliczany wyłącznie dla wektorów o wspólnym początku.
  2. Elementy przestrzeni R n , {\displaystyle \mathbb {R} ^{n},} czyli ciągi n {\displaystyle n} -elementowe (zapisywane w nawiasach okrągłych), nazywane będą wektorami i oznaczane będą małymi, półtłustymi, prostymi literami alfabetu łacińskiego, z kolei elementy przestrzeni M a t n × 1 ( R ) , {\displaystyle \mathrm {Mat} _{n\times 1}(\mathbb {R} ),} czyli macierze jednokolumnowe o n {\displaystyle n} wierszach (zapisywane w nawiasach kwadratowych), nazywane będą wektorami kolumnowymi i oznaczane dużymi, półtłustymi, prostymi, literami alfabetu łacińskiego; składowe wektorów (kolumnowych) i skalary będą zapisywane pismem pochyłym; oznaczenia literowe wektorów i ich składowych pokrywają się, numer składowej wskazano w indeksie dolnym.
  3. Tj. w przypadku modułów nad pierścieniami; zob. moduł dualny i para dualna.
  4. Rozdzielność wraz ze zgodnością z mnożeniem przez skalar, tj. addytywność i jednorodność, ze względu na każdy argument nazywa się liniowością (por. forma liniowa); własność ta zachodzi ze względu na każdy z dwóch czynników, w tej sytuacji mówi się o dwuliniowości (por. forma dwuliniowa).
  5. Tj. ( V E ) T = V E ; {\displaystyle (\mathbf {V} _{E})^{\mathrm {T} }=\mathbf {V} ^{E};} jeśli V E {\displaystyle \mathbf {V} _{E}} jest wektorem kolumnowym współrzędnych wektora V {\displaystyle \mathbf {V} } w bazie E , {\displaystyle E,} to A B = ( A E ) T M B E . {\displaystyle \mathbf {A} \cdot \mathbf {B} =(\mathbf {A} _{E})^{\mathrm {T} }\mathbf {M} \mathbf {B} _{E}.}

Linki zewnętrzne | edytuj kod

Na podstawie artykułu: "Iloczyn skalarny" pochodzącego z Wikipedii
OryginałEdytujHistoria i autorzy