Formules, matrices
In Formules, inleiding
tot en met Formules, functies
is de basis besproken van het noteren van regels uitgevonden door
natuurkundig onderzoek, iets waarvan je hoopt dat dat ook op wetenschappelijk
sociologisch onderzoek van toepassing is.
Vervolgens is in het begin van Formules, differentiaalvergelijking
een natuurkundige toepassing bespreken, het geval van een gewicht hangende aan
een veer, die de mogelijkheid bood om het gedrag van een systeem te beschrijven
- wat je krijgt als oplossing is de experimenteel zichtbare trilling.
Die beschrijving was mogelijk omdat het gewicht-aan-veer systeem zich
gemakkelijk ervoor leent om het te beschouwen als een zogenaamd "gesloten
systeem", dat wil zeggen: het ondervindt verder geen invloeden van de omgeving.
Op één na, die ervoor zorgt dat de trilling van het systeem steeds kleiner wordt
en die we kennen als wrijving.
Hier wordt de notitie ingevoerd waarmee je een systeem met meerdere gekoppelde
invloeden oftewel gekoppelde parameters kan beschrijven. Daarvoor moet eerst het
natuurkundige voorbeeld worden aangepast.
Stap één is de vervanging van de veer door een lange staaf. De veer is ook een
lange staaf, maar dan erg dun en erg lang, en vervolgens opgewonden. Om van een
lange staaf, die dus veel dikker is dan een veer, de rek zichtbaar te maken,
moet er erg hard aan getrokken worden, en daarvoor gebruikt men in de praktijk
een hydraulisch apparaat.
Dat hydraulische trekapparaat gebruikt men voornamelijk om te bepalen hoe sterk
diverse metalen en andere materialen zijn, met als één van de uitkomsten het
punt waarop de staaf breekt. Wat eigenlijk merkwaardig is, dat breken, want
waarom zou je niet net zo lang door kunnen trekken dat de staaf één zeer lange
draad wordt?.
Bij nader onderzoek van de gebroken staaf blijkt waarom: ter plekke van de breuk
is de staaf dunner.
Waarna het breukproces logisch is: de staaf wordt op een bepaalde plek een
beetje dunner, dan staat er extra spanning op dat dunnere stuk ten opzichte van
de dikkere erboven en eronder, en dit dunnere stukje gaat extra rekken, wordt
extra dunner, enzovoort.
Maar waar het hier als voorbeeld om gaat: is gewoon het voorafgaande dunner
worden van de staaf, wat natuurlijk altijd gebeurt: de staaf heeft een vaste
hoeveelheid materie dus maak je hem langer dan moet hij dunner worden.
Oftewel: als je in de lengterichting trekt, vertikaal, gebeurd er kennelijk ook
iets met de dikte of de diameter: horizontaal..
En dat is het effect dat we willen beschrijven: twee parameters, lengte en
diameter, zijn aan elkaar gekoppeld.
En als voorheen doe we dat eerst door de zaak zo veel mogelijk te versimpelen.
Dus ten eerst wordt de regel van het rekken, de wet van Hooke
...:
\[ F ~ = ~ k \times \Delta l \]
|
Met \( \Delta l \) omgeschreven naar afstandsparameter. Omdat er verderop in
verschillende richtingen gewerkt gaat worden dus \( x \) niet aanmerking komt als
parameter-naam, gebruiken we het "Engelse" \( e \) (van "expansion" oftewel uitdijing wat
natuurlijk ook inkrimping kn zijn). Voor hoofdrichting kiezen we altijd liefst de \( x \) hoewel het in feite
vertikaal is:\[ F ~ = ~ k \times e_x \], of \[ e_x ~ = ~ {F \over k}
\]Maar er gebeurt dus ook iets in een andere richting, horizontaal, wat
eigenlijk twee parameter is, \( e_y \) en \( e_z \), waarvan alleen de \( e_y \)
wordt meegenomen:\[ e_y ~ = ~ {F \over k} \] Maar dit is zo duidelijk niet
goed want dan zou de staf in de en richting evenveel rekken wat absoluut niet
het geval: hij rekt veel meer in de richting \( x \)-richting. Dus die \(
k \)'s zijn
verschillend:
\[ e_x ~ = ~ {F \over k_x} \]
|
...
en:
\[ e_y ~ = ~ {F \over k_y } \]
|
Dit zijn twee vergelijkingen die
tegelijkertijd gelden, en zowel wis- als natuurkundigen willen dat dan graag in
één enkele stoppen - omdat het in feite om één enkel verschijnsel gaat. Om de
notatie vergemakkelijken wordt de \( k \) in de noemer vervangen voor een
\( c \) in de
teller, zeg maar: stugheid wordt vervangen door rekbaarheid:
\[ e_x ~ = ~ {c_x \times F} \]
|
... en:
\[ e_y ~ = ~ {c_y \times F} \]
|
Nu komt de tweede notatieafspraak: de; en y versies worden samengenomen -
en "samen nemen" doen wiskundige op een redelijk natuurlijke manier: door er
haakjes omheen te zetten:
\[ \begin{pmatrix} e_x \\ e_y \end{pmatrix} ~ = ~ \begin{pmatrix}
c_x \\ c_y \end{pmatrix} \times F \]
|
Hier is de positie boven elkaar gebruikt, maar men gebruikt ook die naast elkaar:
\[ (\, e_x, \,\, e_y \, ) \]
|
... of in het algemeen:
\[ (\, x, \,\, y\, ) \]
... alleen niet in dit soort gevallen. De combinatie heet een "vector".
Oké, dit was eigenlijk het simpele geval: je trekt in dezelfde richting aan de
staaf als de staaf zelf loopt. Een uitzondering. In een echte constructie wordt
er van twee kanten getrokken, in de lengterichting en "opzij", neem bijvoorbeeld
de dwarsstaaf in de volgende constructie, de staaf die voor de stijfheid zorgt
"in het dwarsverband").
Dat wil zeggen: je hebt een \( F_x \) en een \( F_y \) . Eerst maar weer
het natuurkundige geval - en neem voor de rekbaarheid in de \( y \)-richting een
andere waarde dan in de \( x \). Die laatste was \( k \), dus neem voor de
eerste \( l \). En ga weer terug naar het geval zonder koppeling van \( x \) en
\( y \):
\[ e_x ~ = ~ {F_x \over k} \]
|
... en:
\[ e_y ~ = ~ {F_y \over l } \]
|
Maar kijk nu naar de eerste van deze twee:
\[ e_x ~ = ~ {F_x \over k} \]
|
Die veroorzaakte ook een effect in de \( y \)-richting, zodat we twee vergelijkingen kregen:
\[ e_x ~ = ~ {F_x \over k_x} \]
|
... en:
\[ e_y ~ = ~ {F_x \over k_y } \]
|
En op dezelfde manier geeft de tweede:
\[ e_y ~ = ~ {F_y \over l } \]
|
... ook twee vergelijkingen:
\[ e_x ~ = ~ {F_y \over l_x} \]
|
... en:
\[ e_y ~ = ~ {F_y \over l_y } \]
|
Een onoverzichtelijk geheel.
De eerste stap naar ietsje meer duidelijkheid is de waardes voor \( e_x \) samen
nemen:
\[ e_x ~ = ~ {F_x \over k_x} ~ + ~ {F_y \over l_x } \]
|
En idem voor \( e_y \):
\[ e_y ~ = ~ {F_x \over k_y } ~ + ~ {F_y \over l_y } \]
|
En nu weer van die vervelende \( k \) , \( l \) in de noemer naar de
\( c \)'s in de teller. En
bedenk: de \( k \) hoorde bij het trekken in de richting en de \( l \) bij de \(
y \) - oftewel,
tezamen met het omkeren:
\[ k ~ = ~ {1 \over c_x } ~ ~ ~~~ l ~ = ~ {l \over c_y } \]
|
En vul dit nu in in de laatste twee formules gewoon de \( k \) en \( \) vervangen door
bovenstaande en verder niets veranderen:
\[ e_x ~ = ~ (c_x)_x \, F_x ~ + ~ (c_y)_x \, F_y \]
|
... en idem voor \( e_y \):
\[ e_y ~ = ~ (c_x)_y \, F_x ~ + ~ (c_y)_y \, F_y \]
|
Lees nu de bovenste regel nog eens hardop op: de rek in de \( x \)-richting bestaat
uit de kracht in de \( x \)-richting maal de rekconstante van de \( x \)-richting
bekeken in de \( x \)-richting, plus de rek ten gevolge van de kracht in de \( y \)-richting
maal de rekconstante in de \( y \)-richting, bekeken in de \( x \)-richting.
Eigenlijk niets meer dan wat er op een gegeven moment geconstateerd is dat als
je in de \( x \)-richting trekt, er ook in de \( y \)-richting iets gebeurd, en dat dan
systematisch opgeschreven voor het meest algemene geval.
Omdat dit meteen een heel algemeen geval is, gaan we het omschrijven naar het
wiskundige model. Als eerste worden de haakjes eruit gehaald, in het hoofd
houdende wat er bedoeld wordt:
\[ e_x ~ = ~ c_{x \, x}\, F_x ~ + ~ c_{y \, x}\, F_y \]
|
... en idem voor \( e_y \):
\[ e_y ~ = ~ c_{x \, y}\, F_x ~ + ~ c_{y \, y}\, F_y \]
|
Als tweede wordt de "bij elkaar"-notatie weer gebruikt:
\[ \begin{pmatrix} e_x \\ e_y \end{pmatrix} ~ = ~
\begin{pmatrix} c_{x \, x} \, F_x ~ + ~ c_{y \, x}\, F_y
\\ c_{x \, y}\, F_x ~ + ~ c_{y \, y}\, F_y
\end{pmatrix} \]
|
Nu begint steeds meer op te vallen dat in de twee regels aan de rechterkant
bijna hetzelfde staat: er staan in beide gevallen een \( (F_x ~ , ~ F_y ) \) combinatie
met constanten ervoor gezet en opgeteld. Er staat afgekort iets in de zin van:
\[ (e_x ~ , ~ e_y ) ~ = ~ T \,(F_x ~ , ~ F_y ) \]
|
... waarbij \( T \) een symbool is vooreen willekeurige combinatie van de erop volgende elementen, of een in de wiskunde gebruikelijke termen: een willekeurige
"transformatie".
In feite is het voorbeeld, doordat het zo algemeen is gehouden, een voorbeeld van alle gevallen waarin een parameter met meerdere
componenten, hier dus de twee van \( (e_x ~ , ~ e_y ) \) afhangt van een andere parameter
met meerdere componenten, hier \( (F_x ~ , ~ F_y ) \) , als er een verband
bestaat tussen de twee parameters - hier dus: de rek in de \( x \)-richting hangt af
van die in de \( y \)-richting en omgekeerd.
Omdat dit een veel voorkomend geval betreft, is een zo handig mogelijk notatie
essentieel. Daarom heeft de wiskunde een paar afspraken gemaakt: als eerste worden de constanten gezet in een eigen verzameling - waarvan er hier dus vier zijn en eerst even
heel algemeen worden gehouden:
\[ \begin{pmatrix} e_x \\ e_y \end{pmatrix} ~ = ~
\begin{pmatrix} a & b
\\ c & d
\end{pmatrix} \begin{pmatrix} e_x \\ e_y \end{pmatrix} \]
|
De regel voor het combineren, "vermenigvuldigen", van twee opeenvolgende
combinaties die hierbij ingevoerd wordt is deze: vermenigvuldig de rijen van
de eerste met de kolommen van de tweede - uitgevoerd:
\[ \begin{pmatrix} e_x \\ e_y \end{pmatrix} ~ = ~
\begin{pmatrix} a \, F_x ~ + ~ b\, F_y
\\ c\, F_x ~ + ~ d\, F_y
\end{pmatrix} \]
|
Waaruit je direct kan zien wat de \( a \) , \( b \)zijn in ons geval. Nu maakt de wiskunde de notatie iets anders dan wij afgeleid hebben uit de natuurkunde. Die schrijft:
\[ \begin{pmatrix} e_x \\ e_y \end{pmatrix} ~ = ~
\begin{pmatrix} c_{x \, x} & c_{x \, y}
\\ c_{y \, x} & c_{y \, y}
\end{pmatrix} \begin{pmatrix} F_x \\ F_y \end{pmatrix} \]
|
Deze verandering maakt dat de tweede index gelijk loopt met die van de parameter waarmee hij
vermenigvuldigd wordt, de \( F \) in dit geval. Dat is handig voor latere regels en
notatie.De volgende stap in verder veralgemeniseren is het vervangen van de
specifieke natuurkundige parameters \( e \) en \( F \) oftewel de rek en
kracht, door algemene wiskundige functies. Omdat \( y \) en \( x \) al bezet zijn, gebruiken
we maar \( v \) en \( u \) - met \( v \) als functie van \( u \):
\[ \begin{pmatrix} v_x \\ v_y \end{pmatrix} ~ = ~
\begin{pmatrix} c_{x \, x} & c_{x \, y}
\\ c_{y \, x} & c_{y \, y}
\end{pmatrix} \begin{pmatrix} u_x \\ u_y \end{pmatrix} \]
|
En het kan nog algemener, want x en y hebben toch een natuurkundige
bijbetekenis:
\[ \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} ~ = ~
\begin{pmatrix} c_{1 \, 1} & c_{1 \, 2}
\\ c_{2 \, 1} & c_{2 \, 2}
\end{pmatrix} \begin{pmatrix} u_1 \\ u_2 \end{pmatrix} \]
|
En daar is het al zeer algemene verband tussen twee parameters met twee
componenten, als die parameters op één of andere manier gekoppeld zijn. De
verzameling van constanten waarvan de waarde de sterkte van het verband
aangeven, heet een "matrix". In de matrix staan op de diagonaalplaatsen, die
van linksboven naar rechtsonder, de "gewone" verbanden tussen de parameter en
zijn component - op de niet-diagonaal plaatsen staat de sterkte van de
"dwarsverbanden".
De situatie zonder dwarsverbanden is gewoonlijk de normale situatie, zoals het
geval van de wet van Hooke afgeleid van een gewicht aan een veer - dat omdat een
veer nu eenmaal veel langer is dan dik. Omdat de dikte zo klein is, kan een
verandering erin ook weinig invloed hebben. De "dwarstermen" in de matrix zijn
bijna nul, en in het kader van de altijd beperkte precisie de facto nul.
Een matrix waarvan de dwarstermen nul zijn, heet een diagonaal matrix, en is
komt dus overeen met de simpele situaties in de natuur.
Is de situatie zodanig dat de ene parameter een relatief kleine invloed
uitoefent op de ander, dat wil zeggen: de niet-diagonaaltermen zijn allemaal
veel kleiner dan die op de diagonaal. Dan kan je veelal een combinatie vinden
van de oorspronkelijke parameters waarvoor de matrix wel diagonaal is.
Het vinden van die combinatie heet de matrix diagonaliseren of "normaliseren" of
vaker "het bepalen van de eigenwaardes van de matrix" - die eigenwaardes zijn de
waardes op de diagonaal van de diagonaal-matrix.
De waarde van het diagonaliseren is dat met die nieuwere parameters, je de
functies die afhankelijk zijn van die parameters kan opsplitsen,
en ieder onafhankelijk kan behandelen. Dat is altijd veel simpeler dan
gekoppelde parameters.
Het andere geval is dat twee parameters sterk aan elkaar gekoppeld zijn, en de
niet-diagonaalwaardes dus minstens ongeveer even groot zijn als die op de
diagonaal. Daarvan is aan archetypisch voorbeeld, namelijk een deeltje dat in
een cirkel beweegt - of een ander gesloten baan maar zoals altijd start je zo'n
verhaal met het simpelste geval. Waardoor die cirkelbaan ontstaat is even niet
belangrijk, want waar het hier om gaat is dat daardoor de \( x \)- en \( y
\)-waardes van de positie van dat deeltjes sterk aan elkaar gekoppeld zijn.
Doodgewoon omdat het een cirkelbaan is.
Voor de beschrijving van die koppeling is eerste weer wat notatie-kennis nodig.
Neem een cirkel met straal is één, en kies op die cirkel een punt, zie onder:
Dan kan je de positie van dat opgeven door zijn \( x \)-waarde op te geven,
zijn\( y \)-waarde of de hoek. Dee eerste twee zijn niet helemaal eenduidig,
want telkens is er nog een punt met dezelfde waarde. De hoek is wel eenduidig,
maar praktisch nogal verveld: afstanden kan je meten en zonodig precies meten,
maar een hoek is vervelender. Dus is het handig om te weten hoe je de een uit de
ander kan halen. Voor een cirkel van straal is één zijn dat een vastgelegde
waarde, voor alle mogelijke hoeken, oftewel: een functie. Die functie heeft voor
de \( x \)-richting "cosinus", afgekort "cos", ) en voor de \( y \)-richting
"sinus" (afgekort "sin") - tezamen:
\[ x ~ = ~ \cos \, \alpha ~~~~~~~ y ~ = ~ \sin \, \alpha \]
|
Iedere rekenmachine is uitgerust met deze functie om dit soort
berekeningen te kunnen doen. Het zijn de functies voor het omzetten van "cirkel-waardes"
in "rechtuit-waardes".
Dat wat betreft de notatie. Waar het hier om gaat is de beschrijving van
"het proces", dat wil zeggen: het draaien van het punt in de cirkel rond het
middelpunt. Waarvan één van de uitdrukkingen is: "Als je de positie nu weet,
wat is dan de positie een tijd later, als door het ronddraaien de hoek is
verandert?" Tijd kan je namelijk wel makkelijk meten. En ook kan je dus
meten hoe lang één rondje, oftewel: 360 graden, duurt, dus aan de hand van
de tijd kan je voor het continue proces wél de hoek bepalen. Zeg het punt was op \( ( x ~ , ~ y ) \)
, op tijd \( t_1 \) wat is dan de nieuwe positie op een tijd \( t_2 \) oftewel een hoek \( \alpha \)
later? Nu enig geometrisch puzzelwerk, en gebruik makende van de nieuwe
notatie met vectoren en matrices, is het antwoord dit:
\[ \begin{pmatrix} x \\y \end{pmatrix}_{t_2} ~ = ~
\begin{pmatrix} \cos \, \alpha & - \sin \, \alpha
\\ \sin \, \alpha & \cos \, \alpha
\end{pmatrix}\begin{pmatrix} x \\y \end{pmatrix}_{t_1} \]
|
En daar staan zowel op de diagonaal als niet-diagonaal plaatsen termen
tussen nul en één. Aangevende dat \( x \) en \( y \) stevig gekoppeld zijn.
In de natuurkunde is het veel voorkomend dat de basistoestanden van de soort als
deze laatste zijn, zoals bij planeten en andere satellieten en in atomen,
gepaard gaande met zwakke koppelingen met de buitenwereld. En in de
menswetenschappen zijn periodieke verschijnselen ook veelvoorkomend. Die hoeven
niet netjes cirkelvormig te zijn, want een ander deel van de wiskunde leert dat
niet-nette periodieke verschijnselen te ontleden zijn als een som van de nette
exemplaren, wat heet Fourier-analyse
.
Naar Evolutie
, Wetenschap lijst
, Wetenschap overzicht
, of
site home
.
|