Formules, matrices

In Formules, inleiding

tot en met Formules, functies

is de basis besproken van het noteren van regels uitgevonden door natuurkundig onderzoek, iets waarvan je hoopt dat dat ook op wetenschappelijk sociologisch onderzoek van toepassing is.

Vervolgens is in het begin van Formules, differentiaalvergelijking

een natuurkundige toepassing bespreken, het geval van een gewicht hangende aan een veer, die de mogelijkheid bood om het gedrag van een systeem te beschrijven - wat je krijgt als oplossing is de experimenteel zichtbare trilling.

Die beschrijving was mogelijk omdat het gewicht-aan-veer systeem zich gemakkelijk ervoor leent om het te beschouwen als een zogenaamd "gesloten systeem", dat wil zeggen: het ondervindt verder geen invloeden van de omgeving. Op één na, die ervoor zorgt dat de trilling van het systeem steeds kleiner wordt en die we kennen als wrijving.

Hier wordt de notitie ingevoerd waarmee je een systeem met meerdere gekoppelde invloeden oftewel gekoppelde parameters kan beschrijven. Daarvoor moet eerst het natuurkundige voorbeeld worden aangepast.

Stap één is de vervanging van de veer door een lange staaf. De veer is ook een lange staaf, maar dan erg dun en erg lang, en vervolgens opgewonden. Om van een lange staaf, die dus veel dikker is dan een veer, de rek zichtbaar te maken, moet er erg hard aan getrokken worden, en daarvoor gebruikt men in de praktijk een hydraulisch apparaat.

Dat hydraulische trekapparaat gebruikt men voornamelijk om te bepalen hoe sterk diverse metalen en andere materialen zijn, met als één van de uitkomsten het punt waarop de staaf breekt. Wat eigenlijk merkwaardig is, dat breken, want waarom zou je niet net zo lang door kunnen trekken dat de staaf één zeer lange draad wordt?.

Bij nader onderzoek van de gebroken staaf blijkt waarom: ter plekke van de breuk is de staaf dunner.

Waarna het breukproces logisch is: de staaf wordt op een bepaalde plek een beetje dunner, dan staat er extra spanning op dat dunnere stuk ten opzichte van de dikkere erboven en eronder, en dit dunnere stukje gaat extra rekken, wordt extra dunner, enzovoort.

Maar waar het hier als voorbeeld om gaat: is gewoon het voorafgaande dunner worden van de staaf, wat natuurlijk altijd gebeurt: de staaf heeft een vaste hoeveelheid materie dus maak je hem langer dan moet hij dunner worden.

Oftewel: als je in de lengterichting trekt, vertikaal, gebeurd er kennelijk ook iets met de dikte of de diameter: horizontaal..

En dat is het effect dat we willen beschrijven: twee parameters, lengte en diameter, zijn aan elkaar gekoppeld.

En als voorheen doe we dat eerst door de zaak zo veel mogelijk te versimpelen.

Dus ten eerst wordt de regel van het rekken, de wet van Hooke

...:

\[ F ~ = ~ k \times \Delta l \]

Met \( \Delta l \) omgeschreven naar afstandsparameter. Omdat er verderop in verschillende richtingen gewerkt gaat worden dus \( x \) niet aanmerking komt als parameter-naam, gebruiken we het "Engelse" \( e \) (van "expansion" oftewel uitdijing wat natuurlijk ook inkrimping kn zijn). Voor hoofdrichting kiezen we altijd liefst de \( x \) hoewel het in feite vertikaal is:\[ F ~ = ~ k \times e_x \], of \[ e_x ~ = ~ {F \over k} \]Maar er gebeurt dus ook iets in een andere richting, horizontaal, wat eigenlijk twee parameter is, \( e_y \) en \( e_z \), waarvan alleen de \( e_y \) wordt meegenomen:\[ e_y ~ = ~ {F \over k} \] Maar dit is zo duidelijk niet goed want dan zou de staf in de en richting evenveel rekken wat absoluut niet het geval: hij rekt veel meer in de richting \( x \)-richting. Dus die \( k \)'s zijn verschillend:

\[ e_x ~ = ~ {F \over k_x} \]

... en:

\[ e_y ~ = ~ {F \over k_y } \]

Dit zijn twee vergelijkingen die tegelijkertijd gelden, en zowel wis- als natuurkundigen willen dat dan graag in één enkele stoppen - omdat het in feite om één enkel verschijnsel gaat. Om de notatie vergemakkelijken wordt de \( k \) in de noemer vervangen voor een \( c \) in de teller, zeg maar: stugheid wordt vervangen door rekbaarheid:

\[ e_x ~ = ~ {c_x \times F} \]

... en:

\[ e_y ~ = ~ {c_y \times F} \]

Nu komt de tweede notatieafspraak: de; en y versies worden samengenomen - en "samen nemen" doen wiskundige op een redelijk natuurlijke manier: door er haakjes omheen te zetten:

\[ \begin{pmatrix} e_x \\ e_y \end{pmatrix} ~ = ~ \begin{pmatrix} c_x \\ c_y \end{pmatrix} \times F \]

Hier is de positie boven elkaar gebruikt, maar men gebruikt ook die naast elkaar:

\[ (\, e_x, \,\, e_y \, ) \]

... of in het algemeen:
\[ (\, x, \,\, y\, ) \]
... alleen niet in dit soort gevallen. De combinatie heet een "vector".

Oké, dit was eigenlijk het simpele geval: je trekt in dezelfde richting aan de staaf als de staaf zelf loopt. Een uitzondering. In een echte constructie wordt er van twee kanten getrokken, in de lengterichting en "opzij", neem bijvoorbeeld de dwarsstaaf in de volgende constructie, de staaf die voor de stijfheid zorgt "in het dwarsverband").

Dat wil zeggen: je hebt een \( F_x \) en een \( F_y \) . Eerst maar weer het natuurkundige geval - en neem voor de rekbaarheid in de \( y \)-richting een andere waarde dan in de \( x \). Die laatste was \( k \), dus neem voor de eerste \( l \). En ga weer terug naar het geval zonder koppeling van \( x \) en \( y \):

\[ e_x ~ = ~ {F_x \over k} \]

... en:

\[ e_y ~ = ~ {F_y \over l } \]

Maar kijk nu naar de eerste van deze twee:

\[ e_x ~ = ~ {F_x \over k} \]

Die veroorzaakte ook een effect in de \( y \)-richting, zodat we twee vergelijkingen kregen:

\[ e_x ~ = ~ {F_x \over k_x} \]

... en:

\[ e_y ~ = ~ {F_x \over k_y } \]

En op dezelfde manier geeft de tweede:

\[ e_y ~ = ~ {F_y \over l } \]

... ook twee vergelijkingen:

\[ e_x ~ = ~ {F_y \over l_x} \]

... en:

\[ e_y ~ = ~ {F_y \over l_y } \]

Een onoverzichtelijk geheel.

De eerste stap naar ietsje meer duidelijkheid is de waardes voor \( e_x \) samen nemen:

\[ e_x ~ = ~ {F_x \over k_x} ~ + ~ {F_y \over l_x } \]

En idem voor \( e_y \):

\[ e_y ~ = ~ {F_x \over k_y } ~ + ~ {F_y \over l_y } \]

En nu weer van die vervelende \( k \) , \( l \) in de noemer naar de \( c \)'s in de teller. En bedenk: de \( k \) hoorde bij het trekken in de richting en de \( l \) bij de \( y \) - oftewel, tezamen met het omkeren:

\[ k ~ = ~ {1 \over c_x } ~ ~ ~~~ l ~ = ~ {l \over c_y } \]

En vul dit nu in in de laatste twee formules gewoon de \( k \) en \( \) vervangen door bovenstaande en verder niets veranderen:

\[ e_x ~ = ~ (c_x)_x \, F_x ~ + ~ (c_y)_x \, F_y \]

... en idem voor \( e_y \):

\[ e_y ~ = ~ (c_x)_y \, F_x ~ + ~ (c_y)_y \, F_y \]

Lees nu de bovenste regel nog eens hardop op: de rek in de \( x \)-richting bestaat uit de kracht in de \( x \)-richting maal de rekconstante van de \( x \)-richting bekeken in de \( x \)-richting, plus de rek ten gevolge van de kracht in de \( y \)-richting maal de rekconstante in de \( y \)-richting, bekeken in de \( x \)-richting.

Eigenlijk niets meer dan wat er op een gegeven moment geconstateerd is dat als je in de \( x \)-richting trekt, er ook in de \( y \)-richting iets gebeurd, en dat dan systematisch opgeschreven voor het meest algemene geval.

Omdat dit meteen een heel algemeen geval is, gaan we het omschrijven naar het wiskundige model. Als eerste worden de haakjes eruit gehaald, in het hoofd houdende wat er bedoeld wordt:

\[ e_x ~ = ~ c_{x \, x}\, F_x ~ + ~ c_{y \, x}\, F_y \]

... en idem voor \( e_y \):

\[ e_y ~ = ~ c_{x \, y}\, F_x ~ + ~ c_{y \, y}\, F_y \]

Als tweede wordt de "bij elkaar"-notatie weer gebruikt:

\[ \begin{pmatrix} e_x \\ e_y \end{pmatrix} ~ = ~ \begin{pmatrix} c_{x \, x} \, F_x ~ + ~ c_{y \, x}\, F_y \\ c_{x \, y}\, F_x ~ + ~ c_{y \, y}\, F_y \end{pmatrix} \]

Nu begint steeds meer op te vallen dat in de twee regels aan de rechterkant bijna hetzelfde staat: er staan in beide gevallen een \( (F_x ~ , ~ F_y ) \) combinatie met constanten ervoor gezet en opgeteld. Er staat afgekort iets in de zin van:

\[ (e_x ~ , ~ e_y ) ~ = ~ T \,(F_x ~ , ~ F_y ) \]

... waarbij \( T \) een symbool is vooreen willekeurige combinatie van de erop volgende elementen, of een in de wiskunde gebruikelijke termen: een willekeurige "transformatie".

In feite is het voorbeeld, doordat het zo algemeen is gehouden, een voorbeeld van alle gevallen waarin een parameter met meerdere componenten, hier dus de twee van \( (e_x ~ , ~ e_y ) \) afhangt van een andere parameter met meerdere componenten, hier \( (F_x ~ , ~ F_y ) \) , als er een verband bestaat tussen de twee parameters - hier dus: de rek in de \( x \)-richting hangt af van die in de \( y \)-richting en omgekeerd.

Omdat dit een veel voorkomend geval betreft, is een zo handig mogelijk notatie essentieel. Daarom heeft de wiskunde een paar afspraken gemaakt: als eerste worden de constanten gezet in een eigen verzameling - waarvan er hier dus vier zijn en eerst even heel algemeen worden gehouden:

\[ \begin{pmatrix} e_x \\ e_y \end{pmatrix} ~ = ~ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \begin{pmatrix} e_x \\ e_y \end{pmatrix} \]

De regel voor het combineren, "vermenigvuldigen", van twee opeenvolgende combinaties die hierbij ingevoerd wordt is deze: vermenigvuldig de rijen van de eerste met de kolommen van de tweede - uitgevoerd:

\[ \begin{pmatrix} e_x \\ e_y \end{pmatrix} ~ = ~ \begin{pmatrix} a \, F_x ~ + ~ b\, F_y \\ c\, F_x ~ + ~ d\, F_y \end{pmatrix} \]

Waaruit je direct kan zien wat de \( a \) , \( b \)zijn in ons geval. Nu maakt de wiskunde de notatie iets anders dan wij afgeleid hebben uit de natuurkunde. Die schrijft:

\[ \begin{pmatrix} e_x \\ e_y \end{pmatrix} ~ = ~ \begin{pmatrix} c_{x \, x} & c_{x \, y} \\ c_{y \, x} & c_{y \, y} \end{pmatrix} \begin{pmatrix} F_x \\ F_y \end{pmatrix} \]

Deze verandering maakt dat de tweede index gelijk loopt met die van de parameter waarmee hij vermenigvuldigd wordt, de \( F \) in dit geval. Dat is handig voor latere regels en notatie.

De volgende stap in verder veralgemeniseren is het vervangen van de specifieke natuurkundige parameters \( e \) en \( F \) oftewel de rek en kracht, door algemene wiskundige functies. Omdat \( y \) en \( x \) al bezet zijn, gebruiken we maar \( v \) en \( u \) - met \( v \) als functie van \( u \):

\[ \begin{pmatrix} v_x \\ v_y \end{pmatrix} ~ = ~ \begin{pmatrix} c_{x \, x} & c_{x \, y} \\ c_{y \, x} & c_{y \, y} \end{pmatrix} \begin{pmatrix} u_x \\ u_y \end{pmatrix} \]

En het kan nog algemener, want x en y hebben toch een natuurkundige bijbetekenis:

\[ \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} ~ = ~ \begin{pmatrix} c_{1 \, 1} & c_{1 \, 2} \\ c_{2 \, 1} & c_{2 \, 2} \end{pmatrix} \begin{pmatrix} u_1 \\ u_2 \end{pmatrix} \]

En daar is het al zeer algemene verband tussen twee parameters met twee componenten, als die parameters op één of andere manier gekoppeld zijn. De verzameling van constanten waarvan de waarde de sterkte van het verband aangeven, heet een "matrix". In de matrix staan op de diagonaalplaatsen, die van linksboven naar rechtsonder, de "gewone" verbanden tussen de parameter en zijn component - op de niet-diagonaal plaatsen staat de sterkte van de "dwarsverbanden".

De situatie zonder dwarsverbanden is gewoonlijk de normale situatie, zoals het geval van de wet van Hooke afgeleid van een gewicht aan een veer - dat omdat een veer nu eenmaal veel langer is dan dik. Omdat de dikte zo klein is, kan een verandering erin ook weinig invloed hebben. De "dwarstermen" in de matrix zijn bijna nul, en in het kader van de altijd beperkte precisie de facto nul.

Een matrix waarvan de dwarstermen nul zijn, heet een diagonaal matrix, en is komt dus overeen met de simpele situaties in de natuur.

Is de situatie zodanig dat de ene parameter een relatief kleine invloed uitoefent op de ander, dat wil zeggen: de niet-diagonaaltermen zijn allemaal veel kleiner dan die op de diagonaal. Dan kan je veelal een combinatie vinden van de oorspronkelijke parameters waarvoor de matrix wel diagonaal is.

Het vinden van die combinatie heet de matrix diagonaliseren of "normaliseren" of vaker "het bepalen van de eigenwaardes van de matrix" - die eigenwaardes zijn de waardes op de diagonaal van de diagonaal-matrix.

De waarde van het diagonaliseren is dat met die nieuwere parameters, je de functies die afhankelijk zijn van die parameters kan opsplitsen, en ieder onafhankelijk kan behandelen. Dat is altijd veel simpeler dan gekoppelde parameters.

Het andere geval is dat twee parameters sterk aan elkaar gekoppeld zijn, en de niet-diagonaalwaardes dus minstens ongeveer even groot zijn als die op de diagonaal. Daarvan is aan archetypisch voorbeeld, namelijk een deeltje dat in een cirkel beweegt - of een ander gesloten baan maar zoals altijd start je zo'n verhaal met het simpelste geval. Waardoor die cirkelbaan ontstaat is even niet belangrijk, want waar het hier om gaat is dat daardoor de \( x \)- en \( y \)-waardes van de positie van dat deeltjes sterk aan elkaar gekoppeld zijn. Doodgewoon omdat het een cirkelbaan is.

Voor de beschrijving van die koppeling is eerste weer wat notatie-kennis nodig. Neem een cirkel met straal is één, en kies op die cirkel een punt, zie onder:

Dan kan je de positie van dat opgeven door zijn \( x \)-waarde op te geven, zijn\( y \)-waarde of de hoek. Dee eerste twee zijn niet helemaal eenduidig, want telkens is er nog een punt met dezelfde waarde. De hoek is wel eenduidig, maar praktisch nogal verveld: afstanden kan je meten en zonodig precies meten, maar een hoek is vervelender. Dus is het handig om te weten hoe je de een uit de ander kan halen. Voor een cirkel van straal is één zijn dat een vastgelegde waarde, voor alle mogelijke hoeken, oftewel: een functie. Die functie heeft voor de \( x \)-richting "cosinus", afgekort "cos", ) en voor de \( y \)-richting "sinus" (afgekort "sin") - tezamen:

\[ x ~ = ~ \cos \, \alpha ~~~~~~~ y ~ = ~ \sin \, \alpha \]

Iedere rekenmachine is uitgerust met deze functie om dit soort berekeningen te kunnen doen. Het zijn de functies voor het omzetten van "cirkel-waardes" in "rechtuit-waardes".

Dat wat betreft de notatie. Waar het hier om gaat is de beschrijving van "het proces", dat wil zeggen: het draaien van het punt in de cirkel rond het middelpunt. Waarvan één van de uitdrukkingen is: "Als je de positie nu weet, wat is dan de positie een tijd later, als door het ronddraaien de hoek is verandert?" Tijd kan je namelijk wel makkelijk meten. En ook kan je dus meten hoe lang één rondje, oftewel: 360 graden, duurt, dus aan de hand van de tijd kan je voor het continue proces wél de hoek bepalen. Zeg het punt was op \( ( x ~ , ~ y ) \) , op tijd \( t_1 \) wat is dan de nieuwe positie op een tijd \( t_2 \) oftewel een hoek \( \alpha \) later? Nu enig geometrisch puzzelwerk, en gebruik makende van de nieuwe notatie met vectoren en matrices, is het antwoord dit:

\[ \begin{pmatrix} x \\y \end{pmatrix}_{t_2} ~ = ~ \begin{pmatrix} \cos \, \alpha & - \sin \, \alpha \\ \sin \, \alpha & \cos \, \alpha \end{pmatrix}\begin{pmatrix} x \\y \end{pmatrix}_{t_1} \]

En daar staan zowel op de diagonaal als niet-diagonaal plaatsen termen tussen nul en één. Aangevende dat \( x \) en \( y \) stevig gekoppeld zijn.

In de natuurkunde is het veel voorkomend dat de basistoestanden van de soort als deze laatste zijn, zoals bij planeten en andere satellieten en in atomen, gepaard gaande met zwakke koppelingen met de buitenwereld. En in de menswetenschappen zijn periodieke verschijnselen ook veelvoorkomend. Die hoeven niet netjes cirkelvormig te zijn, want een ander deel van de wiskunde leert dat niet-nette periodieke verschijnselen te ontleden zijn als een som van de nette exemplaren, wat heet Fourier-analyse

.

Naar Evolutie

, Wetenschap lijst

, Wetenschap overzicht

, of site home

Formules, matrices

8 apr.2015