Il ruolo dei Principi Euristici nella Fisica e nella Matematica Introduzione Nel corso del Novecento si è imposta, anche a seguito delle due grandi rivoluzioni della fisica (dovute all’avvento della Meccanica Quantistica e delle due Teorie della Relatività Speciale e Generale), una visione della Fisica Teorica come “teoria assiomatica dei fenomeni naturali”: le diverse leggi che compongono una teoria vengono cioè derivate a partire da pochi, semplici, principi primi o postulati di carattere generalissimo (che potremmo definire “leggi fondamentali”) assunti a priori per veri; da questi, quindi, vengono desunte tutte le conseguenze teoriche e le previsioni sperimentalmente testabili della teoria. Questa concezione della fisica presenta forti analogie coi sistemi assiomatici formali della matematica post-Hilbertiana, ma allo stesso tempo anche una grossa differenza: mentre l’unica richiesta che possiamo fare ad un sistema assiomatico matematico è la sua coerenza interna (che diventa per esso sinonimo di verità), e soddisfatta questa la scelta dei postulati risulta essere completamente arbitraria, per una teoria assiomatica fisica (il cui scopo è quello di descrivere la realtà) c’è la possibilità di stabilire, a posteriori, la validità dei postulati fondamentali su cui poggia mediante il controllo sperimentale dei suoi risultati: una teoria fisica matematicamente dedotta, in modo rigoroso, dai suoi assiomi, che produce previsioni smentite dagli esperimenti poggia, necessariamente, su postulati sbagliati, e quindi deve essere rivista; viceversa, le teorie che ricevono ripetute conferme sperimentali dimostrano, quantomeno, di cogliere alcuni aspetti fondamentali della verità sulla natura. Rimane naturalmente il problema della scelta, a priori, dei postulati su cui fondare una teoria fisica. Certamente la conoscenza dei risultati sperimentali che la teoria dovrà riprodurre fornisce fondamentali criteri di tipo orientativo, ma in diversi casi non è sufficiente per formulare ipotesi complete, ossia non basta per dare una forma matematica esplicita alle nostre leggi fondamentali. In questo contesto hanno giocato un ruolo certamente fondamentale, sia per la ricerca in fisica teorica che per quella in matematica, alcuni principi guida di tipo euristico, utilizzati dai fisici del Novecento per formulare i postulati fondamentali delle più importanti teorie moderne, tra cui ci limitiamo a ricordare la Relatività, la Meccanica Quantistica e le varie Teorie dei Campi. I Principi Euristici Cosa sono questi principi euristici? L'euristica (dal verbo greco εὑρίσκω, letteralmente "scopro" o "trovo") è una parte dell'epistemologia e del metodo scientifico che si occupa di favorire l'accesso a nuovi sviluppi teorici o a scoperte empiriche. L’Enciclopedia Zanichelli definisce l’euristica come la «parte di una scienza riguardante la metodologia di ricerca per la scoperta di fatti e di verità oggettive, da utilizzare come base delle speculazioni successive». Nello specifico, un procedimento euristico in matematica è «un procedimento intuitivo e non rigoroso usato per la giustificazione o la previsione di un risultato che dovrà essere giustificato successivamente», mentre in logica e in fisica è il «metodo di ricerca dei fatti necessari ad una Archimede scoprì il principio che oggi porta il teoria». I principi euristici sono quindi principi guida non suo nome mentre faceva un bagno. Uscì dalla rigorosi (o non necessariamente rigorosi) che sono, però, vasca gridando “Eureka!” (“Ho trovato!”). molto utili nella comprensione intuitiva della verità: essi portano all’individuazione, e ad una sorta di “giustificazione”, dei postulati che si devono porre alla base di una teoria fisica, ma non possono certo fornirne una dimostrazione in quanto i suddetti postulati sono, e restano, degli assiomi (per definizione indimostrabili). Analogamente, in matematica i principi euristici possono guidare alla 1 formulazione di un teorema (“derivazione euristica”), che però non costituisce affatto una prova (“dimostrazione logica”) della validità del suddetto. Questi principi possono anche essere utilizzati, al tempo stesso, per elaborare un approccio risolutivo ad un problema, di tipo fisico o matematico, che tipicamente non rientra nelle casistiche “standardizzate”, e quindi necessita di un approccio più “creativo” per essere affrontato, analogamente a quanto avviene nella ricerca scientifica quando si cerca di costruire le fondamenta di un nuovo soggetto. Come leggiamo sull’enciclopedia Wikipedia, infatti, «Si definisce […] procedimento euristico, un metodo di approccio alla soluzione dei problemi che non segue un chiaro percorso, ma che si affida all'intuito e allo stato temporaneo delle circostanze, al fine di generare nuova conoscenza. È opposto al procedimento algoritmico». Tra i principi euristici che vale la pena ricordare ve ne sono tre molto importanti: il principio di simmetria, il principio di economia ed il principio di corrispondenza. Dedicheremo inoltre due approfondimenti al principio di continuità ed all’argomento dimensionale, per via del loro uso frequente sia in fisica che in matematica. Il Principio di Simmetria Questo principio, che ha costituito una delle strade maestre della ricerca più recente in fisica teorica, afferma sostanzialmente che le simmetrie di un sistema fisico devono riflettersi in corrispondenti “simmetrie matematiche” delle equazioni che ne descrivono il comportamento. In modo analogo, alle simmetrie matematiche di un’equazione possiamo far corrispondere sia simmetrie del sistema fisico descritto sia, in alcuni casi particolari, quantità fisiche conservate, che portano alle ben note leggi di conservazione (in meccanica abbiamo, ad esempio, la conservazione dell’energia, della quantità di moto e del momento angolare per i sistemi isolati), fondamentali nella descrizione dei sistemi naturali. Questa corrispondenza tra simmetrie e quantità conservate è uno dei risultati più importanti a cui sia arrivata la Meccanica Analitica novecentesca (Teorema di Nöther, 1915), e ancora oggi viene usato nelle teorie fisiche più avanzate (come la Teoria Quantistica dei Campi, che descrive le proprietà e le interazioni delle particelle elementari). Il principio di simmetria costituisce anche una guida per formulare “previsioni” sul comportamento dei sistemi naturali: se due sistemi fisici, apparentemente molto diversi, presentano le stesse simmetrie, è ragionevole ritenere che obbediscano ad equazioni molto simili, ovvero con forti analogie formali, e che quindi presentino comportamenti simili e siano descrivibili con gli stessi strumenti matematici. Esempio Consideriamo un parallelepipedo rettangolo di spigoli a, b e c (vedi figura). Il suo volume è dato da: V = ( area base ) ⋅ ( altezza ) = ( a ⋅ b ) ⋅ c = a ⋅ b ⋅ c = V (a, b, c) ed è, naturalmente, una funzione dei due spigoli di base a e b, che compaiono per primi nella formula, e dell’altezza c. c b a c c a b b a Tuttavia, il parallelepipedo presenta una simmetria fondamentale: ruotandolo opportunamente, posso fare sì che qualsiasi coppia di lati diventi la coppia degli spigoli di base (e il lato rimanente diventi l’altezza), senza tuttavia che questo modifichi il valore del volume. Analogamente, nulla 2 deve cambiare se scelgo di leggere gli spigoli di base nell’ordine (a, b) piuttosto che nell’ordine (b, a), visto che l’area della base (un rettangolo) non dipende certo dall’ordine degli spigoli. Questo significa che la funzione V(a,b,c) deve essere invariante (= produrre lo stesso risultato) per un’arbitraria permutazione dell’ordine degli spigoli del parallelepipedo, ovvero: V (a, b, c) = V (b, a, c) = V (c, a, b) = ... Ma questo è verificato, proprio perché il volume coincide col prodotto dei tre spigoli: V (a, b, c) = abc = V (b, c, a ) = bca = ... che è un’operazione completamente simmetrica per qualsiasi scambio nell’ordine dei fattori. Osserviamo quindi che ad una simmetria fisica (invarianza del volume sotto rotazione, ovvero “scambio di ruolo” degli spigoli, che sono tra loro del tutto equivalenti) corrisponde una simmetria matematica della formula (invarianza del prodotto sotto permutazione dei suoi fattori). Ben diverso, invece, è il caso del cilindro. Il suo volume è anche stavolta dato dal prodotto V = ( area base ) ⋅ ( altezza ) = (π r 2 ) ⋅ h = V (r , h) ma le due dimensioni fondamentali del solido, il raggio di base r e l’altezza h, non sono affatto equivalenti dal punto di vista del ruolo: non posso certo infatti ruotare il cilindro per far diventare il raggio l’altezza o viceversa, e anche da un punto di vista matematico la formula del volume non è invariante sotto permutazione delle due grandezze: V ( r , h ) = ( π r 2 ) ⋅ h ≠ V ( h, r ) = ( π h 2 ) ⋅ r r h Infatti la prima formula è quella corretta, mentre la seconda è priva di senso. In questo caso, da una asimmetria matematica della formula (che dipende linearmente da h e quadraticamente da r), deduciamo una asimmetria di ruolo tra i due parametri fisici altezza e raggio (e viceversa). Di tutti i principi euristici, il principio di simmetria è l’unico che possiamo considerare sempre valido, per cui costituisce una guida molto utile anche nel rilevare errori all’interno dei nostri calcoli. Esempio Se sono noti i tre lati di un triangolo, è possibile ricavare il β coseno di uno qualsiasi dei suoi angoli applicando il teorema a c del coseno. Nella fattispecie, se cerchiamo cosα, dobbiamo invertire la seguente espressione: γ a 2 = b 2 + c 2 − 2bc cos α α Lo studente che trova la seguente formula inversa: b 2 2 2 a +b −c cos α = 2bc deve rendersi conto immediatamente di avere sbagliato. Infatti, i due lati b e c sono i lati adiacenti all’angolo α cercato, e la scelta del loro nome è una mera questione di “etichettatura”: pertanto, scambiando di posto le lettere b e c, per ragioni di simmetria la formula per cosα dovrebbe rimanere uguale, e invece in questo caso cambia drasticamente, a causa del segno meno che distingue il termine –c² dal termine +b². L’unico lato che ha uno status “differente” dagli altri è il lato a, in quando lato opposto all’angolo α cercato. E infatti, nella formula inversa corretta: b2 + c2 − a 2 cos α = 2bc il lato a è l’unico a comparire, nella somma, con un segno diverso da quello degli altri due. Esempio 3 Consideriamo il seguente problema: Un rettangolo ha perimetro 48 e area 140. Determinare le misure dei lati. Indicando con x e y i lati, otterremo che il problema è risolto dal seguente sistema: 2 x + 2 y = 48 xy = 140 Osservando bene il sistema, si nota che è perfettamente simmetrico per scambio di posto tra x e y. Ne consegue allora che anche le soluzioni (cioè i lati dei rettangoli che soddisfano i requisiti del problema) dovranno essere simmetriche per scambio di posto tra x e y. Le soluzioni (x,y) sono infatti (14,10) e (10,14), perché, di fatto, i due rettangoli sono lo stesso rettangolo ruotato di 90°. Il Principio di Economia Durante la prima metà del Trecento il filosofo inglese Guglielmo di Occam, esponente della Scolastica interessato principalmente allo studio della filosofia naturale, formulò il famoso principio oggi noto come “Rasoio di Occam”: “Entia non sunt moltiplicanda praeter necessitatem”; ossia, secondo una traduzione a senso: “È dannoso ed inutile moltiplicare gli enti, creando realtà in soprannumero rispetto a quelle da spiegare”. All’epoca, infatti, i fenomeni naturali venivano spiegati chiamando in causa “essenze metafisiche” e “teorie finalistiche” (si pensi, ad esempio, alla teoria aristotelica dei luoghi naturali), non direttamente esperibili attraverso i sensi e quindi non verificabili. Affermando questo principio, Occam sostenne invece l’origine esclusivamente empirica della conoscenza, e propose pertanto di recidere dall’albero della conoscenza (in particolare quella che oggi definiremmo “scientifica”) il ramo “infruttifero” della metafisica (da qui l’espressione “rasoio”). L’idea divenne la base della rivendicazione (sostenuta in seguito anche da Galileo) della sostanziale ametafisicità (= estraneità agli aspetti metafisici) della scienza – la natura si spiega con la (sola) natura, la materia con la materia –, necessaria per poter garantire rigore e verificabilità alle sue asserzioni, ed ancora oggi costituisce un criterio di demarcazione fondamentale tra teorie scientifiche e non scientifiche. Oggi, tuttavia, questo principio viene anche usato in una accezione “più debole” e generale, secondo cui “la spiegazione migliore (quella “giusta”) di un fenomeno è, in generale, la più semplice a nostra disposizione”. Come conseguenza di questo asserto, è bene partire sempre dall’ipotesi più semplice per studiare un fenomeno, perché “in generale” la natura non obbedisce a leggi “complicate”; allo stesso tempo, tra due teorie equivalenti nel descrivere un fenomeno è bene preferire, in assenza di prove che escludano l’una o l’altra, la più semplice tra le due. Esempio Supponiamo di dover risolvere il seguente problema: Se un rubinetto impiega 2 min per riempire un secchio da 10 L di acqua, quanto tempo impiegherà a riempirne uno da 25 L? Necessariamente, per affrontare il problema in questione, dobbiamo ipotizzare che esista una qualche relazione funzionale esplicita che collega il tempo impiegato a riempire il secchio con il quantitativo di acqua che deve essere versato, e naturalmente pretenderemo che, al crescere del quantitativo di acqua da versare nel secchio, cresca anche il tempo richiesto per farlo. L’ipotesi più semplice che possiamo formulare è che esista una relazione di proporzionalità diretta tra queste due grandezze, ossia che il tempo impiegato dipenda linearmente dal quantitativo di acqua: quantitativo di acqua ( tempo impiegato ) = k da versare nel secchio dove k è una costante di proporzionalità da determinarsi coi dati a nostra disposizione. Non è scritto da nessuna parte che le cose debbano stare per forza in questo modo1, ma si tratta certamente di 1 Ad esempio, ipotizzando che il rubinetto si trovi sul fondo di una piccola cisterna, non molto più grande del secchio, la portata del suo getto d’acqua potrebbe anche variare significativamente nel tempo, rendendo la relazione che collega le due grandezze non più lineare. 4 un’ipotesi molto ragionevole, ed è, oltretutto, la più semplice che possiamo formulare. Pertanto il contributo dato dal principio di economia alla risoluzione di questo semplice problema risulta essere fondamentale, poiché senza di esso non avremmo nemmeno saputo da dove cominciare; anzi, risulta essere talmente naturale che avremmo potuto applicarlo anche senza accorgercene. La risposta alla domanda sarà data quindi dalla risoluzione del seguente sistema: 2 min = k ⋅10 L x = k ⋅ 25 L dove x rappresenta la nostra incognita (il tempo impiegato per versare 25 L di acqua) ed il valore di k viene ricavato dalla prima equazione. Il Principio di Corrispondenza Formulato dal fisico danese Niels Bohr all'inizio del XX secolo, il Principio di Corrispondenza affermava, nella sua versione originale, che i risultati della meccanica quantistica devono ridursi a quelli della meccanica classica nelle situazioni in cui l'interpretazione classica può essere considerata valida. Questo principio può essere inteso, però, anche in un senso più lato, e per questo è stato utilizzato anche in molti altri contesti, come ad es. nella Relatività Generale di Einstein: esso, infatti, risulta essere profondamente legato alla nostra concezione filosofica della Scienza, intesa come attività conoscitiva. Anche se al giorno d’oggi prevalgono, tra i filosofi, posizioni fallibiliste, scettiche, relativiste o comunque “molto caute” sulle potenzialità conoscitive della Scienza, tra coloro che si occupano quotidianamente di ricerca scientifica, e che ben comprendono il significato della loro attività, prevale una posizione filosofica che potremmo definire “verificazionismo pragmatico”. Secondo questa posizione, tutte le teorie scientifiche che sono state ripetutamente messe alla prova mediante esperimenti e che si sono sempre dimostrate valide sono da considerarsi verificate, cioè letteralmente “provate esser vere”2, all’interno del campo di validità in cui sono state formulate (= insieme di ipotesi teoriche iniziali, che si traducono in precise condizioni sperimentali). Tuttavia, fuori dal campo di validità in cui sono state originariamente formulate, tali teorie potrebbero dimostrarsi errate, e gli scienziati dovrebbero quindi costruire una nuova teoria capace di spiegare quei fenomeni che risultano incomprensibili alla luce della vecchia teoria. Ma quale rapporto ci deve essere tra la nuova teoria e la vecchia teoria? La nuova teoria, naturalmente, dovrà: – spiegare i nuovi risultati nel nuovo capo di validità, e allo stesso tempo – spiegare i risultati ottenuti nel vecchio campo di validità, portando alle stesse previsioni della vecchia teoria. Le previsioni fatte dalla vecchia teoria, infatti, erano state dimostrate esser vere, e non potranno certo perdere all’improvviso la loro validità: quindi dovranno essere “recuperate” come caso particolare dalla nuova teoria. Secondo questa concezione, perciò, la conoscenza scientifica procede nel suo cammino non in modo dialettico, ma ampliativo-cumulativo: le nuove teorie non cancellano le vecchie, ma le estendono e le generalizzano, inglobandole come casi particolari. Questo asserto, che costituisce l’enunciato generale del Principio di Corrispondenza, ha anche delle conseguenze formali: nel limite matematico in cui il campo di validità della nuova teoria tende a quello della vecchia teoria, le leggi della nuova teoria devono trasformarsi nelle leggi della vecchia teoria. La storia della ricerca scientifica, quindi, ben lungi da essere data da una successione di rivoluzioni caratterizzate da paradigmi irriducibili (= visioni della natura prive di qualsivoglia correlazione), come sostengono i filosofi irrazionalisti, è invece costituita da una progressiva estensione e 2 Senza addentrarci troppo nel significato gnoseo-ontologico che attribuiamo a questo termine “vere”, possiamo dire che questo status delle teorie scientifiche rappresenta in ogni caso, da un punto di vista qualitativo, la forma di conoscenza più affidabile e “più vicina all’oggettivo” (o quantomeno più universale) che sia dato all’uomo di conseguire. 5 generalizzazione delle teorie precedentemente provate: ad esempio la Meccanica Quantistica si ritrasforma nella Meccanica Classica, nel limite in cui la quantizzazione delle energie descritta dalla costante di Planck h risulta trascurabile rispetto alle energie in gioco, così come le trasformazioni di Lorentz e la dinamica relativistica vengono a coincidere esattamente, per velocità molto minori della velocità della luce c, con le trasformazioni di Galileo e la dinamica newtoniana. In modo analogo, le equazioni di campo della Relatività Generale di Einstein diventano, nel limite di masse sufficientemente minori della massa del sole e per velocità molto minori di c, le leggi della Gravitazione Universale di Keplero e Newton. Tutti questi risultati costituiscono un’applicazione del Principio di Corrispondenza, ed evidenziano il ruolo di guida che esso ha giocato nella nascita delle teorie fisiche più importanti del Novecento. Approfondimento: Il Principio di Continuità Enunciato da vari filosofi e scienziati (tra i tanti, si ricordino Aristotele, Leibniz e Linneo), il principio di continuità si riassume nella massima Natura non facit saltus, “La Natura non fa salti”. L’idea è che le funzioni che descrivono i processi naturali debbano essere funzioni continue, lisce, caratterizzate da variazioni graduali e morbide, che non contemplano bruschi “salti” o cambiamenti di legge. Questo significa che, data una legge fisico-matematica F(x, y, z,…)=0, al variare continuo dei parametri x, y, z,… in gioco, la struttura di tale legge non deve mutare. In un certo senso tale principio è strettamente connesso al principio di corrispondenza, che ingloba i casi limite come casi particolari di una legge generale, calcolabili appunto con l’operazione matematica di limite (uno strumento dell’analisi matematica, che studia per l’appunto le funzioni continue). Un esempio di applicazione del principio di continuità è il seguente. Spesso viene detto che il fascio di rette passanti per P(x0, y0) è rappresentato dalla coppia di equazioni: y − y0 = m( x − x0 ) ∨ x = x0 , dove la prima equazione descrive le rette orizzontali o oblique, mentre la seconda l’unica retta verticale passante per P. Tuttavia, a ben vedere, basta solo la prima equazione per caratterizzare l’intero fascio: infatti, riscritta nella seguente forma y − y0 = ( x − x0 ) , m essa include anche il caso della retta verticale nel limite in cui m→∞. Si vede quindi che, al variare continuo del parametro m, è possibile descrivere tutte le rette del piano con la stessa equazione. Un analogo discorso può essere fatto per l’equazione della retta passante per due punti A e B: y − yA x − xA = y B − y A xB − x A Tale equazione non funziona nei casi in cui i punti sono allineati verticalmente (xA = xB) o orizzontalmente (yA = yB). Tuttavia, se riscritta come un prodotto: ( y − y A )( xB − xA ) = ( x − xA )( yB − y A ) riesce ad includere tutti i casi possibili, al variare delle posizioni di A e B. È evidente quindi che in base a questo principio, in generale, anche i casi limite più “patologici” dovrebbero essere comunque inclusi (con qualche piccolo accorgimento) all’interno dell’unica legge che descrive il sistema fisico o matematico di interesse. Esistono notevoli eccezioni a questo principio, di cui ne elenchiamo solo alcune appartenenti proprio all’ambito della analisi matematica: La formula per l’integrale della potenza, che per potenze razionali ad esponente n qualsiasi dà come risultato sempre il seguente: x n +1 n x dx = +c ∫ n +1 6 eccezion fatta per il caso n = –1, in cui la soluzione dell’integrale è il logaritmo naturale: −1 ∫ x dx = ln x + c Le soluzioni linearmente indipendenti dell’equazione differenziale di secondo grado ay ''+ by '+ cy = 0 sono sempre due esponenziali del tipo eλ1 x ed eλ2 x , dove λ1 e λ2 sono le radici del polinomio caratteristico aλ 2 + bλ + c = 0 . La formula vale per ∆>0 (radici reali) e per ∆<0 (radici complesse), mentre nel caso ∆=0 appare la soluzione aggiuntiva xeλ1 x , funzionalmente molto diversa dalle due precedenti. Questi pochi esempi (tra i tanti possibili) costituiscono la prova che il principio ha una mera natura euristica di guida e non quella di una legge rigorosa che sia sempre rispettata. Approfondimento: L’Argomento Dimensionale (o Analisi Dimensionale) Un criterio post-hoc per verificare la correttezza dei calcoli simbolici svolti, utilizzato molto spesso in fisica per controllare le formule, è quello di sostituire ad ogni grandezza fisica la sua unità di misura, e verificare – al termine di tutte le semplificazioni – che il risultato coincida con la “dimensione” attesa (NB: dimensione è “quasi” sinonimo di unità di misura). In realtà, tale criterio è molto utile anche in matematica, persino in contesti in cui le unità di misura sono del tutto assenti: introdurle nel problema, infatti, risulta utile perché “cala” il problema in un contesto “più fisico”, che ci fornisce più strumenti per controllare la correttezza del nostro approccio risolutivo. Esempio: Nel caso si debba invertire la seguente formula (Teorema dei seni) per ricavare il seno dell’angolo β di un triangolo, noti i lati a e b e l’angolo α: a b = sin α sin β è evidente che l’espressione seguente sin α sin β = ab è scorretta: considerando infatti i lati a e b come delle lunghezze, al primo membro abbiamo un oggetto che è un numero puro3, ed al secondo membro un oggetto che si misura in metri–2, per cui la formula non può certamente essere corretta. Pertanto, è ragionevole ritenere anche che formule contenenti espressioni del tipo ab + b sin α siano scorrette, in quanto ottenute sommando oggetti con unità di misura diverse (operazione proibita in fisica e quindi, per analogia, priva di senso anche in matematica). L’analisi dimensionale viene anche utilizzata per formare ragionevoli ipotesi sulla forma che possono assumere certe leggi fisiche sconosciute. Esempio (tratto e adattato da Wikipedia): Qual è il periodo di oscillazione T di una massa m, attaccata a una molla ideale con costante elastica k e sospesa in un campo gravitazionale di accelerazione g? Le quattro quantità hanno le seguenti dimensioni: T [s]; m [kg]; k [kg/s²]; g [m/s²]. La legge fisica dovrà avere una espressione del tipo T = F(m, k, g), dove anche F risulta essere misurata in secondi [s], o, equivalentemente, un’espressione del tipo G(T, k ,m, g) = q 3 Seno, coseno, esponenziale e logaritmo sono funzioni prive di dimensioni: anche gli argomenti di esponenziale e logaritmo devono essere dei numeri puri, mentre gli argomenti del seno e del coseno devono essere angoli, ossia quantità espresse in gradi o in radianti 7 (dove q è una costante numerica, cioè un numero puro). L’ipotesi più semplice è che la legge G abbia la struttura di un prodotto e, con le grandezze fisiche in questione, è possibile formare un unico prodotto adimensionale, che è il seguente4: T 2k =q m Ne deduciamo che la grandezza g non può comparire nella formula, proprio perché si misura in m/s² e non c’è nessun’altra grandezza misurata in metri che possa, nei calcoli, far sparire dal prodotto i metri. L'analisi dimensionale ci conduce quindi a determinare, in questo caso, l’irrilevanza di alcune quantità (la g) in un problema, o la necessità di mettere in gioco altri parametri (che non abbiamo considerato e che possano semplificarsi dimensionalmente5 con g). In questo caso, però, supponendo di avere scelto abbastanza variabili per descrivere il problema in modo appropriato, allora possiamo concludere che il periodo di oscillazione della massa sulla molla è indipendente da g, cioè – per capirci – è lo stesso sia sulla Terra sia sulla Luna. Riscrivendo la precedente espressione otteniamo dunque: m k dove il valore di q rimane incognito e va determinato con altri mezzi (dalla analisi dinamicocinematica del moto della molla si deduce che q = 4π²). T= q Esempio (tratto da una prova Invalsi): Mauro e Piero vanno in vacanza. Mauro ha un'auto a gasolio che in media percorre 24 km con un litro. Piero ha un'auto a GPL che in media percorre 13 km con un litro. Il costo di un litro di gasolio è circa 1,70 € mentre quello di un litro di GPL è circa 0,79 €. Mauro sostiene che è più conveniente utilizzare la sua auto a gasolio. È corretto? Ragioniamo per dimensioni e per senso: un’auto è conveniente se percorre molti km con una spesa di pochi €, quindi ne deduciamo che la convenienza si misura in km/€. Le altre grandezze in gioco sono le prestazioni della macchina, ossia quanti km fa con 1 l di benzina, e i costi del carburante, cioè gli € spesi al litro. È evidente che esiste un solo modo “semplice” (principio di economia) per combinare le unità di misura di costi e prestazioni in modo da ottenere quelle della convenienza: km [ km / l ] ( prestazioni ) (convenienza) = = = (costi) € [€ / l] Abbiamo quindi ricavato la relazione che risolve il problema lavorando solo sulle unità di misura, e senza preoccuparci troppo del senso “fisico” delle operazioni che abbiamo fatto. Ma se riflettiamo sulla formula trovata, è perfettamente sensato dire che un auto è conveniente quando ha alte prestazioni e bassi costi di consumo. Scendendo infine nello specifico del quesito, i calcoli numerici dimostrano che Mauro ha torto, e che è più conveniente l’auto a GPL di Piero. 4 Dimostrazione: L’equazione ha la struttura unità di misura [X] abbiamo: T α k β mγ g δ = q . Sostituendo ad ogni grandezza X la sua dimensione o [T ]α [k ]β [m]γ [ g ]δ = [q] ⇒ sα ⋅ (kg / s 2 ) β ⋅ kg γ ⋅ (m / s 2 )δ = 1 ⇒ sα − 2 β − 2δ ⋅ kg β +γ mδ = 1 , e poiché il prodotto vale uno (cioè non ha unità di misura) tutti gli esponenti devono valere zero: α − 2β − 2δ = 0 α = −2γ ⇒ β = −γ β + γ = 0 δ = 0 δ = 0 Il valore di γ è ovviamente arbitrario (purché diverso da zero), e ponendo γ = −1 si ottiene la formula cercata. Quando ci si trova di fronte a un caso dove l'analisi dimensionale esclude una variabile (in questo caso g) che siamo davvero sicuri che appartenga a una descrizione fisica della situazione, potremmo anche considerare la possibilità che la variabile esclusa sia effettivamente rilevante e che qualche altra variabile sia stata omessa, variabile che potrebbe combinarsi con la variabile rifiutata per formare una quantità adimensionale (ad es. la lunghezza l della molla). 5 8 Applicazioni Vediamo ora in concreto come l’applicazione di questi principi possa essere di enorme utilità anche in matematica, oltre che in fisica. Partiremo da un caso semplice per poi approdare ad uno più impegnativo. Derivazione Euristica del Volume del Tronco di Cono Consideriamo un tronco di cono, e cerchiamo di dare un’espressione esplicita alla formula per il calcolo del suo volume. Le grandezze caratteristiche del solido sono: • il raggio della base minore r, • il raggio della base maggiore R, • l’altezza h e • l’apotema a, ma è piuttosto evidente che – noti r, R e h – è banale ricavare a con l’applicazione del teorema di Pitagora: r a h R a = a ( r , R, h) = ( R − r ) 2 + h 2 Dunque ne consegue che il volume V del tronco di cono dipenderà, nell’ordine, solo da r, R e h: V = V ( r , R, h) Supponiamo che il volume sia una funzione molto regolare nei suoi argomenti, ovvero perlomeno continua, per cui – se vogliamo calcolarne il limite – possiamo sostituire qualsiasi valore particolare di r, R e h all’interno della sua formula: lim r → r0 , R → R0 , h →h0 V (r , R, h) = V (r0 , R0 , h0 ) E’ bene fare alcune osservazioni fondamentali: 1) Deformazioni continue delle dimensioni di un solido che non ne mutano la natura (cioè il tipo di solido) mantengono invariata la formula per il calcolo del suo volume, senza che vi sia bisogno di fare alcun cambiamento salvo che nel valore dei suoi argomenti (argomento di continuità: la Natura “non fa salti”, e nemmeno le sue leggi). Ad esempio, se allungo l’altezza di un parallelepipedo, questo rimane un parallelepipedo, per cui vale ancora la stessa formula di prima per calcolarne il volume: basta solo utilizzare il nuovo valore dell’altezza. Consideriamo perciò la deformazione continua rappresentata nella figura sottostante: supponiamo di ridurre con continuità il raggio R del tronco di cono fino a renderlo minore di r, cioè fino a trasformare la base minore nella base maggiore. r r h h R R La deformazione continua non ha mutato la natura del solido, per cui vale ancora: V = V ( r , R, h) però, poiché ha scambiato il ruolo di base maggiore e base minore, e la nuova figura è ancora un tronco di cono, deve valere anche la formula V = V ( R, r , h) per il calcolo del volume, in cui ho riassegnato ai due raggi il corretto ruolo di “raggio della base minore” e “raggio della base maggiore”. Questo implica che la formula del volume debba 9 avere una dipendenza simmetrica dai due argomenti r ed R, e questo risultato ci sarà enormemente utile in seguito. 2) Nel limite in cui r tende a R il solido si trasforma in un cilindro, per cui deve valere, per il principio di corrispondenza: V ( R, R, h) = πR 2 h 3) Inoltre, nel limite in cui r tende a zero il solido si trasforma in un cono, per cui – sempre per il principio di corrispondenza, deve valere: 1 V (0, R, h) = πR 2 h 3 r r h h h R R R r=R r=0 Nota Bene: Da (1) e (3) discende immediatamente che anche 1 V (r ,0, h) = πr 2 h 3 4) Nel limite in cui l’altezza h tende a zero le due basi si schiacciano l’una sull’altra e il volume si annulla, per cui: V (r , R,0) = 0 Abbiamo adesso tutti gli ingredienti per scrivere la formula esplicita del volume. • Osserviamo innanzitutto che nei limiti (2) e (3) compare il fattore moltiplicativo πh, e che per h pari a zero anche V vale zero, quindi l’ipotesi più semplice (principio di economia) è che il volume sia direttamente proporzionale a tale fattore: V (r , R, h) = πh ⋅ f (r , R) • La funzione f(r,R) che rimane deve avere le dimensioni dei m2, visto che il volume V si misura in m3 e l’altezza in m (argomento dimensionale: anche questo è un criterio euristico). Sarà quindi, nell’ipotesi più elementare, un polinomio del secondo ordine nelle variabili r ed R, che sia anche simmetrico nei suoi argomenti (per l’osservazione (1)): f ( r , R ) = f ( R, r ) e che nel limite in cui r tende a R o a zero soddisfi le condizioni (2) e (3) precedentemente enunciate, cioè: f ( R, R ) = R 2 1 f (0, R) = R 2 3 • La forma più generale che può assumere un polinomio di secondo grado f(r,R), simmetrico nelle variabili r ed R, è ovviamente la seguente6: f (r , R) = n(r 2 + R 2 + mrR) 6 Si ricordi che per avere dei metri quadri possiamo sommare solo grandezze che abbiano le dimensioni dei metri quadri. Non possiamo nemmeno introdurre nel polinomio termini lineari in r o R del tipo qR, dove q è una costante in metri, poiché in tal caso dovremmo chiamare in causa una lunghezza in metri (q) che sia una costante universale dei tronchi di cono, e naturalmente una costante di questo tipo non può esistere. 10 E imponendo che soddisfi i due limiti sopra enunciati otteniamo: 1 1 f ( 0 , R ) = nR 2 = R 2 ⇒ n = 3 3 1 f ( R, R ) = ( 2 R 2 + mR 2 ) = R 2 ⇒ m = 1 3 • Da cui l’espressione finale per il volume del tronco di cono: 1 V ( r , R, h) = πh ⋅ f ( r , R ) = πh( r 2 + R 2 + rR) 3 Derivazione Euristica della Formula di Erone Consideriamo adesso un generico triangolo. La sua area, come è ben noto, è data dal prodotto tra uno qualsiasi dei suoi lati (a) per b c l’altezza ad esso relativa (ha) diviso 2: ha a ⋅ ha A = A( a, ha ) = 2 Si sarebbe quindi portati a credere che sia necessario conoscere, a per determinare l’area di un triangolo, almeno la misura di uno dei suoi lati e dell’altezza ad esso relativa. Tuttavia, se ci pensiamo bene, data una terna di lati a, b e c (le cui misure rispettino la disuguaglianza triangolare), il triangolo che possiamo costruire con essi è univoco (a meno di operazioni di simmetria banali, come la rotazione, la traslazione e/o lo specchiamento). Pertanto, fissati i lati, di quel triangolo è tutto determinato, area compresa. Deve essere quindi possibile scrivere una formula che permetta di determinare, note solo le misure dei lati, il valore dell’area del triangolo. Tale formula, nota col nome di Formula di Erone, sarà quindi una funzione dei soli lati A = A( a, b, c ) e noi andremo a determinarla in maniera euristica. Cercheremo quindi di scrivere la formula più semplice, ma allo stesso tempo più generale possibile, che rispetti le simmetrie del problema: in essa compariranno però diverse incognite, e le andremo a determinare col principio di corrispondenza, ossia imponendo che la formula dell’area appena scritta, che deve valere per tutti i triangoli, ci riconduca agli stessi risultati che sappiamo essere validi per alcuni triangoli particolari. Procediamo dunque con ordine: 1. Come prima osservazione, notiamo che per un generico triangolo i tre lati a, b e c sono del tutto equivalenti, ossia non ha senso “preferirne” uno rispetto agli altri, attribuendogli un qualche ruolo particolare. Ne discende che la formula di A dovrà essere simmetrica nella sua dipendenza dai lati, ossia essere invariante per una qualsiasi permutazione del loro ordine: A( a, b, c ) = A(b, a, c ) = A(c, b, a ) = ... 2. Le uniche espressioni simmetriche per permutazioni dei lati che possiamo costruire sono: – la loro somma, cioè il perimetro 2 p = a + b + c , – il loro prodotto a ⋅ b ⋅ c , oppure – il prodotto di tre funzioni identiche dipendenti da ciascun lato f (a ) ⋅ f (b) ⋅ f (c) , oppure, ancora più in generale, – il prodotto di tre funzioni identiche dipendenti da ciascun lato e dal perimetro/semiperimetro (usare l’uno o l’altro non cambia il senso del discorso) f (a, p ) ⋅ f (b, p ) ⋅ f (c, p ) . 3. Possiamo quindi scrivere un “primo scheletro” della formula dell’area come segue: A( a, b, c ) = f ( a, p ) ⋅ f (b, p ) ⋅ f (c, p ) e possiamo generalizzarla introducendo, a moltiplicare, un’ulteriore funzione g(p) che dipende dal solo semiperimetro: A( a, b, c ) = g ( p ) ⋅ f ( a, p ) ⋅ f (b, p ) ⋅ f (c, p ) 11 4. 5. 6. 7. e, infine, possiamo supporre che tutta la precedente espressione sia ulteriormente trasformata secondo una funzione h, cioè: A(a, b, c) = h ( g ( p) ⋅ f (a, p) ⋅ f (b, p) ⋅ f (c, p) ) Questa è la formula più generale, ma allo stesso tempo più semplice, che possiamo scrivere per l’area A. È opportuno però esplicitare meglio le ragioni di alcune nostre scelte, che potrebbero apparire “troppo arbitrarie”. Innanzitutto, la scelta di non aggiungere altri termini “simili” in somma dentro l’argomento della funzione h è motivata, principalmente, da argomentazioni di economicità. Tuttavia, analogamente al motivo per cui abbiamo scelto il prodotto e non la somma tra le funzioni f, dobbiamo riconoscere anche l’esistenza di argomentazioni di tipo dimensionale dietro le nostre scelte: i lati infatti si misurano in metri, mentre l’area in metri quadri, per cui è ragionevole ritenere che la dimensionalità superiore sia ottenibile con un prodotto, così come per la formula “tradizionale” (lato)·(altezza relativa)/2 a cui la nostra formula dovrà ricondursi in alcuni casi particolari (cioè i triangoli rettangoli, in cui ciascun cateto svolge il ruolo di “altezza relativa” all’altro cateto). Procedendo con l’applicazione del principio di economia, dobbiamo ipotizzare una forma per le funzioni f e g, e naturalmente la forma più semplice che possiamo ipotizzare è quella caratterizzata da una dipendenza lineare negli argomenti, cioè: g ( p ) = np + s f ( a, p ) = ma + qp + r Ci accorgiamo subito, però, che le costanti s ed r devono essere uguali a zero. Questo sempre per ragioni di tipo dimensionale: a e p, infatti, si misurano in metri, mentre n, m e q sono numeri puri, e quindi s ed r sono due lunghezze in metri (ricordiamo che si possono sommare solo oggetti con le stesse unità di misura) che svolgono il ruolo di costanti universali dei triangoli, giacché compaiono nella formula di Erone. Ma è evidente che costanti di questo tipo non possono esistere: per definizione, infatti, la “misura in metri” è una caratteristica contingente dei triangoli, che da un punto di vista filosofico si scontra pesantemente col concetto di universalità. Potremmo anche porre r = n = 0 e s = 1, ma in quel caso, sempre per ragioni dimensionali, la funzione h assumerebbe una forma tutt’altro che “semplice” e “naturale” (vedi punto (7): sarebbe una potenza alla 2/3, che non ricorre mai nelle proprietà dei triangoli noti). Riassumendo le conclusioni del punto precedente, abbiamo: A(a, b, c) = h ( np ⋅ (ma + qp) ⋅ (mb + qp) ⋅ (mc + qp) ) e ci accorgiamo subito che la costante n è un fattore di scala: potremmo infatti “accorparla” alle costanti m e q definendo due nuove costanti: M = m3 n Q = q3 n ed ottenere una formula che dipende da due sole costanti: A(a, b, c) = h ( p ⋅ ( Ma + Qp) ⋅ ( Mb + Qp) ⋅ ( Mc + Qp) ) Oppure, che è una scelta del tutto equivalente, possiamo porla uguale ad un valore arbitrario, ad esempio n = 1: A(a, b, c) = h ( p ⋅ (ma + qp ) ⋅ (mb + qp) ⋅ (mc + qp ) ) Come precedentemente notato, l’argomento di h è dato dal prodotto di 4 fattori che si misurano in metri (m), e quindi ha come unità di misura i metri alla quarta (m4). Però l’area si misura in metri quadri (m2), e dunque il ruolo della funzione h sarà proprio quello di farci passare dalla 4ª potenza alla 2ª potenza dei metri. Ancora una volta applichiamo il principio di economia, osservando che la funzione più semplice di tutte che svolga questa operazione è la radice quadrata. Ne consegue che: A(a, b, c) = p ⋅ (ma + qp) ⋅ (mb + qp ) ⋅ (mc + qp) Ed ora ci rimane solo da determinare i valori di m e q applicando il principio di corrispondenza. 12 8. Consideriamo un triangolo equilatero di base a. L’altezza relativa alla base misura: 3 ha = a 2 Per cui l’area vale: a ⋅ ha 3 2 = A= a 2 4 Questo risultato deve essere riprodotto dalla formula di Erone, ovvero: 3 2 A(a, a, a ) = a 4 E sostituendo al primo membro la corrispondente espressione otteniamo: 3 3 4 3 3 2 a m+ q = a 2 2 4 Una volta svolti i calcoli, l’equazione si trasforma nella relazione seguente tra m e q: 2m + 3q = 1 9. Consideriamo un triangolo rettangolo isoscele di cateti a. La sua area è banalmente data da a2 A= 2 e l’applicazione del principio di corrispondenza porta alla relazione: a2 A(a, a, 2a ) = 2 che, scritta esplicitamente, diventa: 2 2a + 2 a 2 a + 2a 2a + 2a a 2 ma + q m 2 a + q = 2 2 2 2 Sfruttando la relazione precedentemente trovata pongo: 2m = 1 − 3q e l’equazione diventa un’equazione di terzo grado nella sola incognita q: ( 2 + 2 )(1 − q + 2q 2 )( ) 2 + 2q − 2 2 q = 4 Risolvendo l’equazione al calcolatore troviamo due soluzioni particolarmente complicate: −1 − −39 + 28 2 2 (−4 + 3 2) ed una terza soluzione piuttosto semplice: q= ∨ q= −1 + −39 + 28 2 2 (−4 + 3 2) q=1 che per ragioni di economia sarà quella che sceglieremo. 10. Unendo le due relazioni precedenti dei punti (8) e (9) si ottiene: m = −1 q =1 Cioè la forma definitiva della Formula di Erone è A(a, b, c) = p ⋅ ( p − a ) ⋅ ( p − b) ⋅ ( p − c ) 13 11. Osservazione: per semplificare i conti, avremmo potuto applicare il principio di corrispondenza riconducendoci direttamente ad un caso numerico, ad esempio usando due terne pitagoriche, tipo (3,4,5) e (5,12,13), per trovare le relazioni tra m e q, che avremmo scritto nella forma: A(3, 4, 5) = 6 A(5,12,13) = 30 e naturalmente saremmo giunti agli stessi risultati. Oppure, potremmo usare queste due relazioni per testare la correttezza della nostra scelta dei parametri q ed m. Beggi Andrea, revisione del 05/05/2018 14