Appunti di meccanica quantistica Copyright (c) 2003 Michele Ceriotti. Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with Invariant Section being “Disclaimer”, Front-Cover Text being “Appunti di Meccanica Quantistica” and no Back-Cover Texts. A copy of the license is included in the section entitled "GNU Free Documentation License". 2552 58, 243 266 7767746 82686 1 Disclaimer Non do nessuna garanzia sui contenuti di questo testo; è distribuito sotto GNU-FDL, le pagine in inglese che seguono. In pratica è garantito a chiunque il diritto di riprodurre o modificare il documento, a patto che la versione modificata sia ancora distribuita sotto FDL. Non che io ritenga che questa storia legale sia necessaria, ma trovo molto bello il tentativo di introdurre una forma di tutela dell’autore alternativa al copyright nella sua forma classica. Se vi interessa l’argomento, leggetevi il sito della Free Software Foundation, o cercate qualcosa sul progetto GNU. In teoria si dovrebbe distribuire il documento in un formato “trasparente”, cioè facilmente modificabile senza l’uso di programmi commerciali; purtroppo tutte le equazioni sono scritte (e quindi modificabili) solo usando un add-on per Word. Quindi, per rendere il documento il più compatto e portabile possibile, lo distribuisco in formato PDF. Chiunque avesse bisogno di una copia in formato DOC o RTF può richiedermela mandando un’e-mail all’indirizzo [email protected]. Gnu Free Documentation License Version 1.2, November 2002 Copyright (C) 2000,2001,2002 Free Software Foundation, Inc.59 Temple Place, Suite 330, Boston, MA 02111-1307 USA Everyone is permitted to copy and distribute verbatim copies of this license document, but changing it is not allowed. 0. PREAMBLE The purpose of this License is to make a manual, textbook, or other functional and useful document "free" in the sense of freedom: to assure everyone the effective freedom to copy and redistribute it, with or without modifying it, either commercially or noncommercially. Secondarily, this License preserves for the author and publisher a way to get credit for their work, while not being considered responsible for modifications made by others. This License is a kind of "copyleft", which means that derivative works of the document must themselves be free in the same sense. It complements the GNU General Public License, which is a copyleft license designed for free software. We have designed this License in order to use it for manuals for free software, because free software needs free documentation: a free program should come with manuals providing the same freedoms that the software does. But this License is not limited to software manuals; it can be used for any textual work, regardless of subject matter or whether it is published as a printed book. We recommend this License principally for works whose purpose is instruction or reference. 1. APPLICABILITY AND DEFINITIONS This License applies to any manual or other work, in any medium, that contains a notice placed by the copyright holder saying it can be distributed under the terms of this License. Such a notice grants a world-wide, royalty-free license, unlimited in duration, to use that work under the conditions stated herein. The "Document", below, refers to any such manual or work. Any member of the public is a licensee, and is addressed as "you". You accept the license if you copy, modify or distribute the work in a way requiring permission under copyright law. A "Modified Version" of the Document means any work containing the Document or a portion of it, either copied verbatim, or with modifications and/or translated into another language. A "Secondary Section" is a named appendix or a front-matter section of the Document that deals exclusively with the relationship of the publishers or authors of the Document to the Document's overall subject (or to related matters) and contains nothing that could fall directly within that overall subject. (Thus, if the Document is in part a textbook of mathematics, a Secondary Section may not explain any mathematics.) The relationship could be a matter of historical connection with the subject or with related matters, or of legal, commercial, philosophical, ethical or political position regarding them. The "Invariant Sections" are certain Secondary Sections whose titles are designated, as being those of Invariant Sections, in the notice that says that the Document is released under this License. If a section does not fit the above definition of Secondary then it is not allowed to be designated as Invariant. The Document may contain zero Invariant Sections. If the Document does not identify any Invariant Sections then there are none. The "Cover Texts" are certain short passages of text that are listed, as Front-Cover Texts or Back-Cover Texts, in the notice that says that the Document is released under this License. A Front-Cover Text may be at most 5 words, and a Back-Cover Text may be at most 25 words. A "Transparent" copy of the Document means a machine-readable copy, represented in a format whose specification is available to the general public, that is suitable for revising the document straightforwardly with generic text editors or (for images composed of pixels) generic paint programs or (for drawings) some widely available drawing editor, and that is suitable for input to text formatters or for automatic translation to a variety of formats suitable for input to text formatters. A copy made in an otherwise Transparent file format whose markup, or absence of markup, has been arranged to thwart or discourage subsequent modification by readers is not Transparent. An image format is not Transparent if used for any substantial amount of text. A copy that is not "Transparent" is called "Opaque". Examples of suitable formats for Transparent copies include plain ASCII without markup, Texinfo input format, LaTeX input format, SML or XML using a publicly available DTD, and standard-conforming simple HTML, PostScript or PDF designed for human modification. Examples of transparent image formats include PNG, XCF and JPG. Opaque formats include proprietary formats that can be read and edited only by proprietary word processors, SGML or XML for which the DTD and/or processing tools are not generally available, and the machine-generated HTML, PostScript or PDF produced by some word processors for output purposes only. The "Title Page" means, for a printed book, the title page itself, plus such following pages as are needed to hold, legibly, the material this License requires to appear in the title page. For works in formats which do not have any title page as such, "Title Page" means the text near the most prominent appearance of the work's title, preceding the beginning of the body of 2 the text. A section "Entitled XYZ" means a named subunit of the Document whose title either is precisely XYZ or contains XYZ in parentheses following text that translates XYZ in another language. (Here XYZ stands for a specific section name mentioned below, such as "Acknowledgements", "Dedications", "Endorsements", or "History".) To "Preserve the Title" of such a section when you modify the Document means that it remains a section "Entitled XYZ" according to this definition. The Document may include Warranty Disclaimers next to the notice which states that this License applies to the Document. These Warranty Disclaimers are considered to be included by reference in this License, but only as regards disclaiming warranties: any other implication that these Warranty Disclaimers may have is void and has no effect on the meaning of this License. 2. VERBATIM COPYING You may copy and distribute the Document in any medium, either commercially or noncommercially, provided that this License, the copyright notices, and the license notice saying this License applies to the Document are reproduced in all copies, and that you add no other conditions whatsoever to those of this License. You may not use technical measures to obstruct or control the reading or further copying of the copies you make or distribute. However, you may accept compensation in exchange for copies. If you distribute a large enough number of copies you must also follow the conditions in section 3. You may also lend copies, under the same conditions stated above, and you may publicly display copies. 3. COPYING IN QUANTITY If you publish printed copies (or copies in media that commonly have printed covers) of the Document, numbering more than 100, and the Document's license notice requires Cover Texts, you must enclose the copies in covers that carry, clearly and legibly, all these Cover Texts: Front-Cover Texts on the front cover, and Back-Cover Texts on the back cover. Both covers must also clearly and legibly identify you as the publisher of these copies. The front cover must present the full title with all words of the title equally prominent and visible. You may add other material on the covers in addition. Copying with changes limited to the covers, as long as they preserve the title of the Document and satisfy these conditions, can be treated as verbatim copying in other respects. If the required texts for either cover are too voluminous to fit legibly, you should put the first ones listed (as many as fit reasonably) on the actual cover, and continue the rest onto adjacent pages. If you publish or distribute Opaque copies of the Document numbering more than 100, you must either include a machine-readable Transparent copy along with each Opaque copy, or state in or with each Opaque copy a computer-network location from which the general network-using public has access to download using public-standard network protocols a complete Transparent copy of the Document, free of added material. If you use the latter option, you must take reasonably prudent steps, when you begin distribution of Opaque copies in quantity, to ensure that this Transparent copy will remain thus accessible at the stated location until at least one year after the last time you distribute an Opaque copy (directly or through your agents or retailers) of that edition to the public. It is requested, but not required, that you contact the authors of the Document well before redistributing any large number of copies, to give them a chance to provide you with an updated version of the Document. 4. MODIFICATIONS You may copy and distribute a Modified Version of the Document under the conditions of sections 2 and 3 above, provided that you release the Modified Version under precisely this License, with the Modified Version filling the role of the Document, thus licensing distribution and modification of the Modified Version to whoever possesses a copy of it. In addition, you must do these things in the Modified Version: A. Use in the Title Page (and on the covers, if any) a title distinct from that of the Document, and from those of previous versions (which should, if there were any, be listed in the History section of the Document). You may use the same title as a previous version if the original publisher of that version gives permission. B. List on the Title Page, as authors, one or more persons or entities responsible for authorship of the modifications in the Modified Version, together with at least five of the principal authors of the Document (all of its principal authors, if it has fewer than five), unless they release you from this requirement. C. State on the Title page the name of the publisher of the Modified Version, as the publisher. D. Preserve all the copyright notices of the Document. E. Add an appropriate copyright notice for your modifications adjacent to the other copyright notices. F. Include, immediately after the copyright notices, a license notice giving the public permission to use the Modified Version under the terms of this License, in the form shown in the Addendum below. G. Preserve in that license notice the full lists of Invariant Sections and required Cover Texts given in the Document's license notice. H. Include an unaltered copy of this License. I. Preserve the section Entitled "History", Preserve its Title, and add to it an item stating at least the title, year, new authors, and publisher of the Modified Version as given on the Title Page. If there is no section Entitled "History" in the Document, create one stating the title, year, authors, and publisher of the Document as given on its Title Page, then add an item describing the Modified Version as stated in the previous sentence. J. Preserve the network location, if any, given in the Document for public access to a Transparent copy of the Document, and likewise the network locations given in the Document for previous versions it was based on. These may be placed in the "History" section. You may omit a network location for a work that was published at least four years before the Document itself, or if the original publisher of the version it refers to gives permission. K. For any section Entitled "Acknowledgements" or "Dedications" Preserve the Title of the section, and preserve in the section all the substance and tone of each of the contributor acknowledgementsand/or dedications given therein. L. Preserve all the Invariant Sections of the Document, unaltered in their text and in their titles. Section numbers or the equivalent are not considered part of the section titles. M. Delete any section Entitled "Endorsements". Such a section may not be included in the Modified Version. N. Do not retitle any existing section to be Entitled "Endorsements" or to conflict in title with any Invariant Section. O. Preserve any Warranty Disclaimers. If the Modified Version includes new front-matter sections or appendices that qualify as Secondary Sections and contain no material copied from the Document, you may at your option designate some or all of these sections as invariant. To do this, add their titles to the list of Invariant Sections in the Modified Version's license notice. These titles must be distinct from any other section titles. You may add a section Entitled "Endorsements", provided it contains nothing but endorsements of your Modified Version by various parties--for example, statements of peer 3 review or that the text has been approved by an organization as the authoritative definition of a standard. You may add a passage of up to five words as a Front-Cover Text, and a passage of up to 25 words as a Back-Cover Text, to the end of the list of Cover Texts in the Modified Version. Only one passage of Front-Cover Text and one of Back-Cover Text may be added by (or through arrangements made by) any one entity. If the Document already includes a cover text for the same cover, previously added by you or by arrangement made by the same entity you are acting on behalf of, you may not add another; but you may replace the old one, on explicit permission from the previous publisher that added the old one. The author(s) and publisher(s) of the Document do not by this License give permission to use their names for publicity for or to assert or imply endorsement of any Modified Version. 5. COMBINING DOCUMENTS You may combine the Document with other documents released under this License, under the terms defined in section 4 above for modified versions, provided that you include in the combination all of the Invariant Sections of all of the original documents, unmodified, and list them all as Invariant Sections of your combined work in its license notice, and that you preserve all their Warranty Disclaimers. The combined work need only contain one copy of this License, and multiple identical Invariant Sections may be replaced with a single copy. If there are multiple Invariant Sections with the same name but different contents, make the title of each such section unique by adding at the end of it, in parentheses, the name of the original author or publisher of that section if known, or else a unique number. Make the same adjustment to the section titles in the list of Invariant Sections in the license notice of the combined work. In the combination, you must combine any sections Entitled "History" in the various original documents, forming one section Entitled "History"; likewise combine any sections Entitled "Acknowledgements", and any sections Entitled "Dedications". You must delete all sections Entitled "Endorsements". 6. COLLECTIONS OF DOCUMENTS You may make a collection consisting of the Document and other documents released under this License, and replace the individual copies of this License in the various documents with a single copy that is included in the collection, provided that you follow the rules of this License for verbatim copying of each of the documents in all other respects. You may extract a single document from such a collection, and distribute it individually under this License, provided you insert a copy of this License into the extracted document, and follow this License in all other respects regarding verbatim copying of that document. 7. AGGREGATION WITH INDEPENDENT WORKS A compilation of the Document or its derivatives with other separate and independent documents or works, in or on a volume of a storage or distribution medium, is called an "aggregate" if the copyright resulting from the compilation is not used to limit the legal rights of the compilation's users beyond what the individual works permit. When the Document is included in an aggregate, this License does not apply to the other works in the aggregate which are not themselves derivative works of the Document. If the Cover Text requirement of section 3 is applicable to these copies of the Document, then if the Document is less than one half of the entire aggregate, the Document's Cover Texts may be placed on covers that bracket the Document within the aggregate, or the electronic equivalent of covers if the Document is in electronic form. Otherwise they must appear on printed covers that bracket the whole aggregate. 8. TRANSLATION Translation is considered a kind of modification, so you may distribute translations of the Document under the terms of section 4. Replacing Invariant Sections with translations requires special permission from their copyright holders, but you may include translations of some or all Invariant Sections in addition to the original versions of these Invariant Sections. You may include a translation of this License, and all the license notices in the Document, and any Warranty Disclaimers, provided that you also include the original English version of this License and the original versions of those notices and disclaimers. In case of a disagreement between the translation and the original version of this License or a notice or disclaimer, the original version will prevail. If a section in the Document is Entitled "Acknowledgements", "Dedications", or "History", the requirement (section 4) to Preserve its Title (section 1) will typically require changing the actual title. 9. TERMINATION You may not copy, modify, sublicense, or distribute the Document except as expressly provided for under this License. Any other attempt to copy, modify, sublicense or distribute the Document is void, and will automatically terminate your rights under this License. However, parties who have received copies, or rights, from you under this License will not have their licenses terminated so long as such parties remain in full compliance. 10. FUTURE REVISIONS OF THIS LICENSE The Free Software Foundation may publish new, revised versions of the GNU Free Documentation License from time to time. Such new versions will be similar in spirit to the present version, but may differ in detail to address new problems or concerns. See http://www.gnu.org/copyleft/. Each version of the License is given a distinguishing version number. If the Document specifies that a particular numbered version of this License "or any later version" applies to it, you have the option of following the terms and conditions either of that specified version or of any later version that has been published (not as a draft) by the Free Software Foundation. If the Document does not specify a version number of this License, you may choose any version ever published (not as a draft) by the Free Software Foundation. ADDENDUM: How to use this License for your documents To use this License in a document you have written, include a copy of the License in the document and put the following copyright and license notices just after the title page: Copyright (c) YEAR YOUR NAME. Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no FrontCover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled "GNU Free Documentation License". If you have Invariant Sections, Front-Cover Texts and Back-Cover Texts, replace the "with...Texts." line with this: with the Invariant Sections being LIST THEIR TITLES, with the Front-Cover Texts being LIST, and with the Back-Cover Texts being LIST. If you have Invariant Sections without Cover Texts, or some other combination of the three, merge those two alternatives to suit the situation. If your document contains nontrivial examples of program code, we recommend releasing these examples in parallel under your choice of free software license, such as the GNU General Public License, to permit their use in free software. 4 Appunti di meccanica quantistica Operatori in meccanica quantistica Operatori ed autofunzioni ˆ fn = ωnfn Una funzione f si dice autofunzione rispetto ad un operatore Ω̂ se si verifica che Ω con ω ∈ Gli operatori usati in meccanica quantistica sono lineari, cioè sono commutativi rispetto a ˆ (af + bg ) = a Ω ˆf + bΩ ˆ g a,b ∈ C somma e a moltiplicazione per una costante: Ω È in generale possibile esprimere una funzione g soddisfacente ragionevoli condizioni di regolarità come combinazione lineare delle autofunzioni di un operatore, g = ∑c f n n , con n ˆ fn = ωnfn Ω Se si ha un insieme di autofunzioni aventi lo stesso autovalore, tali funzioni si dicono degeneri, e qualsiasi loro combinazione lineare è ancora un’autofunzione degenere: {f n } ˆ f n = ωf n ∧ g = :Ω ∑c f n n ⇒ n ˆg = Ω ∑ c Ωˆ f = ∑ c ωf n n n n n n ∑c f =ω n n = ωg . Nella dimo- n strazione si fa uso della proprietà degli operatori della meccanica quantistica di essere lineari. ˆˆf ≠ BA ˆˆ f . Si definisce quindi il In generale gli operatori non sono tra loro commutativi, cioè AB ˆ, ˆ ˆˆ − ˆˆ commutatore A B = AB BA Rappresentazioni e costruzione degli operatori Quando si ha la necessità di ottenere una forma esplicita per gli operatori, si ricorre a delle rappresentazioni, cioè a delle definizioni di un set di operatori dai quali si ricavano gli altri. Una delle rappresentazioni più usate è la rappresentazione delle posizioni, nella quale ˆx → − i ˆ x→x× e p ∂ . ∂x Gli altri operatori possono essere ricavati esprimendo le espressioni classiche delle osservabili in funzione di momento e posizione, e successivamente applicando le definizioni della rappresentazione: Ad esempio, per l’energia cinetica si ha 1 ˆ E= − i 2m E = px 2 , e l’operatore corrispondente è 2m 2 2 ∂ ∂2 =− ∂x 2m ∂x 2 In tre dimensioni, si ricava in modo simile ˆ E=− 2 2m ∇2 ˆ =ˆ L’operatore energia totale del sistema si chiama hamiltoniano, e vale H E +V × Integrazione degli operatori e notazione di Dirac Spesso è necessario calcolare degli integrali della forma ∫ f Ωˆ g d τ , estesi a tutto il dominio ∗ delle due funzioni. Per semplificare le espressioni, si ricorre ad una notazione a parentesi dovuta a Dirac: Il simbolo f (bra) rappresenta il complesso coniugato della funzione f Il simbolo g (ket) rappresenta la funzione g 5 ∫ f g d τ si rappresenta come ∗ L’integrale ∫ f Ωˆ g d τ = ∗ f g ; un integrale come sopra si esprime come ˆg . f Ω Quando l’operatore è semplicemente una moltiplicazione per 1 si scrive f g = ∫f g dτ , e ∗ l’integrale corrispondente si dice integrale di sovrapposizione. Quando tale integrale è nullo, le due funzioni si dicono ortogonali. L’operazione f f = ∫f f dτ ∗ si chiama integrale di normalizzazione; una funzione che ha integrale di normalizzazione uguale ad uno, si dice normalizzata. Un insieme F = {fk } : ∀fn , fm ∈ F : fn fm = δnm (dove δnm = 1 ⇔ n = m e δnm = 0 ⇔ n ≠ m si chiama delta di Kroenecker) si dice ortonormale. Alcune proprietà di questa notazione, che si ricavano dalle proprietà dell’integrale corrispondente, sono: ˆg = α f Ω ˆg f αΩ ˆ g = α∗ f Ω ˆg αf Ω f g ∗ α∈ α∈ = g f Un’altra notazione simile usata per semplificare le espressioni ricorrenti in meccanica quantistica scrive ∫ f Ωˆ g d τ ∗ ˆ ng : le autofunzioni che descrivono gli stati possibili del come nf Ω sistema vengono indicizzate, e vengono rappresentate tramite i corrispondenti indici (numeri quantici). I postulati della meccanica quantistica 1. Lo stato di un sistema è descritto compiutamente da una funzione del tempo e delle coordina- ( te, detta funzione d’onda Ψ x1 , x2,… , xn ,t ) ( Le funzioni d’onda indipendenti dal tempo si indicano con la minuscola ψ x1 , x2,… , xn ,t ) Lo stato del sistema può dipendere anche da parametri “interni” (come lo spin). Ogni funzione d’onda è di solito identificata da una lista di numeri detti marcatori quantici, che individuano lo stato del sistema, che può quindi essere descritto elencando tali numeri quantici. 2. Le osservabili sono rappresentate da operatori che soddisfino le condizioni di commutazione ˆ j = i δij , ˆ xi , p ˆ xi , ˆ x j = 0 , ˆi , p ˆ j = 0 , dove ˆ ˆi rappresentano rispettivamente l’ip xi e p esima coordinata ed il relativo momento. Si dimostra che la rappresentazione delle posizioni rispetta questo postulato, infatti, ˆ xi , ˆ x j = ( x i x j − x j x i ) × ⋅ = 0 2 ∂2 ˆi , p ˆ j = i ∂ p − = 0 per il teorema di Schwarz. ∂x ∂x i j ∂x j ∂x i ∂x ˆ j = i x i ∂ ⋅ − ∂ ( x i × ⋅) = i x i ∂ ⋅ − i × ⋅ − x i ∂ ˆ xi , p ∂x ∂x j ∂x j ∂x j j ∂x j ⋅ = i ∂x i × ⋅ , e chiara∂x j mente la derivata della coordinata i-esima rispetto alla j-esima è uguale alla delta di Kroenecker. 3. Quando un sistema è descritto dalla funzione d’onda ψ , il valore medio delle misure di un’osservabile Ω eguaglia il valore attendibile del corrispondente operatore, definito come ˆ = Ω ˆ ψ Ωψ ψ ψ ˆ dτ ψ Ωψ ∫ = ∫ψ ψdτ ∗ ∗ 6 Se si sceglie una ∫ funzione d’onda normalizzata, l’espressione si riduce a ˆ = ψ Ωψ ˆ = ψ Ωψ ˆ dτ Ω ∗ Se ψ è un’autofunzione dell’operatore Ω̂ , qualsiasi misura dell’osservabile associata Ω re- ˆ = ψ Ωψ ˆ = ψ ωψ = ω ψ ψ = ω stituirà l’autovalore ω ; infatti Ω Se ψ non è un’autofunzione di Ω̂ , sarà comunque possibile esprimerla come combinazione lineare di tali autofunzioni. Ciascuna misura otterrà come risultato uno degli autovalori dell’operatore, con una probabilità proporzionale al modulo quadro del coefficiente della combinazione lineare. Infatti se ψ = ∑c ψ n n ˆ n = ωn ψn , applicando la definizione di , dove Ωψ n valore attendibile si Ω̂ = otterrà ∑c ψ ∑c ˆ = ψ Ωψ n n n ∑ ∑ ∑ω c c ∫ψ c n ψn n ωmcmψm = m ∗ m n m ∫∑ n c n ψn ∗ ∑ω c m m ∫ ∑c ψm d τ = ψn ∗ ∗ n n m m ˆ m = Ωψ m ∑ω c m m ψm d τ = m ψm d τ . Dato che le funzioni sono ortonormali (come si dimostrerà in segui- ∗ n n ,m to), ˆ = Ω sopravvivono ∑ω c c ∫ψ solo ∗ n n n ψn d τ = ∗ n n gli elementi ∑ω n con indici uguali, e l’integrale diventa 2 cn . Tale valore medio è compatibile con il postulato. n 4. La probabilità di rinvenire una particella nell’elemento di volume d τ centrato nel punto r è () proporzionale a ψ r 2 d τ ; in altri termini, ψ ( r ) rappresenta la densità di probabilità per la 2 particella descritta dalla funzione d’onda. Da questa definizione in termini di probabilità discende che ∫ ψ ( r ) d τ deve essere uguale 2 ad uno; in altri termini la funzione d’onda deve essere normalizzata ad uno, cosa che è sempre possibile se ψ a quadrato integrabile (basta porre ψ = ψ ∫ ψ ( r) 2 ). dτ Dato che l’integrale di normalizzazione è in generale esteso a tutto lo spazio, la condizione di normalizzazione implica che la funzione d’onda debba tendere a 0 per valori delle coordinate che tendono a ∞ . 5. La dipendenza temporale delle funzioni d’onda è descritta dall’equazione di Schroedinger, i ∂Ψ ˆ = HΨ , dove l’operatore hamiltoniano corrisponde all’energia totale del sistema. ∂t Qualora l’hamiltoniano sia indipendente dal tempo (l’energia potenziale del sistema è costante nel tempo), è possibile ricavare una dipendenza esplicita delle funzioni d’onda dal tempo, ricorrendo alla separazione di variabili: Si cercano le soluzioni fattorizzabili in due termini, uno dipendente dalla posizione ed uno dal tempo: Ψ ( r,t ) = ψ ( r ) ϑ (t ) Si sostituisce tale espressione nell’equazione di Schroedinger. Dato che l’hamiltoniano non contiene termini dipendenti dal tempo, esso agisce solo sulla componente di posizione, lasciando invariata quella temporale: i ψ i ∂ϑ ˆ ψ , che si può riordinare come = ϑH ∂t 1 ∂ϑ 1 ˆ = Hψ . ϑ ∂t ψ Dato che i due membri sono liberi di variare indipendentemente, uno in funzione del tempo, l’altro della posizione, l’unica possibilità esistente per cui l’uguaglianza sia verificata sempre è che entrambi i termini siano uguali alla medesima costante. 7 La costante ha le dimensioni di un’energia, e si denota con E ; l’equazione di Schroedinger si può quindi dividere in due problemi indipendenti, ciascuno dei quali restituisce una delle due componenti della funzione d’onda: i ∂ϑ ˆψ = E ψ = Eϑ e H ∂t La prima equazione differenziale ammette la soluzione ϑ ∝ exp ( − i t E ), ed incorpo- rando la costante di proporzionalità nella costante di normalizzazione della funzione ( ) () d’onda, si ricava l’espressione Ψ r,t = ψ r exp ( − i t E ). La soluzione all’equazione di Schroedinger indipendente dal tempo i presenta quindi uno stato Ψ ( r,t ) = ψ ( r ) exp ( − i t E 2 2 ) 2 stazionario, considerando 1 ∂ϑ 1 ˆ = Hψ rapϑ ∂t ψ anche il fatto che = ψ ( r ) è costante nel tempo. 2 Proprietà degli operatori e degli autostati Operatori hermitiani Un ∫ operatore ˆg d τ = f ∗Ω si dice ( ∫ g Ωˆ f d τ) ∗ ∗ hermitiano se o, equivalentemente, ∫ ( ˆg = g Ω ˆf f Ω ˆg d τ = f ∗Ω ) ∗ ˆf g , = Ω cioè se ∫ (Ωˆ f ) g d τ . Gli operatori associa∗ ti ad osservabili sono tutti hermitiani, perché gli operatori hermitiani hanno la proprietà di avere autovalori tutti reali. Ad esempio, l’operatore momento è hermitiano, infatti ∗ parti ψ ψ − i m n ∫ψ ∗ m ⋅ ∂ψn d x = integrando per i ∂x +∞ ∗ ∂ψm ⋅ ψn d x ; dato che (come si è osservato precedentemente) la condi∂x −∞ ∫ zione di integrabilità per le funzioni d’onda si traduce in un comportamento asintotico tenente a zero per coordinate che tendono a ∞ , il termine integrato vale zero, e l’espressione si riduce a ∫ ∗ ψm ⋅ ∂ψn dx = − i ∂x i ∫ ∗ ∂ψm ⋅ ψn d x = ∂x i ∫ ∗ ∂ψm ⋅ ψn ∗ d x , che soddisfa la defi∂x nizione di operatore hermitiano. Si può dimostrare che gli autovalori di un operatore hermitiano sono reali: indicando un autostato con il corrispondente autovalore si può scrivere l’equazione agli autovalori come ˆ = ψ ωψ = ω ψ ψ = ω , supponendo la funzione norΩ̂ψ = ωψ ; di conseguenza ψ Ωψ ˆ malizzata. Facendo il complesso coniugato di entrambi i membri si ricava ψ Ωψ ˆ = ψ Ωψ ˆ osservando che l’operatore è per ipotesi hermitiano ω = ψ Ωψ ∗ ∗ = ω∗ , ed = ω∗ da cui si ri- cava ω ∈ R . Si dimostra anche che le autofunzioni di un operatore hermitiano, corrispondenti ad autovalori distinti, sono mutuamente ortogonali: siano per ipotesi ψ1 e ψ2 due autofunzioni Ω̂ψ1 = ω1ψ1 ed Ω̂ψ2 = ω2ψ2 ; si ricavano quindi ˆ 1 = ω1 ψ2 ψ1 ψ2 Ωψ e ˆ 2 = ω2 ψ1 ψ2 . Sottraendo membro a membro la complessa coniugata della seconψ1 Ωψ da relazione dalla prima si ottiene ˆ 1 − ψ1 Ωψ ˆ 2 ψ2 Ωψ * * = ω1 ψ2 ψ1 − ω2 ψ1 ψ2 . Dato che l’operatore è hermitiano per ipotesi, il primo membro è zero; osservando inoltre che ψ1 ψ 2 * = ψ 2 ψ1 si ricava ( ω1 − ω2 ) ψ2 ψ1 = 0 , che può essere verificata solo se ψ2 ψ1 = 0 , dato che ω1 ≠ ω2 per ipotesi. 8 Complementarietà e principio di indeterminazione Le proprietà algebriche degli operatori conducono ad un’importante conseguenza, riguardante la possibilità di determinare contemporaneamente due osservabili di un sistema. Un primo risultato che si ottiene è che una funzione ψ può essere contemporaneamente autostato di due ˆ, ˆ B = 0 diversi operatori  e B̂ se e solo se i due operatori commutano, cioè se A ˆ ˆ ˆ ˆ Per prima cosa proviamo che Aψ = αψ ∧ Bψ = βψ ⇒ A, B = 0 : date le ipotesi si può ˆˆψ = A ˆ βψ = βA ˆ ψ = βαψ = αB ˆψ = ˆ ˆˆ ψ . Dainfatti scrivere la catena di relazioni AB Bαψ = BA ( ) to che le autofunzioni costituiscono un insieme completo, tale relazione varrà per qualsiasi funzione f = ∑c ψ n n ˆˆ = BA ˆˆ ⇒ A ˆ, B ˆ = 0 , e di conseguenza AB n ( ) ˆ ψ = αψ ∧ A ˆ, ˆ B = 0 ⇒ ˆ Bψ = βψ . Dato che i due operaViceversa, occorre provare che A ˆ ˆ ˆˆ ψ = α ˆ tori possono commutare, è possibile scrivere A Bψ = BA Bψ . Nell’ipotesi aggiunti- ( ) ( ) va che l’operatore  ammetta una sola autofunzione corrispondente all’autovalore α , è evidente che la sola possibilità per verificare la relazione trovata è che sia ˆ Bψ ∝ ψ , cioè ˆψ = βψ , come si voleva dimostrare. B La condizione dell’esistenza di una funzione che sia autostato di entrambi gli operatori corrisponde (per il postulato 3) ad una condizione in cui per ogni misura si rilevano esattamente gli autovalori corrispondenti ai due operatori. È quindi possibile misurare con precisione indefinita le due osservabili, che per questo si dicono compatibili. Al contrario, se alle due osservabili sono associati operatori che non commutano, non sarà possibile trovare una funzione d’onda che sia autostato di entrambi gli operatori, e quindi non si potrà ottenere una precisione arbitraria per entrambe le misure. Due osservabili di questo tipo si dicono complementari. Riguardo ad una coppia di osservabili complementari è possibile ottenere un risultato ancora più forte, che pone un limite inferiore alla precisione con cui è possibile misurarle contemporaneamente. È possibile enunciare questo risultato (che è il principio di indeterminazione di Heisenberg) in una forma molto generale, sfruttando le proprietà algebriche degli operatori. Si vogliono conoscere contemporaneamente due osservabili A e B , alle quali sono associa- ˆ . Si introduce la i per semplificare alˆ, ˆ B = i C ti due operatori il cui commutatore vale A cuni passaggi della dimostrazione. Supponiamo che il sistema si trovi in uno stato arbitrario, cui è associata una generica funzione d’onda normalizzata ψ . Si introducono i valori ˆ = ψ A ˆψ e ˆ medi delle due osservabili A B = ψ ˆ Bψ ; inoltre si definiscono degli opera∧ ∧ ˆ− A ˆ e δB = B ˆ− B ˆ . tori di dispersione, che esprimono lo scarto dal valore atteso, δA = A ( )( ) ( )( ) ∧ ∧ δA ˆ− A ˆ B ˆ− B ˆ − ˆ ˆ− A ˆ = δ B = A B− ˆ B A , ˆ ˆˆ − BA ˆˆ = A ˆ ˆ ˆˆ + A ˆ B ˆ − A ˆ B ˆ− B ˆ A ˆ − BA ˆˆ + ˆ ˆ −ˆ ˆ −A ˆ ˆ AB B A B A B = AB , B = i C , dato Il loro commutatore vale ( ) che i valori medi sono valori numerici che commutano con tutti gli altri operatori. Si studia ora il valore dell’integrale I = ∫ 2 α δ∧A − i δ∧B ψ d τ , in cui α è un numero reale arbitrario. Tale integrale è certamente positivo o al più nullo, visto che la funzione integranda è sempre positiva. Si osserva ∧ ∧ I = α δA − i δB ψ ora che I = ∫ ∗ ∧ ∧ ∧ ∧ α δA − i δB ψ α δA − i δB ψ d τ , cioè ∧ ∧ α δA − i δB ψ . Ora, entrambi gli operatori di partenza sono hermitia 9 ∧ ∧ ni (visto che rappresentano osservabili fisiche), ed anche l’operatore α δA − i δB è “quasi” hermitiano, tranne che per la presenza dell’unità immaginaria. Si può quindi applicare la ∧ ˆf g = g Ω ˆ f , con l’accortezza di cambiare il segno di − i δB (si proprietà di hermiticità Ω tratta in pratica di fare il coniugato dell’operatore). Si ricava in questo modo che ∧ ∧ ∧ ∧ I = ψ α δA + i δB α δA − i δB ψ = ∧ ∧ ∧ ∧ α δA + i δB α δA − i δB . ∧ 2 ∧ 2 Si sviluppa ora tale espressione, ottenendo I = α2 δA ∧ ∧ 2 ∧ ˆ , I = α2 δA conoscendo il commutatore δA, δB = i C Si manipola ∧ 2 I = δA ora questa espressione 2 ˆ ˆ C C 2 α + α ∧ 2 ± ∧ 2 δA A δ 4 ∧ 2 δB 2 + ∧ 2 δA ∧ + δB ∧ 2 + δB ∧ 2 δA ∧ ∧ e, ri- ˆ . +α C completando = ∧ − i α δA δB− δB δA il ˆ C α + ∧ 2 δ A 2 quadrato 2 ˆ C − ∧ 2 4 δA α: δB + ∧ 2 δA in 2 ∧ 2 2 e si osserva che l’integrale continua ad essere positivo (visto che lo era nella sua forma 2 ∧ iniziale). Quindi δA − ˆ C 2 ∧ 2 ∧ 2 + δB + δB ≥ 0 e, osservando che deve 2 ˆ C α + − ∧ 2 2 δA 4 esserlo (per l’arbitrarietà di α ) anche ˆ C ∧ 2 ∧ 2 δA quando il termine a quadrato vale zero, ∧ 2 ≥ 0 , che si riordina in δB 2 ∧ 2 δA ≥ ( Aˆ − Aˆ ) = 4 δA Rimane ora da osservare che ∧ 2 δA = 2 1 ˆ C 4 2 ˆ2 + A ˆ A 2 ˆ A ˆ − 2A = 2 ˆ2 − A ˆ , A che corrisponde alla definizione classica di varianza. Indicando quindi gli scarti quadratici medi ∆A = ∧ 2 δA e ∆B = ∧ 2 δB , la relazione diviene ∆A 2∆B 2 ≥ do la relazione di commutazione iniziale, ∆A ∆B ≥ 1 ˆ 2 C , da cui, ricordan4 1 ˆ ˆ A, B 2 Da tale relazione si ricava facilmente il principio di indeterminazione nella sua forma più comune, che esprime l’incertezza minima nella misurazione simultanea di momento e posizione: ˆ x = i si ricava immediatamente xp ricordando le relazioni di commutazione per le quali ˆ, ∆x ∆p x = 1 2 Viene anche confermata l’osservazione che per due osservabili compatibili, i cui operatori hanno commutatore nullo, è possibile ottenere una precisione arbitraria sulla determinazione simultanea dei loro valori. L’evoluzione temporale delle osservabili Dalle relazioni di commutazione è possibile ricavare anche informazioni su come variano nel tempo i valori attendibili delle osservabili. In particolare, per operatori che non hanno intrinse- 10 ∂ ,Ω ˆ = 0 ) si dimostra la validità della relazione ∂t ˆ ˆ ∂ Ω ∂ Ω ∂ i ˆ ˆ ˆ dτ = : derivando la relazione per il valore attendibile = H Ω = Ψ ∗ΩΨ , ∂t ∂t ∂t ∂Ψ ∗ ˆ ˆ ∂Ψ d τ , applicando la condizione di indipendenza dal tempo dell’operatore ΩΨ + Ψ ∗Ω ∂t ∂t ca dipendenza dal tempo (cioè per i quali ∫ ∫ nell’ultimo passaggio, nel quale si commutano l’operatore con la derivata rispetto al tempo. Applicando ora l’equazione di Schroedinger i ∂Ψ ˆ = HΨ , la relazione precedente diventa ∂t ∗ 1 ∗ˆ ˆ 1 ∗ˆ ˆ 1 H ˆ Ψ ΩΨ ˆΨ d τ = ˆ + Ψ ∗Ω ˆ 1 H − Ψ HΩΨ + Ψ ΩHΨ d τ = i i i i 1 ˆΩ ˆ = i H ˆ ˆ ˆ Ψ − Ψ ∗H ˆ ΩΨ ˆ −Ω ˆH ˆH ˆ dτ = − 1 H Ψ ∗Ω , Ω . Nel primo passaggio si è fatto rii i ∫ ∫ ∫ corso all’hermiticità dell’hamiltoniano. Un’osservabile che commuti con l’hamiltoniano (e quindi il cui valore medio sia costante nel tempo) si dice costante del moto del sistema, e si dice che il suo valore si conserva. Dalla relazione appena dimostrata si dimostrano alcune interessanti corrispondenze con la meccanica classica: Si calcola ˆx ∂ p i ˆ ˆ = H, px : ∂t 2 2 ∂ ∂2 ∂ ∂2 ˆ, p H ˆx = − + V × ⋅ − − ⋅ +V × ⋅ = 2 2 2m ∂x 2 ∂ x ∂ x m ∂ x i i 3 3 3 3 ∂ ∂ ∂ ∂ − ⋅+ V ⋅+ ⋅− (V × ⋅) = V ∂ ⋅ − ∂V − V ∂ ⋅ = i ∂V × ⋅ i 2m ∂x 3 i ∂x i 2m ∂x 3 i ∂x i ∂x i ∂x i ∂x ∂x ˆx ∂ p ∂V ∂V , si riQuindi =− × ; considerando che la forza agente è definita da F = − ∂x ∂t ∂x ˆx ∂ p cava che la velocità di variazione del valore d’attesa del momento è = F× ∂t In modo simile, 2 ∂ ˆ x ∂2 i i ˆ ˆ − = = H x , 2m ∂x 2 + V ∂t 2 ∂2 × x × ⋅ − x − ⋅ +V × ⋅ = 2 2m ∂x 2 2 i =2 ∂ ∂ (x × ⋅) + Vx × ⋅ − Vx × ⋅ + x = ∂ 2 ⋅ = − = 2m ∂x ∂x 2m ∂x ∂ ∂ ∂x ∂2 ∂ ∂ ∂2 i i − ⋅+ × ⋅ + x 2 ⋅ = − ⋅ + ⋅ + x 2 ⋅ = x x ∂x ∂x ∂x ∂x ∂x ∂x ∂x 2m 2m ∂x ∂ ∂2 ∂ ∂2 1 i − ⋅ −x 2 ⋅ ⋅ +x 2 ⋅ = −i ∂x ∂x ∂x ∂x ∂x m 2m 1 ˆ ∂ p ⋅ = m x ∂x cioè, la velocità di cambiamento della posizione media è uguale alla velocità media lungo la stessa asse. Queste ed altre relazioni simili mostrano come la corrispondenza tra la meccanica classica e quella quantistica vada ricercata nel fatto che la prima si concentra sui valori medi delle osservabili. Rappresentazione matriciale degli operatori Elementi di matrice e relazione di completezza: L’analogia tra operatori e matrici discende dal fatto che entrambi sono dotati di un prodotto non commutativo, e di conseguenza diventa possibile postulare relazioni commutative simili a 11 quelle per gli operatori. Ad esempio, la relazione tra momento e posizione diventa xpx − px x = i I dove I è la matrice identica. ˆ m , con gli autostati indicizzati, suggerisce un modo per definire la matrice La notazione n Ω ˆ m , Ωnm rappresenta l’elemento di matrice di indici; gli dell’operatore: ponendo Ωnm = n Ω elementi con indici uguali (che stanno sulla diagonale della matrice dell’operatore) vengono detti elementi di matrice diagonali. Utilizzando questa notazione è possibile ricavare un’importante relazione: ∑r ˆ s s ˆ A Bp = s ∑A B rs = ( AB)rp = sp s ˆˆ p , dove la sommatoria è estesa a tutti gli r AB autostati, e dove si osserva nel secondo passaggio come ∑A B rs corrisponda all’espressione sp s formale del prodotto tra matrici. Tale relazione è detta relazione di completezza. È possibile ricavare la stessa relazione in modo più esplicito, anche se più laborioso: Per prima cosa si considera di avere un insieme completo ortonormale di autostati {σi } . Dato che tale insieme è completo, è possibile esprimere qualsiasi funzione come combinazione lineare di funzioni appartenenti all’insieme: ∑c σ . ψ= i Ora, sfruttando i i l’ortonormalità del sistema, si ricava σk ψ = σk ∑c σ i i ∑c = ∑σ È quindi possibile scrivere ψ = i σi ψ = i ∑c δ σk σi = i ik = ck . i ∑σ ∫σ ψdτ. ∗ i i i ˆˆπ d τ . Se consideriamo un in∫ ρ AB {σ } , è possibile esprimere ˆBπ = ∑ σ ∫ σ ˆBπ d τ , e quindi ˆˆπ = Passiamo ora a considerare l’espressione ρ AB sieme completo di funzioni i i i ∗ ∗ i i i i ∫ l’integrale precedente diventa ˆ ρ∗A Bπ d τ d τ . Vista la linearità dell’operatore σi σi ∗ˆ ∑ ∫ i  , è possibile portare la sommatoria fuori del segno di integrale, ottenendo ˆ σi σi ∗ˆ ˆπ d τ è un numero, è possibile estrarlo σi ∗B ρ∗A Bπ d τ d τ ; dato che ) (∫ ∑∫ ∫ dall’integrale, ricavando ∑ ( ρ A ∫ ˆ σ d τ∫ σ ˆBπ d τ) = ∑ ( ρ Aˆ σ i ∗ ∗ i i i i ) ˆπ . σi B i ˆˆπ in una somma del tipo La relazione di completezza è spesso usata per scomporre ρ AB ∑ ( ρ Aˆ σ i i ) ˆπ . Ad esempio, è possibile dimostrare che gli autovalori del quadrato di σi B un operatore hermitiano sono non negativi: sia ψ un’autofunzione tale che Ω̂2ψ = ω ; ˆ 2ψ = ψ ΩΩψ ˆˆ = ψ Ω ˆ ∑ ψ Ωσ i ˆ , applicando la relazione di completezza. Sfrutσi Ωψ i tando ora l’hermiticità ∗ ˆ = ψ Ωσ ˆ i , σi Ωψ dell’operatore, nell’espressione precedente, ˆ 2ψ = ψ Ω ˆ ∑ ψ Ωσ i ˆ i ψ Ωσ ∗ = i e quindi, ∑ ˆ i ψ Ωσ sostituendo 2 . Dato che i ˆ 2ψ = ω , segue immediatamente la non negatività dell’autovalore. ψ Ω La diagonalizzazione dell’hamiltoniano Si prenda una funzione d’onda generica, espressa come combinazione lineare di un insieme completo di stati, ψ = ∑c σ k k k . Se ora scriviamo ˆ ψ = σm H ∑c k ˆ σk , inserendo σm H k 12 l’equazione ∑c ∑H k di Schroedinger ˆ σk = E σm H k ∑c k indipendente dal tempo ˆψ = E ψ H si ottiene σm σk = Ecm . Confrontando con la notazione matriciale si ricava k c = Ecm . Ora, se fosse possibile trovare un insieme di stati tale che H mk ≠ 0 ⇔ m = k , mk k k cioè tale che la matrice dell’hamiltoniano sia diagonale, l’espressione precedente diventa H mmcm = Ecm , cioè E = H mm : diagonalizzare l’hamiltoniano equivale quindi a trovare l’energia associata al sistema, risolvendo in pratica l’equazione di Schroedinger. Le funzioni d’onda: considerazioni qualitative Caratteristiche delle funzioni accettabili: Dalla forma dell’equazione di Schroedinger e dalla necessità di rappresentare sistemi fisici reali si ricava che le autofunzioni devono avere alcune caratteristiche di base: in primo luogo, visto che il quadrato del modulo di una funzione d’onda costituisce una densità di probabilità, le funzioni d’onda devono essere a quadrato integrabile; di conseguenza non possono essere infinite su un intervallo che non sia infinitesimo. Inoltre ψ ∗ψ deve essere univoca. Dall’equazione di Schroedinger discende invece la necessità che esista la derivata seconda della ∂2 + V ( x ) ); ψ deve quindi essere almeno C 0 e, tranne che in si2m ∂x 2 tuazioni di potenziali “atipici” (ad esempio infiniti o discontinui), è di solito anche C 1 . ˆ =− funzione d’onda ( H 2 Considerazioni qualitative sulle soluzioni accettabili dell’equazione di Schroedinger: Un’osservazione della forma dell’equazione di Schroedinger indipendente dal tempo in una dimensione porta a notare che essa può essere riscritta nella forma ∂2ψ 2m = 2 (V ( x ) − E ) ψ ; ∂x 2 dato che la derivata seconda di una funzione è uguale alla sua curvatura, è possibile ricavare una descrizione approssimativa dell’andamento della soluzione (l’espressione esatta per la curvatura sarebbe ∂2f ∂x 2 1 + ( ∂f ∂x )2 3 2 , ma considerare solo la derivata seconda non cambia quali- tativamente le deduzioni che se ne possono ricavare). La curvatura di una funzione corrisponde alla concavità del suo grafico: se essa è > 0 , il grafico ha la concavità verso l’alto, se viceversa è negativa, il grafico avrà concavità verso il basso. Il valore assoluto della curvatura corrisponde a quanto pronunciata è questa concavità. Dalla forma sopra riportata dell’equazione di Schroedinger si osserva che la curvatura della funzione d’onda dipende sia dal valore di ψ che da quello di y C >0 C =0 x V ( x ) − E . In particolare, l’orientazione della concavità dipende dal segno di entrambe queste quantità, e la curvatura sarà più pronunciata quando è grande l’ampiezza di ψ e quanto più è grande è la quantità V (x ) − E . C <0 Moto traslazionale in una dimensione La particella libera e la relazione di De Broglie Si consideri il caso del moto di una particella in un potenziale costante in qualsiasi punto dello spazio; in tale caso il potenziale si può porre uguale a zero, e l’hamiltoniano diventa 13 2 ∂2ψ ∂2 − = Eψ , ; l’equazione di Schroedinger indipendente dal tempo è quindi 2m ∂x 2 2m ∂x 2 ∂2ψ 2mE 2mE cioè ed energia = − 2 ψ , che ammette le soluzioni ψ = Ae i kx + Be − i kx , con k = 2 ∂x 2 k2 2 . Il problema di una funzione di questo tipo è che non è a quadrato integrabile ed è E = 2m ˆ =− H 2 estesa a tutto lo spazio, e quindi non rappresenta un buon modello fisico per una particella. Comunque questa trattazione ci permette di ricavare alcune osservazioni di carattere generale: L’energia per una particella libera non è quantizzata: nella funzione d’onda sono accettabili tutti i valori di k corrispondenti a qualsiasi energia. p2 con 2m quella in funzione del parametro k si ricava che il momento della particella descritta da ψ è p = k . Inoltre l’espressione di ψ può essere riscritta, tenendo conto della relazione di Confrontando l’espressione classica per l’energia in funzione del momento E = Eulero, come ψ = C cos (kx ) + D sin (kx ) ; diventa così evidente come la funzione abbia un andamento ondulatorio, con k come numero d’onda. Conseguentemente la sua lunghezza d’onda sarà λ = h 2π , il che ci permette di esprimere il momento come p = , che è la relak λ zione di De Broglie. Le stesse relazioni si possono ricavare in modo più rigoroso, applicando alla funzione ˆψ = − i l’operatore momento; dato che p consideriamo la funzione ψ ∂ ( Ae i kx + Be − i kx ) = ∂x come somma di k ( Ae i kx − Be − i kx ) ≠ αψ , due autostati: infatti ∂ Be − i kx = − kBe i kx : le due autofunzioni ∂x corrispondono a una particella che si muove rispettivamente nel verso positivo delle x , con momento k , e nel verso negativo, con momento − k . Misurando il momento della parti2 cella descritta dallo stato ψ avremo quindi una probabilità ∝ A di ottenere un valore k , ˆ Ae i kx = − i p ∂ ˆ Be − i kx = − i Ae i kx = kAe i kx , e p ∂x ed una probabilità ∝ B 2 di misurare un momento negativo − k . Scegliendo una delle due autofunzioni sopra descritte è quindi possibile descrivere una particella che si muove in un verso piuttosto che nell’altro. La densità di flusso Nello studio del moto di una particella è spesso utile ricorrere alla densità di flusso, definita come J = ( Ψ ∇Ψ − Ψ∇Ψ ) , in una dimensione 2m i ∗ ∗ Jx = ∗ ∂Ψ ∂Ψ ∗ . Ψ −Ψ 2m i ∂x ∂x Per uno stato di energia definita (in cui la funzione d’onda è fattorizzabile in una parte dipendente dalla posizione ed una dipendente dal tempo, Ψ ( x ,t ) = ψ ( x ) e − i t E ) l’espressione si semplifica: ∗ ∂ψ − i t E ∂ψ ∗ − i t E ∗ ψ ∗ (e − i t E ) − ψe − i t E e (e ) = ∂x ∂x 2m i ∗ ∗ ∂ψ ∗ ∂ψ ∂ψ − i t E ∗ − i t E ∂ψ ∗ ψ −ψ = ψ −ψ e e ( ) ∂x ∂x 2m i ∂x 2m i ∂x Jx = Un’interpretazione della densità di flusso di probabilità si può ricavare in questo modo: Calcoliamo div J = ∂J x ∂J y ∂J z + + ; eseguiamo il calcolo sulla componente x , dato che ∂x ∂y ∂z per le altre i conti sono analoghi: ∂J x ∂Ψ ∗ ∂Ψ ∂2Ψ ∂Ψ ∂Ψ ∗ ∂ 2Ψ ∗ = + Ψ∗ − −Ψ = 2 ∂x 2m i ∂x ∂x ∂x ∂x ∂x ∂x 2 14 ∗ ∂2Ψ ∂2Ψ ∗ Ψ − Ψ . Dato che per le altre variabili si hanno risultati affini, si deduce ∂x 2 ∂x 2 2m i che div J = ( Ψ ∇ Ψ − Ψ∇ Ψ ) . 2m i ∗ Consideriamo ora 2 ∗ 2 l’equazione di Schroedinger nella forma tridimensionale: ∂Ψ ˆ =− ∇ + V , e quindi − ∇ Ψ +V Ψ = i H . Facendo i complessi coniugati di en∂t 2m 2m 2 ∂Ψ ∗ ∇2Ψ ∗ + V Ψ ∗ = − i trambi i membri − . Ora moltiplico la prima espressione per ∂t 2m Ψ ∗ e la seconda per Ψ , sottraendo poi la seconda dalla prima. Ottengo così 2 2 ∂Ψ ∂Ψ ∗ −Ψ ∗ ∇2Ψ + Ψ ∇2Ψ ∗ + Ψ ∗V Ψ − ΨV Ψ ∗ = Ψ ∗ i +Ψi , che si riordina come ∂t ∂t 2m 2m ∂ ( ΨΨ ∗ ) 2 ∗ 2 ∗ ( Ψ ∇ Ψ − Ψ∇ Ψ ) = − ∂t . 2m i 2 2 2 2 Combinando questo risultato con quello precedente otteniamo div J = − ( ) , la cui ∂ Ψ 2 ∂t analogia con la forma puntuale dell’equazione di continuità è evidente. Applicando il teorema della divergenza ad un generico elemento di volume V con frontiera ∂V otteniamo il risultato ∫∫ J ⋅ nˆ = −∫∫∫ Ψ ∂V 2 . Il flusso del vettore densità di flusso di probabilità attra- V verso una superficie chiusa è uguale alla variazione della probabilità di trovare la particella associata nel volume delimitato dalla superficie. la particella libera in una dimensione la densità di flusso è Per Jx = 2m i A 2 (e − i kx i ke i kx − e i kx ( − i k ) e − i kx ) = 2 k A , è cioè uguale alla velocità della particella m moltiplicata per la probabilità che la particella si trovi in quel determinato stato. Pacchetti d’onde Si è visto che nel caso di particelle con energia (o quantità di moto) con valore esatto assegnato, la funzione d’onda corrispondente ha densità di probabilità uguale su tutto lo spazio. Per ottenere una descrizione fisicamente realistica (una particella ha sempre una posizione nello spazio più o meno ben definita), occorre considerare una combinazione di funzioni d’onda con energie simili, ottenendo così “interferenze” costruttive o distruttive che localizzano la probabilità di trovare la particella in una regione limitata. La trattazione matematica dei pacchetti d’onda richiede l’uso di somme infinite di funzioni trigonometriche (serie di Fourier), e la loro estensione al continuo. La teoria delle serie di Fourier assicura di poter esprimere qualsiasi funzione a quadrato integrabile, periodica su un intervallo di ampiezza L come limite di una somma di funzioni della forma f (x ) = ∞ 2π in x 1 γne L , con γn = L n =−∞ ∑ ∫ L2 −L 2 f (x ) e − in 2π x L d x . Facendo la sostituzione k = n 2π , e L ∞ 2π 1 γne i kx ∆k . Se ora facciamo tendere , possiamo scrivere f ( x ) = 2π n =−∞ L a infinito il periodo L della funzione (di fatto rimuovendo il vincolo di periodicità) osserviamo che ∆k → 0 , e di fatto k diventa una variabile continua. Possiamo quindi scrivere 1 ∞ (con procedimento non del tutto rigoroso) e γ (k ) e i kx d k , f (x ) = 2π −∞ ∞ 1 ∞ γ (k ) e i kx d k e γ (k ) = f ( x ) e − i kx d x . Se poi riscriviamo come f ( x ) = −∞ 2π −∞ ∞ 1 γ (k ) = f ( x ) e − i kx d x , vale una relazione simile al teorema di Parseval, cioè 2π −∞ considerando ∆k = ∑ ∫ ∫ ∫ ∫ 15 ∫ ∞ −∞ f (x ) d x = 2 ∫ ∞ −∞ γ (k ) d k . Una conseguenza è che se la funzione f è normalizzata, an2 che i coefficienti γ lo sono, e viceversa. L’applicazione alla costruzione di un pacchetto d’onde è immediata: dato che tutte le funzioni 2mE della forma e i kx , con k = sono soluzioni della equazione di Schroedinger per una parti- 2 cella libera, possiamo costruire una funzione d’onda come somma di una serie di autostati, ciascuno con un valore assegnato di k . É anzi possibile eseguire una somma continua tramite un integrale, conoscendo la distribuzione di probabilità per i parametri k . Avendo tale densità di probabilità assegnata come una funzione γ (k ) si può esprimere il pacchetto d’onde risultante come ψ ( x ) = 1 2π ∫ ∞ −∞ γ (k ) e i kx d k . Si immagini ad esempio di avere una distribuzione di probabilità che sia nulla ovunque tranne che su un intervallo di ampiezza ∆k centrato in k0 . Perché tale funzione sia γ normalizzata è necessario definirla come 0 k ∉ [k0 − ∆k 2 ,k0 + ∆k 2] γ (k ) = . 1 ∆k k ∈ [k0 − ∆k 2 ,k0 + ∆k 2] Ora l’integrale per la funzione che descrive il pacchetto si riduce all’integrale sulla parte non nulla della distribuzione per il parametro k. Si ricava dunque 1 2 i k x e ix ∆k 2 − e − ix ∆k 2 = e 2i 2π∆k x 0 k 1 k +∆k 2 1 i kx e dk = 2π k −∆k 2 ∆k 1 2 sin x ∆k 2 i k x e . x 2π∆k ∫ ψ (x ) = 0 0 1 1 i kx k e k 2π∆k i x 0 +∆k 2 0 −∆k 2 = 0 ψψ ∗ ψψ ∗ Dk =0.5 Dk =1 x x ψψ ∗ ψψ ∗ Dk =2 Dk =4 x Tracciando il grafico della densità di probabilità ψ 2 x per vari valori di ∆k si nota come il pacchetto d’onde sia tanto più localizzato quanto più è ampia la distribuzione delle k . Tenendo presente che p = k , si riconosce in questo comportamento una manifestazione del principio di indeterminazione ∆p ∆x ≥ 2. 16 È possibile costruire pacchetti d’onda con una distribuzione diversa per le k . In ogni caso continua a manifestarsi il principio di indeterminazione sotto forma di una correlazione tra la dispersione della densità di probabilità per ψ e l’ampiezza della distribuzione di k . Velocità di fase e velocità di gruppo: il moto di un pacchetto d’onde Passiamo ora a studiare la dipendenza dal tempo della funzione d’onda per una particella libera. Essendo il potenziale nullo e costante rispetto al tempo, possiamo applicare la tecnica di separazione di variabili, e sappiamo che una soluzione dell’equazione di Schroedinger dipendente dal tempo sarà Ψ ( x ,t ) = ψ ( x ) e − i t E , e nel caso della particella libera in moto verso +∞ , Ψ ( x ,t ) = Ae i kxe − i t E con k = 2mE 2 . Se vogliamo calcolare la velocità di fase, cioè la velocità con cui un punto della funzione d’onda si sposta in funzione del tempo, basta applicare il teorema della funzione implicita e ricavare − i E Ae i kxe − i t E ∂Ψ ∂t dx =− = − i k Ae i kxe − i t E ∂Ψ ∂x dt = E E = = k 2m p v = . Questo risultato potrebbe apparire paradossale: la velocità di fase dell’onda di mate2m 2 ria si muove con una velocità che è la metà di quella classicamente associata alla particella. Per chiarire il problema occorre considerare non una singola funzione d’onda, ma un pacchetto di onde della forma Ψ k ( x ,t ) = e i kxe − i t E (k ) con E = k2 2 nel caso di una particella libera. 2m 1 2π Il pacchetto sarà descritto dalla funzione d’onda Ψ ( x ,t ) = N ∫ ∞ −∞ c (k ) Ψ k ( x ,t ) d k ; una buona funzione peso c (k ) è una gaussiana, sia perché il parametro di larghezza corrisponde allo scarto quadratico medio, sia perché si dimostra che è la distribuzione che per- (k − k0 )2 exp − (che è una 4σ2 σ 2π 1 mette di minimizzare σx σp . Quindi scegliamo c (k ) = gaussiana Ψ ( x ,t ) = N a quadrato normalizzato), (k − k0 ) + i kx − i t E (k ) exp − 2 −∞ σ 4 ∫ 2 ∞ ottenendo per il pacchetto d k (qui e nel seguito inglobiamo nella costante di normalizzazione tutte le costanti che possano apparire durante le successive integrazioni). Calcoliamo la densità di probabilità per la particella a t = 0 : L’espressione per Ψ diventa (k − k0 )2 + i kx d k = exp − 2 −∞ 4σ 2 ∞ (k − k0 ) + − k k x exp − i dk ( ) 0 −∞ 4σ2 Ψ ( x , 0) = N ∫ ∞ (k − k0 )2 + − + N exp − k k x k x i i d k = Ne i k x ( ) 0 0 2 −∞ σ 4 2 ∞ (k − k0 ) Calcoliamo + i (k − k0 ) x d k ; con il cambio di variabili t = k − k0 , si ha exp − 2 −∞ 4σ 2 ∞ t exp − 2 + i tx d t . −∞ 4σ ∫ ∞ 0 ∫ ∫ ∫ Completo il 2 t − i σx e −σ x d t = e −σ x exp − −∞ 2σ ∫ ∞ t2 exp − 2 + i tx + σ2x 2 − σ2x 2 d t = −∞ 4 σ 2 ∞ t − i σx d t exp − −∞ 2σ quadrato 2 2 2 2 ∫ ∞ ∫ 17 »Ψ »2 Tenendo presente che nell’integrale è rimasta una gaussiana, il risultato 2σ −σ x , ottee 2π 2 2 dell’integrazione è nendo Ψ ( x , 0) = Ne i k0x 2 2 e −σ x . Ora bit=0 sogna solo normalizzare, ponendo che 1 = N2 ∫ ∞ −∞ ∫ sia ∫ ∞ −∞ ∞ 2 Ψ d x = 1 ; si ricava −∞ ei k x 0 2 2 2 e −2σ x d x = (e ) d x = 2 −σ2x 2 π . 2σ2 x 14 2 π Concludendo, Ψ ( x , 0) = 2 2 σ e i k xe −σ x . La funzione d’onda risultante ha una densi0 tà di probabilità gaussiana, centrata in 0 e con ampiezza σx = 1 : per inciso, questo con2σ ferma che per una distribuzione gaussiana dei pesi si ha σx σp = σx σk = 2 , il minimo consentito dal principio di indeterminazione. Consideriamo ora come si modifica il pacchetto al passare del tempo. Per semplificare (e generalizzare) i calcoli, non utilizziamo l’espressione esplicita di E (k ) per la particella libera, ma la sua espansione in E (k ) = E (k0 ) + (k − k0 ) serie dE dk velocità di gruppo v g = + k0 1 dE dk di Taylor 2 1 (k − k0 ) 2 d E2 2 dk = k0 attorno k0 . a Abbiamo quindi + … ; per semplificare la notazione definiamo k0 k0 1 d2 E p e fattore di dispersione w g = = d k2 m m = k0 m (le e- spressioni esplicite si riferiscono alla particella libera). In prima approssimazione consideriamo solo il primo termine dello sviluppo di Taylor, e studiamo il comportamento di un pacchetto della forma Ψ ( x ,t ) = N (k − k0 )2 + i kx − i t E (k0 ) exp − 2 −∞ σ 4 ∫ ∞ − i t (k − k0 ) v g d k analogamente a quanto fatto precedentemente ricavo Ψ ( x ,t ) = N exp ( i k0x − i t E (k0 ) Confrontando ( con exp −σ2 ( x − v gt ) 2 )∫ quanto (k − k0 )2 + i (k − k0 ) (x − v gt ) d k exp − 2 −∞ 4σ ∞ z2 fatto prima, exp − 2 + i z (x − v gt ) d z = −∞ 4σ )∫ ∞ ∫ ( 2 2 z + i σ ( x − v gt ) d z ∝ exp −σ2 ( x − v gt ) exp − −∞ 2σ ∞ ( Abbiamo in definitiva Ψ ( x ,t ) = N exp i k0x − i t E (k0 ) 14 2 π malizza Ψ ( x ,t ) = 2 sità di probabilità è Ψ = σ exp ( i k0x − i t E (k0 ) ( ) ) exp ( −σ (x − v t ) ) , che si nor2 2 g ) exp ( −σ (x − v t ) ) . L’associata den2 2 g ) 2 2 σ exp −2σ2 ( x − v gt ) , che altro non è che una gaussiana π 18 1 e centrata in v gt . Il pacchetto di fatto si muove con velocità v g , che 2σ corrisponde alla definizione classica di velocità p m . di larghezza σx = Concludiamo includendo nell’analisi anche il termine di secondo ordine: »Ψ»2 t=0 t=1 t=2 x Ψ ( x ,t ) = N (k − k0 ) + i kx − i t E (k0 ) exp − −∞ 4σ2 ∫ 2 1 − i t (k − k0 ) v g − i t (k − k0 ) w g d k 2 2 ∞ come al solito l’espressione diventa 2 1 1 exp − (k − k0 ) 2 + i w gt + i (k − k0 ) (x − v gt ) d k σ 4 2 ∞ 1 2 1 exp −z 2 + i w gt + i z ( x − v gt ) d z ; e operando una sostituzione di variabili −∞ 2 4σ ∞ 1 1 exp −z 2 ( A 2 + i B 2 ) + i zC d z considerando A 2 = , B 2 = w gt , C = ( x − v gt ) si ha 2 −∞ 4σ 2 Ψ ( x ,t ) = N exp ( i k0x − i t E (k0 ) )∫ ∞ −∞ ∫ ( ∫ che si può riscrivere completando ) il quadrato come 2 1 iC C 2 2 exp − exp − z A + i B − d z . L’integrale, in modo non 2 2 2 A 2 + i B 2 4 A + i B −∞ 2 tanto chiaro, ∫ ∞ equivale all’integrale di una gaussiana, e il tutto vale 1 C π exp − 2 2 2 4 A B + i A + i B2 2 La funzione d’onda che risulta da questa trattazione è decisamente più complicata delle al- ( tre viste precedentemente: Ψ ( x ,t ) = N exp i k0x − i t E (k0 ) Calcoliamo la densità di probabilità ) exp − 14 A e 2 C2 . + i B 2 normalizziamo: * 2 1 1 C C Ψ = N 2 exp − exp − = 2 2 2 2 4 A +iB 4 A +iB C2 A 2C 2 1 1 = N 2 exp − + 2 . Reinserendo i parametri N 2 exp − 2 2 2 4 4 A − i B 4 A +iB 2(A + B ) 2 2 19 2 2 2σ2 Ψ = N 2 exp − x − v gt ) , che è una gaussiana con ( 2 2 4 1 + 4w t σ g 2 2 4 ( x − v t )2 1 + 4w g t σ 2 1 g 2 . Σ = , che quindi si normalizza come Ψ = exp − 2 2 4σ 2Σ Σ 2π originari si ha La funzione che descrive il pacchetto d’onde, quindi, non solo si sposta con velocità v g , ma cambia anche la propria larghezza rispetto a quella per t = 0 , secondo la relazione Σ2 = 1 + 4w g 2t 2σ4 . Dato che la larghezza della gaussiana esprime l’incertezza nella de4σ2 terminazione della posizione della particella, questo significa che tale incertezza cambia nel tempo rispetto al suo valore iniziale Σ0 = 1 . Possiamo esplicitare tale dipendenza, 2σ 2 2 w g 2t 2 t 2 ottenendo Σ = Σ0 + : il pacchetto d’onde si “spande” nel tempo, tan= Σ + 0 2 2 4Σ0 4m Σ02 2 2 to più rapidamente quanto più piccole sono la massa e l’incertezza iniziale. Il tempo necessario perché la larghezza della gaussiana raggiunga il valore Σ è (risolvendo rispetto al tempo) t = 2m »Ψ»2 Σ 0 Σ 2 − Σ 02 . t=0 t=1 t=2 x Riassumendo, per una particella libera descritta da un pacchetto d’onde con distribuzione gaussiana dei numeri d’onda si dimostra che il valore attendibile della posizione si sposta con velocità vg = p . m Infatti per una distribuzione ( x − v t )2 1 g , ˆ Ψ = x (t ) = Ψ x Ψ = exp − 2 2Σ Σ 2π 2 ∫ ∞ −∞ 2 di probabilità x Ψ d x = v gt e quindi gaussiana d ˆ x = v g . Se dt si considerano intervalli di tempo abbastanza brevi da trascurare il termine di secondo ordine, il pacchetto trasla identicamente, e non cambia la sua forma. Per tempi più lunghi, o più rigorosamente per 2 2 t non trascurabile, il pacchetto si “spande”, aumentando 4m Σ02 2 l’incertezza sulla posizione della particella. Appare quindi evidente come non abbia più senso parlare della traiettoria di una particella in senso classico, e come diventi invece essenziale ricorrere ad una descrizione statistica del moto. Barriere di potenziale Il potenziale a gradino 20 Si consideri ora una particella di massa m ed energia cinetica E che si avvicina dalla regione delle x negative, che interagisca con un poten- V 0 x < 0 . È utile distingueV 0 x ≥ 0 sM ziale del tipo V = re due zone, una per x < 0 , ed una per x ≥ 0 . La prima zona è a potenziale nullo, 1 2 ∂2 ˆ= e la soluzione sal’hamiltoniano è H 2m ∂x 2 2 rà analoga a quella per una particella libera, nella seconda l’hamiltoniano contiene anche un ˆ= termine dovuto al potenziale costante, H x ∂2 + V 0 . Conviene risolvere separatamente 2m ∂x 2 2 l’equazione di Schroedinger per le due zone; ed imporre (perché la soluzione complessiva sia accettabile) che nel punto in cui si congiungono i due tratti la soluzione sia C 1 . Nella zona a potenziale nullo la soluzione è una generica particella libera, con funzione d’onda associata ψ = Ae i kx + Be − i kx con k = 2mE 2 . La parte Ae i kx rappresenta la particella che arriva da sinistra, mentre Be − i kx rappresenta la particella eventualmente riflessa dalla barriera di potenziale. Nella zona a potenziale V0 , basta riscrivere l’equazione di Schroedinger come ∂2ψ = ( E − V 0 ) ψ per ricondurci ad un caso simile al precedente, con soluzioni della forma 2m ∂x 2 2m ( E − V 0 ) ψ = Ce i k x + De − i k x con k2 = ; occorre distinguere due casi: 2 2 2 2 Potenziale più elevato dell’energia della particella Se E < V 0 la particella viene riflessa: k2 = i 2m E − V 0 2 e quindi ψ = Ce − k2 x + De k2 x . Dato che k2 x De diventa infinito per x → ∞ , non è una soluzione accettabile, e deve quindi essere −k x , che va invece conservato. D = 0 . Non si può dire lo stesso per il termine C 2 Imponiamo ora le condizioni di continuità per la funzione d’onda, ricavando una relazione tra le costanti A , B , C : Ae i k 0 + Be − i k 0 = Ce − k2 0 ⇒ A+B =C i kAe i k 0 − i kBe − i k 0 = − k2 Ce per cui A = − k2 0 ⇒ A−B = i k2 C k i k2 i k2 C C 1 + e B = 1 − . 2 2 k k Ricapitolando, la funzione d’onda che descrive la particella con un gradino di potenziale C i k2 i kx − i t E ik C + 1 − 2 e − i kxe − i t E 1 + e e maggiore della sua energia è Ψ = 2 2 k k −k x − it E Ce e 2 x <0 ; x ≥0 C rimane come costante di normalizzazione. Sappiamo che non è possibile normalizzare in senso proprio una funzione d’onda per una particella libera, che è dispersa su tutto lo spazio, ma si possono ottenere vari risultati anche senza eliminare tale fattore. Una prima osservazione è che la probabilità di trovare la particella nella regione a potenziale 2 V 0 > E non è nulla, ma è Ψ 2 = C e −2 k2 x , che ha la forma di un’esponenziale reale decrescente. 21 Si ha quindi un fenomeno di penetrazione quantistica della barriera, in una regione classicamente proibita. Considerando l’espressione per k2 = 2m E − V 0 2 , tale penetrazione è tanto più accentuata quanto più è piccole sono la massa e la differenza tra il potenziale del gradino e l’energia cinetica della particella. Definiamo il coefficiente di riflessione come rapporto tra la densità di flusso dell’onda riflessa e quella dell’onda incidente. Ricordando la definizione di densità di flusso in una dimensione Jx = * ∂Ψ ∂Ψ * , ed applicandola all’onda incidente Ae i kxe − i t E Ψ − Ψ ∂x ∂x 2m i Be − i kxe − i t E , J inc = J rif = − * − i kx eit E (i k ) Ae i kxe − i t E − Ae i kxe − i t E ( − i k ) Ae − i kxe i t E ) = i k ik i k ik J inc = A * A B *B = 1 − 2 1 + 2 1 + 2 1 − 2 = 1 k k k k funzione d’onda per la zona 1 può essere »Ψ»2 k e −e e + e − it E C − 2 = e k 2 2i k C cos kx − 2 sin kx e − i t E ; la densik i kx tà di k * AA e m k * B B , da cui m R = J rif La (A e 2m i e a quella riflessa − i kx − i kx i kx probabilità risulta riscritta come quindi 2 k 2 Ψ = C 2 cos kx − 2 sin kx , k indi- pendente dal tempo. Siamo quindi nelle condizioni di un’onda stazionaria, generata dall’“interferenza” tra l’onda x di materia incidente e quella riflessa. Anche in questo caso la descrizione non è fisicamente realistica, visto che la probabilità di trovare la particella è distribuita su tutto il semiasse negativo delle x ; è possibile ottenere una descrizione più accurata costruendo un pacchetto di onde della forma sopra riportata; non si »Ψ »2 »Ψ »2 t=-10 t=-2 »Ψ »2 x t=0 x »Ψ »2 t=3 x x 22 ottengono risultati analitici significativi, ma eseguendo i calcoli numericamente è possibile rappresentare in modo sufficientemente realistico l’urto di una particella contro il gradino di potenziale. Il pacchetto d’onde incide sulla barriera, vi penetra in parte per il periodo in cui è adiacente quindi viene respinto e si muove in direzione opposta e con uguale velocità. Il pacchetto è praticamente immutato, tranne che per la dilatazione analoga a quella presa in considerazione parlando del moto di un pacchetto d’onde in una regione a potenziale nullo. Potenziale più basso dell’energia della particella Se E > V 0 la particella può (anche classicamente) proseguire oltre la barriera di potenziale. Nella zona 2 la funzione è ancora un’esponenziale complessa oscillante ψ = Ce 2m (V 0 − E ) k2 = 2 i k2x + De − i k x , con 2 . Dato che non arrivano particelle da destra, il termine D deve essere neces- sariamente nullo, affinché la funzione descriva adeguatamente il sistema. Imponendo le condizioni di continuità, Ae i k 0 + Be − i k 0 = Ce i k 0 ⇒ A + B = C 2 i kAe i k 0 − i kBe − i k 0 = i k2Ce i k 0 ⇒ k ( A − B ) = k2C 2 da cui C = k − k2 2kA e B=A . k + k2 k + k2 k − k2 − i kx − i t E i kx − i t E +A e e Ae e k + k2 La funzione d’onda è quindi Ψ = 2Ak2 i k x − i t E e e k + k2 x <0 . A differenza di x ≥0 2 quanto succede per una particella classica, vi è una probabilità non nulla che questa venga riflessa dalla barriera anche se quest’ultima ha un potenziale minore dell’energia cinetica della particella. Calcoliamo le densità di flusso delle varie componenti, incidente, riflessa e trasmessa; analogamente a quanto visto prima, J inc = 1 k * A A, m 0.8 2 J rif = k * k * k − k2 BB= A A , m m k + k2 T 0.6 2 J tra R 0.4 2k k k = 2 C *C = 2 A * A . m m k + k2 Quindi il 0.2 2 coefficiente di riflessione è R = J rif k − k2 = , J inc k + k2 0.5 1 1.5 2 E êV0 2 J k 2k 4kk2 e quello di trasmissione T = tra = 2 = 2 . È immediato verificare che J inc k k + k2 (k + k2 ) R + T = 1 , come sarebbe logico aspettarsi. Inoltre, considerando che k2 = k scrivere T = 4kk 1 − V 0 E ( k 1 + 1 − V0 E 2 = ) ( 2 4 1 − V0 E 1 + 1 − V0 E ) 2 E − V0 , si può riE . Tracciando i grafici di T e R in funzione di E V 0 si osserva come esista una probabilità non nulla che una particella sia riflessa da una barriera di potenziale sensibilmente più bassa della sua energia cinetica. In realtà questo dipende dal fatto di aver lavorato con un potenziale che passa immediatamente da zero ad un 23 valore finito. In una situazione fisica reale il potenziale crescerebbe gradualmente, e quindi gli effetti quantistici di riflessione sarebbero molto meno accentuati. Si può calcolare numericamente l’effetto dell’interazione del gradino di potenziale con un pacchetto d’onde, ottenendo risultati in perfetto accordo con quanto descritto finora. »Ψ»2 »Ψ»2 x x »Ψ»2 »Ψ»2 x »Ψ» x »Ψ» 2 2 x x »Ψ»2 »Ψ»2 x x Barriera di potenziale di larghezza finita Dopo aver analizzato il comportamento di una particella che interagisce con una barriera di potenziale di larghezza infinita, è possibile considerare il caso di una barriera di potenziale di altezza V 0 e larghezza L , x <0 0 V = V 0 0 ≤ x < L 0 x≥L V sM 1 2 3 Come abbiamo fatto per la barriera infinita, dividiamo il problema in tre parti, richiedendo poi x che la soluzione sia C 1 nei punti di raccordo. Nella zona 1 la particella (sempre di massa m ed energia cinetica E ) è descritta da una funzione d’onda per una particella libera, ψ = Ae i kx + Be − i kx con k = 2mE 2 . 24 Nella zona 2 (ipotizzando che il potenziale della barriera sia maggiore dell’energia della particella) abbiamo una situazione in cui k2 = i 2m E − V 0 2 za la funzione d’onda contiene esponenziali reali ψ = Ce possiamo annullare il termine De k2 x è immaginario, e di conseguen− k2 x + De k2 x . In questo caso non , perché per 0 ≤ x < L si mantiene finito. Nella zona 3 il potenziale è ancora nullo, e quindi dobbiamo usare la soluzione per la particella libera, ψ = Fe i kx + Ge − i kx . Escludiamo il termine che descrive una particella proveniente da destra, e ricaviamo ψ = Fe i kx . Applichiamo tutte le condizioni di continuità: Ae i k 0 + Be − i k 0 = Ce − k2 0 + De k2 0 i kAe i k 0 − i kBe − i k 0 = − k2 Ce Ce − k2 L + De − k2 Ce − k2 L k2 L ⇒ A+B =C +D − k2 0 + k2 De − k2 0 ⇒ i k ( A − B ) = k2 ( D − C ) = Fe i kL + k2 De k2 L = i kFe i kL In questo caso la soluzione analitica di questo set di equazioni è algebricamente complicata e non particolarmente interessante. Si ricavano tutte le costanti in funzione di A , ed è così possibile calcolare il coefficiente di trasmissione, che si ricava essere T = Y = 8k12k22 k14 + k24 − 6k12k22 − (k12 + k22 ) cosh 2k2L E V e k2L = L 2 . Tale coefficiente si può riscrivere, considerando 2mV 0L2 2mE V 0 2mEL2 V 0 − E V 0 1 − = = (1 − Y ) 2 2 2 E E V0 come 1 −Y 8 Y . T = 2 2 1 − Y − 6 1 − Y − 1 cosh 2 2mV 0L 1 − Y ( ) 2 Y Y Y2 1 −Y 8 Y Analogamente per E > V 0 si ottiene T = 2 2 1 − Y − 6 1 − Y − 1 cos 2 2mV 0L Y − 1 ( ) 2 2 Y Y Y È quindi possibile studiare graficamente come vari il coefficiente di trasmissione al variare del rapporto tra l’energia totale e l’energia della barriera, per vari valori di α = 2mV 0L2 2 ; vengono così messi in evidenza due fenomeni quantistici: per valori di α piccoli la particella ha una probabilità piuttosto elevata di superare la barriera anche se quest’ultima ha un’energia più elevata; d’altra parte, anche per E > V 0 si hanno fenomeni di riflessione analoghi a quelli visti per la barriera di spessore infinito. 1 0.8 0.6 a=N 0.4 a=NM 0.2 a=NMM 0.5 1 1.5 2 E êV0 25 In questo caso la creazione di un pacchetto d’onde per integrazione numerica di varie funzioni d’onda elementari è molto lenta, e fornisce risultati non particolarmente precisi: il pacchetto d’onde appare deformato dopo la riflessione, e anche la seconda “parete” della barriera sembra contribuire, al fenomeno, generando un secondo pacchetto riflesso che si sovrappone a quello principale. ÈÈ Y » Ψ» 2 2 t=-10 t=- 50 x x ÈÈ Y ÈÈ 2 Y t= 10 2 t= 20 x ÈÈ Y x ÈÈ 2 Y t= 50 2 t= 100 x x Buche di potenziale La buca infinita in una dimensione Consideriamo il caso di una particella vincolata in una regione di larghezza L delimitata da pareti a potenziale infinito. Consideriamo cioè un potenziale del tipo V ∞ ∞ 0 x ∈ ( − L 2 , L 2) V (x ) = ∞ x ∉ ( − L 2 , L 2) Dato che la particella non può stare nella regione a potenziale infinito, la funzione d’onda deve essere identicamente nulla all’esterno dell’intervallo ( − L 2 , L 2) . Per soddisfare i x requisiti di continuità (non è in questo caso possibile imporre che la soluzione sia C 1 , visto che il potenziale diventa bruscamente infinito) è necessario che la funzione d’onda si annulli anche agli estremi di tale intervallo. Nella regione ( − L 2 , L 2) l’hamiltoniano è uguale a quello per una particella libera, e la soluzione è quindi della forma ψ = A cos kx + B sin kx , con k = 2mE 2 . Imponendo le condizioni al contorno si ha che deve essere A cos k L 2 + B sin k L 2 = 0 A cos k L 2 − B sin k L 2 = 0 26 Sommando e sottraendo membro a membro si ottengono 2A cos k L 2 = 0 2B sin k L 2 = 0 Dato che seno e coseno non si annullano mai contemporaneamente, si individuano due classi di soluzioni: Per A = 0 deve essere sin k L 2 = 0 , per cui k L 2 = n π , e quindi k = πm L (con m = 2n pari); la funzione d’onda è un seno (quindi antisimmetrica). Dato che la funzione non può essere identicamente nulla, deve essere n > 0 Per B = 0 deve essere cosk L 2 = 0 , per cui k L 2 = (n + 1 2) π , e quindi k = πm L , (con m = 2n + 1 dispari); la funzione d’onda è un coseno (simmetrica) Considerando entrambe le classi di soluzioni, il parametro k è quantizzato, con k = mπ L , e di conseguenza i possibili valori di energia sono E n = m2π2 2L2 2 , sempre con m > 0 . Oltre alla quantizzazione dell’energia si osserva anche come lo stato a minor energia non abbia un contenuto energetico nullo; diversamente la particella avrebbe velocità nulla, sarebbe quindi possibile conoscerne con esattezza indefinita il momento e, dato che la sua posizione è contenuta in un intervallo di dimensioni finite, sarebbe violato il principio di indeterminazione. V La buca finita in una dimensione Consideriamo ora un potenziale del tipo V0 0 x ∈ ( − L 2 , L 2) , cioè una buca di V (x ) = V 0 x ∉ ( − L 2 , L 2) larghezza L e profondità V 0 . Cerchiamo le solu- 3 1 2 zioni vincolate, cioè quelle per le quali E < V 0 . Come al solito, scomponiamo il problema nelle tre regioni a potenziale costante, ed imponiamo x le condizioni di continuità: Nella zona 1 siamo in una situazione tipo particella libera. Le soluzioni sono del tipo ψ = A cos k1x + B sin k1x con k1 = 2mE 2 . Esprimiamo la soluzione in termini di seni e co- seni invece che di esponenziali complessi perché questo semplifica l’algebra del problema; per via della relazione di Eulero, e considerando che A, B ∈ C , le notazioni sono equivalenti 2 l’equazione di Schroedinger si risolve in modo analogo, solo che Nella zona ψ = Ce ix i e ψ = Ce 2m E −V0 −k2x 2 + De −ix i 2m E −V0 2 , così che si hanno esponenziali reali, con k2 = 2m E − V 0 2 + Dek x . Perché questa soluzione si mantenga finita, è necessario che sia D = 0 ; 2 la soluzione è quindi ψ = Ce −k2x . Anche nella zona 3 la soluzione si riduce ad esponenziali reali, solo che qui è necessario kx conservare solo il termine che tende a zero per x → −∞ . Quindi si ha ψ = De 2 , con k2 = 2m E − V 0 2 . Le condizioni di continuità ai punti dove si congiungono le soluzioni sono (ponendo L 2 = b per sveltire la notazione): A cos k1b + B sin k1b = Ce −k b 2 k1 ( −A sin k1b + B cos k1b ) = −k2Ce −k b 2 27 A cos k1b − B sin k1b = De −k b 2 k1 ( −A sin k1b − B cos k1b ) = −k2De −k b 2 Aggiungo alla prima equazione moltiplicata per k2 la seconda, e alla terza moltiplicata per k2 la quarta. Elimino così i parametri C e D : k2A cos k1b − k1 A sin k1b + k2B sin k1b + k1B cos k1b = 0 k2A cos k1b − k1 A sin k1b − k2B sin k1b − k1B cos k1b = 0 Aggiungendo e sottraendo tra loro le due equazioni ricavo k2A cos k1b = k1 A sin k1b k2B sin k1b = −k1 B cos k1b Moltiplicando membro a k1k2AB (cos k1b + sin k1b ) = 0 e 2 2 membro, quindi AB = 0 . Distinguiamo quindi due casi, A = 0e B = 0 . Per A = 0 abbiamo una classe di soluzioni antisimmetriche: da k2B sin k1b = −k1 B cos k1b ri- 0.5 1 1.5 2 x caviamo una condizione di quantizzazione degli stati: visto che B ≠ 0 , deve essere cotk1b = − k2 k1 , e quindi cot V −E 2mE L2 . Tale equazione può =− 0 2 E 4 ψ essere α= risolta L 2 graficamente: pongo 2mV 0 , f ( x ) = cot αx e g ( x ) = − x= E V0 e 1 − 1 . Plotto x2 il risultato per vari valori di α ; è evidente come per certi valori le due linee non abbiano intersezioni, e non esistano quindi stati vincolati appartenenti a questa classe di soluzioni. In particolare, visto che la cotangente si azzera per αx = π 2 , deve essere α ≥ π 2 . Al crescere di α il grafico della cotangente si addensa, ed aumentano le soluzioni. Recuperando le prime equazioni ricaviamo anche i coefficienti C e D : otteniamo x C = Bek L 2 sin k1 L 2 2 e D = −Bek L 2 sin k1 L 2 . 2 Le soluzioni sono dunque globalmente antisimmetriche. La particella “invade” anche la regione a potenziale proibito, e questo fenomeno è più accentuato per le particelle ad energia elevata. Nel grafico sono rappresentate alcune soluzioni, traslate a quote diverse corrispondenti alle energie associate. Per B = 0 abbiamo una classe di soluzioni simmetriche: da k2A cos k1b = k1 A sin k1b ricaviamo una condizione di quantizzazione degli stati. Visto che A ≠ 0 , deve essere tan k1b = k2 k1 , V0 − E . E e Risolvo tan L 2mE = 2 2 graficamente ponendo quindi 0.25 0.5 0.75 1 1.25 1.5 x 28 L E e α= 2 V0 x= ψ 2mV 0 : traccio il grafico di f ( x ) = tan αx 1 − 1 . In questo caso si ha almeno una soluzione x2 per qualsiasi valore di α , e le soluzioni aumentano e si infitti- e g (x ) = scono al crescere di tale coefficiente. Recuperando le prime equazioni ricaviamo anche i coefficienti C e D : otteniamo C = Aek L 2 cos k1 L 2 e D = Aek L 2 cos k1 L 2 . Le soluzioni 2 2 sono dunque simmetriche. Ricapitolando, per una buca di potenziale di larghezza e profondità finiti si hanno stati vincolati quantizzati. Tali soluziox ni si possono distinguere in due classi, simmetriche ed antisimmetriche. Esiste sempre almeno uno stato simmetrico. Lo stato a più bassa energia (il primo degli stati simmetrici) ha energia nulla. Questo è in accordo non ha con energia il principio nulla.di Questo indeterminazione: è in accordolacon varianza il principio del modi mento è ∧ 2 δp 2 ˆ2 − p ˆ , e dato che per ragioni di simmetria la particella si muoverà a sini= p ˆ = 0 . Quindi stra o a destra con uguale probabilità, p ∧ 2 δp ˆ , e dato che lo staˆ2 = 2m K = p ˆ = E ; stimando l’incertezza K to che stiamo cercando è un’autostato dell’energia cinetica, ∧ 2 δx sulla posizione della particella con la semiampiezza della buca, ∧ 2 ∧ 2 δp indeterminazione ≥ δx 2 , per cui 2mE ≈ L . Per il principio di 2 2 2 L2 e E ≥ . L’energia minima, ≥ 2mL2 4 4 quindi, non può essere nulla. Per stati ad energia bassa rispetto alla profondità della buca le soluzioni per la buca infinita sono una buona approssimazione. Hamiltoniano separabile e fattorizzazione delle soluzioni: Nei prossimi punti si generalizzano i risultati trovati a problemi multidimensionali. Si ricorre ad un procedimento già usato per la risoluzione dell’equazione di Schroedinger indipendente dal tempo, riducendo il problema a situazioni monodimensionali già note. Ogni volta che è possibile scomporre l’hamiltoniano in una somma di termini che agiscono su una sola variabile ˆ= (cioè H ∑ Hˆ i rizzabili xi ˆx tali che H i ψ ( x 1 ,… , x n ) = ∏ f (x ) = Hˆ f (x ) ∏ f (x ) j j xi i j i j ) si cercano le soluzioni fatto- j j ≠i n ∏ u (x ) i e i si risolvono n gli problemi a una variabile i =1 ˆ x ui ( x i ) = E iui (x i ) . H i ˆψ = Se ora torno al problema iniziale H n n ∑ ∏ i =1 ˆx H i j =1 u j (x j ) = n rando le soluzioni ai problemi monodimensionali ∑ i =1 ψ n n n ∑ i =1 E iui ( x i ) ˆ H x ui ( x i ) i n ∏ j =1 j ≠i n ∏ u (x ) = considej j j =1 j ≠i u j (x j ) = n ∏ j =1 u j ( x j ) i =1 1 n ∑E i = i =1 n ∑ E , cioè ψ (x ,…, x ) = ∏ u (x ) è un’autofunzione di Ĥ con autovalore ∑ E i n i i i =1 i . i =1 Sotto alcune ipotesi di regolarità e simmetria del dominio tali autofunzioni fattorizzate formano una base completa per l’operatore Ĥ . 29 La buca infinita 2-dimensionale È ora possibile analizzare una serie di problemi in più dimensioni, che possono essere ricondotti a combinazioni di problemi monodimensionali. Ad esempio, un potenziale definito come 0 ( x , y ) ∈ D V (x , y ) = , ∞ ( x , y ) ∉ D D = ( − Lx 2 , Lx 2) × ( − Ly 2 , Ly 2) ∞ V può essere scomposto in due problemi di buca monodimensionale infinita. Infatti l’hamiltoniano del sistema all’interno di D si può scrivere come ˆ =− H y ∂2 ∂2 , con la condizione che la + 2m ∂x 2 ∂y 2 2 x funzione d’onda si annulli sul bordo del dominio. Chiaramente questo hamiltoniano è separabile, e si può quindi cercare le soluzioni della forma ψ ( x , y ) = ux ( x ) + uy ( y ) . I due problemi monodimensionali sono equivalenti ad una buca di potenziale infinita di lar- ˆx = ghezza rispettivamente Lx ed Ly ; infatti, ad esempio H torno ux ( − Lx 2) = ux ( Lx 2) = 0 . ux ( x ) = sin Di ∂2 , con la condizione al con2m ∂x 2 2 conseguenza le soluzioni saranno n π nx πx n πx π π sin2 (nx + 1 ) + cos x sin2 nx , e le energie E n = x 2 , con n > 0 . 2Lx Lx Lx 2 2 2 2 2 x Nell’espressione per ux sono condensate entrambe le classi di soluzioni simmetriche ed antisimmetriche. uy ( y ) = sin Analogamente per uy ny πy n πy π π sin2 (ny + 1 ) ny + cos y sin2 n y Ly Ly 2 2 si hanno soluzioni ny π , sempre 2Ly 2 2 2 2 con energia E ny = con la condizione n > 0 . Le funzioni della base dipenderanno quindi da due numeri quantici nx e ny , e saranno della »ψ»2 »ψ»2 y y x x ψ 11 ψ 12 »ψ»2 »ψ»2 y y x x ψ 21 ψ 23 30 forma ψnx ,ny = unx ( x ) uny ( y ) , con energia totale E nx ,ny = 2 n 2 π2 2 ny 2 + x 2 , e ricordano da vicino Lx 2 Ly le funzioni monodimensionali in cui sono fattorizzate. Nel caso che la buca di potenziale sia quadrata ( Lx = Ly ) ci si trova di fronte ad un fenomeno detto degenerazione: esistono più stati quantici distinti associati alla stessa energia. Infatti π2 2 (n 2 + nx 2 ) , e per esempio gli stati a,b e gli stati b, a hanno energia 2L2 y π2 2 2 E a,b = E b ,a = (a + b 2 ) . In alcuni casi la degenerazione può essere ricondotta a situazioni di 2L2 simmetria tra gli stati; nell’esempio precedente, gli stati b, a corrispondono a quelli a, b E n ,n = x y ruotati di 90° . »ψ»2 »ψ»2 y y x ψ 24 x ψ 42 Quando si verifica una degenerazione senza che ci siano evidenti operazioni di simmetria che collegano le due funzioni d’onda si parla di degenerazione accidentale; in molti casi queste situazioni possono essere ricondotte a simmetrie nascoste, cioè operazioni di simmetria non “canoniche”. L’oscillatore armonico Il potenziale armonico Spesso nello studio di sistemi fisici di varia natura compaiono situazioni in cui si ha una forza di richiamo agente su una particella, che può di solito essere trattata in prima approssimazione come una forza elastica direttamente proporzionale allo spostamento dalla posizione di F ( x ) = −kx , cui è associata equilibrio, un’energia potenziale V ( x ) = V 1 2 kx . Ad esem2 pio, per un sistema in equilibrio nella posizione x 0 è possibile sviluppare in serie il potenziale, x considerando poi che V ' ( x 0 ) = 0 . Si ha quindi V ( x ) ≈ V ( x 0 ) + 2 1 V " ( x − x 0 ) ; dato che il livello 2 zero del potenziale è arbitrario, qualsiasi potenziale di equilibrio può essere approssimato da un potenziale armonico in un intorno del punto di equilibrio come V ( x ) ≈ L’hamiltoniano per un sistema sottoposto ad un potenziale 2 1 V " (x − x 0 ) . 2 armonico è quindi ∂2 ⋅ 1 2 ˆ =− + kx × ⋅ H 2m ∂x 2 2 2 31 Soluzione L’equazione di Schroedinger indipendente dal tempo per l’oscillatore armonico è ∂2ψ 1 2 k , − + kx ψ = E ψ . Si può semplificare l’espressione con le sostituzioni ω = 2 m 2m ∂x 2 2 2 ∂ψ ⋅ d y = , ∂ ∂ψ ⋅ d y ⋅ d y = ∂ ψ d y ∂y ∂y d x d x ∂y 2 d x ∂x d x 2 ∂2ψ mϖ ∂2ψ k y 2 ∂2ψ 2E 2 − y 2ψ = −λψ . + ψ = E ψ − y ψ = − ψ 2 quindi − , , ∂y 2 m ∂y 2 mϖ ∂y 2 ϖ λ= 2E ∂2ψ ∂ mω = e y = x : in primo luogo, 2 ω ∂x ∂y λψ 1 ∂2ψ −ψ = − 2 ≈ 0. 2 2 y ∂y y Studiamo il comportamento asintotico delle soluzioni, per y → ∞ ; L’equazione differenziale si riduce quindi a 2 ∂2ψ ≈ y 2ψ , che ha soluzione ψ ≈ Ne ± y 2 ∂y 2 2 ; conside- 2 riamo solo ψ ≈ Ne − y 2 , perché l’altra soluzione non è a quadrato integrabile. In effetti tale funzione è soluzione dell’equazione differenziale considerata solo per y → ∞ ; in effetti ∂ 2ψ = ( y 2 − 1 ) ψ ≈ y 2ψ solo in una situazione asintotica. 2 ∂y Possiamo quindi pensare che le soluzioni generali siano il prodotto della soluzione asintotica per una funzione analitica esprimibile come serie di potenze, f (y ) = ψ = Ne − y 2f ( y ) , con 2 ∞ ∑a y i i . Inserendo tale funzione nell’equazione di Schroedinger ricaviamo i =0 N ( ) ∂2 − y 2 e f − Ny 2e − y 2f = −N λe − y 2f 2 ∂y 2 ( 2 2 ) ∂ −ye − y 2f + e − y 2f ' − y 2e − y 2f = −λe − y 2f ∂y e −y 2 2 2 2 2 2 ( y f − f − yf '− yf '+ f ''− y f ) = −λe 2 2 −y2 2 f f ''− 2yf '+ ( λ − 1 ) f ' = 0 Tale equazione differenziale è detta equazione di Hermite, e si può risolvere per serie: svolgendo ∂2 f '' = 2 ∂y le ∞ ∞ ∑ a y = ∑ i (i − 1) a y i i i −2 i i =0 f '= derivate i =2 = i =0 i =1 i =0 i =0 ∑ iai y i −1 = i =1 ∞ ∑ (i + 1) a i +1 yi , i =0 questa espressione diventa = 0, cioè − 2iai + ( λ − 1 ) ai y i = 0 . L’unica possibilità che questa espressione sia nulla è che (i + 2) (i + 1) ai +2 − 2iai + ( λ − 1) ai cienti ai +2 = ∞ i =0 ∞ identicamente yi i +2 ∞ i +2 i =0 ∑ (i + 2) (i + 1) a ∑ (i + 2) (i + 1) ai +2y i − 2∑ iai y i −1y + (λ − 1) ∑ ai y i ∑ (i + 2) (i + 1) a ∑ ai y i = ∞ ∞ ∞ ∞ ∂ ∂y tutti i coefficienti della serie lo siano = 0 . Si ricava così una relazione di ricorrenza tra i coeffi- 2i + 1 − λ a : dati a0 e a1 la funzione è completamente definita. (i + 2) (i + 1) i Studiamo ora il comportamento asintotico di f ( y ) , definita come serie infinita dalla relazione appena ricavata; in particolare, scomponiamola nella serie dei termini pari (derivati ricorsivamente da a0 ) e in quella dei termini dispari, derivanti da a1 . b j = a2 j b j +1 = a2 j +2 = 2 ⋅ 2j + 1 − λ 4j + 1 − λ a2 j = b (2j + 2) (2j + 1 ) (2j + 2) (2j + 1) j 32 ck = a2k +1 ck +1 = a2k +2+1 = f (y ) = ∑b y 2j j j + ∑c y 2 ⋅ (2k + 1 ) + 1 − λ 4k + 3 − λ a2k +1 = c (2k + 3) (2k + 2) k (2k + 1 + 2) (2k + 1 + 1) 2k +1 k k Le due serie dei termini pari e dei termini dispari convergono per il criterio del rapporto: lim j →∞ b j +1 c k +1 4j + 1 − λ 1 4k + 3 − λ 1 = lim = lim ≈ lim = 0 , e lim ≈ lim =0; k →∞ →∞ →∞ →∞ →∞ j j k k bj ck j k (2j + 2) (2j + 1 ) (2k + 3) (2k + 2) questa convergenza legittima la separazione della serie in somma delle due serie dei pari e dei dispari. Inoltre si osserva che tali rapporti sono asintoticamente equivalenti a quelli di un’esponenziale. Quindi, ψ ( y ) = lim Nf ( y ) e lim y →∞ y →∞ −y2 2 y2 ≈ N lim e e f (y ) ≈ ey , 2 y →∞, per −y2 2 da cui = ∞. y →∞ Se ne deduce che se la serie che esprime la funzione f è infinita, la soluzione non è a quadrato integrabile, e quindi non è una soluzione valida. L’unico modo per garantire l’integrabilità delle soluzioni è che da qualche termine in poi i coefficienti della serie si annullino definitivamente. Questo equivale a richiedere che esista un n tale che 2n + 1 − λ = 0 , cioè tale che λ = 2n + 1 . Se n è pari questo garantisce che si annulli(n + 2) (n + 1 ) no i termini pari con i > n , ma l’unico modo per garantire che anche i termini dispari si annullino è che sia a1 = 0 . In modo analogo, se n è dispari occorre imporre a0 = 0 . In questo modo definiamo i polinomi di Hermite di ordine n come ∞ b j y 2j j =0 Hn (y ) = ∞ c y 2k +1 k =0 k ∑ ∑ 4 j + 1 − 2n − 1 b b =1 (2j + 2) (2j + 1) j 0 4k + 3 − 2n − 1 (2k + 3) (2k + 2) ck c 0 = 1 Le soluzioni dell’oscillatore armonico sono quindi funzioni della forma ψn = Ne − y 2H n ( y ) , dove y = mω x, ω= 2 k 2E = 2n + 1 . e λ= m ω Proprietà dei polinomi di Hermite Soddisfano l’equazione differenziale H n ''− 2yH n '+ 2nH n = 0 , dato che sono stati costruiti a partire dall’equazione differenziale f ''− 2yf '+ ( λ − 1 ) f ' = 0 , con la condizione aggiuntiva che fosse λ = 2n + 1 . È possibile definirli anche come H n ( y ) = ( −1 ) e y n Consideriamo Bn ( y ) = ( −1 ) e y n 2 dn −y e = Pn ( y ) e −y , d yn An = dn −y e = Pn ( y ) e −y , allora d yn 2 2 2 dn −y e . Infatti d yn 2 dn −y e , senza supporre che sia un polinomio di Hermite; d yn An = 2 2 cosa 2 dimostrabile An +1 = per 2 A0 = 1 ⋅ e − y e induzione: se d d Pn ( y ) e − y = −2yPn ( y ) + Pn ( y ) e − y , e dy dy 2 2 d −2yPn ( y ) + d y Pn ( y ) è evidentemente un polinomio di ordine n + 1 . Allora Bn ( y ) = ( −1 ) Pn ( y ) e Bn +1 ( y ) = ( −1 ) n n +1 ( −2yP ( y ) + P ' ( y )) = −B n n n '+ 2yBn 33 ∞ ∑b y Applichiamo ancora una volta il principio di induzione: ipotizziamo che Bn = i i sia un i =0 polinomio di Hermite di ordine n , e quindi i suoi coefficienti soddisfano la relazione bi +2 = − ∞ ∑ 2i − 2n b . Calcoliamo Bn +1 = (i + 2) (i + 1) i (i + 1 ) bi +1y i + i =0 ∞ ∑ 2bi y i +1 = − i =0 ∞ ∑ ∞ ∑ ci y i = − Bn '+ 2yBn = i =0 ∞ ∑ ibi y i −i + 2y i =1 (i + 1 ) bi +1y i − b1 + i =1 sta relazione sia soddisfatta per ∀y − ∞ ∑ 2bi −1y i = c 0 + i =1 ∞ ∑b y i i = i =0 ∞ ∑ c y . Perché quei i i =1 tutti i coefficienti devono essere uguali, quindi c 0 = −b1 e − (i + 1 ) bi +1 + 2bi −1 = ci .. Calcoliamo ci +2 − (i + 3) bi +3 + 2bi +1 2i − 2n ; dato che bi +2 = = b, − (i + 1 ) bi +1 + 2bi −1 ci (i + 2) (i + 1 ) i −2i − 2 + 2n + 2i + 4 2i + 2 − 2n 2n + 2 − (i + 3) bi +3 + 2bi +1 = − (i + 3) + 2 bi +1 = bi +1 = b + + + i 3 i 2 i 2 ( ) ( ) ( ) (i + 2) i +1 −2i + 2 + 2n + 2i 2i − 2 − 2n 2 + 2n − (i + 1 ) bi +1 + 2bi −1 = − (i + 1 ) + 2 bi −1 = bi −1 bi −1 = + i 1 i i i ( ) bi +1 2i − 2 − 2n = bi −1 (i + 1) i 2i − 2 (n + 1 ) 2i − 2 (n + 1 ) c 2n + 2 i = Quindi i + 2 = , cioè Bn +1 è effettivamente un poci i + 2 2 + 2n (i + 1) i (i + 2) (i + 1) linomio di Hermite di ordine n + 1 . Visto che B0 = 1 è un polinomio di Hermite con a0 = 1 , a1 = 0 e ai +2 = Vale la relazione 2i a , la dimostrazione è terminata. (i + 2) (i + 1) i ricorsiva H n +1 = 2yH n − 2nH n −1 . Riscriviamo tale relazione come H n +2 − 2yH n +1 + 2 (n + 1 ) H n = 0 ; è sufficiente mostrare che tale espressione è equivalente a H n ''− 2yH n '+ 2nH n = 0 . Dalla formula H n ( y ) = ( −1 ) e y n 2 dn − y e d yn ricaviamo H n +1 = −1 ( −1 ) e y n 2 2 d dn − y e d y d yn 2 e n n d d dn − y dn − y y + − H n = ( −1 ) e y e 1 2 ye e , cioè H n +1 = −H n '+ 2yH n . ( ) dy d y d yn d yn d − H n +2 = −H n +1 '+ 2yH n +1 = Quindi ( −H n '+ 2yH n ) + 2y ( −H n '+ 2yH n ) = dy 2 2 2 2 H n ''− 2H n − 2yH n '− 2yH n '+ 4y 2H n . Sostituiamo le espressioni trovate e ricaviamo H n ''− 2H n − 2yH n '− 2yH n '+ 4y 2H n + 2yH n '− 4y 2H n + 2 (n + 1 ) H n = 0 H n ''− 2H n − 2yH n '+ 2 (n + 1 ) H n = 0 H n ''− 2yH n '+ 2nH n = 0 Vale una forma di relazione di ortogonalità che sarà utile per normalizzare le funzioni d’onda: ∫ ∞ −∞ 2 H n H me − y dy = δnm2nn ! π . Per prima cosa consideriamo i polinomi definiti come H n ( y ) = ( −1 ) e y n viamo che d −y e = −2y dy 2 e che 2 dn −y e ; osserd yn 2 d2 − y e = ( 4y 2 − 2) e − y ; se ipotizziamo che sia d y2 2 2 34 dn −y e = d yn 2 (( −2) ) y n + Pn −2 ( y ) e − y , n 2 n +1 n dn +1 − y e = ( −2) y n +1 − 2yPn −2 ( y ) + n ( −2) y n −1 + P 'n −3 ( y ) e − y ; per induzione, ricaviamo n +1 dy 2 2 che l’ennesimo polinomio di Hermite ha come termine di massimo grado 2n y n ∞ Torniamo a trattare l’integrale ∫ la abbiamo solita formula, −∞ ed 2 H n H me − y dy , ponendo n ≥ m ; sviluppiamo H n secondo H m = 2m ( y m + Pm −2 ( y ) 2m ) , ∫ ∞ −∞ ed +∞ Hm quindi 2 −∞ Hm dn − y e dy . d yn 2 integriamo dn − y dn −1 − y = e dy H e − 2m m n n −1 dy dy −∞ 2 ∫ ∞ ∫ ∞ −∞ Scriviamo per m ( y m −1 + P 'm −3 ( y ) m2m ) poi parti. dn −1 − y e dy . d y n −1 2 Il primo termine è nullo, visto che è il prodotto di un polinomio per un’esponenziale decrescente valutata a ±∞ . Continuando ad integrare per parti, scartando il termine integrato, continuiamo a far decrescere di grado il polinomio (i cui termini di grado minore diventano via via nulli), e a diminuire l’ordine della derivata. Alla fine arriveremo ad avere (visto che n ≥ m ) 2mm ! dn −m − y e dy ; se era n = m ora avremo 2mm ! n −m −∞ d y ∫ ∞ 2 ∫ ∞ 2 −∞ e −y dy = 2mm ! π , altri- +∞ dn −m −1 −y menti 2 m ! e che è evidentemente nullo. n −m −1 d y −∞ 2 m I primi polinomi di Hermite (generati dalla relazione H n ( y ) = ( −1 ) e y n 2 dn − y e ) sono d yn 2 H 0 ( y ) = 1 , H 1 ( y ) = 2y , H 2 ( y ) = 4y 2 − 2 Normalizzazione e proprietà delle soluzioni: Le soluzioni hanno la forma ψn = Ne − y 2H n ( y ) , 2 mω dove y = k 2E e λ= = 2n + 1 ; si ω m x, ω= ψ ,V dimostra che la costante di normalizzazione va- ( N = 2nn ! π le ∫ 2 ψn = N 2 ∫ ∞ −∞ ) −1 2 (visto che e −y H n ( y ) H n ( y ) d y 2 = N 2 n ! π ); qualora consideriamo le autofunzioni espresse esplicitamente come funzione di x occorre considerare che il cambio di variabili modifica anche l’integrale di normalizzazione ( 2 n ∫ ψn ( x ) d x = N 22nn ! 2 mω ∫ ψn ( y ) d y = 2 π ), e occorre usare come fattore di mω normalizzazione N = 2nn ! π mω −1 2 . Inoltre è evidente che le autofunzioni hanno energie quantizzate, con E n = n + x 1 ω . La separazione tra due livelli adiacenti di energia è costante, 2 35 ed è uguale a ∆E = ω . Anche lo stato fondamentale, ad energia minima, non ha energia nulla. Questo fatto si può ancora vedere come una diretta conseguenza del principio di indeterminazione. mω x2 exp − . La corrispondente densità di π 2 mω 2 x2 1 probabilità è ψ 0 ( x ) = , che è una gaussiana con σ = 2mω , che exp − mω π mω consideriamo come incertezza sulla x . Con considerazioni di simmetria analoghe a quelle L’autostato a più bassa energia ψ 0 ( x ) = 4 fatte per la buca di potenziale ricaviamo che come ∫ parti δp ψ0 ∧ 2 ∂2ψ 0 ˆ2 = dx otteniamo p ∂x 2 = 2 ∫ ∞ −∞ − 2 ∧ 2 ˆ . Se ora calcoliamo p̂2 ˆ2 = 2m K = p δp mω π 2 x2 x2 exp − d x ; integrando per 2 2 mω mω mω πmω mω . Quindi ∆p ∆x = = π 4 2 mω = ; si dice che lo stato 2 2mω 2 fondamentale dell’oscillatore armonico è uno stato a minima indeterminazione, visto che il prodotto ∆p ∆x è il minimo possibile. Un’altra osservazione che si può fare è che ˆ = p ˆ2 2m = ω 4 = 1 2 E , cioè l’energia è in media ripartita in modo equo tra cinetica e K potenziale. Il teorema viriale Si può ricavare un analogo quantistico del teorema viriale, che ci permetterebbe di ricavare informazioni più generali sulla ripartizione dell’energia nell’oscillatore armonico. Partiamo con- ˆ ⋅ˆ r . siderando la derivata temporale del valore attendibile dell’operatore p Dalla relazione sulla variazione temporale dei valori medi degli operatori si ricava d ˆ ˆ i ˆ ˆ ˆ p⋅r = H, p ⋅ r dt Si dimostrano le seguenti relazioni: ˆ ˆ ˆ ˆˆ ˆ ˆ ˆ ˆ ˆˆ ˆ ˆˆ ˆ ˆˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ A, BC = ABC − BCA = ABC − BAC + BAC − BCA = A, B C + B A, C ˆ ˆ ˆ ˆˆ ˆ ˆ ˆ ˆ ˆˆ ˆ ˆ ˆˆ ˆ ˆ ˆ ˆ ˆ ˆ A , B + C = ABC − BCA = AB + AC − BA − CA = A, B + A, C 2 2 ∂⋅ − i ∂ ⋅ − − i ∂ − 2 ˆ, p H ˆx = − r i ∇ − + V × ∇2 ⋅ +V ( r ) × ⋅ = ( ) 2m ∂x ∂x ∂x 2m i ∂3 ⋅ ∂3 ⋅ ∂3 ⋅ ∂⋅ + 2 + 2 − i V (r) 3 2m ∂x ∂y ∂x ∂z ∂x ∂x 3 3 ∂3 ⋅ ∂3 ⋅ ∂3 ⋅ − i + + −i 3 2 ∂x ∂y ∂x ∂z 2 2m ∂x ∂V ( r ) ∂x × ⋅ − i V (r) sfruttando l’uguaglianza delle derivate parziali miste. ∂ ⋅ =i ∂x ∂V ( r ) ∂x ×⋅ 2 2 2 ˆ, ˆ H =− x r ∇ x × ⋅ + V × x × ⋅ − x × − ∇2 ⋅ +V ( r ) × ⋅ = ( ) ( ) ( ) 2m 2m 2 ∂ 2 ( x × ⋅ ) ∂ 2 ( x × ⋅) ∂ 2 ( x × ⋅ ) ∂2 ⋅ ∂2 ⋅ ∂2 ⋅ r V x x + + + × ⋅ − − + 2 + 2 + V ( r ) x × ⋅ = ( ) 2 2 2 2 2m ∂x ∂y ∂z ∂y ∂z 2m ∂x 2 ∂⋅ i ˆ =− =− p 2 2m ∂x m x − 2 36 considerando che ∂ 2 ( x × ⋅) ∂ ∂x ∂⋅ ∂ ∂⋅ ∂ ⋅ ∂2 ⋅ = ×⋅+ x + = ⋅ + x =2 2 ∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂2x e ∂ 2 ( x × ⋅) ∂ ∂x ∂⋅ ∂ ∂ ⋅ ∂2 ⋅ x x = × ⋅ + = = ∂y 2 ∂y ∂y ∂y ∂y ∂y ∂2y Quindi, usando opportunamente ˆ ˆ x = H ˆ ˆ x+p ˆ x = i x H ˆ x H , px ˆ , px ˆ ,ˆ Infine, combinando con ∂V ( r ) ∂x gli i ˆ ⋅ˆ H ˆ, p r = i r ⋅ ∇V ( r ) × ⋅ − (− m 2 )∇ le ×⋅− appena ricavate, i ˆ2 p m x analoghi 2 relazioni risultati ˆyˆ p y per e ˆ zˆ p z, ⋅ 2 2 d ˆ ˆ i ˆ ˆ ˆ ∇2 ⋅ = K̂ e ∇2 ⋅ ; Dato che − p⋅r = H, p ⋅ r = − r ⋅ ∇V ( r ) × ⋅ + 2 − 2m 2m dt d ˆ ˆ ˆ −∇V ( r ) = F , p⋅r = r⋅F×⋅ +2 K dt Ora consideriamo il caso di essere in un sistema vincolato, in cui p < ∞ e x < ∞ in ogni i- stante. Facciamo la media temporale 1 τ ∫ τ 0 1 d ˆ ˆ p ⋅ r dt = dt τ ∫ τ 0 ˆ d t , da cui r⋅F×⋅ +2 K 1 ˆ ˆ ˆ ⋅ˆ ˆ . Passiamo al limite per τ → ∞ e ricordando che p ⋅ r ( τ) − p r ( 0 ) = r ⋅ F × ⋅ + 2 K τ ˆ = − r ⋅ F × ⋅ , espressione che costituisce il teoil sistema è vincolato otteniamo che 2 K rema viriale. Nel caso particolare ( −sax ) ˆ =− x 2 K s −1 di un sistema monodimensionale con potenziale V = ax s , ˆ = s V × ⋅ . Per l’oscillatore armonico questo significa che , cioè 2 K ˆ = V × ⋅ , generalizzando il risultato trovato per lo stato fondamentale. K Per un sistema con un potenziale coulombiano V = − forza F = a r 3 ˆ =− r , abbiamo 2 K a , e quindi con il corpo soggetto a una r a ˆ = 1 V ×⋅ . r ⋅ r × ⋅ , cioè K 2 r 3 Il momento angolare Gli operatori del momento angolare ˆ i In meccanica classica il momento angolare si esprime come l = r ∧ p = x px ˆ j y py kˆ z , in compz ponenti lx = yp z − zp y , l y = zp x − xp z , lz = xp y − yp x . Il modulo del momento angolare risulta l 2 = lx 2 + l y 2 + lz 2 . Il momento angolare in meccanica quantistica viene definito in modo analogo, ma utilizzando ˆz − ˆ ˆy , al posto di coordinate e momento gli operatori corrispondenti. Si ha quindi ˆ lx = ˆ yp zp ˆ ˆ ˆx − ˆ ˆz , ˆ ˆy − ˆ ˆx e l 2 = ˆ ly = ˆ zp xp lz = ˆ xp yp lx 2 + ˆ ly 2 + ˆ lz2 37 Nella rappresentazione delle posizioni tali operatori si esplicitano come ∂⋅ ∂⋅ ∂⋅ ˆ ∂⋅ ∂⋅ −x ∂⋅, ˆ ˆ , ly = − i z lx = − i y −z −y lz = − i x ∂z ∂y ∂x ∂x ∂z ∂y Le relazioni di commutazione Ricaviamo le relazioni di commutazione relative agli operatori del momento angolare, a partire ˆ j = i δij , xi , p dalle relazioni postulate ˆ ˆi , p ˆ j = 0 . Calcoliamo ad esempio ˆ xi , ˆ x j = 0 , p ˆ ˆ −ˆ ˆy ,ˆ ˆx − ˆ ˆ z = ˆ ˆz ,ˆ ˆ x − ˆ ˆy ,ˆ ˆ x − ˆ ˆz , ˆ ˆ z + ˆ ˆy ,ˆ ˆ z . Per semplil ,ˆ l = ˆ yp zp zp xp yp zp zp zp yp xp zp xp x y z ˆˆ ˆ ˆ ˆˆ ˆ ˆ ˆ ˆ ˆˆ ficare questa espressione occorre ricorrere al risultato AB , CD = ABCD − CDAB = ˆ ˆ ˆ ˆ + CADB ˆ ˆ ˆ ˆ − CDAB ˆ ˆ ˆˆ = ˆˆ ˆ ˆ − ACBD ˆ ˆ ˆ ˆ + ACBD ˆ ˆ ˆ ˆ − ACDB ˆ ˆ ˆ ˆ + ACDB ˆ ˆ ˆ ˆ − CADB ABCD ˆ B ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ A , C D + AC B, D + A, C DB + C A, D B . Si ricava quindi ˆz ,ˆ ˆ x = ˆ ˆz ,ˆ ˆ x + ˆˆ ˆz , p ˆ x + [ˆ ˆx p ˆz + ˆ ˆ x p ˆz = − i ˆ ˆx yp zp y p z p yz p y, ˆ z] p z ˆ y, p yp ˆ ˆy ,ˆ ˆ x = ˆ ˆy ,ˆ ˆ x + ˆˆ ˆy , p ˆ x + [ˆ ˆx p ˆy + ˆ ˆ x p ˆy = 0 ˆ zp zp z p z p zz p z, ˆ z] p z ˆ z, p ˆz , ˆ ˆ z = ˆ ˆz , ˆ ˆ z + ˆˆ ˆz , p ˆ z + [ˆ ˆzp ˆz + ˆ ˆ z p ˆz = 0 yp xp y p x p yx p y, ˆ x] p x ˆ y, p ˆ ˆy ,ˆ ˆ z = ˆ ˆy ,ˆ ˆ z + ˆˆ ˆy , p ˆ z + [ˆ ˆzp ˆy + ˆ ˆ z p ˆy = i ˆ ˆy ˆ zp xp z p x p zx p z, ˆ x] p x ˆ z, p xp ˆy − ˆ ˆx ) = i ˆ In conclusione, ˆ l ,ˆ l = i (ˆ xp yp l z e, in modo simile, ˆ l ,ˆ l =i ˆ l x e ˆ l ,ˆ l =i ˆ ly x y y z z x l2,ˆ l x = ˆ l 2,ˆ l + ˆ l 2,ˆ l + ˆ l 2,ˆ l Consideriamo ora il commutatore ˆ x x y x z x ˆ l 2,ˆ l =ˆ lx3 − ˆ lx3 = 0 x x ˆ l 2,ˆ l =ˆ l yˆ l yˆ lx − ˆ l yˆ l xˆ ly + ˆ l yˆ l xˆ ly −ˆ l xˆ l yˆ ly = ˆ l y ˆ l ,ˆ l + ˆ l ,ˆ l ˆ l = −i ˆ l yˆ lz + ˆ l zˆ ly y x y x y x y ˆ l 2,ˆ l =ˆ l zˆ l zˆ lx − ˆ l zˆ l xˆ lz + ˆ l zˆ l xˆ lz − ˆ l xˆ l zˆ lz = ˆ l z ˆ l ,ˆ l + ˆ l ,ˆ l ˆ l =i ˆ l zˆ ly + ˆ l yˆ lz z x z x z x y In definitiva ˆ l2,ˆ l x = 0 , ˆ l2,ˆ l y = 0 , ˆ l2,ˆ lz = 0 ( ( ) ) L’operatore momento angolare, pur presentando molte analogie con un vettore, non è un vetto- ˆ ˆ i j kˆ ˆ ˆ re a tutti gli effetti: infatti mentre u ∧ u = 0 , l ∧ l = ˆ lx ˆ ly ˆ lz = ˆ l yˆ lz i ˆ ˆ lx ˆ ly ˆ lz i ( ) ˆ −ˆ l zˆ ly … = i l ˆ lx Gli operatori di spostamento Risulta comodo definire altri operatori associati al momento angolare, un operatore di innal- l+ = ˆ lx + iˆ l y ed un operatore di abbassamento ˆ l− = ˆ lx − iˆ ly . zamento ˆ ˆ l +ˆ l− ˆ ˆ l −ˆ l− Valgono le relazioni inverse ˆ e ly = + lx = + 2 2i Valgono le relazioni di commutazione ˆ l ,ˆ l = ˆ l ,ˆ l + i ˆ l ,ˆ l =i ˆ ly + ˆ lx = ˆ l+ z + z x z y ˆ l ,ˆ l = ˆ l ,ˆ l − i ˆ l ,ˆ l =i ˆ ly − ˆ lx = − ˆ l− z − z x z y ˆ l ,ˆ l = ˆ l + iˆ l y ,ˆ lx − iˆ l y = ˆ l ,ˆ l + i ˆ l ,ˆ l + i ˆ l ,ˆ l + i ˆ l ,i ˆ l = 0+ ˆ lz + ˆ lz + 0 = 2 ˆ lz + − x x x y x y x y y ˆ ˆ l = 0 Visto che l 2 commuta con tutte le sue componenti, l 2,ˆ ± 38 Ricapitolando Il momento angolare verifica le relazioni di commutazione ˆ l ,ˆ l =i ˆ l z , ˆ l ,ˆ l =i ˆ l x , ˆ l ,ˆ l =i ˆ ly x y y z z x ˆ l2,ˆ l x = 0 , ˆ l2,ˆ l y = 0 , ˆ l2,ˆ lz = 0 Qualsiasi operatore che rispetti tali relazioni viene detto momento angolare, e gode di tutte le proprietà di cui gode il momento angolare vero e proprio. Gli autostati del momento angolare Definizione degli autostati ˆ Ci occupiamo degli autostati del modulo del momento angolare l 2 e del valore di una delle sue componenti, convenzionalmente ˆ l z . Definiamo gli autostati simultanei di questi due operatori in base a due numeri quantici l e ml , sui quali per il momento non poniamo condizioni particolari. l z λ, ml = ml Definiamo ml come ˆ λ, ml ; questa definizione è giustificata dal fatto che ha l z ) gli autovalori della le dimensioni di un momento angolare, e (data anche l’hermiticità di ˆ componente del momento angolare devono essere multipli reali di . ˆ ˆ Dato che l 2 e ˆ l z commutano, lo stato λ, ml deve essere autostato anche per l 2 . Da considerazioni dimensionali e dal fatto che stiamo trattando il quadrato di un operatore hermitiano, deduciamo che l’autovalore associato allo stato in esame dovrà rispettare una relazione tipo ˆ2 l λ, ml = f ( λ,ml ) 2 λ,ml con f ( λ,ml ) ≥ 0 . ˆ lz2 = ˆ lx 2 + ˆ l y 2 ha autovalori positivi (sempre per considerazioni di hermiticità) Dato che l 2 − ˆ ˆ ( e l2 −ˆ l z 2 λ, ml = f ( λ,ml ) − ml 2 ) 2 λ,ml , allora f ( λ,ml ) ≥ ml 2 . Gli effetti degli operatori di spostamento Dalle relazioni di commutazione relative agli operatori di spostamento sappiamo che questi non commutano con ˆ l z , e quindi generano un nuovo stato agendo su λ, ml . ˆ ˆ ˆ ˆ l + λ, ml = ˆ l + l 2 λ,ml = l + λ, ml è un autostato di l 2 con lo stesso autovalore. Infatti l 2ˆ l + λ,ml . Nel primo passaggio abbiamo applicato il fatto che i due operatori f ( λ,ml ) 2ˆ commutano. ( ) l zˆ l + λ, ml Se andiamo invece a considerare ˆ l zˆ l + λ, ml = ˆ l +ˆ l z + ˆ l z ,ˆ l + λ, ml = otteniamo ˆ (ˆl ˆl + ˆl ) (ml + 1)ˆl + + z + ( λ, ml = ˆ l + ml + ˆ l+ ) λ,ml = λ,ml , confrontando quindi il risul- (ml + 1)ˆl + λ,ml con il fatto che ˆl z λ,ml + 1 = (ml + 1) λ,ml + 1 , ricaλ, ml = c + ( λ,ml ) λ,ml + 1 , dove c + ( λ,ml ) è un fattore di proporzionalità l zˆ l + λ, ml = tato ˆ l+ viamo che ˆ adimensionale. Ripetiamo lo (ˆl ˆl − ˆl ) λ, ml = − z − stesso ragionamento (ml − 1)ˆl − con ˆ l zˆ l − λ, ml = λ, ml , cioè ˆ l − λ, ml = c − ( λ,ml ) (ˆl ˆl + ˆl ,ˆl ) λ,m − z z − l = λ,ml − 1 . 39 Gli autovalori del momento angolare Gli operatori di spostamento cambiano il valore di ˆ l z per incrementi unitari; tali valori sono ˆ lz2 ≤ l 2 . però limitati dal fatto che deve essere f ( λ, ml ) ≥ ml 2 , e ˆ ( ) Consideriamo per prima cosa l = max ml : f ( λ, ml ) ≥ ml 2 . Se applichiamo allo stato λ,l l’operatore ˆ l + non possiamo ottenere un nuovo stato, perché in tal modo violeremmo la condizione che l sia il valore massimo. l + λ,l = 0 , con l come incognita. Questa equivale a Si tratta quindi di risolvere l’equazione ˆ ˆ l −ˆ l + λ,l = 0 , (ˆl 2 x che +ˆ l y 2 + i ˆ l ,ˆ l x y ) si sviluppa ˆ λ, l = l 2 − ˆ lz2 − ˆ l z (ˆl − i ˆl )(ˆl + iˆl ) ˆ l −ˆ l + λ,l = come ( λ, l = x f ( λ, l ) − l 2 2 x l) − y λ, l = λ, l . 2 L’equazione si è quindi ridotta a ( l ± λ, ml f ( λ, l ) = l 2 + l ; dato che ˆ è autostato di l 2 , con lo stesso autovalore, segue che f ( λ, l ) − l 2 2 2 − l) 2 y λ, l = 0 , che è verificata solo se 2 ˆ f ( λ,ml ) = l 2 + l , con ml = l, l − 1, l − 2,… ˆ l z 2 ≤ l 2 ; deve cioè esistere uno stato λ,k , Bisogna però che sia anche verificata la condizione ˆ ( ) l − λ,k = 0 . con k = min ml : ml 2 ≤ l (l + 1 ) ∧ ml = l − n,n ∈ N , cioè tale che ˆ l +ˆ l − λ,k = In modo simile a quanto fatto prima ricaviamo ˆ (ˆl x 2 +ˆ l y 2 − i ˆ l ,ˆ l x y f ( λ,k ) = k 2 − k . ) ˆ lz2 + ˆ l z λ, k = l 2 − ˆ λ, k = ( (ˆl + i ˆl )(ˆl − i ˆl ) x f ( λ,k ) − k 2 2 y 2 − x k) 2 y λ,k = λ,k = 0 , cioè Dato che dobbiamo essere nello stesso set di soluzioni per il quale avevamo trovato il limi- ˆ te superiore, l’autostato di l 2 deve essere ancora l 2 + l , deve quindi valere l’uguaglianza l 2 + l = k 2 − k , che è verificata per k = −l e per k = l + 1 . Delle due soluzioni solo la prima è accettabile, visto che k = l + 1 è maggiore del valore massimo accettabile per ml . Si è così visto come ml possa variare per intervalli interi tra un minimo di −l e un massimo di ˆ l ; visto che per questo insieme di valori l 2 λ, ml = l (l + 1 ) 2 λ,ml , è sensato identificare questi stati come l, ml . Rimane da stabilire quali valori di l e ml siano accettabili; il fatto di dover passare da l a −l per intervalli interi implica che debba essere verificata l − n = −l , con n ∈ N . Questa equazione implica che l = n , cioè che l abbia valori interi ( n pari) o semiinteri 2 ( n dispari). Ricapitolando, partendo solo dalle caratteristiche di hermiticità degli operatori di momento ˆ angolare e dalle loro relazioni di commutazione abbiamo dimostrato che l’operatore l 2 am- n , n ∈ N . Particolari problemi possono imporre 2 l z (abcondizioni aggiuntive (ad esempio che siano validi solo i valori interi). Per l’operatore ˆ biamo arbitrariamente scelto z come asse “principale”) abbiamo invece trovato autovalori ml , con ml = −l, −l + 1,… , l − 1, l . mette come autovalori l (l + 1 ) 2 , con l = 40 Gli elementi di matrice degli operatori di spostamento Sono rimasti ancora indeterminati i coefficienti c ± (l, ml ) , che avevamo dedotto essere intro- l ± l, ml = c ± (l, ml ) dotti dagli operatori di spostamento, tramite ˆ l, ml l,ml ± 1 . Dato che gli stati sono ortonormali per le proprietà degli operatori hermitiani, possiamo scrivere l ± l,ml = c ± (l,ml ) l,ml ± 1 ˆ l,ml ± 1 l,ml ± 1 = c ± (l,ml ) : i coefficienti sono quindi gli ele- menti di matrice degli operatori di spostamento. Per 2 calcolarli, (l 2 + l − (ml 2 + ml ) ˆ ˆ l −ˆ l + l, ml = l 2 − ˆ lz2 + ˆ l z l, ml = l,ml ; applicando però la relazione ˆ l,ml ± 1 rical ± l, ml = c ± (l, ml ) ricaviamo ) per l −ˆ l + l, ml = c + (l,ml ) viamo anche che ˆ ( ( tando, l 2 + l − ml 2 + ml prima cosa ˆ l − l,ml + 1 = c + (l,ml ) c − (l,ml + 1 ) 2 )) = c (l,m ) c (l,m + 1) . + l − l,ml . Confron- l Ora dobbiamo stabilire una relazione tra gli elementi di matrice dei due operatori, in modo da poterli ricavare indipendentemente uno dall’altro. Sfruttiamo il fatto che, pur non essendo ˆ l+ e ˆ l − hermitiani, ˆ lx e ˆ l y lo sono: l − l,ml + 1 = l,ml ˆ l x l,ml + 1 − i l,ml ˆ l y l,ml + 1 = applicando l’hermiticità l,ml ˆ l x l, ml l, ml + 1 ˆ ∗ − i l, ml + 1 ˆ l y l, ml ∗ = ∗ ∗ ˆ l x l,ml + i l,ml + 1 ˆ l y l,ml = l, ml + 1 ˆ l + l, ml ∗ ˆ l − l, ml + 1 = l,ml + 1 ˆ l + l,ml : ˆ l+ e ˆ l − sono l’uno il coniugato hermitiano l, ml + 1 Cioè, l, ml l − l,ml + 1 = c − (l,ml + 1 ) dell’altro; dato che poi l, ml ˆ l + l,ml e l, ml + 1 ˆ ∗ = c + (l,ml ) ∗ , c − (l, ml + 1 ) = c + (l, ml ) ∗ ( ) La relazione trovata prima diventa quindi c + (l, ml ) c + (l,m ) = l 2 + l − ml 2 + ml = e quindi, sce∗ gliendo la fase in modo tale da avere un valore reale positivo per il coefficiente, c + (l,ml ) = c − (l,ml + 1 ) = l 2 + l − (ml 2 + ml ) . Abbiamo trovato gli elementi di matrice cercati. Regole di composizione dei momenti angolari Sistemi composti e momento angolare totale Quando si ha a che fare con un sistema con più di una sorgente di momento angolare, è possibile specificare lo stato del sistema in due modi diversi. Da quanto abbiamo visto prima, non è possibile specificare contemporaneamente le tre componenti di ciascun momento angolare (per via delle relazioni di commutazione); d’altra parte è possibile specificare il modulo quadro del momento angolare e la sua componente lungo un asse (di solito z ). Un primo modo di rappresentare lo stato del sistema composto da due particelle dotate di momento angolare sarebbe quello di utilizzare il modulo quadro e la componente lungo z dei due momenti; lo stato sarebbe quindi caratterizzato dai numeri quantici j1 , j 2 , m1 , m2 , tali che ˆ2 j1 ψ j (come 1 , j2,m1 ,m2 = garantito 2 dalla j1 ( j1 + 1 ) ψ j 1 , j 2,m1 ,m2 teoria generale del momento angolare) si abbia , ˆ j1z ψ j1 , j2,m1 ,m2 = m1ψ j1 , j2,m1 ,m2 e le analoghe per la seconda par- ticella. In effetti questo è possibile perché gli operatori di momento angolare per la prima particella commutano con qualsiasi operatore di momento angolare della seconda particella, giustificando la possibilità di trovare autostati comuni. Prima di introdurre una seconda possibilità per specificare gli stati del sistema, è necessario ˆ ˆ ˆ definire l’operatore momento angolare totale j = j1 + j2 , e studiarne le proprietà. 41 ˆ j è un momento angolare in senso operatoriale, ne: ad esempio ˆ j ,ˆj = ˆj1x + ˆj2x ,ˆj1y + ˆj2y = x y i ˆj + 0 + 0 + i ˆj = i ˆj 1z 2z soddisfa cioè le proprietà di commutazio- ˆj1x ,ˆj1y + ˆj1x ,ˆj2y + ˆj2x ,ˆj1y + ˆj2x , +ˆj2y = z ˆ ˆ ˆ ˆ2 j commuta con i due moduli quadri j12 e j22 ; infatti j12 commuta con ogni componente di ˆ ˆ ˆ j1 (e certamente con ogni componente di j2 ), e viceversa. Dato che si può esprimere j2 in funzione delle componenti dei due momenti di particella singola, evidentemente ˆj2,ˆj 2 = ˆj2,ˆj 2 = 0 . Per la stessa ragione ˆj commuta con ˆ 2 e ˆ 2 . j1 j2 1 2 z Non si può dire lo stesso per quanto riguarda le componenti dei due momenti con il modu- ˆj ,ˆj2 = 1z lo quadro del momento angolare totale: ( ) ( ) ˆj1z ,ˆjx 2 + ˆj1z ,ˆjy 2 + ˆj1z ,ˆjz 2 = ˆj , ˆj + ˆj 2 + ˆj , ˆj + ˆj 2 + 0 = 2x 2y 1z 1x 1z 1y ˆj1z ,ˆj1x 2 + 2ˆj1xˆj2x + ˆj1z ,ˆj1y 2 + 2ˆj1yˆj2y = ˆj1z ,ˆj1x 2 + ˆj1y 2 + 2 ˆj1z ,ˆj1xˆj2x + ˆj1yˆj2y = ˆj ,ˆj 2 − ˆj 2 + 2 ˆj ,ˆj ˆj + 2 ˆj ,ˆj ˆj = 1z 1z 1 1z 1x 2x 1z 1y 2y 0 + 2 i ˆj1yˆj2x − 2 i ˆj1xˆj2y = 2 i (ˆj ˆj 1 y 2x ) − ˆj1xˆj2y , cioè le componenti dei momenti singoli con commutano con il modulo del momento totale. Nella dimostrazione si è fatto ampio uso delle proprietà di commutazione dei singoli momenti e del fatto che ogni componente di uno commutasse con tutte quelle dell’altro. A questo punto possiamo affermare che j1 , j 2 , j , m j formano un buon set di numeri quanti- ˆ ˆ ˆ jz . ci, in quanto individuano uno stato ψ j1, j2, j ,mj che è autostato degli operatori j12 , j22 ; j2 e ˆ Non è però autostato di ˆ j1z e ˆj2z ; per la proprietà di completezza sarà però possibile esprimere ψj ψj 1, j2, j ,m j 1, j 2, j ,m j = come ∑ m1 ,m2 m1 +m2 =m j combinazione cm ,m ψ j 1 2 1, j 2,m1 ,m2 lineare degli stati ψj 1, j2,m1 ,m2 tali che m1 + m2 = m j : . Abbiamo quindi due modi per rappresentare lo stato di un sistema con due elementi dotati di momento angolare, una rappresentazione disaccoppiata dove specifichiamo le componenti dei singoli momenti lungo z , ma non abbiamo una definizione univoca del modulo del momento angolare totale, ed una rappresentazione accoppiata, nella quale conosciamo il momento angolare totale ma non possiamo in generale definire univocamente m1 e m2 . In genere le due rappresentazioni sono equivalenti, ma può essere utile scegliere una piuttosto j1z e ˆj2z non commutiche l’altra a seconda del problema in esame; in effetti può capitare che ˆ no con l’hamiltoniano (e quindi non sia possibile trovare autostati dell’hamiltoniano che siano ˆ jz commutino; in tal caso evidenteanche autostati dei due operatori), ma al contrario j2 e ˆ mente è più utile usare la rappresentazione accoppiata. Valori permessi del momento angolare totale Una volta scelta la rappresentazione accoppiata occorre determinare quali valori possono essere assunti da j ed m j ; dato che m1 + m2 = m j , il valore massimo per m j è j1 + j 2 , e date le proprietà del momento angolare deve essere max m j = max j = j1 + j 2 . Per determinare invece il limite inferiore procediamo come segue: Il numero totale di stati indipendenti nella rappresentazione (2 j 1 + 1 ) ( 2 j 2 + 1 ) disaccoppiata è 42 Per ogni possibile valore di j sono possibili (2 j + 1 ) valori di m j Dato che passando da una rappresentazione all’altra il numero di stati indipendenti non j max ∑ (2 j + 1 ) = ( 2 j può cambiare, deve valere 1 + 1 ) (2 j 2 + 1 ) . j = j min j −1 j j + j max − j min + 1 = 2 Svolgendo i conti, j− j + j max − j min + 1 = (2 j + 1 ) = 2 j=j j=j j =1 j =1 2 2 j max ( j max + 1 ) − j min ( j min − 1 ) + j max − j min + 1 = j max + 2 j max − j min + 1 = 2 ( j1 + j 2 ) + 4 j1 j 2 + 1 j max j max ∑ ∑ ∑ max ∑ min min min Inserendo la condizione j max = j1 + j 2 , j12 + j 22 − 2 j1 j 2 = j min 2 , da cui j min = j1 − j 2 Le funzioni d’onda degli stati accoppiati Abbiamo detto che per le proprietà di completezza degli insiemi degli autostati, è possibile esprimere gli stati di una rappresentazione come combinazione lineare degli stati dell’altra, ψj 1, j 2, j ,m j ∑ = cm ,m ψ j m1 ,m2 m1 +m2 =m j 1 2 1, j 2,m1 ,m2 . Conoscendo le funzioni di entrambe le rappresentazioni è possibile estrarre molto semplicemente i coefficienti con un integrale di sovrapposizione: ψj 1 , j2,m1 ,m2 ψj 1 , j 2, j ,m j ∑ = cm ,m ψ j m1 ,m2 m1 +m2 =m j 1 2 1 , j 2,m1 ,m2 ψj 1, j 2,m1 ,m2 = cm ,m grazie alla condizione di orto1 2 normalità degli stati. Il processo per calcolare gli autostati accoppiati e quindi i coefficienti di Clebsch-Gordan è piuttosto complesso; in generale si costruisce lo stato con j = j max e m j = j max (che di solito coincide semplicemente con lo stato disaccoppiato con m1 = j1 e m2 = j 2 ), dopodiché si ricavano gli altri utilizzando l’operatore di abbassamento. Sistemi con più momenti angolari In presenza di più di due momenti angolari disaccoppiati è possibile procedere all’accoppiamento per passi successivi, ottenendo prima lo stato accoppiato di due dei momenti, quindi accoppiando questo stato con un altro dei momenti disaccoppiati, e così via. Operatori di spin e matrici di Pauli Finora non abbiamo ancora incontrato una rappresentazione esplicita di operatori ed autostati di spin, che abbiamo genericamente chiamato stati α e β . In effetti è possibile dimostrare che se si considerano le matrici ˆ sz = spettano 1 4 2 le 1 0 regole di 1 1 2 0 0 1 0 1 ˆ 1 0 e sy = sx = , ˆ 2 1 0 2 i −1 commutazione 0 0 1 0 1 1 − −1 1 0 1 0 0 dei 0 = −1 momenti 1 4 2 0 −1 angolari 1 0 0 − 1 (an − i , queste ri0 sz , ˆ sx = ˆ 1 2 0 1 = 2 −1 0 esempio, −1 = 0 sy ). i ˆ Questo inoltre permette di dare espressioni esplicite per gli stati di spin. Ad esempio, gli auto- 1 0 0 1 sz α = stati di ˆ sz sono i vettori α = e β = , in quanto si ricava immediatamente che ˆ e ˆ szβ = − 2 2 α β. Similmente, per ˆ sx α = 1 1 1 1 1 − i 1 i sy α = e β= . e β= , e per ˆ 2 1 2 −1 21 2 1 43 Si può anche trovare l’operatore ŝ2 , applicando semplicemente le regole per il prodotto di ma- 1 0 , in perfetto accordo con il fatto che stiamo considerando un 0 1 1 3 1 1 sistema con s = , visto che gli autovalori di ŝ2 risultano essere 2 = 2 + 1 . 2 4 22 trici; il risultato è ˆ s2 = 3 4 2 Moto circolare Laplaciano in coordinate polari Si può ricavare l’espressione in coordinate polari per il laplaciano ∇2f = ∂2f ∂2f + applicando ∂x 2 ∂y 2 le formule di derivazione per le funzioni composte. Partiamo dal considerare le espressioni della trasformazione delle coordinate, con tutte le relative derivate. r = x 2 + y 2 ye φ = arctan x quindi ∂φ y x2 y =− 2 2 =− 2 2 ∂x x x +y r ∂φ 1 x 2 x = = 2 2 2 ∂y x x + y r ∂r = ∂x x x = 2 2 r x +y ∂r = ∂y y y = 2 2 r x +y e ∂r = ∂y 2 2 1 − x + y2 2 1 − x2 + y2 x2 (x +y 2 y (x 2 ) 2 3 2 + y2) 3 = y2 r3 x2 = 3 r , ∂2φ −2yr ∂r ∂x 2xy =− = 4 2 ∂x r4 r e 2 . ∂ φ −2xr ∂r ∂y 2xy = = − ∂y 2 r4 r4 Ora calcoliamo la derivata seconda composta: ∂2r = ∂x 2 ∂2f usando le regole di derivazione della funzione ∂x 2 ∂f ∂f ∂r ∂f ∂φ = + e quindi ∂x ∂r ∂x ∂φ ∂x ∂2f ∂2f ∂r ∂2f ∂φ ∂r ∂2f ∂φ ∂ 2f ∂r ∂φ ∂f ∂ 2r ∂f ∂ 2φ = + + + + + ∂x 2 ∂2r ∂x ∂φ∂r ∂x ∂x ∂2φ ∂x ∂r ∂φ ∂x ∂x ∂r ∂x 2 ∂φ ∂x 2 ∂2f ∂2f ∂r ∂2f ∂φ ∂r ∂2f ∂φ ∂ 2f ∂r ∂φ ∂f ∂ 2r ∂f ∂ 2φ Analogamente = 2 + + 2 + + + 2 2 ∂y ∂φ ∂y 2 ∂ r ∂y ∂φ∂r ∂y ∂y ∂ φ ∂y ∂r ∂φ ∂y ∂y ∂r ∂y Il laplaciano risulta quindi, riordinando i termini, ∂r 2 ∂r 2 ∂2f ∂φ 2 ∂φ 2 ∂2f ∂φ ∂r ∂φ ∂r + + + 2 + + 2 ∂x ∂y ∂ φ ∂x ∂y ∂φ∂r ∂x ∂x ∂y ∂y ∂f ∂2r ∂2r ∂f ∂2φ ∂2φ + + + + ∂r ∂x 2 ∂y 2 ∂φ ∂x 2 ∂y 2 ∂2f 1 ∂2f 1 ∂f Sostituendo le derivate trovate sopra, ∇2f = 2 + 2 2 + ∂ r r ∂ φ r ∂r ∇2f = ∂2f ∂2r Particella vincolata su una circonferenza Consideriamo una particella vincolata a muoversi su una circonferenza; la sua energia potenziale è costante e può essere considerata nulla. In questo modo l’equazione di Schroedinger indipendente dal tempo per la particella si può scrivere come − 2 2m ∇2ψ = E ψ , con il vincolo che la distanza della particella da un punto fisso (diciamo l’origine del sistema di riferimento) sia costante. Esplicitando il laplaciano in coordinate polari abbiamo − ∂2ψ 1 ∂2ψ 1 ∂ψ + + = E ψ . Avendo supposto r costante per la particella, deve essere 2m ∂2r r 2 ∂2φ r ∂r 2 44 2 ∂ψ 1 ∂2ψ = E ψ . Introducendo il momento di inerzia = 0 , per cui l’equazione si riduce a − 2m r 2 ∂2φ ∂r I = mr 2 per la particella, e osservando che dati i vincoli geometrici ψ = ψ ( φ) , l’equazione si riduce ad una analoga a quella per la particella libera, − soluzione ψ = Ae i ml φ + Be − i m φ , con ml = l 1 ∂2ψ = E ψ ( φ ) , che ammette come 2I ∂2φ 2 2IE . Dato che però la funzione deve essere perio- dica sulla circonferenza, deve valere la condizione al contorno circolare ψ ( φ + 2π ) = ψ ( φ ) , che si traduce nel vincolo ml = 0, ±1, ±2,… Momento angolare della particella Abbiamo già ricavato il momento angolare nella rappresentazione delle posizioni come ∂⋅ ∂⋅ ˆ lz = − i x −y . È opportuno convertirlo nell’equivalente in coordinate polari: ∂x ∂y ∂⋅ y ∂⋅ x ∂ ⋅ x ∂ ⋅ y ∂⋅ ∂⋅ ∂⋅ ˆ lz = − i x −y = − i x + −y − = −i . 2 2 ∂x ∂φ ∂y ∂r r ∂φ r ∂r r ∂φ r Se ora applichiamo l’operatore ad una delle autofunzioni dell’hamiltoniano abbiamo ∂ Ae i m φ = ml Ae i m φ . Le funzioni sono autostati del momento angolare, con au∂φ ml . Dato che sono autostati di un operatore hermitiano, le funzioni ψm sono orto- ˆ l z Ae i m φ = − i l tovalore l l l normali, se si normalizzano ponendo A = ∫ 2π 0 e − i m φe i m φ d φ l −1 2 =1 l 2π La densità di probabilità è costante lungo tutta la circonferenza, rendendo in pratica infinita l’indeterminazione sulla posizione della particella. Questa è una conseguenza del principio di indeterminazione, visto che abbiamo una conoscenza esatta del momento angolare e, quindi (dato che la particella si muove su una circonferenza di raggio fissato) del momento lineare. L’atomo di idrogeno Operatori vettoriali in coordinate sferiche La geometria del problema relativo all’atomo di idrogeno rende molto più conveniente affrontarlo in coordinate sferiche. Le espressioni relative agli operatori vettoriali in coordinate sferiche si possono ricavare applicando le regole di derivazione delle funzioni composte, sapendo che x = r sin ϑ cos φ y = r sin ϑ sin φ z = r cos ϑ q r z y f La derivazione delle formule risultanti è molto lunga, ma i risultati sono: ∂f ∂f 1 ∂f 1 ˆr + ˆϑ + ˆ ∇f = u u u ∂r r ∂ϑ r sin ϑ ∂φ φ x 45 ∂ ∂f ∂2f 1 ∂ 2 ∂f 1 1 in particolare la parte relativa r + 2 sin ϑ + 2 2 2 r ∂r ∂r r sin ϑ ∂ϑ ∂ϑ r sin ϑ ∂φ2 1 ∂2 1 ∂2 a r si può scrivere anche come rf ) , visto che (rf ) = 1 ∂ f + r ∂f = 2 ( r ∂r r ∂r 2 r ∂r ∂r 2 2 2 1 ∂ 2 ∂f 2 ∂f ∂ f 2 ∂f ∂ f ∂f 1 ∂f +r2 2 = . + 2 e anche 2 + r = 2 2r r ∂r ∂r r ∂r ∂r r ∂r ∂r 2 r ∂r ∂r ∇2f = La massa ridotta Per l’atomo di idrogeno ci troviamo a dover affrontare il problema (che ricorre anche in altre circostanze) del moto di due particelle con un potenziale che dipende esclusivamente dalla distanza reciproca. Un sistema di questo tipo sarà descritto da una funzione d’onda più com- ( ) plessa, che abbia come parametri le posizioni di entrambe le particelle, del tipo ψ r1, r2 . L’hamiltoniano del sistema sarà quindi − 2 2m1 ∇1 2 − 2 2m2 ( ) ∇22 + V r1 − r2 . Sarebbe però molto più comodo poter esprimere l’energia del sistema in funzione del moto del contro di massa e della distanza relativa tra le due componenti; introduciamo quindi la posizione del centro di massa rC = m1r1 + m2r2 , la distanza tra i due corpi d = r2 − r1 , la massa totale M = m1 + m2 e la m1 + m2 m1m2 1 1 1 = + ( ). m1 + m2 µ m1 m2 massa ridotta µ = Consideriamo xC = in primo luogo la coordinata x ; le relazioni sono xd = x2 − x1 e m1 m ∂x d ∂x d ∂x C m1 ∂x C m2 e , mentre x 1 + 2 x 2 , le derivate prime sono = −1 , = 1, = = M M M M ∂x 1 ∂x 2 ∂x 1 ∂x 2 le derivate seconde sono tutte nulle. Possiamo ora applicare la regola di derivazione della funzione composta, e ricavare ∂2f ∂2f ∂f ∂f ∂x c ∂f ∂x d = e = + ∂x 12 ∂2x c ∂x 1 ∂x c ∂x 1 ∂x d ∂x 1 2 2 ∂x c ∂2f ∂x d ∂2f ∂x c ∂x d + , esplicitando 2 + 2 ∂x d ∂x c ∂x 1 ∂x 1 ∂x 1 ∂x d ∂x 1 2 ∂2f ∂2f m1 ∂2f ∂2f m1 . = + −2 2 2 2 2 ∂x 1 ∂ xc M ∂x d ∂x d ∂x c M Analogamente si trova 2 ∂2f ∂2f m2 ∂2f ∂2f m2 ; inserendoli nell’espressione dell’hamiltoniano rica= 2 + +2 2 2 2 ∂x 2 ∂ xc M ∂x d ∂x d ∂x c M x dell’operatore differenziale è viamo che la parte relativa alle 2 2 2 2 2 2 m +m ∂ f 1 ∂f ∂f 1 ∂f − − = 1 2 2 + + 2 2 2 ∂x c m1 m2 ∂x d 2 M 2m1 ∂x 1 2m2 ∂x 2 Considerando che lo stesso succede per le altre coordinate, l’hamiltoniano iniziale è equivalente a − 2 2M ∇C 2 − 2 2µ ( ) ∇d 2 + V d . È utile osservare che l’hamiltoniano è separabile, e che se si ( ) ( ) considera ψ rc , d = ξ rc è possibile scomporre il problema in un problema per il mo- 2 ∇C 2ξ ( rc ) = E c ξ ( rc ) , uno per il moto relativo dei due corpi to del centro di massa − − 2 2µ () χ d 2M ( ) ( ) χ (d ) = E ∇d 2 χ d + V d d () χ d La separazione di variabili in coordinate polari Se osserviamo il sistema da un sistema di riferimento solidale con il centro di massa possiamo limitarci a considerare il moto relativo delle due particelle, e risolvere l’equazione di Schroe46 dinger − 2 2µ ( ) ∇2 ψ ( r ) + V r coordinate ∇2f = polari: ψ (r) = E abbiamo ψ ( r ) ; la soluzione viene semplificata lavorando in visto che il laplaciano ∂f 1 ∂ 1 1 ∂ 1 ∂f 1 ∂ 1 rf ) + 2 = rf ) + 2 Λ2f sin ϑ + 2 ( 2 2 2 ( ∂ϑ sin ϑ ∂φ r ∂r r ∂r r sin ϑ ∂ϑ r 2 2 2 diventa dove Λ2 agisce solo sulla parte angolare, ed è detto operatore legendriano. Tale hamiltoniano è separabile: se scrivo ψ (r , ϑ, φ ) = R (r ) Y ( ϑ, φ ) e inserisco tale espressione nell’equazione ottengo − in Λ2Y = λY e − 2 1 ∂2 (rR ) Y − R 1 2 2µ r ∂r 2 2µr 2 Λ2Y + V (r ) RY = E 2 −λ 1 ∂2 rR ) + + V (r ) R = E 2 ( 2 2µ r ∂r 2µr 2 RY , che si scompone R La componente angolare Si tratta di risolvere l’equazione Λ2 = ∂ ∂ 1 ∂ 1 ; sin ϑ + 2 sin ϑ ∂ϑ ∂ϑ sin ϑ ∂φ2 2 per Λ2Y ( ϑ, φ) = λY ( ϑ, φ ) , 2 differenziale prima cosa si fattorizza la con funzione Y ( ϑ, φ) = Θ ( ϑ) Φ ( φ ) , e sostituendo nell’equazione si può separare: ∂2Φ = η2Φ : ricordando che in coordinate polari la componente verticale del momento an2 ∂φ golare ha come operatore ˆ lz = − i e Φ = Ne ∂⋅ l zf = ml f , ˆ lz2 = − , e che ˆ ∂φ 2 ∂2Φ ∂2 = −ml 2Φ , , allora 2 ∂φ2 ∂φ i ml φ 2 ∂Θ ml Θ 1 ∂ ϑ − + k Θ = 0 . Le soluzioni di tale equasin ∂ϑ sin2 ϑ sin ϑ ∂ϑ zione sono dei polinomi detti di Legendre, in seno e coseno di ϑ . La soluzione assume quindi la forma Θ ( ϑ) = Pl (cos ϑ) , ma è molto complessa da ricavare analiticamente. La ri- resta quindi da risolvere caveremo invece utilizzando le proprietà del momento angolare. Le armoniche sferiche tramite gli operatori di momento angolare Esprimiamo in primo luogo le componenti del momento angolare in coordinate polari: Nella rappresentazione delle posizioni tali operatori si esplicitano come ∂⋅ ∂⋅ ∂⋅ ˆ ∂⋅ ∂⋅ −x ∂⋅, ˆ ˆ , ly = − i z ; la trasformazione lx = − i y −z −y lz = − i x ∂z ∂y ∂x ∂x ∂z ∂y è piuttosto laboriosa, ed è utile avere tutte le derivate delle trasformazioni da coordinate cartesiane a polari: φ 1 sin φ cos φ sin ϑ cos ϑ cos φ − r r sin ϑ 1 cos φ sin φ sin ϑ cos ϑ sin φ r r sin ϑ 1 0 cos ϑ − sin ϑ r r ∂ x = r sin ϑ cos φ ∂x y = r sin ϑ sin φ ∂ z = r cos ϑ ∂y ∂ ∂z ϑ 47 se ∂⋅ 1 ∂⋅ sin ϑ sin φ cos ϑ ∂r − r sin ϑ ∂ϑ − ˆ = lx = − i r cos φ ∂ ⋅ ∂⋅ 1 ∂⋅ cos ϑ sin ϑ sin φ ∂r + r cos ϑ sin φ ∂ϑ + r sin ϑ ∂φ sostituiamo 1 ∂⋅ ∂⋅ ∂⋅ sin φ ∂ ⋅ − i r − (sin2 ϑ + cos2 ϑ ) − cot ϑ cos φ = i sin φ ∂ϑ + cot ϑ cos φ ∂φ r r ∂ϑ ∂φ ∂⋅ ∂⋅ in modo simile si ricavano ˆ l y = − i cos φ − cot ϑ sin φ e ˆ lz = − i troviamo anche ∂ϑ gli ∂φ operatori di ∂⋅ ∂φ spostamento ∂⋅ ∂⋅ ˆ + cot ϑ (cos φ − i sin φ ) = l + = i (sin φ − i cos φ ) ∂ϑ ∂φ ∂⋅ ∂⋅ ∂⋅ iφ ∂ ⋅ ( i sin φ + cos φ ) ∂ϑ + i cot ϑ (cos φ + i sin φ ) ∂φ = e ∂ϑ + i cot ϑ ∂φ ∂⋅ ∂⋅ in modo analogo ˆ − i cot ϑ l− = − ei φ ∂ϑ ∂φ ˆ lx 2 + ˆ ly 2 + ˆ l z 2 : i calcoli sono piuttosto lunghi, ma alla fine si ricava rimane da ricavare l 2 = ˆ ∂2 ⋅ ∂⋅ ∂2 ⋅ ∂2 ⋅ 2 . È immediato osservare come questa espresione + ϑ + ϑ + cot cot ∂ϑ2 ∂ϑ ∂φ2 ∂φ2 1 ∂ ∂ ∂2 1 sia equivalente a − 2 ϑ + = − 2Λ2 : risolvere l’equazione ansin 2 2 ϑ ∂ϑ ∂ϑ ϑ ∂φ sin sin ˆ2 l =− 2 golare equivale a trovare gli autostati del momento angolare. Dalla discussione precedente e da quanto sappiamo sul momento angolare possiamo ricavare ˆ Λ2Y ( ϑ, φ) = − l 2Y ( ϑ, φ ) = − 2l (l + 1 ) Y ( ϑ, φ ) . Possiamo inolˆ tre ricordare anche che gli autostati di l 2 sono pure autostati di, che sono inoltre caratterizzati da un secondo numero quantico ml = −l, −l + 1,… , l − 1, l . Possiamo quindi trovare l’autostato subito gli autovalori λ , dato che 2 con ml = l , che denotiamo Yll , ricordando l’effetto degli operatori di spostamento e che quindi l +Yll = 0 . deve essere ˆ impostiamo quindi un’equazione differenziale inserendo la forma esplicita in coordinate ∂⋅ ∂⋅ ei φ + i cot ϑ Yll ( ϑ, φ ) = 0 . Fattorizzando è ∂φ ∂ϑ ∂Θ ∂Φ ei φ Φ + i cot ϑ Θ = 0 quindi l’equazione: ∂φ ∂ϑ polari dell’operatore di spostamento: possibile tan ϑ separare 1 ∂Θ ∂Φ 1 ∂Φ 1 1 ∂Θ = −i =c. = c e −i , che si divide nelle due equazioni tan ϑ Θ ∂ϑ ∂φ Φ ∂φ Φ Θ ∂ϑ ∂Φ 1 = c ha evidentemente soluzione Φ = Ne i c ∂φ Φ cos ϑ 1 dΘ = c d ϑ si integra come ln Θ = c ln (sin ϑ) + A , che si può riscrivere Θ sin ϑ Θ = N sinc ϑ l zYll = l Yll , posLa soluzione ha quindi la forma Yll = N sinc ϑ e i c φ ; dato che deve valere ˆ −i ∂e i c φ = N sinc ϑ ce i c φ = cYll . Dal confronto si ottiene l zYll = − i N sinc ϑ siamo ricavare ˆ ∂φ 48 c = l e quindi Yll = N sinl ϑ e i l φ . Tutte le altre autofunzioni si possono ottenere facendo agire l’operatore di abbassamento su questa.prima funzione. La componente radiale in un campo coulombiano: Rimane a questo punto da risolvere la parte dell’equazione di Schroedinger relativa al moto ra- −λ 1 ∂2 rR ) + + V (r ) R = E R ; in particolare, inserendo il 2 ( 2 2µ r ∂r 2µr Ze 2 per risultato dell’equazione angolare e considerando un potenziale coulombiano V = − 4πε0r diale dell’elettrone, cioè − 2 2 l (l + 1 ) 1 ∂2 Ze 2 + − rR R R = E R . Si può semplifi( ) 2µ r ∂r 2 2µr 2 4πε0r care la soluzione cercando con la sostituzione Γ = rR , che permette di ottenere l’equazione 2 2 l (l + 1 ) ∂2Γ Ze 2 + − differenziale Γ = −E Γ 2 2µ ∂r 2µr 2 4πε0r un atomo idrogenoide abbiamo − Per semplificare l’algebra 2 della soluzione riscriviamo l’equazione come 2µE ∂ Γ 2µZe 1 l (l + 1 ) 2µZe , b = l (l + 1 ) e + 2 − Γ = − 2 Γ ; effettuando le sostituzioni a = 2 2 2 4πε0 ∂r r 4πε0 r ∂ 2Γ a b 2µE + − Γ = λ2 Γ . λ2 = − 2 , possiamo scrivere ∂r 2 r r 2 Si studia il comportamento asintotico: per r → ∞ i termini con r a denominatore diventa∂ 2Γ = λ2 Γ , che ammette chiaramente soluzioni no trascurabili, e l’equazione si riduce a 2 ∂r Γ ≈ Ne ±λr . È accettabile solo la soluzione decrescente. 2 2 2 Studiando invece per per r → 0 predomina il termine con r 2 , rimane; tentando come soluzione Γ = r γ troviamo γ ( γ − 1 ) r γ − 2 − b r γ − 2 = 0 . Tenendo conto che b = l (l + 1 ) , si ha γ ( γ − 1 ) = l (l + 1 ) , che ha come soluzioni γ = −l e γ = l + 1 . Dato che l ≥ 0 , e che la fun- zione deve essere finita nell’origine, l’unica soluzione accettabile è la seconda. Ipotizziamo che la soluzione completa sia il prodotto delle soluzioni asintotiche per un polinomio Γ = Nr l +1 P (r ) e −λr . ( ) Sostituendo nell’equazione si ottiene rP '' (r ) + 2 (l + 1 − λr ) P ' (r ) + a − 2λ (l + 1 ) P (r ) = 0 . Considerando P (r ) = ∞ ∑c r i i si hanno i =0 P ' (r ) = ∞ ∑ (i + 1) c ri i +1 i =0 rP ' (r ) = ∞ ∑ (i + 1 ) ci +1r i +1 = i =0 ∞ ∑ icir i = i =1 ∞ rP '' (r ) = r ∑ (i + 2) (i + 1) ci +2r i i =0 ∞ ∑ ic r i i visto che tanto il termine con i = 0 è nullo i =0 = ∞ ∑ i =0 (i + 2) (i + 1 ) ci + 2r i +1 = ∞ ∑ (i + 1) i c ri = i +1 i =1 ∞ ∑ (i + 1) i c ri i +1 i =0 Sostituendo nell’espressione precedente e raccogliendo tutti i termini in una sola sommato∞ ria si ricava ∑ (i + 1) i c i =0 i +1 + 2 (l + 1 ) (i + 1 ) ci + 1 − 2λici + (a − 2λ (l + 1 ) ) ci r i dato che i vari termini della serie di potenze sono linearmente indipendenti, l’unico modo di avere una somma identicamente nulla è che i coefficienti siano tutti nulli: imponendo 49 (i + 1) i ci +1 + 2 (l + 1) (i + 1) ci +1 − 2λici + (a − 2λ (l + 1)) ci 2λ (i + l + 1 ) − a ricorrenza tra i coefficienti, ci +1 = ci . (2l + 2 + i ) (i + 1) Se studiamo lim i →∞ però il comportamento = 0 si ricava una relazione di asintotico della serie, troviamo che 2λ (i + l + 1 ) − a c i +1 1 = lim ~ 2λ , cioè la serie ha un andamento asintotico simile ad e 2λr , i →∞ ci i (2l + 2 + i ) (i + 1) con il risultato che Γ ~ Nr l +1e 2λre −λr non sarebbe integrabile a quadrato. È quindi necessario richiedere che i coefficienti si annullino per i > i , il che equivale a richiedere che ( ) 2λ i + l + 1 − a (2l + 2 + i )(i + 1) = 0. Se ne ricava una condizione su λ , dato che deve essere λ = numero quantico principale n = i + l + 1 , λ = λ2 = − En = − 2µE si 2 ottiene 2 2µZe 2 1 =− 2µ 24πε0 2n 2 a0 = 4πε0 una 2 me 2 µZ 2e 4 1 . 32π2ε02 n 2 ( ) a 2µZe 2 ; ricordando le espressioni a = 2 e 2n 4πε0 condizione di quantizzazione Ricordando 2 a . Introducendo il 2 i +l +1 che il per raggio di l’energia: Bohr è = 0.529 A ed approssimando la massa ridotta con quella dell’elettrone si 2 2µZe 2 1 Z 2e 2 1 = − può semplificare l’espressione in E n = − 2µ 24πε0 2n 8πε0a0 n 2 2 Inoltre, dato che l = n − i − 1 , i valori ammissibili per l sono l = 0, 1,… ,n − 1 Dato che R = Pn l (r ) c i +1 = c i è −a r Γ , concludiamo che le funzioni d’onda radiali sono Rn l = Nr l Pn l (r ) e 2n , dove r il polinomio definito dalla relazione ricorsiva sui coefficienti a (i + l + 1 ) − n . Se è possibile approssimare µ ≈ me allora si può più considerare n (2l + 2 + i ) (i + 1 ) Rn l = Nr l Pn l (r ) e −Z ao r L’atomo idrogenoide: conclusione Mettendo insieme i risultati dei paragrafi precedenti possiamo ora esprimere gli autostati di un atomo idrogenoide di carica nucleare Z ; le soluzioni sono identificate da tre numeri quantici, n , l , ml . La forma delle autofunzioni è ψn l ml = NYl ml ( ϑ, φ ) Rn l (r ) , con le armoniche sferiche e la funzione radiale definite nei rispettivi paragrafi. Ciascuna funzione è autostato, oltre che dell’hamiltoniano, del momento angolare e della sua componente lungo z . Rispettivamente gli autovalori sono E n = − Z 2e 2 1 2 , l = 8πε0a0 n 2 l (l + 1 ) e lz = ml . 2 Teoria delle perturbazioni indipendenti dal tempo Generalità Spesso può essere molto complicato risolvere per via analitica l’equazione di Schroedinger per un sistema cui è associata un hamiltoniano Ĥ . Molto spesso, però, è possibile ottenere solu50 ˆ =H ˆ ( 0) + H ˆ (1) , dove zioni approssimate, qualora l’hamiltoniano possa essere scomposto come H Ĥ( 0) è un hamiltoniano cui corrisponde una equazione di Scroedinger della quale sia nota la so- luzione analitica, e Ĥ (1) sia un termine perturbativo, il cui contributo sia molto minore di quello di Ĥ ( 0) , in un senso che si chiarirà in seguito. In tal caso si esprime la soluzione di prova ( 0) come combinazione lineare degli autostati di Ĥ , e si determinano i coefficienti della combinazione lineare che ottimizzino la corrispondenza con le soluzioni vere. Perturbazione a carico del potenziale Ĥ Un caso particolare riguarda una perturbazione a carico ˆ2 ˆ = − 2 p + V ( x ) + v ( x ) , dove sia nota la soluzione per H ˆ ( 0) = − H 2m del potenziale, con ˆ2 2 p + V (x ) . 2m { ( )} . Tale insieme costitui- Consideriamo l’insieme delle soluzioni al problema semplificato, ψi 0 sce una base ortonormale completa, e quindi è possibile esprimere una qualsiasi soluzione del problema completo come combinazione lineare di queste soluzioni base: ψk = ∑c ψi( ) . 0 ki i Le ψk funzioni sono soluzioni del problema indipendente dal tempo ˆ2 p ψ + V ( x ) ψk + v ( x ) ψk = E k ψk , mentre le funzioni base verificano l’equazione 2m k ˆ 2 ( 0) p 0 0 0 − 2 ψi + V ( x ) ψi( ) = E i( )ψi( ) . Se sostituiamo l’espressione di ψk come combinazione linea2m − 2 { ( )} otteniamo quanto segue: re di ψi ∑ i 0 cki − ∑ c (E ki ˆ 2 ( 0) p 0 ψi + V ( x ) ψi( ) + 2m 2 k − E i( 0) i ) ψ( ) = ∑ c 0 i ki ∑ c v (x )ψ( ) = ∑ c 0 ki i i ki E k ψi( 0) i v ( x )ψi( 0) i ( 0) ∗ moltiplicando per una particolare funzione imperturbata ψm ricaviamo ∑ c (E ki k − E i( i normalità si riduce vmi = ψm( ) v ( x ) ψi( 0 0) 0) ) ψ( ) 0 m a ψi( 0) ( = ∑c i ψm( ) v ( x ) ψi( 0 ki ) ∑c ckm E k − E m( ) = 0 , che per la condizione di orto- ψm( ) v ( x ) ψi( 0 ki 0) ed integrando sul dominio i 0) = ∑c v ki mi definendo i . L’equazione ricavata è esatta ma non molto utile, dato che esprime uno dei coefficienti della combinazione lineare in funzione di tutti gli altri e dell’energia dello stato perturbato, che è pure un’incognita. A questo punto entrano in gioco le approssimazioni. Per prima cosa si assume che gli stati del sistema siano perturbati poco dal potenziale v ( x ) . In ragione di questa ipotesi possiamo con- ≈ 1 i = j , e considerare le conseguenze sulla espressione << 1 i ≠ j siderare che i coefficienti siano cij ricavata sopra: ( ) ckm E k − E m( ) ≈ ckkvmk e quindi, considerando che ckk ≈ 1 ckm ≈ 0 vmk ( 0) (0) e in particolare, sempre visto che c kk ≈ 1 , E k − E k ≈ v kk , cosa sensata dal Ek − Em momento che afferma che la perturbazione sulle energie degli stati è dell’ordine di grandezza del valore di attesa del potenziale perturbante. 51 ( 0) Ora questo ci permette di avere E k ≈ v kk + E k , per cui ckm ≈ ( 0) Ek vmk = raccogliendo 0 − E m( ) + vkk −1 vmk v v = (0) mk (0) 1 + (0) kk (0) , che può essere ulteriormente Ek − Em v Ek − Em 0 0 E k( ) − E m( ) 1 + (0) kk (0) Ek − Em ( 0) ( 0) semplificata nell’approssimazione di avere v ( x ) << E k − E m ∀k ≠ m , ricavando ( ( ) ckm ≈ ) vmk 0 E k − E m( ) ( 0) In definitiva, abbiamo un modo molto semplice per stimare la perturbazione sugli autostati di un sistema indotta da una perturbazione sul potenziale trascurabile rispetto al potenziale base. È infatti sufficiente calcolare tutti gli elementi di matrice vmi = ψm v ( x ) ψi ( 0) ( 0) del potenzia- le perturbante con gli stati del sistema non perturbato, e si possono quindi ottenere, in prima approssimazione: ( 0) Le perturbazioni delle energie rispetto agli stati del sistema non perturbato E k − E k ≈ v kk Le funzioni d’onda perturbate come combinazione lineare ψk = ∑c ψi( ) , con i coefficienti 0 ki i dati da ckm v ≈ (0) mk (0) Ek − Em Perturbazione di un sistema a due livelli Consideriamo un sistema limitato a due livelli, per il quale siano noti gli atutostati di Ĥ ( 0) (0) ( 0) ( 0) ( 0) ˆ ψ1 = E 1 ψ1 soddisfano quindi H ( 0) ( 0) , che ˆ ψ2 = E 2 ψ2 . Se consideriamo come funzione di e H ˆ =H ˆ prova per l’hamiltoniano completo H (0) (0) ( 0) ( 0) (0) ˆ ( ) una combinazione lineare dei due stati non +H 1 perturbati ψ = a1ψ1 + a2ψ2 , e sostituiamo nell’equazione di Schroedinger per l’hamiltoniano ( 0) ( ( 0) ( 0) ( 0) ˆ ψ1 + a2H ˆ ψ2 = E a1ψ1 + a2ψ2 completo otteniamo a1H ) moltiplicando rispettivamente per ψ1( ) e ψ2( ) ed integrando su tutto il dominio otteniamo (sfruttando l’ortonormalità degli stati) 0 ∗ 0 ∗ due equazioni: 0 ˆ ψ1(0) + a2 ψ1(0) H ˆ ψ2(0) = Ea1 a1 ψ1( ) H 0 ˆ ψ1(0) + a2 ψ2(0) H ˆ ψ2(0) = Ea2 a1 ψ2( ) H ( 0) Definiamo come al solito gli elementi di matrice H ij ψi ˆ ψ (j ) ; diventa ora evidente come la H 0 soluzione delle due equazioni corrisponda in effetti alla soluzione di un sistema lineare della a1 ( H 11 − E ) + a2H 12 = 0 , con una condizione aggiuntiva sui coefficienti imposta dalla a1 H 21 + a2 ( H 22 − E ) = 0 normalizzazione di ψ . Perché un sistema di questo tipo ammetta soluzioni non banali occorre forma che il determinante della matrice dei coefficienti sia nullo ( H 11 − E ) H 21 H 12 = 0 , condizione soddisfatta (il determinante dà un’espressione qua( H 22 − E ) dratica in E ) per E ± = 1 H + H 22 ± 2 11 ( H 11 − H 22 ) 2 + 4H 12H 21 . Nel caso abbastanza comune che gli elementi diagonali della perturbazione siano nulli ( ( ) = 0 ), H kk 1 tale espressione si semplifica, E± = 1 E + E2 ± 2 1 (E1 − E2 ) 2 + 4ε2 , con 52 2 ( ) ( ) ( ) ε2 = H 12 H 21 = H 12 1 tenere 1 1 questo considerando l’hermiticità dell’operatore. I passaggi intermedi per ot- risultato vertono sulle seguenti considerazioni: H ik = H ik( ) + H ik( ) , 0 1 E i = k 0 0 0 ( 0) ˆ ( 0) ( 0) ψk = E k ψi( ) ψk( ) = E k δik . , visto che ψi H H ik( ) = k ≠ i k 0 Questa espressione si presta a varie considerazioni fisiche; in primo luogo, se ε2 = 0 , E + = E1 e E − = E 2 ; in secondo luogo, espandendo in serie si ricava E± = 1 4ε2 E 1 + E 2 ± ( E 1 + E 2 ) 1 + = ∆E 2 2 E + ≈ E1 − 1 1 4ε2 E + E ± E + E + + … , e quindi 1 ( ) 1 2 1 2 2 2 2 ∆E ε2 ε2 e E − ≈ E2 + ∆E ∆E Sistemi a più livelli Nel caso di un sistema che possa accedere a più di due livelli la trattazione è un po’ più complessa. In primo luogo, si scompone l’hamiltoniano in un termine principale ed una serie di ( 0) ˆ = λ 0H ˆ + λ 1H ˆ (1) + λ2H ˆ (2) + … ; il coefficiente λ serve unicamente a perturbazioni successive H tener traccia dell’ordine dell’approssimazione, e si porrà uguale a 1 alla fine del procedimento. In modo analogo, esprimiamo la funzione d’onda e l’energia perturbate come una somma di termini di approssimazione ψk = λ 0ψk( ) + λ1ψk( ) + λ2ψk( ) + … ed 0 successiva, 1 2 E k = λ 0E k( ) + λ1E k( ) + λ2E k( ) + … 0 1 2 ˆ ψk = E k ψk , e raccogliamo i termini Inseriamo ora tali espressioni in un’equazione della forma H con lo stesso esponente per λ . Otterremo un’espressione della forma ( ) ( ) ˆ (0)ψk(0) − E k(0)ψk(0) + λ1 H ˆ (0) − E k(0) ψk(1) + H ˆ (1) − E k(1) ψk(0) + … = 0 λ 0 H ∞ in forma più involuta ma più sintetica ∑ λ ∑ (Hˆ ( ) − E ( ) ) ψ( ) = 0 p n n =0 p k q k p ,q p +q =n Ciascun termine della sommatoria esterna deve essere posto uguale a zero, a dare così in set di equazioni: ˆ (0)ψk(0) − E k(0)ψk(0) = 0 H 0 ˆ ( ) − E k(0) ψk(1) + H ˆ (1) − E k(1) ψk(0) = 0 H ( ) ( ) ˆ (0)ψk(0) = E k(0)ψk(0) ; posIpotizziamo ora di conoscere le soluzioni dell’hamiltoniano principale, H siamo quindi esprimere le correzioni di primo ordine alle funzioni d’onda come combinazioni (1) lineari delle funzioni di ordine zero: ψk = ∑c ψ (j ) 0 kj j Se inseriamo questa espressione nella seconda equazione del sistema otteniamo ∑ c (Hˆ ( ) − E ( ) ) ψ( ) + (Hˆ ( ) − E ( ) ) ψ( ) = 0 , che considerando che Hˆ ( )ψ( ) = E ( )ψ( ) equivale ( ) ˆ ( )ψ ( ) − E ( ) ) ψ ( ) = E ( )ψ ( ) − H a ∑ c (E 0 0 k kj 0 j 1 1 k 0 k 0 0 j 0 0 j j j 0 kj 0 k j 0 j 1 k 0 k 1 0 k j Moltiplicando entrambi i membri per ∑ c (E kj j ( 0) j (0) − Ek )δ kj (1) (0) ˆ (1) ( 0) = E k − ψk H ψk ψk( )∗ 0 ed integrando sul dominio ricaviamo ; il primo membro è sempre zero, perché anche quando k = j e quindi il delta di Kroenecker è diverso da zero, il termine (E ( ) − E ( ) ) 0 j 0 k si annulla. 53 (1) ( 0) ˆ (1)ψk(0) = 0 , che possiamo riscrivere, H Abbiamo quindi ottenuto l’espressione E k − ψk (1) (1) con l’usuale notazione per gli elementi di matrice, E k = H kk , che ci dà la correzione al primo ordine dell’energia per lo stato ψk . Il metodo per ricavare la correzione al primo ordine per gli autostati è molto simile: partiamo (1) dalla stessa espressione di ψk = ∑c ∑ c ( E ( ) − E ( ) ) ψ( ) = E ( )ψ( ) − Hˆ ( )ψ( ) , ma que- ψ (j ) e 0 kj 0 kj j 0 k j 0 j 1 k 0 k 1 0 k j ( 0) ∗ sta volta moltiplichiamo per un generico ψm ; quando integriamo sul dominio otteniamo ∑ c (E ( ) − E ( ) ) δ 0 quindi kj 0 k j mj 1 0 ˆ (1)ψk(0) . = E k( )δmk − ψm( ) H m≠k Per otteniamo j ( ckm E m ( ) − E k( 0) 0 )=− 0 ˆ (1)ψk(0) , da cui ckm = ψm( ) H ( ) H mk 0 E − E m( ) 1 ( 0) k Correzioni di ordine maggiore La tecnica per ottenere la correzione di secondo ordine dell’energia è del tutto analoga a quella appena descritta: descriviamo la correzione della funzione d’onda come combinazione lineare (2) delle autofunzioni dell’hamiltoniano di partenza, ψk = ∑b kj ψ (j ) ; inseriamo ora tale termine 0 j nella (H terza ( 0) − Ek (2) k ( equazioni ricavabili per il sistema, ) ψ + (H − E ) ψ = 0 . ˆ ( ) − E ( ) ) ψ( ) + Si ottiene l’espressione ∑ b ( H ∑ c (Hˆ ( ) − E ( ) ) ψ( ) + (Hˆ ( ) − E ( ) ) ψ( ) = 0 ˆ ( 0) )ψ delle ˆ (1) + H (1) (1) − Ek ˆ (2) k 0 kj (2) ( 0) k k 0 k 0 j 1 j ( 0) ∗ Moltiplico per ψk 1 k kj 0 j 2 2 k 0 k j in modo analogo a quanto fatto per la correzione al primo ordine, e in- tegro sul dominio. Si ricava quindi, con considerazioni sull’ortonormalità degli stati analo- ∑c ghe a quelle fatte in precedenza ( ) − E k( ) = 0 , da cui otteniamo la correzione H kj( ) + H kk 1 kj 2 2 j (2) (2) al secondo ordine E k = H kk + ∑ ( ) ckj H kj( ) = H kk + 1 2 j ≠k H jk( )H kj( ) 1 1 ∑ E( ) − E( ) 0 k j ≠k 0 j Il principio variazionale Teorema variazionale e energia di stato fondamentale Il principio variazionale fornisce un metodo per ricavare abbastanza semplicemente l’energia di stato fondamentale per un sistema del quale non si conoscano le soluzioni analitiche. Il metodo si basa su un teorema che afferma che, dato un sistema di hamiltoniano Ĥ , con energia di stato fondamentale E 0 , per qualsiasi funzione ξ a quadrato integrabile il valore di attesa dell’hamiltoniano è minore di E 0 , E ξ = ˆξ ξ H ξ ξ ≤ E0 . La dimostrazione si basa sul fatto che (pur senza conoscere gli autostati {ψk } ), possiamo affermare che questi costituiscano una base ortonormale completa, e che quindi possiamo esprimere come combinazione lineare ξ = ∑c ψ n n . n Se ora inseriamo tale espressione nella formula per l’energia media associata alla funzione di prova ξ otteniamo E ξ = ∑c n ˆ ψn ψn H 2 n ∑c n ∑c E = ∑c 2 n n 2 n 2 n . n n 54 ∑c E ∑c E = ≥ ∑c ∑c 2 2 n Dato che per definizione E 0 ≤ E n , E ξ n n n 0 n 2 2 n = E 0 come volevasi dimostrare. n n n Rapporto di Rayleigh e metodo variazionale Un primo metodo per sfruttare questa proprietà consiste nell’utilizzare una funzione di prova dipendente da una serie di parametri v , φ = φ ( x, v) ; definiamo quindi rapporto di Rayleigh ε= ˆφ φ H φ φ = ε ( v) . Dato che il teorema variazionale ci assicura che ε ≥ E 0 , la migliore stima per l’energia di stato fondamentale sarà inf ε ( v) ; di solito le funzioni di prova hanno dipenv∈Dv denza continua dai parametri, in modo tale che inf ε ( v) = min ε ( v) , e che quindi possiamo v∈Dv v∈Dv cercare il minimo assoluto tra i minimi relativi ottenuti dalla condizione ∇ε = 0 (che in effetti ∂ε = 0 ∂v 1 si traduce nel sistema ). ∂ε =0 ∂vn L’energia ottenuta in questo modo può essere più o meno vicina all’energia di stato fondamentale, a seconda di quanto buona fosse la nostra scelta della funzione di prova e di quanti gradi di libertà le avessimo fornito. Metodo di Rayleigh-Ritz È un caso particolare del metodo precedente; come funzione di prova si sceglie una combinazione lineare dei membri di una base completa, magari proveniente da una versione semplificata del problema. I parametri variabili sono i coefficienti della combinazione lineare. Abbiamo quindi definito φ = ∑c ψ k k ; stabilendo inoltre l’usuale notazione per gli elementi k di matrice ˆ ψk = H jk e gli integrali si sovrapposizione ψ j ψk = S jk , il rapporto di ψj H ∑ c ψ Hˆ ∑ c ψ j j k j Rayleigh diventa ε = ∑c c = ∑c c k ∑c ψ ∑c ψ j j k j ∑c c H = ∑c c S ˆ ψk ψj H j k k k, j ψ j ψk j k k j k jk j k jk k, j k, j . k, j k La derivata rispetto al coefficiente m -esimo diventa ∂ε ∂cm ∑c H + ∑c H = ∑c c S k mk j k j j k ∑ c c H ∑ c S j k jm − jk k, j ∑ ∑c H ∑ 1 c jckS jk ∑c k, j k, j k k k mk jk + ∑c H j j jm mk + k k, j 1 c jckS jk k −ε ∑c c S j k k k mk + j jm j 2 jk k, j ∑c S ∑c S ∑c S j j jm = = k ( H mk − εSmk ) + ∑ c j ( H jm − εS jm ) j 55 Occorre che tali espressioni si annullino; dato che S ab = S ba e H ab = H ba l’operatore hermitiano, basta che sia nulla l’espressione ∑c k essendo ( H mk − εSmk ) . k Ripetendo per tutte le derivate si arriva ad un sistema lineare della forma ∑c k ( H 1k − εS1k ) = 0 k ( H mk − εSmk ) = 0 k ∑c k Dato che è implicita una condizione aggiuntiva sui coefficienti, derivante dalla normalizzazione della funzione d’onda risultante dalla combinazione lineare, il sistema è sovradeterminato, e le soluzioni non banali si avranno quindi solo quando il determinante della matrice dei coefficienti det {H ik − εS ik } = 0 . ( ) Tale equazione secolare determinerà un numero di soluzioni (eventualmente coincidenti) pari alla dimensionalità della base; la minore di tali soluzioni sarà la nostra miglior stima (per lo meno un limite superiore) dell’energia di stato fondamentale per il sistema. Perturbazioni dipendenti dal tempo Generalità La teoria delle perturbazioni dipendenti dal tempo si occupa di definire il comportamento di sistemi sottoposti a perturbazioni variabili nel tempo. Questo argomento è tanto più importante per il fatto che i casi in cui l’equazione di Schroedinger dipendente dal tempo ammette soluzioni analitiche sono molto pochi. Diventa quindi cruciale avere la possibilità di studiare in modo approssimato il comportamento di un sistema a potenziale costante sottoposto ad una perturbazione dipendente dal tempo. Il sistema a due livelli Come per il caso indipendente dal tempo, studiamo in primo luogo un sistema in grado di as- ˆ =H ˆ sumere solo due stati, descritto da un’hamiltoniano della forma H ( 0) ˆ( +H 1) (t ) . Siano ψa e ψb gli autostati dell’hamiltoniano non perturbato, tali da soddisfare le equazioni indipendenti ( 0) ( 0) ˆ ψa = E a ψa e H ˆ ψb = E b ψb , e siano gli stati normalizzati ad 1. dal tempo H In virtù della completezza del set di base, ogni stato del sistema può essere espresso come combinazione lineare, ψ = c a ψa + cb ψb ; dato che nendo una condizione sui coefficienti. Inserendo la dipendenza dal Ψ (t ) = ca ψa exp ( − i t E a 2 2 ψa ψb = δab , ψ ψ = ca + cb = 1 , impo- tempo ) + cb ψb exp ( − i t E b ) otteniamo la funzione d’onda Ora occorre chiedersi cosa succede considerando anche la perturbazione al primo ordine. Un modo per inserire la dipendenza dal tempo della funzione d’onda è permettere ai coefficienti di variare nel tempo. La nostra funzione d’onda avrà quindi la forma Ψ (t ) = c a (t ) ψa exp ( − i t E a ) + cb (t ) ψb exp ( − i t E b ) . ˆΨ = i Inseriamo tale espressione nell’equazione di Schroedinger dipendente dal tempo, H ∂Ψ : ∂t Sostituendo (e considerando implicitamente la dipendenza dal tempo dei coefficienti e dell’hamiltoniano della perturbazione) otteniamo c a exp ( − i t E a ˆ ( 0)ψ a )( H ) ˆ ( )ψa + cb exp ( − i t E b +H 1 ˆ ( 0)ψ b )( H ) ˆ ( )ψ b = +H 1 56 ca ψa exp ( − i t E a i cb ψb exp ( − i t E b i c a ψa exp ( − i t E a i c ψ exp ( − i t E b b b ) − i E a caψa exp ( − i t E a ) + = ) − i E b cb ψb exp ( − i t E b ) ) + ca exp ( − i t E a ) E aψa + c t E E + − ψ exp i ) b ( ) b b b Semplificando i termini uguali per via del fatto che ψa ψb e sono autostati dell’hamiltoniano imperturbato, otteniamo l’equazione ˆ (1)ψa − i ) (caH exp ( − i t E a ) ca ψa + exp ( − i t E b ˆ (1)ψb − i ) (cb H ) c b ψb = 0 Come al solito isoliamo ψa e ψb moltiplicando per i rispettivi complessi coniugati ed integrando; grazie all’ortogonalità dei due stati otteniamo rispettivamente ) (ca exp ( − i t E a ) (cb exp ( − i t E b ) c ) + exp ( − i t E ˆ (1)ψa − i ca + exp ( − i t E b ψa H ) cb ˆ (1)ψb = 0 ψa H ˆ (1)ψb − i ψb H ) ca ˆ (1)ψa = 0 ψb H b a Utilizzando la solita notazione per gli elementi di matrice e riordinando le equazioni: ca = − i (1) c a H aa + exp ( − i t ( E b − E a ) ) c H ( ) cb = − i (1) cb H bb + exp ( − i t ( E a − E b ) ) c H ( ) (1) b a 1 ab 1 ba (1) Nel caso (frequente) in cui H aa = H bb = 0 , e ponendo ω0 = Eb − Ea le espressioni si riduco- no a ca = − i ( ) e − i t ω H ab cb cb = − i ( ) e i t ω H ba ca 1 0 1 0 Abbiamo quindi un sistema di due equazioni differenziali accoppiate, che ci permettono di ricavare (almeno in via teorica) l’evoluzione temporale dei coefficienti della combinazione lineare. Le due equazioni possono essere risolte in modo generale con un processo di approssimazioni successive, considerando la perturbazione piccola rispetto alle energie dello stato non perturbato. Consideriamo come stato iniziale del sistema ψ = ψa , quindi c a ( 0) = 1 e cb ( 0) = 0 ORDINE ZERO: considerando la perturbazione praticamente nulla, i coefficienti rimarrebbero inalterati nel tempo. Quindi una prima approssimazione sarebbe c a (t ) = 1 cb (t ) = 0 ( 0) ( 0) ORDINE UNO: inseriamo i coefficienti di ordine zero nella coppia di equazioni, ottenendo così un’espressione esplicità delle derivate prime: ca = − i ( ) e − i t ω H ab cb = 0 cb = − i ( ) e i t ω H ba ca = − 1 0 ( 0) 1 0 ( 0) i ( ) e i t ω H ba 1 0 Possiamo adesso ricavare le espressioni al primo ordine delle due costanti: (1) ca = 1 (1) cb = − i t ∫e i τω0 0 ( ) H ba ( τ) d τ 1 va notato che la condizione di normalizzazione non è più rispettata; ciò dipende dal fatto di stare utilizzando un’espressione approssimata ORDINE DUE: ripetiamo il procedimento con i coefficienti trovati: ca = − i (1) ( ) e − i t ω H ab cb = 0 1 1 2 ( ) e − i t ω H ab 0 1 t ∫e 0 i τω0 ( ) H ba ( τ) d τ 1 57 i cb = − i (1) ( ) e i t ω H ba ca = − 1 0 ( ) e i t ω H ba 1 0 Troviamo quindi risolvendo (2) ca = 1 − i (2) cb = − 1 2 t e − i τ ' ω H (1) τ ' ) ab ( 0 ∫ ∫e t i τω0 0 0 ∫ τ' (1) e i τω H ba ( τ) d τ d τ ' 0 0 ( ) H ba ( τ) d τ 1 Il procedimento può essere reiterato a piacimento, ottenendo via via approssimazioni sempre più fedeli alle soluzioni esatte. Sistemi a molti livelli ˆ =H ˆ ( 0) + H ˆ (1) (t ) ; gli auConsideriamo ora il caso di un sistema descritto da un’hamiltoniano H ˆ ( 0 ) ψn = E n ψn . tostati dell’hamiltoniano imperturbato sono tali da soddisfare H In virtù della completezza del set di base, ogni stato del sistema può essere espresso come combinazione lineare, ψ = ∑c ψ k k k ; per garantire la normalizzazione della funzione, dato che ∑c la base è ortonormale, deve valere 2 k =1. k Consideriamo quindi la funzione d’onda dipendente dal tempo; oltre al termine esponenziale dovuto all’hamiltoniano imperturbato, occorrerà consentire una ulteriore variabilità temporale, espressa dalla dipendenza dei coefficienti dal tempo: Ψ (t ) = ∑c k (t ) ψk exp ( − i t E k ) k Inserendo tale funzione nella equazione di Schroedinger con l’hamiltoniano completo otterremo quanto segue: ∑c k ˆ ( 0)ψk )( H exp ( − i t E k k ) ∑ exp ( − i t E ˆ (1)ψk = +H k k ) i ck ψk + E kck ψk , con i ter- mini segnati che si elidono grazie al farro che le ψk sono autostati dell’hamiltoniano non perturbato. Abbiamo ora un’equazione della forma ∑c k exp ( − i t E k ˆ (1)ψk )H k = ∑i ck exp ( − i t E k ) ψk k dalla quale possiamo estrarre equazioni relative a ciascun autostato moltiplicando per ψ j ∗ ed integrando sul dominio; otteniamo infatti una serie di equazioni, con la solita notazione sugli elementi di matrice ∑c k exp ( − i t E k (1) ) H mk k da qui, definendo ωmk = = i cm exp ( − i t E m Em − Ek , cm = 1 i ) ∑c e k i ωmkt ( ) H mk 1 k Possiamo ora risolvere per approssimazioni successive. Definiamo lo stato iniziale (facciamo uso di una notazione vettoriale per condensare tutti i coefficienti in un solo termine): c ( 0) = c0 . Ora, come per il sistema a due livelli, possiamo calcolare: ORDINE ZERO: la perturbazione è praticamente nulla, e i coefficienti rimangono costanti: c( 0) (t ) = c0 ORDINE UNO: inseriamo i coefficienti di ordine zero nelle equazioni e le integriamo, ottenendo: cm( ) (t ) = ( c0 )m − 1 i ∑ ∫ c ( ) ( τ) e t k 0 0 k i ωmk τ ( ) H mk ( τ) d τ 1 Come nel caso a due stati, non è grantito che sia rispettata la condizione di normalizzazione. 58 ORDINE DUE: il procedimento si può reiterare per dare approssimazioni di ordine superiore: cm( ) = 2 1 i ∑ c ( )e 1 k i ωmkt ( ) H mk , da cui 1 k cm( ) (t ) = ( c0 )m − 2 i ∑ ∫ c ( ) ( τ) e t 1 k 0 k i ωmk τ ( ) H mk ( τ) d τ 1 e così via L’effetto fotoelettrico Richiami di elettromagnetismo classico La teoria dell’elettromagnetismo classico descrive le onde luminose come un campo elettrico oscillante in modo sinusoidale; l’intensità della luce (definita come potenza per unità di superficie) è direttamente proporzionale al modulo del campo elettrico oscillante. Dalle equazioni di Maxwell ricaviamo che un’onda elettromagnetica piana si propaga nello spazio sotto forma di un campo elettrico ed uno magnetico perpendicolari tra loro e rispetto alla direzione di propagazione, con un rapporto tra i moduli dei campi dato da 1 B , e con una velocità di propagazione c = ε0µ0 E = 1 ε0µ0 La densità di energia di un campo elettromagnetico è u = 1 1 2 B = ε0E2 per un’onda ε E2 + 2 0 2µ0 elettromagnetica; il flusso di energia attraverso una superficie d S perpendicolare alla direzione di propagazione delle onde in un intervallo di tempo dt è uc d t d S , per cui l’intensità dell’onda incidente è uc = c ε0E2 Considerando un campo variabile in modo sinusoidale (come di solito vengono descritte le onde elettromagnetiche) E = E 0 sin 2πνt , l’intensità è da intendersi come media sul periodo, quindi I = c ε0 1 T ∫ T 0 2 E d t = c ε0E 02ν ∫ 1 0 ν sin2 2πνt d t = 1 cε E 2 2 0 0 In modo più complesso è possibile dimostrare che le onde elettromagnetiche trasportano anche quantità di moto; in particolare, quando un oggetto assorbe completamente una quantità di energia elettromagnetica U , questo acquisisce anche una quantità di moto p= U c L’esperimento L’apparato sperimentale per la verifica dell’effetto fotoelettrico consta in due placche di metallo in un contenitore sotto vuoto, alle equali è possibile applicare una d.d.p. , da un amperometro per misurare la corrente che passa nel circuito e da una sorgente di luce che colpisce una delle due placche. Si osserva che quando il catodo viene illuminato ∆V da una luce di frequenza appropriata si misura una corrente nel circuito; questa corrente può essere spiegata ammettendo che degli elettroni vengano emessi dal catodo con una certa energia cinetica (effetto fotoelettrico), e che questi elettroni raggiungano quindi l’anodo producendo la corrente. Si osserva una serie di fenomeni difficili da spiegare ricorrendo alla fisica classica: A 59 L’intensità della corrente fotoelettrica dipende dall’intensità della luce incidente, ma si osserva che esiste una frequenza della luce al di sotto della quale la corrente è nulla qualsiasi sia l’intensità della luce incidente. Se si applica una differenza di potenziale tra le due piastre, in modo da ostacolare il passaggio di corrente tra le piastre, si osserva che la d.d.p. necessaria a fermare la corrente (stopping potential) dipende linearmente dalla frequenza della luce, ed è indipendente dall’intensità. Lo stopping potential dà un’indicazione dell’energia cinetica massima degli elettroni, visto che il lavoro compiuto da un elettrone per passare dal catodo all’anodo è e ∆V , e per poter arrivare all’anodo deve aver energia cinetica iniziale pari almeno a K max = e ∆V . L’emissione di elettroni a seguito dell’illuminazione è praticamente immediata. Analizzando il problema con gli strumenti della fisica classica questi effetti appaiono inspiegabili infatti: La forza agente su un elettrone nel metallo in presenza del campo elettrico oscillante dovuto all’onda elettromagnetica è eE ; dato che il modulo massimo del campo magnetico è proporzionale all’intensità della luce incidente, dovremmo aspettarci che l’elettrone acquisti un’energia cinetica maggiore sotto l’effetto di una luce più intensa; questo non succede. Per lo stesso motivo l’emissione dovrebbe essere possibile ad ogni frequenza, purchè l’intensità luminosa sia sufficiente. Dato che l’energia luminosa è uniformemente distribuita su tutta la superficie del metallo, mentre ciascun elettrone può catturare energia solo da un’area limitata, con una luce sufficientemente debole si dovrebbe poter misurare un ritardo nell’emissione, dovuto al tempo necessario a trasferire energia dall’onda all’elettrone. In realtà l’emissione è comunque istantanea. La spiegazione dell’effetto fotoelettrico e i fotoni La spiegazione dell’effetto fotoelettrico fu data da Einstein nel 1905, ipotizzando che l’energia di un’onda elettromagnetica non fosse distribuita in modo continuo nello spazio, ma fosse concentrata in quanti di energia in seguito chiamati fotoni. Le proprietà ondulatorie delle onde elettromagnetiche (diffrazione, interferenza…) sono spiegabili come effetto medio della sovrapposizione dell’effetto di moltissimi fotoni, che evidentemente non si propagano come corpuscoli classici, ma con caratteristiche tipiche delle onde. Inoltre si ipotizza che l’energia dei fotoni dipenda dalla frequenza della luce che compongono, tramite la relazione E = h ν , dove h = 6.6262 × 10−34 J ⋅ s è la costante di Planck, e che in un evento fotoelettrico un fotone venisse completamente assorbito da un elettrone del metallo. L’energia cinetica dell’elettrone dopo l’evento è K = h ν − w 0 , dove w 0 è detta funzione lavoro, ed esprime il lavoro minimo che va speso per allontanare un elettrone dalla superficie del metallo. Sotto queste ipotesi, le anomalie dell’effetto fotoelettrico risultano spiegate, infatti: L’energia cinetica degli elettroni emessi non dipende in alcun modo dall’intensità della luce incidente; aumentare l’intensità significa solo aumentare il numero di fotoni incidenti, e quindi di elettroni emessi (e quindi l’intensità di corrente). Se i fotoni hanno un’energia h ν < w 0 , gli elettroni non acquisiscono energia sufficiente a lasciare la placca di metallo, e quindi non si registra corrente. L’energia luminosa non è più dispersa su tutta la superficie, ma concentrata in quanti localizzati; per quanto l’intensità luminosa sia debole, saranno sempre presenti fotoni in grado di allontanare gli elettroni che colpiscono; l’emissione è quindi istantanea in ogni caso. È verificata la relazione lineare tra lo stopping potential e la frequenza della radiazione incidente, infatti K = e ∆V = h ν − w 0 per cui ∆V = w h ν− 0 e e Per inciso, è possibile calcolare il numero medio di fotoni per unità di volume per una radiazione elettromagnetica di frequenza ν ed intensità I : la densità di energia del campo elettrico deve essere uguale alla densità di fotoni per l’energia di ciascuno, ed inoltre I = uc , per cui nh ν = u = I I e quindi n = . c h νc 60 Corda oscillante e equazione delle onde L’equazione delle onde Consideriamo una corda di densità lineare µ sottoposta ad una tensione di modulo T ; la corda viene ora allontanata dalla sua posizione di equilibrio, in modo tale che il suo stato possa essere descritto da una funzione che dà lo scostamento dall’equilibrio in funzione della posizione, y = f ( x ) . Consideriamo quindi un segmento di corda; per spostamenti piccoli la lunghezza del segmento sarà quasi uguale a d x , quindi la sua massa sarà µ d x La forza agente sui due estremi del segmento sarà uguale in modulo alla tensione agente sulla corda, e sarà tangente alla corda nei due punti; chiamiamo gli angoli formati dalla corda con l’orizzontale nei due estremi rispettivamente θ e θ + d θ . Le due forze saranno quindi, in componenti cartesiane, F1 = T cos θˆ i + T sin θˆj e T +d θ θ F θ T dx F2 = T cos ( θ + d θ ) ˆ i + T sin ( θ + d θ ) ˆj e la forza risultani + T sin ( θ + d θ ) − sin θ ˆj ; moltiplicando e te sarà quindi F = F2 − F1 = T cos ( θ + d θ ) − cos θ ˆ e considerando che è un’infinitesimo abbiamo dθ dθ cos ( θ + d θ) − cos θ ˆ sin ( θ + d θ ) − sin θ ˆ d θi + T d θj ∼ −T sin θ d θˆ i + T cos θ d θˆj F =T dθ dθ La componente orizzontale è un’infinitesimo di ordine superiore, visto che consideriamo θ dividendo per molto piccolo, quindi in seguito consideriamo unicamente (con l’ulteriore approssimazione dy , esprimiamo il differenziale cos θ ≈ 1 ) F = T d θˆj ; per finire, dato che θ = arctan dx d2 y 1 1 dθ = d x , con l’ulteriore approssimazione 2 2 ≈ 1 , sempre grazie al 2 d x dy dy 1+ 1+ dx dx fatto che consideriamo solo piccoli spostamenti. Per finire, possiamo scrivere l’equazione del moto per il segmento di corda: dato che ∂2y ∂2y ∂2y d x siamo in grado di ricavare l’equazione differenziale nota = µdx 2 =T 2 ∂t ∂t ∂x 2 ∂2y µ ∂2y − = 0; come equazione delle onde, ∂x 2 T ∂t 2 F =m Le soluzioni Si osserva che una soluzione dell’equazione è y = y 0 cos (kx − ωt ) , che inserita nell’equazione dà −k 2y + ω2 T µ 2 T ω y = 0 , che è verificata se 2 = , cioè ω = k . Le equazioni che mettono in k µ T µ relazione la pulsazione ed il numero d’onda sono dette relazioni di dispersione. Inoltre è facile ∂y dx ω verificare che per un’onda sinusoidale la velocità di fase è = − ∂t = y ∂ k dt ∂x Onde stazionarie Una seconda classe di soluzioni (formata in effetti da una combinazione lineare delle precedenti) comprende funzioni della forma y = sin kx cos ωt . Questo tipo di soluzioni vengono dette onde stazionarie, perché i nodi ed i ventri della perturbazione non cambiano posizione nel tempo; infatti se x = n π , y = 0 per ∀t . k 61 Le onde stazionarie sono la soluzione più adatta a descrivere il comportamento di una corda vincolata agli estremi, per cui lo spostamento deve essere sempre nullo per x = 0, L . Questo impone la condizione aggiuntiva L = n π π , cioè k = n . k L Effetto Compton Elementi di meccanica relativistica Ci limitiamo qui a dare alcuni risultati relativi alla toria della relatività ristretta, senza accennare alle dimostrazioni ed alla teoria stessa. L’energia totale di un corpo di massa a riposo m0 e velocità v è E = la massa m02c 4 Per relativistica come m= m0 1 − v2 c2 , m0c 2 1 − v2 c2 E 2 = m2c 4 = ; definendo m02c 4 c2 = c2 − v2 m02 c2 − v2 + v2 v2 = m02c 4 1 + 2 = m02c 4 + v 2c 2 = m02c 4 + p 2c 2 . 2 2 2 2 2 1−v c c −v c −v inciso, espandendo E = m0c (1 − v c 2 2 ) 1 2 − 2 abbiamo E = m0c 2 + in serie E = m0c 2 rispetto 1 − v2 c2 1 v2 3 v4 = m0c 1 + + + .... 2 4 2c 8c 2 −1 2 alla velocità abbiamo . Fermando la serie al secondo ordine 1 m v 2 , cioè l’energia a riposo più l’energia cinetica classica. 2 0 X R Apparato sperimentale Un fascio monocromatico collimato di raggi X è fatto incidere su un bersaglio di grafite; si misurano a veri angoli i raggi diffusi, individuando tramite un diffrattometro (con un cristallo di nota distanza reticolare) le lunghezze d’onda dei raggi X diffusi dal bersaglio. Si nota che, mentre il raggio incidente è monocromatico, quello diffuso presenta due diverse lunghezze d’onda, una uguale a quella incidente, l’altra diversa di un valore ∆λ dipendente dall’angolo di diffusione. CRISTALLO SCATTERER θ RIVELATORE Inoltre lo shift ∆λ non dipende dal materiale di cui è composto il bersaglio. Interpretazione La spiegazione dell’effetto Compton è possibile accettando l’ipotesi dei fotoni di Einstein; in questo caso i raggi X incidenti sul bersaglio di grafite hanno energia E = h ν . Consideriamo l’espressione relativistica per l’energia E = m0c 2 1 − v2 c2 ; dato che la velocità dei fotoni è per de- finizione v = c , il denominatore si annulla, e l’unico modo di avere un contenuto energetico finito è che anche la massa a riposo del fotone sia nulla. Da questa considerazione, e utilizzando l’altra espressione per l’energia E = m02c 4 + p 2c 2 = pc , da cui otteniamo un’espressione per il momento del fotone, p = h ν h = . c λ Dal momento che la frequenza anomala registrata non dipende dal materiale del bersaglio, si ipotizza che l’effetto non sia dovuto ad un’interazione con i nuclei, ma soltanto con gli elettro62 ni. Inoltre si considerano gli elettroni inizialmente fermi, dal momento che l’energia di un fotone X è molti ordini di grandezza più grande di quella di un fotone ultravioletto (in grado di strappare gli elettroni più esterni da un metallo, e quindi dotato di un’energia simile a quella degli elettroni meno intensamente legati ai nuclei). Consideriamo quindi l’urto elastico tra il fotone e l’elettrone inizialmente in quiete; il momento totale del sistema è quello del fotone. Dopo l’urto il fotone e l’elettrone diffondono rispettivamente ad angoli θ e φ rispetto alla direzione iniziale del fotone; la conservazione del momento impone che valgano p 0 = p ' cos θ + p cos φ p 0 − p ' cos θ = p cos φ ⇒ 0 = p ' sin θ − p sin φ λ λ p ' sin θ = p sin φ ⇒ φ , θ Eleviamo al quadrato le espressioni e sommiamo membro a membro: (p0 − p ' cos θ) 2 + p '2 sin2 θ = p 2 (sin2 φ + cos2 φ ) da cui p 02 + p '2 − 2p 0p ' cos θ = p 2 La conservazione dell’energia totale relativistica impone che h ν 0 + m0c 2 = h ν '+ m02c 4 + K cioè c (p 0 − p ') = K Inoltre dall’espressione (K + m c ) 2 2 0 = m02c 4 + p 2c 2 ricaviamo K 2 c 2 + 2Km0 = p 2 , per cui p 2 = (p 0 − p ') + 2cm0 (p 0 − p ') 2 Sostituendo nell’espressione ricavata dalla conservazione del momento abbiamo p 02 + p '2 − 2p 0p ' cos θ = (p 0 − p ') + 2cm0 (p 0 − p ') 2 −p 0p ' cos θ + 2p 0p ' = 2cm0 (p 0 − p ') dividendo per 2p 0p ' 1 1 1 − cos θ = cm0 − p ' p0 Utilizzando la relazione p = h h ricaviamo λ '− λ 0 = (1 − cos θ) cm0 λ Abbiamo quindi un’equazione che lega lo spostamento della lunghezza d’onda del raggio anomalo all’angolo di diffusione del fotone; ∆λ = λc (1 − cos θ ) , con λc = h = 0.0243 A cm0 La presenza nel raggio diffuso di fotoni con lunghezza d’onda uguale a quella iniziale può essere spiegata ammettendo che i fotoni X non siano in grado di allontanare gli elettroni più profondi; in questo caso l’urto avviene con tutto l’atomo, e nell’urto elastico il fotone conserva quasi totalmente la sua quantità di moto Diffrazione Legge di Bragg θ Consideriamo un fronte d’onde elettromagnetiche incid denti su un cristallo; i raggi saranno riflessi dai vari atomi del reticolo; i raggi riflessi da atomi dello stesso piano cristallino saranno in fase se l’angolo ri riflessione è uguale all’angolo di incidenza, per ovvie ragioni geometriche; invece i raggi riflessi dal piano cristallino inferiore saranno in fase se la differenza di cammino ottico è uguale ad un numero intero di lunghezze d’onda; deve quindi essere verificata la condizione 2d sin θ = n λ . 63 Onde di materia L’ipotesi di de Broglie Così come era stato dimostrato che alle onde elettromagnetiche sono associate particelle, e che molti fenomeni fisici sono spiegabili sulla base di questa interpretazione corpuscolare della radiazione, de Broglie propose l’ipotesi che anche le particelle materiali con massa a riposo non nulla avessero un’onda associata che ne descrivesse il moto; in particolare ipotizzo che le relazioni tra energia e momento della particella e frequenza e lunghezza d’onda associate fossero uguali a quelle proposte per i fotoni, E = h ν e p = h λ . Negli esperimenti ordinari tali proprietà ondulatorie non vengono osservate perché, per via del valore molto piccolo della costante di Planck, anche per oggetti molto piccoli la lunghezza d’onda associata è troppo piccola per essere rivelata. Ad esempio, per un elettrone di energia la lunghezza d’onda associata sarebbe di 100 eV λ= 6.62 × 10−34 J ⋅ s = 1.2 A 2 ⋅ 9.1 × 10−31 ⋅ 100 eV ⋅ 1.6 × 10−19C L’esperimento di Davidsson e Gerner e quello di Thomson Le proprietà ondulatorie della materia furono verificate mediante esperimenti di diffrazione di elettroni; in pratica Davidsson e Gerner eseguirono un esperimento in riflessione, mentre Thomson in trasmissione (tipo Debye-Scherrer) su un fascio di elettroni accelerati. Dato che le distanze interatomiche sono dell’ordine di grandezza della lunghezza d’ondea dell’onda di materia associata all’elettone, venivano registrate figure di interferenza simili a quelle prodotte con raggi X in condizioni analoghe. Esperimenti successivi dimostrarono fenomeni di interferenza e diffrazione anche per neutroni ed atomi di elio, sempre con risultati quantitativi in accordo con l’ipotesi ondulatoria di de Broglie. Principio di complementarietà Materia e radiazioni esibiscono entrambi un comportamento duale, nel senso che in certi esperimenti se ne osserva un comportamento ondulatorio, mentre in altri si verificano fenomeni di natura corpuscolare. Nessun esperimento, però, è in grado di mostrare contemporaneamente i due aspetti, che sono dunque complementari. L’atomo di Bohr L’atomo di Rutherford e il problema della stabilità Osservando la diffusione di particelle α da parte di una sottile lamina d’oro, Rutherford dedusse che la struttura dell’atomo doveva presentare la gran parte della massa e tutta la carica positiva concentrati in un volume molto più piccolo di quello dell’atomo. Se ne dedusse quindi un modello atomico con un nucleo massiccio nella quale è concentrata tutta la carica positiva, e degli elettroni molto leggeri che orbitano attorno al nucleo. Un modello del genere, se riusciva a spiegare i risultati dello scattering di particelle α introduceva un problema di stabilità: orbitando attorno al nucleo gli elettroni sarebbero inevitabilmente soggetti ad un moto accelerato, e secondo l’elettromagnetismo classico dovrebbero emettere energia sotto forma di onde elettromagnetiche, perdendo energia fino a collassate sul nucleo. Lo spettro di emissione Facendo attraversare da scariche elettriche i vapori di un elemento, gli atomi presenti si eccitano per le collisioni tra loro e l’interazione con la scarica elettrica, e diseccitandosi emettono luce; analizzando con un prisma od un reticolo di diffrazione la luce emessa si osserva che questa non presenta uno spettro continuo, ma piuttosto una serie di linee discrete, disposte secondo schemi più o meno complicati. Per l’idrogeno si trova un’espressione empirica piuttosto semplice per le frequenze di queste righe spettrali; in particolare la formula misura il numero d’onda (l’inverso della lunghezza 64 d’onda), e ha la forma κ= 1 1 1 = Rh 2 − 2 λ m n n >m, dove la costante vale Rh = 10967757 m −1 I postulati di Bohr 1. 2. 3. 4. Per spiegare l’apparentemente contraddittoria stabilità degli atomi, e per rendere conto delle espressioni empiriche per gli spettri atomici, Bohr introdusse alcuni postulati, sui quali costruire un modello atomico che fosse in accordo quantitativo con i dati sperimentali. Un elettrone in un atomo si muove in un’orbita circolare attorno al nucleo, obbedendo alla legge di Coulomb ed alla meccanica classica. All’elettrone non è consentito muoversi su una qualsiasi orbita del continuo consentito dalla meccanica classica, ma può muoversi solo sulle orbite il cui momento angolare associato è multiplo intero di . Un elettrone che si muova in una di queste orbite non emette radiazione nonostante sia accelerato. La sua energia totale rimane costante. Quando l’elettrone passa da un’orbita all’altra emette energia elettromagnetica, sotto forma di un’onda di frequenza pari alla differenza di energia tra i due livelli diviso la costante di Planck h Questi postulati continuano ad essere contraddittori, in quanto in parte si rifanno alla meccanica classica (le orbita in un potenziale Coulombiano), in parte la contraddicono (l’elettrone non irraggia, le orbite sono quantizzate). Una giustificazione piuttosto artificiosa della quantizzazione del momento angolare può essere data in questi termini: consideriamo valida l’ipotesi di de Broglie; all’elettrone è quindi associata una funzione d’onda, e deve trattarsi di un’onda stazionaria; per avere un’onda stazionaria lungo una circonferenza di raggio r la lunghezza d’onda deve essere un sottomultiplo della lunghezza della circonferenza, cioè 2πr = n λ ; dato che per de Broglie λ = h p , otteniamo R che deve essere pr = L = n , cioè il momento angolare è quantizzato. Ricaviamo ora nel dettaglio le varie quantità caratteristiche dell’atomo di Bohr, ottenendo anche un’espressione per le righe di emissione dello spettro dell’atomo di idrogeno. Consideriamo un atomo costituito da un nucleo puntiforme di carica +Ze e massa M e da un elettrone di carica −e e massa m . Consideriamo quindi l’elettrone in moto circolare attorno al nucleo, e consideriamo la sua massa trascurabile rispetto a quella del nucleo (in modo da non dover ragionare in termini di massa ridotta). L’equilibrio meccanico dell’elettrone è determinato dalla condizione tiplicando entrambi i membri per mr 2 otteniamo Ze 2 1 v2 ; mol= m 4πε0 r 2 r 1 1 Ze 2 m = m2v 2r 2 = L2 = n 2 4πε0 r r 2 1 ; il ragr n2 2 ; per n = 1 e Z = 1 otteniamo il cosiddetto raggio di Ze 2m 4πε0 2 = 0.529 A . Bohr, spesso usato come unità di misura per la fisica atomica; a0 = e 2m gio dell’orbita è quindi r = 4πε0 Ricaviamo quindi le altre quantità, la velocità del moto v = ziale V = − Ze 2 mZ 2e 4 =− 2 4πε0r (4πε0 ) n 2 2 e l’energia cinetica K = n Ze 2 , l’energia poten= mr 4πε0n 1 mZ 2e 4 mv 2 = 2 2 ( 4πε0n ) 2 . L’energia 65 totale di un elettrone su un’orbita caratterizzata dal numero quantico n è quindi E = K +V = − mZ 2e 4 1 Z2 2 1 . = − 2 2 2ma02 n 2 2 ( 4πε0 ) n Ora, in una transizione tra due livelli n1 e n2 si avrà emissione di un fotone di energia h ν = ∆E ; passando ai numeri d’onda, questo equivale ad una riga di numero d’onda 2 1 1 ν κ= = − , espressione che corrisponde a quella empirica; il valore calcolato 2 c 2ma0 ch n2 n1 per la costante di proporzionalità è 10973731 m −1 , in ottimo accordo col valore sperimentale Rh = 10967757 m −1 . Momento magnetico orbitale Momento magnetico associato ad un elettrone dotato di momento angolare La discussione di questo punto sarà semiclassica, dato che la trattazione interamente quantomeccanica è piuttosto complessa; fortunatamente i risultati coincidono, e questo giustifica il procedimento approssimato. Consideriamo l’elettrone come se orbitasse su un’orbita circolare di Bohr di raggio r ; essendo una carica in moto, produce una corrente i = q e v . Da un punto di vista classico =− T 2πr l’orbita si può considerare come una spira circolare percorsa da corrente, cui è quindi associato un momento magnetico µ = iA = − utilizzando le costanti µ B = e e e v πr 2 = − mvr = − L . Tale espressione si riscrive 2πr 2m 2m e = 0.927 × 10−23 A ⋅ m2 (magnetone di Bohr), ed un fattore 2m g = 1 orbitale, introdotto per simmetria con le corrispondenti equazioni riguardanti lo spin, µ g µ g come µ = − B L ; vettorialmente µ = − B L . A questo punto si inserisce la parte quantomeccanica della trattazione, considerando che un’espressione analoga vale per gli operatori µ gˆ momento magnetico e momento angolare orbitale, ˆ µ = − B L. Interazione con un campo magnetico esterno Se al sistema viene applicato un campo magnetico, in modo sempre semiclassico si può considerare che l’energia di intera- B zione sia uguale a E = −µ ⋅ B , e che il momento torcente agente µ sul sistema sia τ = µ × B . Ad esempio la forza agente su un corpo dotato di momento magnetico allineato nella stessa direzione di un campo magnetico τ ∂Bz . non uniforme in modulo (diciamo l’asse z ) è Fz = µz ∂z Precessione di Larmor Come al solito applichiamo un procedimento semiclassico per studiare il comportamento di un sistema dotato di momento angolare orbitale immerso in un campo magnetico. Il momento torcente agente sul sistema è τ = µ × B = − µBg L θ L × B , e per le proprietà del prodotto vettoriale è sempre perpendicolare al momento angolare. Dato che per la forma angolare della secon- dL/dt 66 da legge di Newton τ = dL , il momento angolare si muoverà circolarmente come una trottola, d con un moto detto precessione di Larmor; dalla figura si ricava che τ = quindi la frequenza angolare del moto di precessione è ω = µ Bg LB sin θ = dL , dt µ g v µ Bg LB sin θ L sin θ = B B . = r L’esperimento di Stern-Gerlach e lo spin Misura del momento magnetico Un esperimento adatto a misurare il momento magnetico di un sistema atomico (e S quidni indirettamente il momento angolare) è quello descritto in figure: un fascio di atomi neutri viene fatto passare tra le eB N spansioni polari di un magnete, costruito in modo tale da avere un campo magnetico diretto come l’asse z e di intensità crescente verso l’alto. La forza agente sugli atomi è diretta verso l’alto e dipende dalla componente lungo z del momento magnetico, Fz = µz ∂Bz . ∂z Per un atomo di idrogeno in uno stato 2p ( l = 1 ) sono possibili tre diversi valori del momento magnetico lungo z , µz = − µ Bg lz = −µ Bml ml = −1, 0, 1 , e quindi dovrebbero vedersi tre fasci distinti, laddove la meccanica classica prevederebbe un continuo di fasci corrispondenti a tutte le possibili orientazioni dei momenti magnetici. Lo spin In effetti, anche se l’esperimento mostra la suddivisione del fascio in una serie discreta di fasci, non c’è accordo quantitativo, e ci sono anche delle notevoli discrepanze qualitative; ad esempio, per degli atomi 1s (con momento angolare nullo, e che quindi non dovrebbero subire deflessione) si osserva la suddivisione in due fasci distinti. Per spiegare questa anomalia si introduce lo spin, una proprietà intrinseca delle particelle, descritta da operatori di momento angolare (che rispettano le relative regole di commutazione). Sz saranno quindi rispettivamente Gli autovalori degli operatori di spin S2 ed ˆ s (s + 1) e 2 ms , con s intero o semintero e ms = −s,… , 0,… , s . Per l’elettrone s = 1 2 , e quindi i possibili valori per ms sono ± 1 2 . µ g Inoltre allo spin è associato un momento magnetico, tramite la relazione ˆ µ = − B S . Per l’elettrone il fattore g anomalo vale 2.00232 . Sono quindi possibili due valori di µz , e questo spiega la presenza di due fasci distinti nello Stern-Gerlach su atomi 1s L’esistenza dello spin, che è un fenomeno puramente quantomeccanico, può essere derivata teoricamente dalla soluzione dell’equazione di Schroedinger per l’atomo di idrogeno, considerando però anche una correzione relativistica. In effetti da questa trattazione si otterrebbe un fattore g = 2 ; la leggera differenza dipende da fluttuazioni quantistiche dei campi, e viene spiegata nell’ambito dell’elettrodinamica quantistica. Interazione spin-orbita Deduzione semiclassica dell’energia di interazione Un elettrone in moto attorno al nucleo “sente” un campo magnetico locale piuttosto intenso, che interagisce con il momento magnetico intrinseco dovuto allo spin determinando variazioni 67 nell’energia dei vari stati. Un primo passo nel valutare l’entità di questa interazione consiste nel calcolo del campo magnetico sentito dall’elettrone. v Consideriamo un elettrone in un’orbita di Bohr attorno al nucleo; come mostrato negli schemi, in un sistema di riferimento solidale -e con l’elettrone vedremmo il nucleo orbitare attorno ad esso, alla stessa distanza e con velocità di verso opposto. Di conseguenza, r possiamo considerare che l’elettrone “senta” l’effetto di una corren+Ze te generata dal moto del nucleo. Ricordando l’espressione per il campo magnetico generato da una carica in moto, il campo magnetico che agisce sull’elettrone sarà B = µ0 −v × r . Ze r3 4π Considerato che il campo elettrico agente sull’elettrone è E= Ze r , e ricordando che c = 1 4πε0 r 3 µ0ε0 , possiamo conve- nientemente riscrivere il campo magnetico come B = − 1 v×E . c2 -e r Manipoliamo ulteriormente tale espressione; consideriamo in primo luogo che la forza agente su un corpo in un potenziale +Ze dV r , e la forza agente centrale si può scrivere come F = − dr r -v sull’elettrone nel campo elettrico del nucleo è F = −e E . Da queste due relazioni possiamo ottenere B=− E= dV r , che sostituita nell’espressione per il campo magnetico dà d r er 1 dV v× r . ec 2r d r Dato che il momento angolare (grazie alle proprietà del prodotto vettoriale) si esprime come L = r × mv = −mv × r , possiamo per finire scrivere B = + 1 dV L emc 2r d r L’interazione tra il momento magnetico di spin e il campo magnetico si può esprimere mediante la relazione ∆E = µ Bg S ⋅ B ; a causa di alcuni effetti relativistici, questà espressione è errata di un fattore 2 , e l’espressione esatta da considerare è ∆E = µ Bg S⋅B. 2 1 emc 2r ˆ so = − 1 quindi per l’hamiltoniano di interazione spin-orbita H emc 2r Combinando con il campo magnetico otteniamo ∆E = − dV dr dV dr µ Bg S ⋅ L , ottenendo 2 µBg ˆ ˆ S⋅L 2 Stati accoppiati e momento angolare totale È ora necessaria un’osservazione: perchè dei numeri quantici descrivano adeguatamente uno stato, è necessario che commutino con l’hamiltoniano del sistema; solo questo, infatti, garantisce di poter trovare autostati comuni e che le grandezze descritte dagli operatori siano inva- rianti nel tempo. Accade ora che gli operatori ˆ Sz ed ˆ Lz non commutino con l’hamiltoniano di interazione spin-orbita; in un sistema accoppiato, quindi, ms e ml non sono più invarianti del moto. ˆ ˆ so = γˆ Lz non commuta con H S ⋅ L ; trascurando la costante, che ovviamente Mostriamo che ˆ non influisce sulle proprietà di commutazione, possiamo ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ Lz , Sx Lx + Lz , Sy L y + Lz , Sz Lz = Lz , Lx Sx + Lz , L y Sy + 0 = i scrivere (ˆL ˆS y x ˆ ˆ ˆ Lz , S ⋅ L = ) −ˆ Lxˆ Sy . 68 Possiamo invece pensare che sia utile adottare la rappresentazione accoppiata. In effetti, si può mostrare che l’operazione funziona, nel senso che j e m j sono buoni numeri quantici, inva- ˆ2 ˆ2 ˆ ˆ ˆ 1 ˆ2 ˆ2 ˆ2 J − S − L , dato che J = S + L + 2S ⋅ L ; 2 ˆ ˆ ˆ ˆ ora J2 e ˆ Jz commutano certamente con J2 − S2 − L2 , e quindi i loro valori di attesa sono in ˆ ˆ rianti nel tempo. Infatti possiamo scrivere S ⋅ L = varianti. L’atomo di idrogeno Possiamo ora addentrarci nel calcolo dell’energia di interazione spin-orbita per gli stati di un ˆ so ψn,l, j ,m ; ψn,l, j ,m H atomo idrogenoide; calcoliamo cioè il valore di attesa dell’hamiltoniano per quanto ψn,l, j ,m j visto precedentemente, 1 d V µ B g 1 ˆ2 ˆ2 ˆ2 − J − S − L ψn,l, j ,m emc 2r d r 2 2 µ Bg 1 Ze 1 ψ 2 emc 2 n,l, j ,m r 3 4πε0 2 2 j Ze 1 1 2 2 2m c 4πε0 2 2 j tale Potremmo proseguire calcolando Rn,l è uguale j a = ( j ( j + 1 ) − s ( s + 1 ) − l (l + 1 ) ) ψ ( j ( j + 1) − s (s + 1) − l (l + 1)) valore j Rn,l n ,l, j ,m j = 1 R r 3 n,l 1 R , ma in effetti si ottiene che la correzione è r 3 n,l 10−4 volte più piccola dell’energia di stato fondamentale dell’idrogeno, e comunque comparabile con altre correzioni dovute al trattamento relativistico delle energie. Interazione luce-materia L’hamiltoniano di interazione in approssimazione di dipolo Consideriamo un atomo di idrogeno immerso in un campo elettrico oscillante; possiamo considerare il sistema di elettrone e nucleo come un dipolo elettrico , con momento di dipolo d = e x ; dato che l’energia di interazione tra un campo elettrico uniforme sulla regione occupata dal dipolo ed il dipolo stesso è U = −d ⋅ E (t ) ; dato che la radiazione coinvolta ha di solito lunghezza d’onda molto maggiori delle dimensioni atomiche, l’approssimazione di dipolo è giustificata, visto che il campo è sufficientemente costante nello spazio su scala atomica. La presenza di una perturbazione elettromagnetica oscillante introduce quindi una perturbazione dipendente dal tempo che (trascurando anche le interazioni con la componente magneti- ˆ ' = −e x ⋅ E (t ) ca dell’onda) si traduce in un’hamiltoniano H Richiami di teoria delle perturbazioni Applichiamo quindi la teoria delle perturbazioni dipendenti dal tempo, introducendo come ulteriore approssimazione il fatto che il sistema sia a due soli livelli ψi e ψf ; in pratica escludiamo la possibilità che la transizione avvenga in più stadi, passando da altri livelli. Ricordando la teoria delle perturbazioni dipendenti dal tempo (tra l’altro in questo caso gli e- ˆ ' ψ = −e E ⋅ ψ xψ = 0 , visto che tutte le lementi di matrice diagonali sono nulli, visto che ψ H funzioni d’onda hanno simmetria di inversione), definiamo lo stato del sistema con una combinazione lineare dipendente dal tempo dei due stati, ψ = ci (t ) ψi + c f (t ) ψf , e abbiamo le relazioni: ci = − i H 'if c f e i ωif t con ωif = Ei − E f 69 cf = − i H 'fi cie i ωfit con ωif = E f − Ei Con un approssimazione al primo ordine e considerando ci ( 0) = 1 e c f ( 0) = 0 , ricaviamo cf = − i t ∫ H' fi 0 ( τ) e i ω τ d τ fi Interazione con un’onda elettromagnetica Entriamo ora nel merito della situazione specifica, calcolando gli elementi di matrice per il caso ε , dove ε̂ è un speciale considerato. Esprimiamo il campo elettrico oscillante E = E 02 cos ωtˆ versore che dà lo stato di polarizzazione dell’onda. Le formule di Eulero ci permettono di ri- εE 0 e i ωt + e − i ωt . scrivere la variazione periodica come E = ˆ ˆ ' ψb = −eE 0 e i ωt + e − i ωt ψa ˆ ε ⋅ xψb Osserviamo ora che gli elementi di matrice H ab = ψa H concentrano la variabilità temporale nell’espressione esprena al bracket, mentre l’elemento di matrice rimasto dipende unicamente dalle due funzioni d’onda e dallo stato di polarizzazione dell’onda incidente, e lo possiamo indicare come χab . Possiamo ora calcolare esplicitamente la variazione dei coefficienti in funzione del tempo, inserendo l’espressione trovata in c f = − cf = i χfieE 0 L’integrale t ∫ e + e ( ) ∫ (e i ωτ e − i ωτ 0 t i ωfi +ω τ 0 i ωfi τ i t ∫ H' fi 0 ( τ) e i ω τ d τ ; fi dτ −i ω +e ( fi −ω )τ )d τ si svolge semplicemente ed è uguale a i ω +ω t i ω −ω t e ( ) −1 e ( ) −1 + i ( ωfi + ω) i ( ωfi − ω) fi fi Dato che nelle normali condizioni di spettroscopia le frequenze sono dell’ordine di 106 − 1015 , i denominatori dei due termini dell’espressione sono molto grandi, e quindi corrispondono a valori molto piccoli (visto che il numeratore ha certamente modulo circa 1 ) il ( ) termine ωfi − ω può però tendere a zero per quando la frequenza applicata e quella propria della transizione diventano quasi uguali, e quindi il secondo termine può essere non nullo. Compiendo quindi l’approssimazione di considerarlo molto maggiore del primo (che i ω −ω t 1 e ( fi ) − 1 . viene di conseguenza trascurato), abbiamo c f = χfieE 0 (ω fi Dato che P (t ) = γ fi 2 la probabilità i(ω 1 2 e (ωfi − ω) )t 2 fi −ω ( di e( i ωfi −ω)t 2 transizione −i ω −e ( )t 2 fi −ω ω −ω t sin2 fi 2 2 2 2 2 con γ 2 = e E 0 χfi γ fi 2 fi 2 ωfi − ω 2 Possiamo fare due osservazioni: in primo luogo, la probabilità di transizione varia nel tempo in modo sinusoidale (flopping), per cui dopo un certo tempo il sistema torna allo stato iniziale. La dipendenza dalla frequenza della pertur- ) 2 è = − ω) proporzionale γ fi 2 PHt0 L (ω fi 1 − ω) 2 e( ωFI a i ωfi −ω)t 2 2 cf , ricaviamo 2 1 t = sin ( ωfi − ω) 2 2 ω 70 bazione si risolve in un andamento come quello nel grafico, con un picco attorno alla frequenza propria della transizione. La probabilità di transizione è quindi maggiore quando le due frequenze sono simili. In effetti all’aumentare del tempo il picco diventa più stretto ed alto, fino a superare il valore unitario (questo dipende dal fatto di aver considerato una approssimazione piuttosto grossolana); comunque, le osservazioni qualitative sono corrette. Emissione stimolata Se ripetessimo lo stesso procedimento partendo da uno stato iniziale eccitato ci ( 0) = 0 e c f ( 0) = 1 , otterremmo risultati simili, ma al contrario con il sistema che tende a transire verso lo stato a più bassa energia, emettendo di fatto energia. Questo processo è detto di emissione stimolata. Radiazione non monocromatica Consideriamo ora cosa succede se la radiazione a cui sottoponiamo il sistema non è monocromatica, ma composta da una distribuzione di frequenze, che supporremo descritta da una “densità di probabilità”, cioè una funzione u ( ω) tale che u ( ω) d ω dia la frazione di intensità associata alle frequenze comprese tra ω e ω + d ω . ε è I = Dato che l’intensità di una onda elettromagnetica E = E 02 cos ωtˆ possiamo scrivere E 02 = 2 1 ε0 (2E 0 ) = 2ε0E 02 , 2 1 I u ( ω) d ω 2ε0 TOT La probabilità di transizione è per l’intervallo di frequenze tra ω e ω + d ω è quindi P (t ) = e χfi 2ε0 2 2 2 ω −ω t sin2 fi 2 dω. I TOTu ( ω) 2 ωfi − ω 2 Per calcolare la probabilità complessiva di transizione, conseguente all’illuminazione con un continuo di frequenze, dovremmo integrare l’espressione per tutti i possibili valori di ω ; dato che però il termine sin2 x x 2 ha un picco molto stretto mentre presumibilmente la distribuzione di frequenze è piuttosto larga, nel calcolare l’integrale considereremo u ( ω) = u ( ωfi ) . Abbiamo quindi 2 ωfi − ω t sin ∞ e χfi 2 dω P (t ) = I u ( ωfi ) 2 0 2ε0 2 TOT ωfi − ω 2 ω −ω Con un cambio di variabili, Ω = fi t , ed estendendo all’infinito i limiti di integrazione 2 2 sfruttando ∫ ∞ 0 2 ∫ la ω −ω t sin2 fi 2 d ω = t2 2 ωfi − ω 2 “localizzazione” della funzione, ricaviamo sin2 Ω 2 d Ω = 2πt −∞ Ω2 t ∫ ∞ Abbiamo quindi ricavato la formula P (t ) = e 2χfi 2 I u ( ωfi ) 2πt , nota come regola d’oro di 2ε0 2 TOT Fermi. È stato eliminato il fenomeno di “flopping” per cui il sistema oscillava tra lo stato 71 perturbato e quello imperturbato, e il rate di transizione è costante nel tempo, R= 2 2 d P e χfi = I u ( ωfi ) 2π d t 2ε0 2 TOT Per ora abbiamo considerato una radiazione polarizzata linearmente e proveniente da un’unica direzione. In effetti per avere la probabilità di transizione per onde incoerenti e provenienti da ogni direzione sarebbe necessario calcolare i valori medi per tutte le possibili orientazioni degli elementi di matrice di dipolo. Emissione spontanea e coefficiente di Einstein Abbiamo già osservato un atomo sottoposto ad una radiazione di opportuna frequenza può subire un’eccitazione ad uno stato di più alta energia, ma allo stesso tempo può subire un fenomeno di emissione stimolata che lo riporta allo stato fondamentale. Esiste però anche un fenomeno di diseccitazione spontanea, con il quale un atomo in uno stato eccitato può tornare allo stato fondamentale emettendo energia. Tale fenomeno è in realtà spiegabile in termini di perturbazioni dovute all’energia di punto zero del campo elettromagnetico. È possibile ricavare però una descrizione del fenomeno anche con considerazioni di equilibrio termico. Consideriamo infatti un sistema all’equilibrio, con N a atomi in uno stato ψa a bassa energia e N b atomi in uno stato eccitato ψb . La velocità di variazione del numero di atomi nello stato ψa , che si eccitano allo stato ψb sarà proporzionale (tramite il rate di assorbimento che chiameremo Babu ( ω) ) al numero di atomi che occupano tale stato, d Na = −Babu ( ω) N a dt La perdita di atomi dallo stato ψb , che si diseccitano cadendo nello stato ψa dipenderà sia dall’emissione stimolata (per la chiameremo il coefficiente Bbau ( ω) ) che dall’emissione spontanea (il cui coefficiente chiameremo A ). L’espressione del rate di diseccitazione sarà quindi d Nb = −Bbau ( ω) N b − AN b dt In condizioni di equilibrio i due rate devono essere uguali, per garantire che non vari la popolazione dei due livelli, quindi Babu ( ω) N a − Bbau ( ω) N b − AN b = 0 , da cui possiamo ricavare u ( ω) = AN b A = Babu ( ω) N a − Bbau ( ω) N b Babu ( ω) N a N b − Bbau ( ω) Inseriamo ora delle condizioni dovute all’assunto di essere in equilibrio termodinamico: per la distribuzione di Boltzmann, N a exp ( − E a kT ) = = exp ( ω kT ) , mentre la formula di N b exp ( − E b kT ) Planck per la radiazione del corpo nero ci dà la distribuzione di frequenze per la radiazione ( ω 2π) 8πh . termica all’equilibrio, u ( ω) = 3 c exp ( − ω kT ) − 1 3 Unendo queste espressioni, troviamo che deve essere Bab = Bba (come avremmo potuto ri- 8πh ( ω 2π ) cavare analiticamente dalla teoria delle perturbazioni), e che A = B . c3 3 La vita media degli stati eccitati Se vogliamo calcolare la vita media di uno stato eccitato che subisca unicamente processi di emissione spontanea dobbiamo considerare che (sebbene nella nostra approssimazione abbiamo considerato solo due livelli), il sistema può transire a tutti gli stati ad energia inferiore. Per ogni stato ad energia inferiore avremo un coefficiente di emissione spontanea Ai = Bi 8πh ωi 3 ; c3 72 dovremo quindi considerare la somma di tutti i coefficienti, A = ∑ A . Risolvendo l’equazione i i d Nb = −AN b , ricaviamo che la popolazione dello stato eccitato decresce esponenzialmente, dt secondo N b = N 0e − At , per cui possiamo considerare come indice della vita media del sistema eccitato il valore τ = 1 . A Regole di selezione ed elementi di matrice di dipolo Nella trattazione per ricavare il rate di assorbimento abbiamo lasciato espresso senza calcolare l’elemento di matrice di dipolo [e ] ψf ε ⋅ xψi ; eseguendo il calcolo troviamo che per certe combinazioni di funzioni d’onda iniziale e finale l’elemento di matrice è nullo. In questi casi il rate di transizione è anch’esso zero, e quindi di fatto la transizione è “proibita”. In effetti anche transizioni proibite in questa approssimazione di dipolo hanno una probabilità non nulla di avvenire se consideriamo l’interazione con il campo magnetico o la non uniformità spaziale del campo elettrico (approssimazione di quadrupolo); le probabilità che si trovano per questi ordini superiori di approssimazione sono comunque svariati ordini di grandezza più piccoli di quelli di dipolo, e quindi le corrispondenti transizioni sono molto deboli rispetto a quelle permesse in approssimazione di dipolo. Le regole di selezione sono ∆ms = 0 , ∆l = ±1 , ∆ml = 0, ±1 . Tali regole si possono ricavare sulla base di osservazioni di simmetria; ad esempio ψn,l ,m α ε ⋅ xψn ',l ',m 'β = 0 visto che i due diversi stati di spin sono ortogonali. Da questo rill l caviamo la regola ∆ms = 0 ˆ ); in tal caso l’elemento di matrice Consideriamo una luce polarizzata lungo l’asse z ( ε = k di dipolo si riduce a ψn,l ,m z ψn ',l ',m ' = ll ∫∫∫ R ∗ nl l (r ) Pl (cos ϑ) e − i mϕ r cos ϑ Rn ' l ' (r ) Pl ' (cos ϑ) e i m ' ϕr 2 sin ϑ d r d ϑ d ϕ ; ∗ separabile, e se si isola la componente in ϕ si osserva che è ∫ 2π 0 e( i m ' −m ) ϕ l’integrale è d ϕ , che evidente- mente è diverso da zero solo se ∆ml = 0 Le altre regole si ricavano (in modo più complesso) sfruttando le proprietà delle armoniche sferiche Sistemi di particelle indistinguibili Descrizione del sistema e funzione d’onda associata Un sistema formato da N particelle sarà descritto da una funzione d’onda della forma Ψ ( x1,… , x N ,t ) , tale da soddisfare un’equazione di Scroedinger con hamiltoniano del tipo ˆ= H N ˆ2 p ∑ 2m + V (x ,…, x ,t ) i i =1 1 N i Bosoni, fermioni e proprietà di simmetria Enunciamo ora una proprietà fondamentale dei sistemi a particelle indistinguibili, che può essere in qualche modo giustificata su un piano teorico, ma che in effetti ha numerose conferme sperimentali. La funzione d’onda che descriva un sistema di particelle indistinguibili a spin intero (bosoni) deve essere simmetrica rispetto allo scambio di qualsiasi coppia di indici, nel senso che deve ( ) ( essere Ψ x1,… , xa ,… , xb ,… , x N ,t = Ψ x1,… , xb ,… , xa ,… , x N ,t ) 73 La funzione d’onda che descriva un sistema di particelle indistinguibili a spin semiintero (fermioni) deve essere antisimmetrica rispetto allo scambio di qualsiasi coppia di indici, nel senso ( ) ( che deve essere Ψ x1,… , xa ,… , xb ,… , x N ,t = −Ψ x1,… , xb ,… , xa ,… , x N ,t ) Tali regole rendono comunque conto del significato quantistico di indistinguibilità: se due particelle non possono essere distinte in base a proprietà intrinseche, e le loro funzioni d’onda si sovrappongono, è impossibile assegnare a ciascuna un’”etichetta” univoca. Di conseguenza, anche se per ragioni di calcolo dobbiamo introdurre delle etichette sulle variabili associate ad ogni particella, si deve garantire che il modulo quadro della funzione d’onda (che esprime l’osservabile associata alla funzione d’onda stessa) non cambi per qualsiasi permutazione degli indici. Sistemi di particelle non interagenti Un caso particolare che aiuta a chiarire i termini di questa regola riguarda il caso di un sistema di particelle che non interagiscono tra loro; in tal caso l’hamiltoniano del sistema (consideria- ˆ= mo per semplicità il caso autonomo) è della forma H N ∑ i =1 te separare; ˆ2 p i + 2mi ( ) N ∑ V (x ) , e si può chiarameni i =1 ( ) ˆ i ψ xi = E ψ xi , che differiscono solo Ottengo così una serie di equazioni agli autovalori H ( ) per le etichette del vettore posizione, e che daranno quindi una serie di soluzioni ψn xi . Potrò come al solito esprimere la soluzione del problema complessivo come prodotto delle soluzioni dei problemi componenti, ψ = N ∏ i =1 ψn ( xi ) , che avrà come energia E = i N ∑E i =1 ni . É però evidente che anche permutando gli indici dei vettori posizione otterremmo una soluzione degenere, con uguale energia. Ad esempio, ψ = ψ1 ( x1 ) ψ2 ( x2 ) ha energia E = E 1 + E 2 , ma anche ψ ' = ψ1 ( x2 ) ψ2 ( x1 ) ha ugualmente energia E ' = E = E 1 + E 2 . Questo dipo di degenerazione è detta degenerazione di scambio. ( ) ( ) È chiaro che d’altra parte una funzione d’onda come ψ = ψ1 x1 ψ2 x2 non rispetta i re- quisiti di simmetria, visto che non è simmetrica nè antisimmetrica rispetto allo scambio degli indici. Osserviamo però che qualsiasi combinazione lineare delle due funzioni sarebbe ancora autostato dell’hamiltoniano, con energia E , dato che le funzioni sono degeneri. ˆ ψ1 = E ψ1 e Infatti, ricordando le proprietà elementari di linearità degli operatori, se H ˆ ψ2 = E ψ2 , H ˆ (a ψ1 + b ψ2 ) = aE ψ1 + bE ψ2 = E (a ψ1 + b ψ2 ) . H Combinazioni lineari simmetrizzate e determinanti di Slater Per il caso particolare considerato sopra, si può intuitivamente immaginare come ottenere una combinazione lineare simmetrica o antisimmetrica a partire dalle due funzioni: si vede in moto 1 ψ1 ( x1 ) ψ2 ( x2 ) + ψ1 ( x2 ) ψ2 ( x1 ) è simmetrica rispetto allo scambio dei 2 1 segni, mentre ψ − = ψ1 ( x1 ) ψ2 ( x2 ) − ψ1 ( x2 ) ψ2 ( x1 ) è antisimmetrica. Il coefficiente serve 2 immediato che ψ + = solo a normalizzare le combinazioni lineari In casi più complessi (già con 3 particelle) il procedimendo non è però così immediato, visto che occorre cercare una funzione che rispetti i requisiti di simmetria rispetto allo scambio di qualsiasi coppia di indici. Ricordiamo la definizione formale di determinante: data una matrice quadrata A di ordine n , si definisce det A = ∑ π∈P sign ( π ) n ∏a i =1 i πi , dove P è l’insieme degli n ! vettori ottenuti permu 74 tando il vettore ω = (1, 2,… ,n ) , e sign ( π ) è uguale a 1 se il vettore π si ottiene da ω con un numero pari di scambi, −1 se il numero di scambi è dispari. ψ 1 ( x1 ) ψ 2 ( x 1 ) ψ1 ( x2 ) ψ 2 ( x 2 ) Consideriamo ora una matrice così costruita: A = ψ x 1 ( n ) ψ2 ( xn ) … … … ψn ( x 1 ) ψn ( x 2 ) ; il de ψn ( xn ) terminante di tale matrice sarà formato dalla somma di termini ottenuti dalla permutazione n degli indici dei vettori posizione sul prodotto ∏ ψ (x ) , con un segno dovuto alla parità del i i i =1 numero di scambi eseguiti per ottenere tale permutazione; se ora scambio due indici nella funzione risultante dal determinante, di fatto faccio uno scambio in più senza cambiare i segni di n conseguenza. Il risultato è che se avevo un termine ∏ ψ (x ) , ora un’altro dei termini restani i =1 πi ti sarà trasformato in quello, ma avrà segno opposto, perchè era stato ottenuto originariamoente con un numero di scambi di parità diversa. La funzione sarà quindi antisimmetrica rispetto a qualsiasi scambio di indici. Il determinante di una matrice del tipo di A è detto determinante di Slater, e costituisce un metodo per ottenere la funzione d’onda antisimmetrica a partire dalle funzioni d’onda di singola particella. Grazie all’ortonormalità degli stati singoli, la costante di normalizzazione è molto semplice, e ci permette di ricavare una semplice formula, ψ ( x1 , … , x N ) = ψ 1 ( x1 ) ψ1 ( x2 ) 1 det N! ψ x 1( N) ψ 2 ( x1 ) … ψ 2 ( x2 ) … ψ2 ( x N ) … ψ N ( x1 ) ψ N ( x2 ) ψ N ( x N ) Per ottenere invece una funzione d’onda totalmente simmetrica (per i bosoni) è sufficiente considerare segni sempre positivi nella somma del determinante. Il principio di esclusione di Pauli Una semplice conseguenza del principio di antisimmetria è il fatto che due fermioni non possano occupare lo stesso stato. Infatti se proviamo a scrivere la combinazione lineare antisimmetrica otteniamo ψ − = 1 ψ1 ( x1 ) ψ1 ( x2 ) − ψ1 ( x2 ) ψ1 ( x1 ) = 0 ; chiaramente tale stato non e2 siste. Questo principio vale in particolare per gli elettroni, che negli atomi devono occupare uno e un solo stato per ciascuno. Nel caso particolare degli elettroni bisogna però considerare che, oltre alla funzione d’onda spaziale, gli elettroni possiedono anche lo spin, che può assumere due stati e che quindi di fatto permette a due elettroni con spin opposto di occupare lo stesso orbitale atomico. Spinorbitali, forze di scambio, stati di multipletto Consideriamo due elettroni negli stati ψ1 e ψ2 ; in effetti la descrizione dello stato di ciascun elettrone richiede anche di tener conto dello spin. Lo faremo introducendo i simboli α (i ) per Sz α = indicare che l’elettrone i -esimo ha spin “su” ( ˆ 1 α ), e corrispondentemente β (i ) tale 2 1 che ˆ Szβ = − β. 2 Introduciamo quindi degli spinorbitali che riuniscano le informazioni spaziali con quelle di ( ) spin (ad esempio ψ1 x1 α (1 ) per indicare l’elettrone 1 nello stato ψ1 con spin su). Possiamo costruire quattro diverse combinazioni lineari simmetriche o antisimmetriche con gli spin: 75 SIMMETRICHE α (1 ) α (2) ; β (1 ) β (2) ; ANTISIMMETRICHE 1 2 α (1 ) β (2) + α (2) β (1 ) 2 α (1 ) β (2) − α (2) β (1 ) 1 Affinchè lo spinorbitale sia complessivamente antisimmetrico, alle parti di spin simmetriche deve corrispondere una parte “spaziale” antisimmetrica, e viceversa. Otteniamo quindi tre stati a spin simmetrico, detti di tripletto, ed uno antisimmetrico (singoletto): TRIPLETTO 1 SINGOLETTO 1 α (1 ) α (2) 2 ψ1 ( x1 ) ψ2 ( x2 ) − ψ1 ( x2 ) ψ2 ( x1 ) β (1 ) β (2) 1 2 α (1 ) β (2) + α (2) β (1 ) 2 ψ1 ( x1 ) ψ2 ( x2 ) + ψ1 ( x2 ) ψ2 ( x1 ) 1 2 α (1 ) β (2) − α (2) β (1 ) Questi stati hanno diverse proprietà interessanti. In primo luogo, calcoliamo la probabilità che ( i due elettroni si trovino nello stesso punto, cioè ψ x1, x2 ) 2 , con x1 = x2 . Per gli stati di tri- 2 ψ1 ( x ) ψ2 ( x ) − ψ1 ( x ) ψ2 ( x ) = 0 , mentre per lo 2 pletto tale probabilità è nulla, infatti 1 stato di singoletto la probabilità che i due elettroni si sovrappongano non è necessariamente nulla, 1 2 ψ1 ( x ) ψ2 ( x ) + ψ1 ( x ) ψ2 ( x ) = 2 ψ1 ( x ) ψ2 ( x ) 2 2 Tale comportamento può essee interpretato come se tra gli elettroni con funzione spaziale antisimmetrica agisse una forza di scambio repulsiva, e tra quelli singoletto una forza attrattiva. L’origine di tale forze non dipende da interazioni in senso classico tra le particelle, ma unicamente dalle proprietà di simmetria della funzione d’onda. Una seconda osservazione riguarda i valori dello spin totale per le varie configurazioni: dalla teoria del momento angolare sappiamo che il valore dello spin totale per un sistema con due spin 1 2 può avere come numeri quantici s = 0, 1 . In effetti è possibile dimostrare che le parti di spin sono proprio gli autostati della rappresentazione accoppiata; rispettivamente, ψ s ms 0 0 1 1 1 1 0 1 2 α (1 ) β (2) − α (2) β (1 ) α (1 ) α (2) 2 α (1 ) β (2) + α (2) β (1 ) β (1 ) β (2) 1 −1 L’atomo di elio L’hamiltoniano per il sistema Consideriamo un atomo di elio, con due eletttroni interagenti tra loro e con il nucleo; ˆ2 ˆ2 2 2 ˆ = p1 + p2 − 2e 1 + 1 + e l’hamiltoniano del sistema è quindi H 2m1 ( 2m2 4πε0 r1 r2 1 , e la fun4πε0 x1 − x2 ) zione d’onda è del tipo ψ x1 − x2 . Non esiste soluzione analitica per un’equazione differenziale di questo tipo, quindi occorre accontentarsi di soluzioni approssimate. In particolare pos- 76 siamo considerare l’interazione tra gli elettroni come una perturbazione, e quindi risolvere 2 ˆ2 ˆ2 ˆ 0 = p1 + p2 − 2e 1 + 1 . l’equazione di Schroedinger per l’hamiltoniano semplificato H 2m1 2m2 4πε0 r1 r2 Approssimazione di ordine zero Una prima approssimazione consiste nel cercare le soluzioni per l’hamiltoniano semplificato 2 ˆ2 ˆ2 ˆ 0 = p1 + p2 − 2e H 2m1 2m2 4πε0 1 1 + ; tale hamiltoniano è separabile, dando due hamiltoniani idro r1 r2 ( ) ( ) 2 α (1 ) β (2) − α (2) β (1 ) , genoidi; lo stato fondamentale è quindi ψ = ψ1,0,0 x1 ψ1,0,0 x2 1 reso antisimmetrico E = 2Z E H 1s 2 sfruttando la parte di spin. L’energia è pari a = 8 × −13.6 eV = −108.8 eV . L’energia misurata sperimentalmente è pari a −78.9 eV ; la nostra approssimazione è quindi davvero scadente. In effetti abbiamo trascurato il termine di interazione interelettronica, che evidentemente rappresenta tutt’altro che una lieve perturbazione. L’approssimazione di ordine uno nell’energia Dalla teoria delle perturbazioni sappiamo che la correzione al primo ordine per l’energia è 1 ˆ (1)ψ ; E 1( ) = ψ H J = e2 4πε0 ∫ tale termine ψ1,0,0 ( x1 ) ψ1,0,0 ( x2 ) 1 d3 x1 d3 x2 x1 − x 2 2 2 corrisponde all’integrale L’integrale sopra riportato viene detto integrale di Coulomb, in quanto in pratica descrive ( ) ( ) l’energia potenziale di interazione tra due distribuzioni di carica ρ1 x = e ψa x ρ2 ( x ) = e ψb ( x ) 2 e 2 Calcoliamo l’integrale per lo stato fondamentale dell’atomo di elio: la funzione d’onda idrogenoide 1s è ψ1,0,0 = Z 3 −Zr a e ; l’integrale in questione si può calcolare analiticamente, πa03 0 Ze 2 , 8 4πε0a0 (1) ˆ (1)ψ = 5 ma il procedimento è un po’ lungo. Il risultato che si ottiene è E 1 = ψ H che corrisponde al valore numerico di circa 34 eV , il che ci porta ad una stima di −108.8 + 34 = −74.8 eV , molto più vicina all’energia sperimentale. Potremmo ora continuare ad applicare la teoria delle perturbazioni, calcolando le funzioni d’onda corrette al primo ordine e così via. Principio variazionale Applichiamo invece il principio variazionale; osserviamo che possiamo in qualche modo tenere conto delle interazioni elettrone-elettrone nelle funzioni d’onda, se immaginicamo che la presenza del secondo elettrone “schermi” il nucleo, facendo sì che i due elettroni risentano un potenziale coulombiano inferiore, come se la carica effettiva del nucleo fosse Z < 2 . Utilizziamo quindi una funzione di prova della forma ψ = Z 3 −Z (r +r ) a e πa03 1 2 0 L’hamiltoniano del sistema non può cambiare, ma possiamo riscriverlo in modo da mettere in evidenza una parte tale che la funzione di prova sia autostato, ˆ2 ˆ2 2 ˆ = p1 + p2 − Ze H 2m1 2m2 4πε0 1 1 e2 + + r1 r2 4πε0 Z −2 Z −2 1 + + r r − x2 x 2 1 1 ˆψ : Calcoliamo quindi il valore di attesa ψ H 77 La funzione di prova è autostato della prima parte dell’hamiltoniano, per cui il contributo di tale segmento è 2Z 2E H 1s Abbiamo poi l’espressione Z − 2 Z − 2 e2 ψ + ψ , che può essere scomposta come 4πε0 r2 r1 (Z − 2) e2 (Z − 2) e 2 1 1 1 ψ 1 ( x1 ) + ψ 1 ( x 2 ) ψ 1 ( x 2 ) = ψ 1 ( x1 ) 2 ψ H 1sZ ( x ) ψ H 1sZ ( x ) ; r1 r2 r 4πε0 4πε0 1 si dimostra che il valore di attesa di per lo stato fondamentale di un atomo idrogenoide r e2 Z è , per cui il valore ottenuto da questa parte è − ( −4) (Z − 2) Z = −4 (Z − 2) ZE H 1s 4πε02a a0 0 Infine, abbiamo il valore di attesa dell’interazione elettrone-elettrone, che abbiamo già detto essere 5 Ze 2 5 = − ZE H 1s 8 4πε0a0 4 Sommando, ( −2Z 2 il valore atteso per l’hamiltoniano è + 27 4 Z ) E H 1s (2Z 2 − 4Z (Z − 2) − 5 4 Z ) E H 1s = Applichiamo quindi il principio variazionale, trovando il minimo al variare di Z dell’energia media; molto semplicemente, d −2Z 2 + 27 4 Z ) E H 1s = 0 si risolve in −4Z + 27 4 = 0 , cioè ( dZ Z = 27 16 = 1.687 ; la carica effettiva è effettivamente minore. Se inseriamo tale valore per trovare Ĥ , ricaviamo che l’energia di stato fondamentale è stimata in −77.5 eV , ancora piu vicino al valore sperimentale di −78.9 eV . Stati eccitati Consideriamo ora uno stato eccitato dell’elio, con gli elettroni su due stati ψa e ψb , che in prima approssimazione possiamo considerare stati di un atomo idrogenoide con Z = 2 ; per via delle regole di simmetria sulle funzioni d’onda e del grado di libertà dovuto agli spin, possiamo in realtà avere quattro diverse funzioni d’onda correttamente antisimmetrizzate, cioè TRIPLETTO 1 SINGOLETTO 1 α (1 ) α (2) 2 ψa ( x1 ) ψb ( x2 ) − ψb ( x2 ) ψa ( x1 ) β (1 ) β (2) 1 2 α (1 ) β (2) + α (2) β (1 ) 2 ψa ( x1 ) ψb ( x2 ) + ψb ( x2 ) ψa ( x1 ) 1 2 α (1 ) β (2) − α (2) β (1 ) Dato che gli integrali per ottenere l’energia agiscono solo sulla parte spaziale, dobbiamo in pratica considerare le funzioni ψ ± = 1 ˆ= l’hamiltoniano H 2 ψa ( x1 ) ψb ( x2 ) ± ψb ( x2 ) ψa ( x1 ) , e considerare (dato ˆ2 ˆ2 p p e2 2e 2 1 1 1 1 + 2 − ) quali siano le espressioni per + + 2m1 2m2 4πε0 r1 r2 4πε0 x1 − x2 ˆ ψ ± . La parte non perturbata fornisce ovviamente la somma delle energie dei due livelli, ψ± H relativamente ad un atomo idrogenoide, E 0 = E a + E b . La correzione dovuta all’interazione elettorne-elettrone risulta invece essere 78 1 e2 1 1 ψ x ψ x ± ψ x ψ x ψ ( x ) ψ ( x ) ± ψb ( x2 ) ψa ( x1 ) = ( ) ( ) ( ) ( ) a b b a 1 2 2 1 4πε0 x1 − x2 2 a 1 b 2 2 1 ψ x ψ x + ψ x ψ x 1 ψ x ψ x ± ψ a ( x1 ) ψ b ( x 2 ) ( ) ( ) ( ) ( ) a 1 b 2 a 2 b 1 a ( 2) b ( 1) x1 − x 2 x 2 − x1 1 e2 = 2 4πε0 1 ψ x ψ x + ψ x ψ x 1 ψ x ψ x ψ x ψ x ( ) ( ) ( ) ( ) ( ) ( ) a 2 b 1 a 2 b 1 a ( 1) b ( 2) a 1 b 2 x1 − x 2 x1 − x 2 I primi 2 due J = e 4πε0 Il terzo termini ∫ ψ (x ) a 1 e ψ a ( x1 ) ψ b ( x 2 ) sono ψb ( x2 ) 2 il 2 uguali, e sono uguali all’integrale di Coulomb, 1 d3 x1 d3 x2 x1 − x 2 quarto termine sono anche essi uguali, visto 1 1 ψ a ( x 2 ) ψ b ( x1 ) = ψ ( x ) ψ ( x ) ψ a ( x1 ) ψ b ( x 2 ) x1 − x 2 x1 − x 2 a 2 b 1 che per ∗ l’hermiticità dell’operatore; dato poi che 1 1 = , e che tale operatore è purax1 − x 2 x1 − x 2 mente un termine moltiplicativo, posso spostarlo nella parte destra del bracket, ottenendo l’uguaglianza voluta. e2 Chiamo quindi K = 4πε0 ∫ ψ a ( x1 ) ψ a ( x 2 ) ψ b ( x1 ) ψ b ( x 2 ) ∗ ∗ x1 − x 2 d3 x1 d3 x2 integrale di scambio, e in definitiva ricavo che la correzione da apportare è J ± K , con il segno dipendente dal segno della funzione d’onda. L’integrale di scambio è in genere positivo, e rende conto delle forze di scambio dovute alle proprietà di simmetria della funzione d’onda. In effetti, risulta che le funzioni d’onda di singoletto E = E a + E b + J + K hanno energia maggiore di quelle di tripletto ( E = E a + E b + J − K ); questo non dipende da un’effettiva interazione diretta tra gli spin (che tenderebbero a disporsi nella configurazione a spin totale nullo), ma dal fatto che le funzioni d’onda spaziali antisimmetriche hanno minor probabilità che gli elettroni si trovino vicini, ottenendo di fatto che l’energia di repulsione coulombiana tra gli elettroni sia minore. Soluzioni con il metodo di Hartree-Fock per atomi a molti elettroni Finitezza di un potenziale generato da una distribuzione continua di carica Dimostriamo che il potenziale di una distribuzione continua di carica a simmetria sferica genera un potenziale finito al centro della distribuzione; dal teorema di Gauss sappiamo che 1 ∫∫ E ⋅ nˆ d S = ε ∫∫∫ ρ d V 0 grazie alle simmetrie del problema e passando al modulo del campo elettrico, a distanza R dal centro vale che 4πR 2E ( R ) = trico E ( R ) = 1 ε0R 2 ∫ R 0 1 4π ε0 ∫ R 0 r 2ρ d r . Ricaviamo quindi il modulo del campo elet- r 2ρ d r 79 sappiamo ora che V ( R ) = − V (R) = − ∫ R ∞ 1 ε0r '2 ∫ r' 0 ∫ R ∞ E (r ) d r ; inserendo l’espressione per il campo elettrico, r 2ρ d r d r ' ; possiamo integrare per parti, considerando che per il teo- rema fondamentale del calcolo integrale 1 il risultato è V ( R ) = − − ε0r ' 1 − ε0r ' ∫ r' 0 ∫ r' 0 r 2ρ d r = r '2 ρ (r ') ; R r ρ dr − ∞ 2 R ∫ R ∞ − 1 r '2 ρ d r ' ; ora la prima parte, ε0r ' ∞ 1 r 2ρ d r = Q TOT < ∞ , è uguale a r ρ d r , considerando che 0 0 ε0R ∞ R R 1 1 quindi V ( R ) = r 2ρ d r − r ' ρ dr ' ε0R 0 ε0 ∞ ∫ r' ∫ 2 ∫ ∫ R 0 r 2ρ d r , ∫ rimane ora da calcolare lim V ( R ) ; sfruttando la continuità di ρ ( R ) potremo portarlo fuori R →0 dagli lim R →0 0+ integrali 1 ρ ( 0) ε0R 1 ε0 ∫ ∞ 0 ∫ R 0 quando r 2 dr − r ' ρ dr ' = ora, dato che ∫ ∞ 0 1 ε0 1 ε0 ∫ ∞ 0 ∫ 0 ∞ opportuno: lim R →0 r ' ρ dr ' = 1 ε0R ∫ lim R →0 1 1 1 ρ ( 0) R3 − ε0R ε0 3 ∞ 1 R 0 r 2ρ d r − 1 lim ε 0 R →0 ∫ R ∞ r ' ρ dr ' = 0 ∫ r ' ρ dr ' = ∞ r ' ρ dr ' r 2ρ d r = Q TOT < ∞ , possiamo dividere ∫ 0 rρ dr = 1 ∫ 0 rρ dr + ∫ ∞ 1 r ρ d r ; per ∫ r ρ d r è finito, mentre per r > 1 , r ρ < r ρ , per cui se converge ∫ r ρ d r , converge anche ∫ r ρ d r . via della continuità di ρ (r ) , ∞ 2 0 ∞ 2 1 1 L’hamiltoniano per gli atomi a molti elettroni L’hamiltoniano per un atomo generico con molti elettroni deve tenere conto per ciascun elettrone del termine di energia cinetica, dell’interazione con il nucleo e dell’energia coulombiana di interazione con tutti gli altri elettroni componenti il sistema; di conseguenza, avrà la forma ˆ= H n ∑ i =1 ˆ 2 Ze 2 p i − 2m 4πε0 n ∑ i =1 1 e2 1 + ri 4πε0 2 ∑ x −1 x i,j i≠j i . j ( ) Le soluzioni dovranno essere funzioni a più particelle, ψ x1 ,… , xn , eventualmente antisimmetrizzate qualora fosse necessario. In effetti il problema è estremamente complesso, e non ammette soluzioni analitiche note (era già impossibile la soluzione per l’elio, il sistema multielettroni più semplice). L’approssimazione di Hartree Una semplificazione (piuttosto pesante) al problema prevede un approccio di questo tipo: piuttosto che considerare l’interazione istantanea tra ciascun elettrone e tutti gli altri (il che rende tra l’altro l’hamiltoniano non separabile), studiamo il comportamento “medio” tra ogni elettrone e la distribuzione di carica che si può fare corrispondere agli altri componenti del Consideriamo quindi che sia possibile definire un potenziale che esprima l’interazione di ciasistema. scun elettrone con tutti gli altri; in tal caso l’hamiltoniano diventa ˆ= H n ∑ i =1 ˆ 2 Ze 2 p i − 2m 4πε0 n ∑ i =1 1 + ri n ∑ V , che è separabile e permette quindi di trovare per ogni elettroi i =1 80 ( ) ne una funzione d’onda di singola particella ψin xi ( ) ( ) ˆ i ψin xi = E in ψin xi , con tale che H 2 ˆ2 ˆ i = pi − Ze 1 + Vi . l’hamiltoniano di singola particella H 2m 4πε0 ri Sappiamo ora che la probabilità di trovare l’elettrone i in una posizione x è data da ψin ( x ) ; è quindi ragionevole supporre (analogamente a quanto fatto nel razionalizzare il 2 significato dell’integrale di Coulomb nell’atomo di elio) che il potenziale medio generato da ( ) ( ) ciascun elettrone corrisponda a quello di una distribuzione di carica ρi x = e ψin x 2 . Possiamo quindi definire il potenziale medio sentito dall’elettrone i -esimo come e2 Vi ( xi ) = 4πε0 ∑∫ j ≠i ψ j (x ) xi − x 2 d3 x Le soluzioni autoconsistenti Il problema è però solo apparentemente risolto: in effetti per esprimere il potenziale di Hartree agente su ciascun elettrone, dovremmo conoscere tutte le altre funzioni d’onda. Il problema però si presta molto bene all’applicazione di una specie di metodo di punto fisso, la ricerca cioè di un potenziale autoconsistente. Si parte cioè da una stima approssimativa del potenziale agente. Scegliamo per cominciare un potenziale radiale che tenda a zero per r → ∞ , e a una costante finita positiva per r → 0 (abbiamo dimostrato nel primo paragrafo che questo ultimo assunto è giustificato per una distribuzione continua di carica). Risolviamo l’equazione di Hartree per questo potenziale di prova, ottenendo un primo set di soluzioni. Occupiamo i livelli ottenuti da questa soluzione in modo da minimizzare l’energia, rispettando la forma debole del principio di esclusione di Pauli (massimo due elettroni con spin opposti per ciascun livello); calcoliamo il potenziale generato dalla distribuzione di carica associata a questo set di funzioni d’onda; risolviamo l’equazione di Hartree con il nuovo potenziale, ottenendo quindi un set perfezionato di stati. Si ripete il procedimento fino a quando il potenziale ottenuto non differisce di una quantità molto piccola da quello del passo precedente. In tal caso si dice che il campo è autoconsistente, e riteniamo di aver trovato un’approssimazione accettabile degli stati e delle relative energie. La correzione di Fock Avendo applicato la forma debole del principio di esclusione di Pauli, non abbiamo richiesto che la funzione d’onda complessiva fosse antisimmetrica; in questo modo la nostra approssimazione ignora completamente le forze di scambio. Un modo per tenerle in considerazione è aggiungere un termine 2 ˆF ψi ( xi ) = − e V 4πε0 ∑ ψ (x ) ∫ i j ≠i ψ j ∗ ( x ) ψi ( x ) xi − x d3 x , ottenendo quindi come hamiltoniano 2 ˆ2 ˆ i = pi − Ze 1 + Vi + V ˆF H 2m 4πε0 ri Stato fondamentale per gli atomi a molti elettroni Simboli di termine e indicazione della configurazione Lo schema di occupazione dei livelli per un atomo a molti elettroni si scrive elencando i livelli occupati con il relativo numero di elettroni presenti (ad esempio per il carbonio 1s 22s 22p 2 ). Gli orbitali si riempiono secondo il principio di Aufbau. A meno che l’atomo non abbia una shell completa, per la stessa occupazione sono possibili diverse disposizioni degli elettroni. Entreremo nel merito di quale sia quella a minor energia in seguito, per adesso ci limitiamo a descrivere la una simbologia adatta a codificare univocamente la configurazione dell’atomo. 81 ˆ Si considerano gli operatori spin totale S = ∑ ˆS , momento angolare totale i i ˆ L= ∑ ˆL i e i ˆ ˆ ˆ momento totale J = S + L ; l’atomo si troverà in uno stato che sia autovalore per i moduli quadri di questi operatori (gli autostati si costruiscono come combinazione lineare di ap- Szi e ˆ Lzi ). propriati autostati di ˆ Conseguentemente per l’autostato varranno le relazioni ˆ2 S ψ = S (S + 1 ) ψ , ˆ2 ˆ L ψ = L ( L + 1 ) ψ e J2ψ = J ( J + 1 ) ψ , con i valori consentiti dalle relazioni di somma dei momenti angolari. Il simbolo che descrive lo stato atomico ha la forma 2S +1 {L}J , dove al posto di {L} si scrive un simbolo S , P , D … per indicare rispettivamente i valori di L = 0, 1, 2… ; ad esempio, un atomo di carbonio in uno stato con L = 1 , S = 1 , J = 0 si scriverebbe 1s 22s 22p 2 3P0 Regole di Hund e stato a minima energia Una prima osservazione da fare è che tutti gli elettroni degli shell completamente pieni non contribuiscono ai momenti angolari totali; in effetti, ciascun singolo orbitale 2p doppiamente occupato ha spin totale nullo, visto che per m=1 m=0 m=-1 il principio di esclusione di Pauli può essere soltanto nello stato di singoletto, e per un guscio completo il momento angolare orbitale totale è nullo. Inoltre se gli elettroni completano una shell esiste un solo modo di occupare gli 2p orbitali in modo da minimizzare l’energia; il problema m=1 m=0 m=-1 sorge quando un insieme di orbitali in prima approssimazione degeneri è solo parzialmente occupato; ad esempio, in figura sono riportate solo due delle molteplici configurazioni possibili per i due elettroni 2p del carbonio. Per risolvere il problema si possono adottare delle regole, che stabiliscono quali valori di L , S , J caratterizzino lo stato a minima energia. Tali regole, però, si fondano su uno schema di accoppiamento detto di Russel-Saunders, o ˆ LS , che preveder che S = ∑ ˆS i ˆ e L= i ∑ ˆL i siano ben definiti, cioè che sia possibile ac- i coppiare i momenti orbitali e di spin dei singoli elettroni prima di procedere con l’accoppiamento LS che viene eseguito sui momenti totali. In effetti questo è possibile solo quando l’interazione spin-orbita (che come abbiamo visto rende ml e ms dei cattivi numeri quantici) non è particolarmente intensa, cioè solo per gli atomi leggeri; per gli atomi pesanti occorre accoppiare direttamente momento orbitale e spin per i singoli elettroni, e poi formare il momento totale. Si considerano quindi come ˆ ˆ ˆ ˆ operatori ji = Si + Li per ciascun elettrone, e J = ˆ ∑ j . Uno schema di accoppiamento di i i questo tipo si dice accoppiamento jj . REGOLE DI HUND: il termine a minore energia è, tra quelli possibili in accoppiamento LS , quello che ha: 1. molteplicità di spin S massima 2. momento angolare orbitale totale L massimo 3. per atomi con il set degenere meno che semipieno, J minimo, per quelli con il set più che semipieno, J deve essere il massimo possibile Tali regole possono essere giustificate in questo modo: massimizzando lo spin totale ottengo le combinazioni di multipletto che hanno la parte di spin simmetrica, e che quindi devono avere parte spaziale antisimmetrica; in questo modo, 82 grazie alle forze di scambio, riduco l’interazione coulombiana destabilizzante tra gli elettroni la seconda regola ha anche essa a che fare con proprietà delle funzioni d’onda per cui l’interazione tra gli elettroni diminuisce se questi hanno momento orbitale totale elevato la terza regola dipende dall’interazione spin-orbita; si dimostra infatti che si può scrivere il ˆ ˆ ˆ ˆ J2 − S2 − L2 ˆ SO = Aˆ S⋅L = A termine di interazione spin-orbita come H ; la costante di pro2 porzionalità dipende dall’occupazione dello stato, ed è positiva se la shell è meno che semipiena, negativa altrimenti. É ora chiaro il significato della regola: se la shell è meno che semipiena il termine spin-orbita è destabilizzante, e quindi occorre minimizzare J ; se invece è più che semipiena, il termine è negativo e quindi stabilizzante, e si richiede dunque di massimizzare J Un esempio: lo stato dell’ossigeno L’ossigeno atomico, nel suo stato neutro, ha 8 elettroni, che quindi si occupano gli orbitali come 1s 22s 22p 4 ; abbiamo quindi 4 orbitali da sistemare nei 6 spinorbitali 2p ; costruiamo tutti i microstati possibili, cioè tutti gli stati con i singoli elettroni aventi i possibili valori di ml , ms individuali. Dato che per ogni spinorbitale può essere assegnato ad un solo elettrone per il principio di esclusione di Pauli, e che non ci interessa l’ordine con cui sono assegnati gli stati 6 4 agli elettroni, abbiamo un totale di = 6 ×5× 4 ×3 = 15 microstati possibili. 4 ×3× 2× 1 m 1 2 m2 m2 m2 2 3 4 Descriviamo ciascun microstato nella forma ml , ml , ml , ml ; ad esempio lo stato con ( ) si scriverà 1, 1, 0, −1 . Enumerando i microstati possibili troviamo che essi sono (1, 1, 0, 0) (1, 1, −1, −1 ) ( −1, −1, 0, 0) (1, 1, −1, 0) (1, 1, −1, 0) (1, 1, −1, 0) (1, 1, −1, 0) ( 0, 0,1, −1) (0, 0, 1, −1) (0, 0,1, −1 ) (0, 0, 1, −1) ( −1, −1,1, 0) ( −1, −1, 1, 0) ( −1, −1,1, 0) ( −1, −1, 1, 0) Applicando le regole di composizione dei momenti angolari successivamente ai quattro elettroni in esame è facile osservare che i momenti orbitali e di spin totali possono assumere i valori L = 0, 1, 2,3, 4 e S = 0, 1, 2 in effetti, min S = min ( s ± s ± s ± s ) con s = 1 2 e min L = min (l ± l ± l ± l ) con l = 1 visto che abbiamo a che fare con elettroni p . Chiaramente non tutti questi stati sono possibili, per via del principio di esclusione; ad esempio, per avere uno stato con L = 4 dovremmo avere uno stato con M L = 4 , ma dato che ML = ∑m li , questo significherebbe avere quattro elettroni che occupano lo stato con ml = 1 , i cosa evidentemente impossibile. Costruiamo quindi una tabella nella quale indichiamo per ciascuno dei microstati elencati i corrispondenti valori di M L e M S : M L \ MS +2 +1 0 −1 −2 +1 0 −1 (1, 1, 0, 0) (1, 1, −1, 0) (1, 1, −1, 0) ; (1, 1, −1, 0) (1, 1, −1, 0) (0, 0, −1, −1) (1, 1, −1, −1) ; (0, 0, −1, −1) ; (0, 0, −1, −1) (0, 0, −1, −1) ( −1, −1,1, 0) ( −1, −1,1, 0) ; ( −1, −1, 1, 0) ( −1, −1, 1, 0) ( −1, −1, 0, 0) 83 ˆ ˆ Procediamo ora con una tecnica di decimazione: gli autostati di S2 e di L2 possono essere espressi come combinazione lineare degli stati non accoppiati sopra elencati; deve però conservarsi la dimensionalità dello spazio, e quindi non potrò fare un numero di combinazioni tra loro linearmente indipendenti maggiore di quello degli stati disaccoppiati. Ragioniamo ora in questi termini: se esiste uno stato con M L = 2 e M S = 0 dovrà necessa- ˆ ˆ riamente esistere un autostato di L2 e S2 con L = 2 e S = 0 , 1 D . Ma se esiste tale stato dovranno necessariamente esistere anche una serie di stati con M S = 0 e M L = −2, −1, 0, 1, 2 ; elimino dunque dalla tabella gli stati indipendenti associati a tale configurazione. M L \ MS +2 +1 0 −1 −2 +1 0 −1 (1, 1, 0, 0) (1, 1, −1, 0) (1, 1, −1, 0) ; (1, 1, −1, 0) (1, 1, −1, 0) (0, 0, −1, −1) (1, 1, −1, −1 ) ; (0, 0, −1, −1) ; (0, 0, −1, −1 ) (0, 0, −1, −1) ( −1, −1,1, 0) ( −1, −1,1, 0) ; ( −1, −1, 1, 0) ( −1, −1, 1, 0) ( −1, −1, 0, 0) Ora rimangono configurazioni con M L = 1 e M S = 1 ; deduciamo che sia presente uno stato 3 P , per il quale devono esistere stati con M S = −1, 0, 1 e M L = −1, 0, 1 ; li eliminiamo dal diagramma. M L \ MS +2 +1 0 −1 −2 +1 0 −1 (1, 1, 0, 0) (1, 1, −1, 0) (1, 1, −1, 0) ; (1, 1, −1, 0) (1, 1, −1, 0) (0, 0, −1, −1) (1, 1, −1, −1 ) ; (0, 0, −1, −1) ; (0, 0, −1, −1 ) (0, 0, −1, −1 ) ( −1, −1,1, 0) ( −1, −1,1, 0) ; ( −1, −1, 1, 0) ( −1, −1, 1, 0) ( −1, −1, 0, 0) L’ultimo stato indipendente rimasto corrisponde ad una configurazione 1 S Ora che abbiamo individuato che le configurazioni permesse dal principio di esclusione per l’ossigeno sono 1 D , 3P , 1 S possiamo applicare le regole di Hund; Già la prima regola ci permette di individuare che la configurazione con la massima molteplicità di spin è la 3P ; non occorre applicare la seconda regola, mentre per definire il momento totale J osserviamo che 0 = S − L ≤ J ≤ S + L = 2 ; il livello è più che semipieno e quindi dobbiamo scegliere il valore massimo, per cui infine ricaviamo che il simbolo che descrive lo stato fondamentale dell’ossigeno è 1s 22s 22p 4 3P2 Le regole di selezione per le transizioni per un atomo multielettronico Per un atomo a molti elettroni le regole di selezione sono ∆J = 0, ±1 ma sono proibite le transizioni J = 0 → J = 0 ; inoltre deve essere ∆L = 0, ±1 , ∆S = 0 , ∆l = ±1 . Mentre le regole sul momento totale J sono sempre ben formulate, le altre tre valgono solo quando è applicabile l’accoppiamento LS e i vari momenti totali sono ben definiti. 84 Effetto Zeeman Gli effetti magnetici sull’hamiltoniano atomico Consideriamo un atomo immerso in un campo magnetico B , e tutte le correzioni all’hamiltoniano imputabili alle proprietà magnetiche dell’atomo stesso, avremo quindi: ˆ so = − l’interazione spin-orbita, che abbiamo dimostrato essere H 1 d V µ B gs ˆ ˆ S⋅L emc 2r d r 2 l’interazione tra il momento angolare orbitale di ciascun elettrone con il campo magnetico ˆ Li = −ˆ esterno, H µl ⋅ B = µ B gl ˆ ˆ L = µ B gl ˆ Li ⋅ B , che sommata per tutti gli elettroni dà H L⋅B, ˆ dove L è il momento orbitale totale µ g ˆ ˆ Si = −ˆ µ s ⋅ B = B s Si ⋅ B , che sil’interazione degli spin con il campo magnetico esterno, H ˆS = milmente dà una correzione complessiva per tutti gli elettroni H µ Bgs ˆ S⋅B Ricordando che gl = 1 e che gs = 2 con un’ottima approssimazione, l’hamiltoniano complessi- µ ˆ ˆ µ ˆ ˆ =H ˆ 0 + γˆ vo si può scrivere come H S⋅L + B L⋅B +2 B S⋅B Abbiamo ora un problema: scegliendo l’orientazione arbitraria degli assi in modo che l’asse z coincida con la direzione del campo magnetico esterno, l’hamiltoniano si riduce a µ ˆ µ ˆ =H ˆ 0 + γˆ H S ⋅ L + B Bˆ L z + 2 B Bˆ Sz ; abbiamo però visto che ˆ Lz ed ˆ Sz non sono inva- rianti del moto per un sistema contenente la correzione spin-orbita, ma allo stesso tempo ˆ2 J non commuta con un hamiltoniano contenente ˆ Lz o ˆ Sz , e quindi non possiamo introdurre nemmeno la rappresentazione accoppiata. Effetto Zeeman normale z Consideriamo per prima cosa la situazione con un campo esterno applicato molto intenso; la correzione spin-orbita diventa a ˆ ˆ questo punto trascurabile, nel senso che L e S precedono attorno al campo magnetico, e si possono considerare quasi completamente disaccoppiati; in una condizione come questa Sz ed ˆ ˆ Lz µB L sono costanti nel tempo, e quindi M L ed M S sono buo- ni numeri quantici. A questo punto la correzione all’energia dovuta all’interazione con il campo magnetico esterno si calcola semplicemente come ∆E = B µ B ˆ Lz + 2 B B ˆ Sz S = µ B B [ M l + 2M s ] Effetto Zeeman anomalo Il caso in cui si abbia un campo esterno applicato relativamente debole è invece di più difficile ˆ ˆ trattazione, visto che non possiamo più trascurare l’accoppiamento dei momenti totali L e S . Abbiamo quindi una situazione come quella descritta in figura: ˆ ˆ ˆ L e S precedono attorno al momento totale J , ed a ciascuno di essi è associato il corrispondente momento magnetico ˆ il momento magnetico totale non è antiparallelo a J e vi precede attorno 85 possiamo considerare che il momento magnetico totale abbia una componente paral- z ˆ lela a J , µ J costante, mentre e che la com- J=L+S ponente perpendicolare abbia una media temporale nulla Iniziamo quindi a considerare µ ˆ ˆ ˆ µ=ˆ µs + ˆ µl = − B L + 2S ; la proiezione lungo ˆ usando l’algebra vettoriale, è J, ˆ ˆ ˆ ˆ ˆ L + 2S ⋅ L + S ˆ ˆ µ ˆ J ⋅ µ J. ˆ J=− B µJ = ˆ2 ˆ2 J J L S µl µs Dobbiamo però considerare anche la presenza del campo magnetico, che non è abbastanza forte da rompere l’accoppiamento, ma provoca ˆ una precessione di J (e di conseguenza di µ J ) µ j attorno alla sua direzione. L’angolo formato tra i due vettori è però costante, e quindi possiamo calcolare il prodotto scalare del campo magnetico per µ J µ = µ l + µs ˆ ˆ ˆ ˆ L + 2S ⋅ L + S ˆ µ J⋅B ˆ µJ ⋅ B = − B ˆ2 J z Assegniamo ora la direzione di z parallela a B , in J ˆ modo tale che J ⋅ B = Bˆ Jz A questo punto siamo pronti a calcolare la correzione all’energia dovuta al campo magnetico: abbiamo infatti ∆E = −µ ⋅ B ≈ −µ J ⋅ B , considerando l’interazione B media; inserendo le varie espressioni trovate finora calcoliamo ∆E = µ j µ µB b µB J ˆ ˆ ˆ ˆ ˆ B L + 2S ⋅ L + S z = ˆ J2 J ˆ ˆ ˆ ˆ ˆ B L2 + 2S2 + 3L ⋅ S z = ˆ J2 J µ B 1 ˆ2 ˆ ˆ ˆ ˆ ˆ B 2L + 4S2 + 3 J2 − L2 − S2 z = 2 ˆ J2 J µ B 1 ˆ2 ˆ2 ˆ2 ˆ B 3J − L + S z ˆ 2 J2 Calcoliamo tale valor medio su uno stato accoppiato ψ S ,L,J ,M J ; sappiamo come si esprimono gli autovalori del modulo quadro di un momento angolare. Di conseguenza 86 ∆E = µB 1 B 2 2 MJ J ( J + 1) 2 (3J ( J + 1) − L ( L + 1) + S (S + 1)) = µ B BM J 2J ( J + 1 ) + J ( J + 1 ) − L ( L + 1 ) + S (S + 1 ) = µ B BM J g 2J ( J + 1 ) g =1+ J ( J + 1 ) − L ( L + 1 ) + S (S + 1 ) è detto fattore di Landé, e rende conto della pertur2J ( J + 1 ) bazione all’energia di uno stato ψ S ,L,J ,M J immerso in un campo magnetico. L’approssimazione di Born-Oppenheimer La risoluzione dei problemi molecolari La risoluzione analitica dei problemi molecolari, risultanti cioè dall’interazione di più nuclei e di (almeno) un elettrone risultano in generale irrisolvibili per via analitica. Occorre quindi adottare delle approssimazioni; in primo luogo, in considerazione del fatto che la massa nucleare è molto più grande di quella degli elettroni, è di solito possibile considerare il moto degli elettroni in un potenziale generato dai nuclei fissi, piuttosto che tentare di risolvere il problema a più particelle. L’hamiltoniano per una molecola e l’approssimazione Consideriamo l’hamiltoniano per una molecola composta da N nuclei e da un elettrone. L’hamiltoniano dovrà considerare le interazioni tra tutte queste particelle, che comunque potremo raccogliere in un termine di energia potenziale dipendente dalle loro rispettive posizio- ˆ= ni. H ˆ2 p e + 2me N ∑ j =1 ˆ2 p j + V xe , X 1 , … , X N 2M j ( ) ( ) La soluzione dovrà chiaramente essere della forma Ψ xe , X1 ,… , X N ; potremo certamente scomporre tale funzione in una parte riguardante unicamente i nuclei, ed in una riguardante l’elettrone, che contiene le posizioni dei nuclei come parametri, ( ) ( ) ( ) Ψ xe , X 1 , … , X N = ψ xe , X 1 , … , X N χ X 1 , … , X N ˆ Ψ = ΜΨ , e inseriamo la Formuliamo l’equazione di Schroedinger indipendente dal tempo, H soluzione nella forma fattorizzata: Consideriamo prima l’effetto di un laplaciano sulla funzione fattorizzata: 3 ∂2 ( ψχ ) ∑∂ ∇ j 2 ( ψχ ) = i =1 3 ∑ i =1 3 ∑ i =1 ∂ ∂ ∂2ψ ( ) Xj 2 i ∂2ψ (X ) j Possiamo ˆ ψχ = − H χ+ 2 χ+ i (X ) j 2 ( ) ∂ Xj ( ) ora 2 i N ∑ j =1 ∂ ∂ Xj ∂ψ ∂ X j ∑ ( ) ( ) i ∂ψ 2 ψ +2 ∂ Xj χ+ i ∂χ ∂ Xj ( ) i ψ = ∂χ = ∂ Xj i ∂χ 2 2 = ∇ j ( ψ ) χ + ∇ j ( χ ) ψ + 2∇ j ψ ⋅ ∇ j χ ∂ Xj i ( ) ( ) ∂2χ ∂ Xj 3 i =1 i ∂2χ ∇e ψ χ− 2me 2 = 2 i ψ +2 ∂ψ ∂ Xj ( ) ( ) calcolare ∇j χ ψ− 2m j 2 2 i N i l’effetto 2 ∑ 2m (∇ j =1 j 2 j dell’hamiltoniano, ottenendo (ψ ) χ + 2∇ j ψ ⋅ ∇ j χ ) + V ( xe , X1,…, X N ) ψχ che ˆ 0ψχ + H ˆ ' ψχ , dove possiamo riscrivere come H 87 ˆ 0ψχ = − H ˆ ' ψχ = − H ∇e 2ψ χ− 2me 2 N N ∑ j =1 2 ∑ 2m (∇ j =1 2 j ∇ j 2χ ψ + V xe , X1,… , X N ψχ e 2m j 2 ( ) ( ψ ) χ + 2∇ j ψ ⋅ ∇ j χ ) j Consideriamo ora l’equazione agli autovalori ( ) ( ) ∇e 2ψ + V xe , X 1 , … , X N ψ = E X 1 , … , X N ψ 2me 2 − ˆ 0ψχ = Κψχ come − Possiamo riscrivere H N ∑ j =1 ∇ j 2χ ψ + E X1,… , X N ψχ = K ψχ , che pos2m j 2 ( N ∑ siamo semplificare dividendo per ψ , ottenendo − j =1 ) ∇ j 2χ + E X 1 ,… , X N χ = K χ 2m j 2 ( ) Abbiamo quindi ottenuto un’equazione per l’elettrone, N ∑ − ( ) ( ) ∇e 2ψ + V xe , X1,… , X N ψ = E X1,… , X N ψ , e una per i nuclei, 2me 2 − j =1 ∇ j 2χ + E X 1 ,… , X N χ = K χ 2m j 2 ( ) In definitiva, l’approssimazione di Born-Oppeneheimer si può identificare con l’aver trascurato ˆ ' ψχ = − il termine H N 2 ∑ 2m (∇ j =1 2 j ( ψ ) χ + 2∇ j ψ ⋅ ∇ j χ ) j Metodo di Heitler-London per l’idrogeno Un primo modo di affrontare il problema del legame chimico tra due atomi costituisce nel considerare come funzioni d’onda le stesse funzioni degli atomi isolati, e di costruire i determinanti di Slater per il sistema. In questa approssimazione, si considerano di fatto gli elettroni centrati sui due atomi, e si fa derivare il legame dalle forze di scambio. A B x Consideriamo come esempio la molecola di idrogeno H2 ; uti- lizziamo come funzioni di base gli stati 1s relativi ai due nuclei di idrogeno; avremo quindi una funzione d’onda ψ1sA centrata sul nucleo A , e una ψ1sB centrata sul nucleo B . Indicando con x1 e x2 le posizioni dei due elettroni e con σ+ e σ− le parti di spin di tripletto e di singoletto rispettivamente, possiamo scrivere le funzioni d’onda di tripletto e di singoletto come ( ) ( ) ( ) ( ) ( x ) ψ (x ) − ψ (x ) ψ (x ) σ SINGOLETTO: N ψ1sA x1 ψ1sB x2 + ψ1sA x2 ψ1sB x1 σ − TRIPLETTO: N ψ1sA 1 1sB 1sA 2 2 1sB 1 + Il fattore di normalizzazione non è 1 2 , perché gli stati componenti il determinante di Slater non sono ortogonali; si dimostra semplicemente che per entrambi gli stati esso vale ψ1sA ( x1 ) ψ1sB ( x2 ) ± ψ1sA ( x2 ) ψ1sB ( x1 ) ψ1sA ( x1 ) ψ1sB ( x2 ) ± ψ1sA ( x2 ) ψ1sB ( x1 ) = ψ1sA ( x1 ) ψ1sB ( x2 ) ψ1sA ( x1 ) ψ1sB ( x2 ) + ψ1sA ( x2 ) ψ1sB ( x1 ) ψ1sA ( x2 ) ψ1sB ( x1 ) ± ( ψ (x ) ψ (x ) ψ (x ) ψ (x ) 1sA 1 1sB 2 ± 2 ψ1sA ψ1sB 2 1sA 2 1sB 1 ) + ψ1sA ( x2 ) ψ1sB ( x1 ) ψ1sA ( x1 ) ψ1sB ( x2 ) = 2 88 per cui N = 1 dove S è l’integrale di overlap S = ψ1sA ψ1sB 2 (1 ± S 2 ) L’hamiltoniano per il sistema, considerando l’approssimazione di Born-Oppenheimer, comprenderà le interazioni dei due elettroni con ciascuno dei due nuclei e tra i due nuclei; trascuriamo per il momento le interazioni tra i due elettroni, che per il momento consideriamo con- ˆ= centrati sui nuclei: H ˆ2 ˆ2 p p e2 1 + 2 − 2m 2m 4πε0 1 e2 1 1 1 + + + + r1 A r1B r2A r2B 4πε0 1 rAB Calcoliamo quindi il valore di attesa per dell’energia per la funzione d’onda; la procedura è piuttosto lunga; si tratta di calcolare ˆ ( ψ1sA ( x1 ) ψ1sB ( x2 ) ± ψ1sA ( x2 ) ψ1sB ( x1 ) ) = ψ1sA ( x1 ) ψ1sB ( x2 ) ± ψ1sA ( x2 ) ψ1sB ( x1 ) H ˆ ψ1sA ( x1 ) ψ1sB ( x2 ) + ψ1sA ( x2 ) ψ1sB ( x1 ) H ˆ ψ1sA ( x2 ) ψ1sB ( x1 ) ± ψ1sA ( x1 ) ψ1sB ( x2 ) H (ψ 1sA ( x ) ψ ( x ) Hˆ ψ ( x ) ψ ( x ) 1 1sB 2 1sA 2 1sB 1 ˆ ψ1sA ( x1 ) ψ1sB ( x2 ) + ψ1sA ( x2 ) ψ1sB ( x1 ) H ) Calcoliamo ciascun termine separatamente; i termini saranno a due a due uguali, visto che differiscono solo per lo scambio degli indici delle posizioni dei due elettroni, e sono integrati su tutto lo spazio 3 × 3 . ˆ ψ1sA ( x1 ) ψ1sB ( x2 ) = ψ1sA ( x1 ) ψ1sB ( x2 ) H ˆ2 p e2 1 ψ1sA ( x1 ) 1 − ψ (x ) 2m 4πε0 r1 A 1sA 1 ψ1sB ( x2 ) ψ1sB ( x2 ) + ˆ2 p e2 1 ψ1sB ( x2 ) 2 − ψ (x ) 2m 4πε0 r2B 1sB 2 ψ1sA ( x1 ) ψ1sA ( x1 ) + ψ1sA ( x1 ) − e2 1 ψ ( x ) ψ1sB ( x2 ) ψ1sB ( x2 ) + 4πε0 r1B 1sA 1 ψ1sB ( x2 ) − e2 1 ψ ( x ) ψ1sA ( x1 ) ψ1sA ( x1 ) + 4πε0 r2A 1sB 2 e2 1 ψ ( x ) ψ ( x ) ψ1sA ( x1 ) ψ1sB ( x2 ) 4πε0 rAB 1sA 1 1sB 2 Definiamo gli integrali: J = ψ1sM ( x N ) − e2 1 ψ ( x ) che di fatto dà l’energia coulombiana media 4πε0 rNM ' 1sM N dell’elettrone N nell’orbitale centrato sull’atomo M , nel campo generato dall’altro nucleo M ' K = ψ1sM ( x N ) − e2 1 ψ (x ) 4πε0 rNM 1sM ' N e osserviamo che i primi due termini corrispondono ad hamiltoniani idrogenoidi applicati a funzioni d’onda idrogenoidi. Il lungo integrale sopra, considerando anche l’ortonormalità degli stati componenti, si riduce a E 1s × 1 + E 1s × 1 + J × 1 + J × 1 + e2 1 e2 1 ; tale valore va molti× 1 = 2E 1s + 2J + 4πε0 rAB 4πε0 rAB plicato per 2 , visto che il secondo termine è uguale 89 Il terzo e quarto termine risultano invece ˆ ψ1sA ( x1 ) ψ1sB ( x2 ) = ψ1sA ( x2 ) ψ1sB ( x1 ) H ˆ2 p e2 1 ψ1sB ( x1 ) 1 − ψ (x ) 2m 4πε0 r1 A 1sA 1 ψ1sA ( x2 ) ψ1sB ( x2 ) + ˆ2 p e2 1 ψ1sA ( x2 ) 2 − ψ (x ) 2m 4πε0 r2B 1sB 2 ψ1sB ( x1 ) ψ1sA ( x1 ) + ψ1sA ( x2 ) − e2 1 ψ1sB ( x2 ) ψ1sB ( x1 ) ψ1sA ( x1 ) + 4πε0 r2A ψ1sB ( x1 ) − e2 1 ψ1sA ( x1 ) ψ1sA ( x2 ) ψ1sB ( x2 ) + 4πε0 r1B e2 1 ψ1sA ( x2 ) ψ1sB ( x1 ) ψ1sA ( x1 ) ψ1sB ( x2 ) 4πε0 rAB Un rapido confronto con le definizioni degli integrali K e S mostrano che tale espressione si riduce a E 1s × S 2 + E 1s × S 2 + K × S + K × S + e2 1 e2 1 2 S , an× S 2 = 2E 1sS 2 + 2KS + 4πε0 rAB 4πε0 rAB che questo da moltiplicare per 2 . Per ottenere finalmente Ĥ ( occorre sommare il tutto e dividere per il fattore di normalizza- ) ˆ = 2E 1s + zione 2 1 ± S 2 . Facendolo si ottiene in modo semplice H J ± KS e2 1 + 2 1±S 4πε0 rAB I valori di distanza internucleare e di potenziale minimo ottenibili con tale procedimento sono grossolanamente in accordo con i dati sperimentali. Si potrebbe migliorare tale valore inserendo un termine di interazione elettrone-elettrone nell’hamiltoniano. Orbitali molecolari LCAO L’approccio degli orbitali molecolari Un modo alternativo di affrontare il problema del legame chimico consiste sostanzialmente in un’applicazione del metodo variazionale, nel quale si adotta come base un set di orbitali atomici relativa ai vari atomi componenti la molecola, e se ne fa una combinazione lineare, i cui coefficienti sono ottimizzati con il principio variazionale. Spesso è possibile semplificare notevolmente i calcoli mediante considerazioni di simmetria, che consentono di stabilire che determinati integrali si annullano, o che permettono di scegliere come set di base delle combinazioni di orbitali atomici già adattate secondo la simmetria del problema. Lo ione molecolare H2+ e A B In linea di principio dovremmo affrontare un problema a tre x corpi, ma l’approssimazione di Born-Oppenheimer ci permette piuttosto di studiare il moto di un elettrone nel potenziale generato dai due nuclei, la cui distanza reciproca è semplicemente un parametro del sistema; in effetti questa approssimazione conduce ad un problema risolvibile anche analiticamente, anche se in modo tutt'altro che semplice. L’hamiltoniano del sistema è 2 ˆ2 ˆ= p − e H 2m 4πε0 1 1 e2 1 , e tiene in considerazione gli effetti dell’interazione cou + + rA rB 4πε0 rAB lombiana dell’elettrone con i due nuclei e dei due nuclei tra loro. Come anticipato nell’introduzione, dovremmo adoperare il metodo variazionale per trovare la combinazione lineare di orbitali atomici che minimizza l’energia del sistema; in effetti, in que90 sto caso molto semplice è subito riconoscibile una simmetria di inversione rispetto al punto medio dell’asse internucleare; qualsiasi funzione d’onda che descriva il sistema deve quindi essere necessariamente simmetrica od antisimmetrica rispetto a tale centro di inversione (in modo tale che il modulo quadro della funzione d’onda (che è poi l’osservabile fisica) abbia la stessa simmetria del sistema stesso). La nostra prima scelta sarebbe certamente fare una combinazione lineare delle funzioni d’onda 1s corrispondenti ai due atomi di idrogeno componenti lo ione molecolare. È immediato convincersi che le uniche combinazioni lineari che soddisfino i requisiti di simme- ( ) ( ) tria sono ψ + = ψ1sA x + ψ1sB x ( ) ( ) e ψ − = ψ1sA x − ψ1sB x ; quando il sistema presenta un centro di inversione si è soliti contrassegnare le funzioni d’onda simmetriche come gerade (pari) e quelle antisimmetriche come ungerade (dispari). Nel nostro caso, chiameremmo ψ + ≡ ψ g e ψ − ≡ ψu . Si dimostra molto facilmente che il fattore di normalizzazione è 1 l’integrale di sovrapposizione; infatti 2 ± 2S , dove S è ψ ± ψ ± = ψ1sA ψ1sA + ψ1sB ψ1sB ± 2 ψ1sA ψ1sB = 2 ± 2S Anche l’energia dei due autostati si calcola in modo analogo a quanto fatto nel modello di le definizioni di J = ψ1sM ( x N ) − e2 1 ψ (x ) 4πε0 rNM ' 1sM N Heitler-London: ricordando K = ψ1sM ( x N ) − e2 1 ψ ( x ) , con la differenza che qui abbiamo un solo elettrone 4πε0 rNM 1sM ' N e e quindi gli indici sulle posizioni sono superflui, calcoliamo ˆ ψ ± = ψ1sA H ˆ ψ1sA + ψ1sB H ˆ ψ1sB ± 2 ψ1sA H ˆ ψ1sB = ψ± H ˆ2 p e2 1 e2 1 ψ1sA − ψ1sA + ψ1sA − ψ1sA + 2m 4πε r πε 4 r 0 A 0 B ˆ2 p e2 1 e2 1 ψ1sB − ψ1sB + ψ1sB − ψ1sB + 2m 4πε r 4πε0 rA 0 B ±2 ψ1sA e2 1 + 2 (1 ± S ) = 4πε0 rAB 2 e 1 e2 1 = 2E 1s (1 ± S ) + 2J ± 2K + 2E 1s + 2J ± 2 ( E 1sS + K ) + 2 (1 ± S ) 4πε0 rAB 4πε0 rAB Dividendo per ψ ± ψ ± = 2 ± 2S troviamo quindi il valore d’attesa per l’energia, cioè E ± = E 1s + ˆ2 p e2 1 e2 1 − ψ1sB + ψ1sA − ψ1sB 4πε0 rA 2m 4πε0 rB J ±K e2 1 + 1 ± S 4πε0 rAB La molecola di idrogeno È possibile aggiungere un secondo elettrone, nell’approssimazione piuttosto pesante che questo non interagisca con il primo e quindi non alteri i livelli energetici della molecola; per il principio di esclusione di Pauli lo stato può essere unicamente di singoletto, e quindi (considerando ψu = 1 le funzioni d’onda normalizzate ψg = 1 2 + 2S ( ψ1sA ( x ) + ψ1sB ( x ) ) e 2 − 2S ( ψ1sA ( x ) − ψ1sB ( x ) ) ), la funzione d’onda a due elettroni per lo stato fondamen- ( ) α 1 β 2 −α 2 β 1 ( ) ( ) ()2 () ( ) tale sarà ψ = ψ g x1 ψ g x2 Si può calcolare che l’energia associata a questo stato è E ± = 2E 1s + 2 J ±K e2 1 + 1 ± S 4πε0 rAB 91 L’approssimazione è migliore che nel caso del legame di valenza: infatti se eseguiamo i prodotti (trascurando il termine di normalizzazione) ψ g ( x1 ) ψ g ( x 2 ) = ψ1sA ( x1 ) ψ1sB ( x2 ) + ψ1sA ( x2 ) ψ1sB ( x1 ) + ψ1sA ( x1 ) ψ1sA ( x2 ) + ψ1sB ( x1 ) ψ1sB ( x2 ) . Oltre al termine TERMINE DI HEITLER-LONDON TERMINE "IONICO" con gli elettroni centrati sui due nuclei, è presente una parte che tiene conto della possibilità che i due elettroni si trovino istantaneamente concentrati su uno dei due nuclei. La combinazione di funzioni di base è più “ricca”, e quindi ci si può aspettare un miglior grado di approssimazione. Simmetrie delle funzioni d’onda e simboli di termine Consideriamo una molecola a simmetria cilindrica, con l’asse molecolare allineato lungo l’asse z ; l’operatore ˆ Lz commuta con l’hamiltoniano, e quindi una buona funzione d’onda deve esse- ˆy − y p ˆ x è indipendente dalla scelta Lz = x p re autostato di tale operatore. Tra l’altro, dato che ˆ dell’origine lungo l’asse z , possiamo di volta in volta “centrarlo” sul nucleo di ciascun atomo, ottenendo un operatore analogo a quello atomico. Sia data una funzione d’onda MO-LCAO ψ = ∑ c α , dove gli α i i i sono orbitali atomici cen- i trati sui vari ˆ Lz ψ = ∑ c ˆL α = ∑ c i z atomi i i i i costituenti ml ,i αi = ↑ solo se ml ,i =ml ∀i la ml molecola; ∑c α i i se applichiamo ˆ Lz , otteniamo = ml ψ i Lz se e solo se tutti gli Appare chiaro quindi che ciascun orbitale molecolare è autostato di ˆ orbitali atomici componenti sono autostati con lo stesso valore di ml Questo, oltre a fornirci una regola di simmetria per scegliere quali orbitali atomici usare per costituire un set di base per costruire gli MO, ci fornisce anche un criterio per classificare gli MO stessi; in base al valore di ml distingueremo MO di tipo σ ( ml = 0 ), π ( ml = ±1 ), δ ( ml = ±2 ) e così via. Lz , possiamo definire un simbolo di termine per la moleSempre basandoci sugli autovalori di ˆ cola, che dia informazioni sul suo stato, al di là dello schema di occupazione degli orbitali; la forma di tale simbolo richiama quella usata per gli atomi multielettronici: 2S +1 Λ P , dove S indica la molteplicità di spin, Λ è un simbolo che corrisponde al momento angolare totale lungo l’asse ( Σ per M l = 0 , Π per M l = ±1 ...) e P indica la parità (gerade o ungerade) rispetto all’inversione; per gli stati Σ , inoltre, si indica un apice + o − a seconda della parità rispetto alla riflessione per un asse passante per l’asse della molecola. Stati eccitati Gli stati eccitati di particella singola si possono costruire, in prima approssimazione, combinando tra loro orbitali atomici di pari energia e simmetria opportuna; per una molecola biatomica omonucleare, ad esempio, possiamo ricavare uno stato σg e uno σu sommando e sottraendo gli orbitali atomici 2s centrati sui due atomi; combinando i 2pm =1 possiamo invece ottenere stati πg e πu . In genere gli stati ottenuti sommando gli orbitali atomici (che presentano maggiore densità elettronica nella zona internucleare) hanno energia minore di quelli ottenuti per differenza; l’ordinamento complessivo andrebbe però dedotto caso per caso con calcoli accurati o misure spettroscopiche 92 Il riempimento dei livelli procede con regole simili a quelle per gli atomi a molti elettroni, occupando gli stati in ordine crescente di energia, ed in caso di occupazione parziale di stati degeneri, massimizzando lo spin. Riportiamo per esempio l’occupazione dei livelli per l’ossigeno. Il simbolo di termine per l’ossigeno sarà 1σg 2 2σu2 3σg 2 4σu2 5σg 2 1πu 4 2πg 2 ; il mo- m=1 m=-1 6σ u σπ g 2p 1π u 5σ g 4σ u 2s mento angolare totale è nullo, la funzione d’onda simmetrica e la molteplicità di spin è 1 ; la configurazione è quindi completata dal simbolo 3 Σg− . 3σ g 2σ u 1s Molecole biatomiche eteronucleari 1σ g Nel caso che la molecola sia formata da atomi diversi non è più possibile semplificare la formazione degli MO avvalendosi di considerazioni di simmetria; dobbiamo sviluppare quindi il calcolo variazionale per la LCAO. Scegliamo come base due orbitali di energia simile (la ragione di tale assunto sarà chiarita in seguito), ψ A e ψ B , centrati rispettivamente sugli atomi A e B . La forma generale del MO sarà ψ = c A ψ A + c B ψ B , con un fattore di normalizzazione 1 c A 2 + c B 2 + 2c Ac BS ; dove S è l’integrale di sovrapposizione ψ A ψ B ; definiamo inoltre, per ˆ ψ A , αB = ψB H ˆ ψB , β = ψA H ˆ ψB . sveltire la notazione, α A = ψ A H Ricordando la teoria variazionale, dobbiamo risolvere l’equazione secolare αA − E β − ES β − ES =0 αB − E Eseguiamo la semplificazione S ≈ 0 , e sviluppiamo il determinante; si ottiene l’equazione di secondo ( α A − E ) ( α B − E ) − β2 = 0 , grado E = 1 2 α A + α B ± (α A − α B ) 2 che ammette αA − αB l’espansione in soluzioni + 4β2 Riscrivendo tale espressione come E = 1 2 α A + α B ± α A − α B rando come serie 1+x =1+ β ) E ≈ 1 2 α A + α B ± α A − α B 1 x + …, 2 1+ possiamo 4β2 2 e conside( α A − α B ) scrivere (nell’ipotesi 2β2 1 + 2 ( α A − α B ) Sotto l’ipotesi aggiuntiva α A < α B , possiamo ricavare esplicitamente le due energie, β2 2β2 E − ≈ 1 2 α A + α B − α B + α A − = αA − αB − αA (αB − α A ) β2 2β2 E + ≈ 1 2 α A + α B + α B − α A + = αB + αB − αA (αB − αA ) In base a questi risultati possiamo fare due osservazioni: in primo luogo, facendo interagire tra loro i due orbitali di partenza, l’orbitale a minore energia viene stabilizzato, mentre quello a più alta energia viene destabilizzato. Questo significa che l’interazione non può provocare cambiamenti nell’ordine delle energie dei livelli interagenti, anzi tende ad accentuarne la diffe- ˆ ψ A , αB = ψB H ˆ ψB renza. In secondo luogo, dato che gli integrali α A = ψ A H corrispondono all’energia media dei due stati rispetto all’hamiltoniano molecolare, possiamo osservare che la 93 correzione alle energie dovuta all’interazione tra gli stati è tanto più marcata tanto minore è la differenza di energia tra i due livelli; due livelli puri con energie molto diverse daranno luogo a MO con energie quasi identiche agli stati di partenza. Questo giustifica il fatto di considerare, almeno per un approccio qualitativo allo studio del legame, l’interazione solo tra orbitali di energia simile. Per questo, ad esempio, si trascurano in genere gli orbitali che non corrispondano ad elettroni di valenza degli atomi costituenti la molecola. Rotazioni e vibrazioni molecolari per molecole biatomiche Il rotatore rigido La parte iniziale dello studio delle rotazioni di una molecola biatomica è molto simile a quella per gli atomi idrogenoidi; anche in questo caso, in effetti, abbiamo un sistema a due particelle ˆ2 ˆ2 ˆ = p1 + p2 + U x1 − x2 interagenti, che può essere descritto da un hamiltoniano del tipo H 2m1 ( 2m2 ) L’hamiltoniano può essere separato in una parte dipendente dal moto del centro di massa, ed in una parte che considera l’energia nel sistema di riferimento solidale al centro di massa. Que- ˆ2 ˆ = pr + U r ; per inciso, notiasta seconda parte, che è quella che ci interessa, ha la forma H 2µ ( ) mo che il momento di inerzia del sistema I = m1r12 + m2r22 , con le distanze riferite al centro di massa, può essere espresso come I = µd 2 , dove d è la distanza internucleare. Consideriamo infatti che, dato che la molecola è lineare e le distanze si riferiscono al centro di massa devono valere le relazioni m1r1 = m2r2 e r1 + r2 = d . Possiamo quindi eseguire la serie di operazioni r 2 r 2 I = m1m2 1 + 2 = m2 m1 m1m2 2 m1r1 mr 2 r1 + 2 2 r2 = r1 + r2 + m1 + m2 m2 m1 µ (r12 + r22 + r2r1 + r1r2 ) = µd 2 che ci permette di verificare l’uguaglianza. ˆ2 ˆ = pr + U r Da quanto fatto per l’idrogeno sappiamo che l’hamiltoniano H ( ) si può riscrive- 2µ ˆ2 2 1 ∂2 L ˆ =− × ⋅ + + U (r ) × ⋅ r re sfruttando le coordinate polari come H ( ) 2 2µ r ∂r 2µr 2 Nell’ipotesi di considerare la molecola come un rotatore rigido, non c’è componente radiale per ˆ= l’energia cinetica , e l’hamiltoniano si riduce a H ˆ2 L + U (r ) × ⋅ . Sappiamo che gli autostati 2µr 2 ˆ di L2 sono le armoniche sferiche Ylm ( ϑ, φ ) , con autovalori l (l + 1 ) . 2 Se inseriamo le armoniche sferiche nell’equazione di Schroedinger indipendente dal tempo come soluzione di prova otteniamo ˆ Ylm ( ϑ, φ ) = H ˆ2 L Ylm ( ϑ, φ) + U (r ) Ylm ( ϑ, φ ) = 2µr 2 l (l + 1 ) Ylm ( ϑ, φ) + U (r ) Ylm ( ϑ, φ) = EYlm ( ϑ, φ ) , da cui ricaviamo che E = 2µr 2 dove d è la lunghezza fissa del rotatore rigido. 2 l (l + 1 ) + U (d ) , 2µd 2 2 Le transizioni possibili sono solo quelle con ∆l = ±1 , per cui in un esperimento di spettroscopia saranno visibili assorbimenti ad energie; ponendo B = 2 2µr 2 , ricaviamo ∆E = E l +1 − E l = B (l + 1 ) (l + 2) − l (l + 1 ) = 2B (l + 1 ) ; 94 In una tipica spettroscopia di assorbimento si registrano delle serie di picchi corrispondenti all’eccitazione delle molecole della specie in esame, a partire da diversi livelli iniziali; il grafico di assorbimento che si registra è simile a quello riportato in figura; ciascun picco corrisponde ad un livello iniziale per la molecola. I picchi sono equispaziati, come ci si aspetta dalla relazione ∆E l →l +1 = 2B (l + 1 ) ; infatti I ∆ ( ∆E ) = ∆E l +1→l +2 − ∆E l →l +1 = E 2B (l + 2) − 2B (l + 2) = 2B L’intensità dei picchi è proporzionale alla popolazione dei livelli, e il caratteristico andamento può essere spiegato sulla base di considerazioni termodinamiche. In primo luogo, consideriamo il fatto che ciascun livello rotazionale è anche autostato di ˆ Lz , e che quindi ad ogni valore di l corrispondono 2l + 1 livelli energeticamente degeneri. Se consideriamo ˆ il rapporto tra la popolazione di uno stato di L2 e quelle di uno stato di riferimento (il rapporto agisce di fatto come una “normalizzazione”), in base alla distribuzione di Boltzmann avremo Nl 2l + 1 exp ( − B l (l + 1 ) kT ) = ∗ ; di conseguenza l’intensità degli assorbimenti Nl 2l + 1 exp − B l ∗ (l ∗ + 1 ) kT ( ∗ ) I l ∝ N l ∝ (2l + 1 ) exp ( − B l (l + 1 ) kT ) . Si può anche prevedere a quale valore di l corrisponde l’assorbimento più intenso ad ogni temperatura; in prossimità di tale valore dovremmo infatti avere d Il = 0 , e quindi dl 2 exp ( − B l (l + 1 ) kT ) + (2l + 1 ) ( − B (2l + 1 ) kT ) exp ( − B l (l + 1 ) kT ) = 0 , cioè (2l + 1) B (2l + 1) = 2kT , e quindi l ≈ kT 1 − 2B 2 Rotatore elastico e rotovibrazioni Chiaramente l’ipotesi del rotore rigido che la distanza interatomica sia costante è un’approssimazione molto poco realistica; in effetti il potenziale di interazione tra i due atomi costituenti la molecola è tale da avere un minimo in corrispondenza della distanza media di legame; quando abbiamo trattato l’oscillatore armonico abbiamo mostrato che qualsiasi potenziale di equilibrio può essere approssimato con un potenziale armonico in un intorno del punto di equilibrio; possiamo quindi modificare l’hamiltoniano per la nostra molecola, inserendovi ˆ =− un termine armonico: H ˆ2 2 1 ∂2 1 L × ⋅ + + U (d ) + k (r − d ) × ⋅ r ( ) 2 2 2µ r ∂r 2µr 2 2 In modo analogo a quanto fatto per l’idrogeno, introduciamo una soluzione di prova della y (r ) Ylm ( ϑ, φ) ; otteniamo (considerando in prima approssimazione e per semr ˆ2 ˆ2 ˆ2 2 2 L Ylm y 1 ∂2y 1 L L y y ˆψ = − ≈ + + U (d ) + k (r − d ) Ylm = E Ylm ; plicità ) Y H lm 2 2 2 2 2µr 2µd 2µ r ∂r 2µd r 2 r r forma ψ = Calcolando − ˆ2 L Ylm e semplificando 2 ∂2y 1 + U (d ) + k (r − d ) y = E − 2 2µ ∂r 2 2 le armoniche sferiche si ottiene l (l + 1 ) y = ( E − E rot ) y = E vib y 2µd 2 2 95 Eseguendo − un cambio di r =d +x, variabili tale equazione diventa ∂w 1 + U (d ) + kx 2 w == E vibw . A parte il termine potenziale costante, questa è 2µ ∂x 2 2 2 2 un’equazione analoga a quella per l’oscillatore armonico; di conseguenza le soluzioni saranno dei termini esponenziali moltiplicati per gli opportuni polinomi di Hermite, e le energie degli stati saranno quantizzate, ed uguali a E n = n + 1 k . ω , con ω = 2 µ Dato che le regole di selezione stabiliscono per le transizioni vibrazionali ∆n = ±1 , sullo spet- tro si osserverà un assorbimento solo, visto che ∆E n →n +1 = n + 1 1 ω − n + + 1 ω = ω . 2 2 Lo spettro rotovibrazionale Solitamente nell’analisi spettroscopica di una molecola si osserva che avvengono contemporaneamente transizioni rotazionali e vibrazionali; l’energia totale associata alla transizione è ∆E = ∆E vib + ∆E rot ; la molecola può infatti assorbire energia, mentre si eccita ad uno stato vibrazionale superiore, subendo contemporaneamente una eccitazione o una diseccitazione rotazionale, in accordo con la regola di selezione ∆l = ±1 . Lo spettro presenterà quindi tre rami diversi: un ramo Q corrispondente ad una transizione esclusivamente vibrazionale; in questo caso ∆E = ω . Perché una molecola possa subire un’eccitazione solo vibrazionale è necessario che si trovi in uno stato elettronico con momento angolare lungo l’asse della molecola non nullo. un ramo P corrispondente ad una eccitazione vibrazionale accompagnata da un decadimento rotazionale. Se lo stato di partenza è caratterizzato dal numero quantico l , l’energia della transizione sarà ∆E = ω − 2B l un ramo R corrispondente ad una eccitazione vibrazionale accompagnata da un’eccitazione rotazionale. Se lo stato di partenza è caratterizzato dal numero quantico l , l’energia della transizione sarà ∆E = ω + 2B (l + 1 ) . I Q P R Tenendo conto anche delle considerazioni sull’intensità dei picchi dedotte per gli spettri rotazionali puri, lo spettro complessivo per una specie molecolare avrà una struttura simile a quella in figura- ∆E Rotazioni di una molecola qualsiasi Tensore di inerzia Per studiare il moto rotazionale di un corpo di forma qualsiasi, in rotazione attorno ad un asse fisso, è sufficiente definire il suo momento di inerzia rispetto a quell’asse, I = ∫∫∫ ρr 2 d V , do- V ve ρ è la densità e r 2 il quadrato della distanza dall’asse di rotazione. A questo punto l’energia cinetica rotazionale del corpo si esprime in modo semplice come E = 1 2 L2 Iω = 2 2I Per un corpo che non sia in rotazione attorno ad un asse fisso, si dimostra che è possibile trovare un sistema di riferimento ortogonale solidale al corpo stesso, e che considerando le componenti del momento angolare rispetto a questi tre assi vale che E = La 2 Lb 2 Lc 2 + + . Inoltre si 2I a 2I b 2I c può i definire un tensore di inerzia, cioè una matrice cui elementi sono 96 I αβ = ∫∫∫ ρ (r δ 2 αβ − x αx β ) d V , dove r è la distanza dal centro di massa e x α e x β sono le coor- V dinate rispetto α -esima e β -esima del punto. Si dimostra che tale matrice è un tensore, nel senso che data una trasformazione del siste−1 ma di riferimento tale che x ' = Ax , il tensore si trasforma come I ' = A I A . Inoltre il sistema di riferimento in cui la matrice è diagonale corrisponde al sistema di riferimento dei tre assi propri per il corpo, e in tali condizioni I αα = I α . L’applicazione a molecole di simmetria elevata È semplice mostrare come questa trattazione generale si riduca, in caso di sistemi ad elevata simmetria, ad espressioni semplici e già trattate. Ad esempio, per una molecola biatomica, a simmetria cilindrica, I c = 0 e I a = I b = I ; in questo caso, evidentemente Lc = 0 , per cui possiamo scrivere E = La 2 Lb 2 La 2 + Lb 2 + Lc 2 L2 + = = , come avevamo ottenuto in altro modo. 2I 2I 2I 2I Nel caso di un rotatore sferico, cioè un sistema con tutti e tre i momenti di inerzia uguali, I a = I b = I c = I , possiamo semplicemente scrivere E = La 2 Lb 2 Lc 2 La 2 + Lb 2 + Lc 2 L2 . In + + = = 2I 2I 2I 2I 2I ˆ 2 ˆ = L , e come abbiamo visto questo ammette gli autovauna descrizione quantomeccanica, H 2I l (l + 1 ) ˆ ˆ ˆ ; dato inoltre che H , Lc = 0 avremo 2l + 1 livelli degeneri, autostati di Lc 2I 2 lori E l = Infine consideriamo un rotatore cilindrico (ad esempio una trottola), che ha I a = I b = I ≠ I c ; in questo caso l’hamiltoniano è ˆ2 ˆ2 ˆ2 ˆ = La + Lb + Lc = H 2I 2I 2I c ˆ La 2 ˆ L2 ˆ L2 ˆ L2 ˆ L2 + b + c + c − c = 2I 2I 2I c 2I 2I ˆ 1 L2 ˆ 2 1 ˆ, ˆ + Lc − ; sempre considerando che H Lc = 0 , deduciamo che gli autostati ψlk soI I 2I 2 2 c 2 1 l (l + 1 ) 1 + 2k 2 − no caratterizzati da energie 2I 2I c 2I 97