Spazi di Haar e polinomi in più variabili
Davide Boscaini
Queste sono le note da cui ho tratto il seminario del giorno 25 Ottobre 2011. Per
scriverle mi sono basato sul secondo capitolo del testo Scattared Data Approximation di Holger Wendland. Invito chi trovasse eventuali errori a segnalarli presso
[email protected].
Durante il corso di Calcolo Numerico, nello studio della teoria dell’interpolazione
polinomiale in una variabile, abbiamo studiato il seguente
Teorema 1. Dati N siti distinti x1 < x2 < · · · < xN ed N valori y1 , . . . , yN , esiste un
unico polinomio p ∈ πN −1 (R) che soddisfa le condizioni di interpolazione
p(xi ) = yi
i = 1, . . . , N.
Un aspetto che rende interessante questo teorema, oltre al risultato di esistenza ed
unicità, in sé stesso molto interessante, riguarda il fatto che lo spazio πN −1 (R) non dipende
né dalla particolare scelta dei siti xi , i = 1, . . . , N , né dai particolari valori yi , i = 1, . . . , N ,
che vogliamo interpolare, ma solo dal numero dei siti. Segue quindi che, in dimensione uno,
si può scegliere lo spazio in cui vivono le interpolanti indipendentemente dalla scelta dei
siti di interpolazione. Nella teoria dell’approssimazione il concetto di quando uno spazio è
indipendente dai dati scelti è stato generalizzato e riguarda l’argomento di cui vogliamo
parlare in questo breve seminario. Sfortunatamente quello che vedremo è che il caso in più
variabili presenterà alcune difficoltà e la situazione non sarà, in generale, cosı̀ favorevole
come quella del caso unidimensionale.
1
Il teorema di Mairhuber-Curtis
Motivati dal caso unidimensionale diamo la seguente
Definizione 1. Supponiamo che Ω ⊆ Rd contenga almeno N punti. Sia V ⊆ C 0 (Ω) uno
spazio lineare di dimensione N . Allora V è detto spazio di Haar di dimensione N su
Ω se, considerati N siti distinti ~x1 , . . . , ~xN ∈ Ω e valori arbitrari y1 , . . . , yN ∈ R, esiste
esattamente una funzione s ∈ V tale che
s(~xi ) = yi
i = 1, . . . , N.
Per quanto visto nell’introduzione segue che V = πN −1 (R) è uno spazio di Haar di
dimensione N per ogni sottoinsieme Ω ⊆ R che contenga almeno N punti.
Gli spazi di Haar, talvolta detti anche spazi di Chebyshev, possono essere caratterizzati
in molti modi. Ad esempio come
Teorema 2. Sotto le ipotesi della definizione 1 i seguenti enunciati sono equivalenti
(i) V è uno spazio di Haar di dimensione N ;
1
(ii) ogni u ∈ V \ {~0} ha al più N − 1 zeri;
(iii) per ogni n-pla di punti distinti x1 , . . . , xN ∈ Ω e ogni base u1 , . . . , uN di V , considerata
la matrice


u1 (x1 ) u2 (x1 ) . . . uN (x1 )
 u1 (x2 ) u2 (x2 ) . . . uN (x2 ) 


A :=  .
,
..
..
.
.
.
 .

.
.
.
u1 (xN ) u2 (xN ) . . . uN (xN )
cioè Aij = uj (xi ), si ha che
det (A) 6= 0.
Dimostrazione. (i) ⇒ (ii) Sia V uno spazio di Haar di dimensione N e supponiamo per
assurdo che esista una funzione u ∈ V \ {~0} che abbia gli N zeri x1 , . . . , xN . In questo
caso sia u che la funzione identicamente nulla interpolano valori nulli in questi siti.
Ma per ipotesi siamo in uno spazio di Haar, quindi abbiamo unicità dell’interpolante:
possiamo quindi concludere che u ≡ 0, assurdo. Segue quindi che u può avere al
massimo N − 1 zeri.
(ii) ⇒ (iii) Supponiamo ora che la seconda proprietà sia soddisfatta. Se det (A) = 0, con
Aij = uj (xi ), allora esiste un vettore b ∈ RN \ {~0} tale che Ab = 0, cioè
N
X
bj uj (xi ) = 0
per ogni i = 1, . . . , N.
j=1
P
Ma allora la funzione u := N
j=1 bj uj ha N zeri e quindi, per quanto visto nel punto
precedente, dev’essere identicamente nulla, ma questo è impossibile perché per ipotesi
b 6= ~0.
(iii) ⇒ (i) Infine, se la terza proprietà è soddisfatta, allora possiamo supporre che l’interpolante sia della forma
N
X
u=
cj uj ,
j=1
per qualche coefficiente cj ∈ R, j = 1, . . . , N , possiamo cioè pensare u come combinazione lineare di autovettori di V . In tal caso le condizioni di interpolazione
sono
N
X
bj uj (xi ) = yi per i = 1, . . . , N.
j=1
Ma dal momento che, per ipotesi, det (A) =
6 0, i coefficienti bj sono univocamente
determinati e, di conseguenza, anche la funzione
u=
N
X
cj uj ,
j=1
è unica. Questo ci permette di concludere che u appartiene ad uno spazio di Haar di
dimensione N .
2
Esempio 1. Sia d = 2 ed N = 3. Consideriamo poi lo spazio V ⊆ C 0 (R2 ) di base
{u1 , u2 , u3 } = {1, x, y}, con u1 : (xi , yi ) 7→ 1, u2 : (xi , yi ) 7→ xi e u3 : (xi , yi ) 7→ yi , e i siti
~x1 = (x1 , y1 ), ~x2 = (x2 , y2 ) e ~x3 = (x3 , y3 ). Per il teorema 2 si ha che V è uno spazio di
Haar di dimensione 3 per ogni Ω ⊆ R2 se


u1 (x1 , y1 ) u2 (x1 , y1 ) u3 (x1 , y1 )
det (A) = det u1 (x2 , y2 ) u2 (x2 , y2 ) u3 (x2 , y2 )
u1 (x3 , y3 ) u2 (x3 , y3 ) u3 (x3 , y3 )


1 x1 y1
= det 1 x2 y2 
1 x3 y3


1
x1
y1
= det 0 x2 − x1 y2 − y1 
0 x 3 − x 1 y3 − y1
x2 − x1 y2 − y1
= det
x3 − x1 y3 − y1
= ±2 area(T ),
con T triangolo formato dal vettore di vertici (x1 , y1 ) e (x2 , y2 ) con il vettore di vertici
(x1 , y1 ) e (x3 , y3 ). E quindi tale determinante è nullo se e solo se i tre punti sono allineati,
segue quindi che questo spazio, non soddisfando la condizione (iii) del teorema 2, non può
essere uno spazio di Haar.
Dopo aver caratterizzato gli spazi di Haar, ci dedichiamo alla questione di quando esiste
uno spazio di Haar in dimensione alta. Il prossimo risultato mostra che questo è possibile
solo in semplici situazioni
Teorema 3 (di Mairhuber-Curtis). Se Ω ⊆ Rd , d ≥ 2 contiene un punto interno, allora
non esiste uno spazio di Haar su Ω di dimensione N ≥ 2.
Dimostrazione. Supponiamo per assurdo che V = span{u1 , . . . , uN } sia uno spazio di Haar
su Ω. Se Ω contiene un punto interno ~x0 , allora esiste δ ∈ R, δ > 0, tale che la palla
B(~x0 , δ) ⊆ Ω. Fissiamo ora N − 2 punti distinti ~x3 , . . . , ~xN ∈ B(~x0 , δ) e scegliamo due
curve continue ~x1 (t) e ~x2 (t), t ∈ [0, 1], contenute in B(~x0 , δ) tali che ~x1 (0) = ~x2 (1) e
~x2 (0) = ~x1 (1), non abbiamo altri punti di intersezione e non abbiano punti in comune con
{~x3 , . . . , ~xN }. Questo è possibile perché d ≥ 2. Ora, dal momento che abbiamo assunto
che U sia uno spazio di Haar su Ω, per definizione la funzione
D(t) := det (A)
è continua e non cambia segno. D’altronde D(1) = −D(0) perché a t = 1 abbiamo
scambiato le prime due righe della matrice. Quindi D deve cambiare segno e quindi, per il
teorema degli zeri esiste un 0 < t̃ < 1 tale che D(t̃) = 0. Assurdo.
2
Polinomi in più variabili
Finora abbiamo visto che, al contrario di quanto succedeva per il caso unidimensionale, i polinomi in più variabili non formano uno spazio di Haar. È quindi impossibile
interpolare un qualsiasi insieme di dati su un generico insieme di siti X = {~x1 , . . . , ~xQ },
Q = dim πm (Rd ), con polinomi di πm (Rd ). Nonostante questo l’interpolazione polinomiale
3
gioca comunque un ruolo importante nel caso di più variabili: dovremo solo restringerci
all’insieme dei siti per i quali è possibile individuare univocamente tale interpolante. Questo
è l’argomento principale di questa sezione.
Lemma 4. Per d = 1, 2, 3, . . . e m = 0, 1, 2, . . . abbiamo
m X
k+d
k=0
d
m+1+d
=
.
d+1
Dimostrazione. Proviamo questo lemma tecnico per induzione sul grado dei polinomi m.
Per m = 0 la cosa è banale, per le proprietà del coefficiente binomiale infatti vale
d
d+1
1=
=
= 1.
d
d+1
Supponiamo ora che sia valida la tesi per il grado m e proviamo che questo ci permette di
concludere che il risultato valga anche per il grado m + 1. Scriviamo
m+1
X
k=0
X
m k+d
k+d
m+1+d
=
+
d
d
d
k=0
m+1+d
ip.ind. m + 1 + d
=
+
d+1
d
(m + 1 + d)!
def. (m + 1 + d)!
=
+
m!(d + 1)!
d!(m + 1)!
(m + 1)(m + 1 + d)! + (d + 1)(m + 1 + d)!
=
(m + 1)!(d + 1)!
(m + 1 + d)!(m + 1 + 2)
=
(m + 1)!(d + 1)!
m+d+2
=
.
d+1
Questo risultato ausiliario ci aiuterà a comprendere meglio la struttura dei polinomi in
dimensione d.
Teorema 5. Valgono i seguenti due fatti
(i) i monomi ~x 7→ ~xα , ~x ∈ Rd , α ∈ Nd , sono linearmente indipendenti;
(ii) dim πm Rd = m+d
.
d
Dimostrazione. La dimostrazione sfrutta il principio di induzione sulla dimensione d ed è
divisa in due parti
(i) Caso base: per d = 1 l’enunciato è ovvio, infatti per ogni polinomio in una singola
variabile
N
X
p(x) =
cj xj ,
j=0
i coefficienti sono determinati da cj = p(j) (0)/j!, segue quindi che p(x) ≡ 0 se e solo
se cj = 0 per ogni j = 1, . . . , N .
4
Supponiamo ora che la tesi sia vera per la dimensione d − 1 e verifichiamo che questo
implica che la tesi è vera per la dimensione d. Sia J ⊆ Nd un insieme finito e
X
cα ~xα = 0.
α∈J
Definiamo Jk = {α ∈ J : α1 = k}. Allora esiste un n ∈ N tale che J = J0 ∪J1 ∪· · ·∪JN .
Questo significa che
X
0=
cα ~xα
α∈J
=
N X
X
cα x1 α1 · · · xd αd
k=0 α∈Jk
=
N
X
x1 k
X
cα x2 α2 · · · xd αd .
α∈Jk
k=0
Ora per il caso in singola variabile possiamo concludere che
X
cα x2 α2 · · · xd αd = 0, k = 0, . . . , N,
α∈Jk
ed ora per l’ipotesi induttiva abbiamo che cα = 0 per ogni α ∈ J.
(ii) Per il punto (i) basta dimostrare che
m+d
#{α ∈ N : |α| ≤ m} =
.
d
d
Caso base: se d = 1,
#{α ∈ N : α ≤ m} = m + 1 =
m+1
.
1
Supponiamo ora che la tesi sia vera per la dimensione d − 1 e verifichiamo che questo
implica che la tesi è vera per la dimensione d:
m n
d−1
n[
oo
X
#{α ∈ Nd : |α| ≤ m} = #
α ∈ Nd : αd = k,
αi ≤ m − k
i=1
k=0
=
m
X
n
o
# α ∈ Nd−1 : |α| ≤ m − k
k=0
ip. ind.
=
m X
m−k+d−1
k=0
0
X
d−1
h+d−1
=
d−1
h=m
lemma 4 m + 1 + d − 1
=
d−1+1
m+d
=
.
d
h=m−k
5
Nella definizione 1 abbiamo formulato le condizioni affinché uno spazio di funzioni
garantisca interpolanti uniche. Siamo ora in grado di interpretare queste condizioni come
condizioni per i punti.
Definizione 2. I punti X = {~x1 , . . . , ~xN } ⊆ Rd con N ≥ Q = dim πm (Rd ) sono chiamati
πm (Rd )-unisolventi se il polinomio identicamente nullo è l’unico polinomio di πm (Rd ) che
si annulla su ciascun punto dell’insieme.
Possiamo ora riformulare quanto visto nell’esempio 1 dicendo che tre punti in R2 sono
πm (Rd )-unisolventi se e solo se non sono allineati. Un generalizzazione di questo fatto vide
dal seguente
Teorema 6. Supponiamo che {L0 , . . . , Lm } sia un insieme formato da m + 1 rette distinte
in R2 e che X = {~x1 , . . . , ~xN } sia un insieme di Q = (m + 1)(m + 2)/2 punti distinti
tali che il primo sia su L0 , i secondi due siano su L1 ma non su L0 , e cosı̀ avanti, in
modo tale che gli ultimi m + 1 punti appartengano su Lm ma non alle precedenti rette
L0 , L1 , . . . , Lm−1 . Allora X è πm (R2 )-unisolvente.
Dimostrazione. Usiamo l’induzione su m. Caso base: per m = 0 il risultato è banale, in
questo caso infatti l’insieme dei siti X è formato da un unico punto, diciamo ~x1 . Ora
π0 (R2 ) è lo spazio formato dai polinomi costanti, e l’unica costante nulla su un certo punto
~x1 è la costante nulla, segue quindi che X = {~x1 } è π0 (R2 )-unisolvente.
Supponiamo ora vero l’enunciato per m − 1 e verifichiamo che la tesi valga anche per
m. A tal proposito consideriamo ora p ∈ πm (R2 ) tale per cui
p(~xi ) = 0
per i = 1, . . . , Q,
dobbiamo quindi mostrare che p è il polinomio identicamente nullo.
Per ogni i = 1, . . . , m scriviamo le rette Li come
αi x1 + βi x2 = γi ,
ricordando che ~x = (x1 , x2 )T . Se ora consideriamo la restrizione di p su una qualsiasi retta
Li , otteniamo un polinomio di grado m in una sola variabile. In particolare, se ristretto ad
Lm , p è un polinomio in una variabile di grado m che si annulla a m + 1 punti distinti. Ma
allora p si annulla identicamente su Lm e quindi possiamo fattorizzare tale polinomio come
p(~x) = (αm x1 + βm x2 − γm )q(~x),
con q polinomio di grado m − 1. Ora q soddisfa l’ipotesi induttiva, cioè q ≡ 0, e quindi
p ≡ 0.
Questo teorema può essere generalizzato a Rd usando iperpiani in Rd al posto di rette
in R2 e un’induzione sulla dimensione d a patto di richiedere l’ipotesi aggiuntiva che su ogni
iperpiano considerato i punti siano unisolventi. Invece di continuare in questa direzione,
approfondiamo il seguente caso particolare. Consideriamo l’insieme
d
Xm
= {β ∈ Nd : |β| ≤ m},
dove β = (β1 , . . . , βd ) e |β| := β1 + · · · + βd . Ora, per definizione, ~xβ = xβ1 1 xβ2 2 · · · xβd d e si
ha che deg(~xβ ) = β1 + β2 + · · · + βd = |β|. Visto poi che
{p ∈ πm (Rd ) : deg(p) ≤ m} = span{~xβ : deg(~xβ ) ≤ m}
= span{~xβ : |β| ≤ m},
6
possiamo concludere che
dim{p ∈ πm (Rd ) : deg(p) ≤ m} = #{~xβ : |β| ≤ m}
= #{β ∈ Nd : |β| ≤ m},
d ha esattamente Q = dim π (Rd ) punti.
cioè che Xm
m
2 rappresenta una griglia equispaziata su un
Esempio 2. Nel caso d = 2, l’insieme Xm
triangolo. in particolare è composto dai punti a coordinate naturali delle rette di equazione
yi = −x + i, i = 0, . . . , m. In figura si trova una rappresentazione dei punti appartenenti
all’insieme X32 .
4
3
2
1
0
1
2
3
4
Come ci aspettavamo
10 =
dim (X32 )
2
= dim (π3 (R ))
teorema 5/(ii)
=
3+2
2
= 10.
2 è π (R2 )-unisolvente. Di conseguenza l’interpolazione polinoLemma 7. L’insieme Xm
m
miale di grado m su questo insieme di siti è unica.
Dimostrazione. Considerate le rette Li di equazione yi = −x + i, i = 0, . . . , m, l’enunciato
segue dal teorema 6.
Ovviamente anche in questo caso l’enunciato può essere generalizzato a dimensioni d
maggiori e può essere dimostrato via induzione sulla dimensione d, come in pagina 19 del
testo.
7