PDF - Sistemi integrati

Stereoscopia
SISTEMI 3D
Frame compatible: considerazioni
sulla risoluzione spaziale*
L’
articolo, a cura di Franco Visintin, intende valutare
teoricamente le perdite in risoluzione dei formati stereoscopici
3D HD rispetto alla risoluzione orizzontale e verticale presentate
dagli standard 2D HD monoscopici, oggi in uso in Europa.
Figura 1. Side-by-Side su film da 70mm
L’esigenza di assicurare il trasporto di segnali
stereoscopici con le esistenti infrastrutture di
produzione e distribuzione in 3D ha portato allo
sviluppo dei cosiddetti “Dual image stereoscopic
3D imaging systems”.
Tali sistemi sono in grado di fornire due
immagini (il cosiddetto stereo pair) che gli occhi
destro e sinistro possono vedere, nella pratica,
simultaneamente. In tal modo, gli osservatori
sono in grado di percepire le profondità insite
nell’immagine, come accade nella visione
binoculare di oggetti reali.
Fra i vari sistemi proposti per trasportare le due
immagini HD dello stereo pair è stato adottato
il ‘3D frame compatible packing method’, che
ospita in un singolo quadro HD le due immagini
dette, secondo uno ‘spatial multiplexing’. Ciò
però comporta il loro ‘downsizing’ cioè uno
schiacciamento (image squeezing) orizzontale
e/o verticale dell’immagine.
Nel processamento digitale del segnale video,
Figura 2. Over-Under su film da 35mm
(*) La decimazione è un processo volto a ridurre il numero dei campioni
(samples) del segnale digitale. Il termine viene dal latino decimatio
cioè ‘eliminazione di un decimo’, provvedimento in uso nell’esercito
romano contro i soldati codardi o ammutinati.
26
Sistemi Integrati - Audio/Video
Tv Digitale Volume
Volume2 2- -2009
2012
l’image squeezing viene attuato mediante un
processo di decimazione (*) preceduto da un
opportuno filtraggio, finalizzato a ridurre possibili
aliasing.
Sistemi simili a questi erano già stati presi in
considerazione dalla cinematografia stereoscopica.
Infatti, sia durante la prima ‘Golden Era’ della
cinematografia 3D negli anni ‘50 che nel secondo
boom del 3D Hollywood-driven nel 1983, sono
stati utilizzati diversi metodi riguardo alle pellicole
stereoscopiche. Grazie a un separatore ottico
(beamsplitter) la camera da 35mm o 16mm era
in grado di indirizzare la luce da due diversi punti
(quelli dei due occhi) a due porzioni differenti
dello stesso fotogramma. A tale riguardo vennero
impiegati i due seguenti formati:
– Side-by-Side, che acquisiva sul fotogramma
le immagini sinistra e destra, una a fianco
dell’altra, schiacciandole orizzontalmente;
– Over-Under, che le acquisiva una sull’altra,
schiacciandole verticalmente.
di destra, invece, viene divisa in tre parti
(tiles), senza alcun processo di filtraggio
o decimazione, ma solo tramite una
distribuzione (remapping) dei pixel.
Il 3D in televisione
Trasferendo l’esperienza cinematografica 3D al
settore televisivo con l’attuale ‘frame compatible
3D TV’, sono state prese in considerazione alcune
soluzioni similari:
– Side-by-Side (SbS): le immagini sinistra e
destra vengono inserite nel quadro 720p o
1080i, l’una a fianco dell’altra. Per attuare
ciò, si richiede un restringimento orizzontale
del segnale video, con conseguente
dimezzamento della definizione orizzontale
dell’immagine;
Il presente articolo intende valutare,
teoricamente, le perdite in risoluzione di questi
formati stereoscopici 3D HD rispetto alla
risoluzione orizzontale e verticale presentate
dagli standard 2D HD monoscopici, oggi in uso in
Europa, che sono: 720p/50, 1080i/25, 1080p/50.
Analoghe considerazioni possono essere
condotte nei riguardi dei formati HD che adottano
le frequenze 59,94/60 Hz.
Valutazione della risoluzione
Negli ambienti cinematografico e televisivo
il termine ‘risoluzione’ viene inteso per valutare
quanto ravvicinati possano trovarsi i dettagli di
un’immagine per poter essere ancora percepiti
visivamente come separati. I dettagli sono
considerati idealmente costituiti da linee,
alternativamente una chiara e una scura (line pairs).
In cinematografia, la valutazione della
risoluzione è legata alle dimensioni fisiche ed è
specificata come numero di linee per unità di
lunghezza (LP/mm, line per mm), lungo gli assi
verticale e orizzontale.
Figura 3. Side-by-side
– Top-and-Bottom (TaB): le immagini sinistra
e destra vengono inserite nel quadro 720p
o 1080i l’una sull’altra, richiedendo così un
restringimento verticale, con conseguente
dimezzamento della definizione verticale
dell’immagine.
Figura 6.
Valutazione
della risoluzione
Figura 4. Top-and-Bottom
– 3D-Tile Format: le due immagini sinistra e
destra con formato 720p vengono inserite
in un singolo
quadro 1080p:
quella di
sinistra rimane
invariata, cioè
senza alcun
restringimento
(down-sizing);
l’immagine
Figura 5.
3D Tile Format
In televisione la valutazione della risoluzione è
legata alla dimensione globale dell’immagine ed
è specificata, orizzontalmente e verticalmente,
dal numero di linee presenti su una distanza
eguale all’altezza dell’immagine (LPH, line per
picture height). In particolare:
– la risoluzione verticale NV definisce la
capacità del sistema di risolvere linee
orizzontali, condizionata primariamente sia
dal numero di linee usate per l’esplorazione
dell’immagine che dall’effetto combinato
delle capacità della camera e del display
(effetti Kell e di interlacciamento, vedi
oltre). Viene espressa come numero di linee
orizzontali risolvibili sullo schermo.
Sistemi Integrati - Audio/Video Volume 2 - 2012
27
Stereoscopia
– la risoluzione orizzontale NH definisce
la capacità del sistema di risolvere linee
verticali, condizionata dalla frequenza di
campionamento adottata dal sistema, cioè
dalle capacità della camera e del display,
tenendo conto il rapporto d’immagine
(aspect ratio, AR) del sistema e la frequenza
di cut-off del filtro anti-aliasing. È espressa
come numero di linee verticali risolvibili su
una lunghezza orizzontale pari all’altezza
dello schermo. Al fine di tenere la stessa
scala spaziale per ambedue le risoluzioni
verticale e orizzontale, la risoluzione
orizzontale è anch’essa specificata come
linee per altezza d’immagine (LPH) invece
che come linee per larghezza d’immagine
(LPW, lines per picture width).
Risoluzione verticale
La risoluzione verticale equivale solo
idealmente al ‘numero di righe attive’ (Nal,
number of active lines) nell’esplorazione del
quadro (frame).
Infatti, questo concetto è valido solo quando
le linee di esplorazione del mezzo di acquisizione
(camera o scanner, ove l’esplorazione viene
effettuata con file di celle sensibili) sono
centrate sui dettagli dell’immagine. All’opposto,
una perdita completa di risoluzione verticale si
verifica quando le linee scavalcano i contorni.
Quanto detto porta ad una diminuzione della
risoluzione verticale, identificabile moltiplicando
il numero delle linee attive (Nal) per il ‘fattore
di Kell verticale’ (vKf) il cui valore, misurato
statisticamente con l’esplorazione progressiva, è
stato stimato fra 0,6 e 0,8 (per i vecchi sensori e
display a raggi catodici) e fra 0,85 e 0,95 per gli
attuali sensori (CCD, CMOS) e display (LCD, PDP)
con matrice di pixel.
Raymond D. Kell della RCA nel 1934, in base
a prove soggettive con sistemi ad esplorazione
progressiva, valutò che la risoluzione verticale
potesse ridursi, per le ragioni specificate, al 64% del
numero delle righe attive. Tale valore venne da allora
riveduto più volte, fino a raggiungere quelli specificati
più sopra.
Il valore della Risoluzione Verticale è quindi il seguente:
NV = Nal x vKf (linee)
Un’ulteriore perdita nella risoluzione verticale, valida solo
sui dettagli in movimento, si verifica per i soli sistemi con
esplorazione interlacciata.
Questa perdita viene individuata dal fattore di
interlacciamento (If) inteso come il rapporto fra le linee
percepite in un’immagine video trattata con esplorazione
interlacciata e le linee percepite nella stessa porzione
d’immagine, trattata con esplorazione progressiva (vedi
Ref.1) e stimata col valore 0,7.
La risoluzione verticale interlacciata completa NVi risulta
pertanto:
NVi = Nal x vKf x If (linee)
Nota: per immagini con esplorazione progressive il fattore
d’interlacciamento vale 1.0.
Risoluzione orizzontale
La risoluzione orizzontale equivale idealmente al ‘numero
di campioni per riga attiva’ (Nsa, number of samples per
active line) diviso per il rapporto d’immagine (aspect
ratio, AR). Ma ciò vale solo nel caso le celle dei sensori
della camera siano centrate orizzontalmente sui dettagli
dell’immagine. All’opposto, si avrebbe una completa perdita
di risoluzione, se tali celle li scavalcassero.
Tale perdita viene individuata mediante il ‘fattore di Kell
orizzontale’ (hKf, horizontal Kell factor), il cui valore è
stimato fra 0,85 e 0,95.
Il valore della risoluzione orizzontale viene così espresso
dalla seguente formula:
NH = Nsa x hKf / AR (lines)
La Tabella 1 riassume i valori delle risoluzioni verticale
NV2D e orizzontale NH2D calcolati per gli attuali sistemi 2D
HD (televisione ad alta definizione monoscopica).
TABELLA 1. I PARAMETRI DEI SISTEMI 2D
Parametri
Frame rate (frame per secondo)
Numero di linee attive per frame - Nal
Numero di campionamenti per linea attiva - Nsa
Fattore Kell verticale - vKf
Fattore Kell orizzontale - hKf
Fattore di interlaccio - lf
Risoluzione verticale (linee per altezza dell’immagine) NV2D
Risoluzione orizzontale (linee per altezza dell’immagine) NH2D
28
Sistemi Integrati - Audio/Video
Tv Digitale Volume
Volume2 2- -2009
2012
Unità di misura
fps
LPH
LPH
720p50
50
720
1280
0,90
0,90
1,00
≈ 648
≈ 648
1080i25
25
1080
1920
0,90
0,90
0,70
≈ 680
≈ 972
1080p50
50
1080
1920
0,90
0,90
1,00
≈ 972
≈ 972
Valutazione della risoluzione
nella TV stereoscopica 3D
L’inserimento della coppia d’immagini
dell’informazione 3D entro un unico quadro
(frame packing) viene effettuato schiacciando
quelle immagini orizzontalmente (quindi
riducendo il numero dei campioni per riga
attiva Nsa , number of samples per active line), o
verticalmente (quindi riducendo il numero delle
righe attive Nal , number of active lines).
Questo schiacciamento riduce la
corrispondente risoluzione in base ai seguenti
fattori:
– fattore di riduzione verticale Vrf (Vertical
reduction factor) = Nal ridotto / Nal originale
– fattore di riduzione orizzontale Hrf
(Horizontal reduction factor) =
Nsa ridotto / Nsa originale
cosicché i valori delle risoluzioni orizzontale e
verticale della coppia delle immagini 3D sinistra
e destra divengono:
– risoluzione verticale 3D, NV3D = NV2D x Vrf
– risoluzione orizzontale 3D, NH3D = NH2D x Hrf
Possiamo ora calcolare i valori della risoluzione
verticale e orizzontale nelle varie condizioni
di frame packing, tenendo in conto i valori di
NV2D e NH2D della Tabella 1.
I valori di NH e NH che emergono da questa
valutazione possono offrire interessanti
considerazioni sull’opportunità di operare con i
vari sistemi di frame packing oggi proposti.
In conseguenza di ciò:
Vrf = 720/720 = 1,0
Hrf = 640/1280 = 0,5
per cui i valori di risoluzione divengono:
NV3D = NV2D x Vrf = ≈ 648 x 1,0 = ≈648 LPH
(Risoluzione Verticale)
NH3D = NH2D x Hrf = ≈ 648 x 0,5 = ≈324 LPH
(Risoluzione Orizzontale)
Figura 7a. 3D SIDE-by-SIDE 1080i/25
Side by Side 1080i/50, figura 7a. Le immagini
sinistra e destra, schiacciate orizzontalmente
al rapporto d’immagine 960x1.080, vengono
inserite side-by-side entro il quadro 1.920x1.080
e trasmesse nel formato 1080i/25. Quindi:
Vrf = 1080/1080 = 1,0
Hrf = 960/1920 = 0.5
per cui i valori della risoluzione divengono:
NV3D = NV2D x Vrf = ≈680 x 1,0 = ≈680 LPH
(Risoluzione Verticale)
NH3D = NH2D x Hrf = ≈972 x 0,5 = ≈486 LPH
(Risoluzione Orizzontale)
Figura 7. 3D SIDE-by-SIDE 720p/50
3D Side by Side 720p/50. Le immagini sinistra
e destra, schiacciate orizzontalmente al rapporto
d’immagine 640x720, vengono inserite side-byside entro il quadro 1.280x720 e trasmesse nel
formato 720p/50.
Figura 8. 3D SIDE-by-SIDE 1080p/50
Sistemi Integrati - Audio/Video Volume 2 - 2012
29
Stereoscopia
3D SIDE-by-SIDE 1080p/50, figura 8.
Le immagini sinistra e destra, schiacciate
orizzontalmente al rapporto d’immagine
960x1.080, vengono inserite side-by-side entro
il quadro 1.920x1.080 e trasmesse nel formato
1080p/50. Ne deriva che:
Vrf =1.080/1.080 = 1,0
Hrf = 960/1.920 = 0.5
3D TOP-and-BOTTOM, figura 10. Le immagini
sinistra e destra, schiacciate verticalmente
al rapporto d’immagine 1.920x540, vengono
inserite top-and-bottom entro il quadro
1.920x1.080 e trasmesse a 1080i/25. Ecco che:
per cui i valori della risoluzione divengono:
NV3D = NV2D x Vrf = ≈972 x 1.0 = ≈972 LPH
(Risoluzione Verticale)
per cui i valori della risoluzione divengono:
NV3D = NV2D x Vrf = ≈680 x 0.5 = ≈340 LPH
(Risoluzione Verticale)
NH3D = NH2D x Hrf = ≈972 x 0.5 = ≈486 LPH
(Risoluzione Orizzontale)
NH3D = NH2D x Hrf = ≈972 x 1.0 = ≈972 LPH
Risoluzione Orizzontale)
Figura 9. 3D TOP-and-BOTTOM 720p/50
Vrf = 540/1080 = 0,5
Hrf = 1.920/1.920 = 1,0
Figura 11. 3D TOP-and-BOTTOM 1080p/50
3D TOP-and-Bottom, figura 9. Le immagini
sinistra e destra, schiacciate verticalmente
al rapporto d’immagine 360x1.280, vengono
inserite top-and-bottom entro il quadro
1.250x720 e trasmesse a 720p/50. Allora:
Vrf = 360/720 = 0,5
Hrf = 1.280/1280 = 1,0
per cui i valori della risoluzione divengono:
3D TOP-and-BOTTOM, figura 11. Le immagini
sinistra e destra, schiacciate verticalmente
al rapporto d’immagine 1.920x540, vengono
inserite top-and-bottom entro il quadro
1.920x1.080 e trasmesse a 1080i/50. Quindi:
Vrf = 540/1.080 = 0,5
Hrf = 1.920/1.920 = 1,0
per cui i valori della risoluzione divengono:
NV3D = NV2D x Vrf = ≈648 x 0.5 = ≈324 LPH
(Risoluzione Verticale)
NV3D = NV2D x Vrf = ≈972 x 0.5 = ≈486 LPH
(Risoluzione Verticale)
NH3D = NH2D x Hrf = ≈648 x 1.0 = ≈648 LPH
(Risoluzione Orizzontale)
NH3D = NH2D x Hrf = ≈972 x 1.0 = ≈972 LPH
(Risoluzione Orizzontale)
Figura 10. 3D TOP-and-BOTTOM 1080i/25
Figura 12. 3D TILE 1080p/50
30
Sistemi Integrati - Audio/Video
Tv Digitale Volume
Volume2 2- -2009
2012
TABELLA 2. RISOLUZIONE VERTICALE E ORIZZONTALE NEI SISTEMI 2D E 3D
Parametri
Frame rate
(frame per secondo)
Numero di linee attive
per frame - Nal
Numero di campionamenti
per linea attiva - Nsa
Risoluzione verticale NV
(linee per altezza dell’immagine)
Risoluzione orizzontale NH
(linee per altezza dell’immagine)
Unità
Formati 2D
di misura 720p50 1080i50 1080p50
SbS
720p50
SbS
SbS
1080i25 1080p50
Formati 3D
TaB
TaB
TaB
3D Tile
720p50 1080i25 1080p50 1080p50
fps
50
25
50
50
25
50
50
25
50
50
-
720
1.920
1.920
720
1.080
1.080
720
1.080
1.080
720
-
1.280
1.920
1.920
1.280
1.920
1.920
1.280
1.920
1.920
1.280
LPH
≈ 648
≈ 680
≈ 972
≈ 648
≈ 680
≈ 972
≈ 324
≈ 340
≈ 486
≈ 651
LPH
≈ 648
≈ 972
≈ 972
≈ 324
≈ 486
≈ 486
≈ 648
≈ 972
≈ 972
≈ 651
3D TILE 1080p/50, figura 12. Le immagini
destra e sinistra, ambedue nel formato 720p/50,
vengono inserite nel quadro 1.920x1.080 e
trasmesse col formato 1080p/50. Non si richiede
alcun processamento di schiacciamento, ma solo
un più sicuro processamento di re-mapping,
evitando così problemi di degradazione
dell’immagine. L’immagine sinistra viene
inserita nella parte superiore sinistra del quadro
1.920x1.080, mentre l’immagine destra è divisa
in tre parti (tiles) che vengono inserite negli
spazi restanti del quadro 1.920x1.080 (come si
può vedere in Figura 12).
In conseguenza di ciò, i valori di risoluzione
sono gli stessi di quelli di un’immagine nel
formato 720p.
NV3D = ≈648 LPH (Risoluzione Verticale)
NH3D = ≈648 LPH (Risoluzione Orizzontale)
Conclusioni
La Tabella 2 riassume i valori delle risoluzioni
verticale NV e orizzontale NH calcolate per i
sistemi 2D e 3D al momento disponibili. Il segno
≈ ricorda che i valori della risoluzione dipendono
da quelli attribuiti ai fattori di Kell (orizzontale
e verticale) e al fattore d’interlacciamento, il che
è stato motivo di acceso dibattito fin dal 1934,
quando Raymond D. Kell ne scoprì l’esistenza.
I dati raccolti in Tabella 2 per i formati SbS
e TaB denunciano, a differenza di quelli del 3D
Tile Format, rilevanti divergenze fra i valori della
risoluzione orizzontale e verticale. Mentre molto
è stato scritto sul fatto che l’occhio possa essere
più influenzato dalla risoluzione orizzontale
o da quella verticale, resta il sospetto che il
giudizio complessivo degli spettatori sulla qualità
dell’immagine possa essere condizionato dai
valori più bassi di tale risoluzione. Una ricerca
statistica su tale aspetto sarebbe auspicabile.
Peraltro non vi è dubbio che una situazione di
bilanciamento fra le due risoluzioni giochi a
favore di una valutazione più favorevole della
qualità dell’immagine riprodotta.
Riferimenti
1. Allan W. Jayne, Jr., “Video and Scanner
Resolution -- The Kell Factor”, www.cockam.
com/kell.htm, 1997-2000
2. ITU-R, “Parameter values for the HDTV
standards for production and international
programme exchange”, Rec. ITU-R BT.709-5
(04/2002)
3. Michael Robin, “Revisiting Kell”, Broadcast
Engineering, March 1, 2003
4. Michael Robin, “Horizontal Resolution: Pixel
or Lines”, Broadcast Engineering, April 1,
2005
5. Steve Mullen, Just What is 1080i?
, HDV@Work, Feb. 2006 http://
digitalcontentproducer.com/hdhdv/depth/
hdv_at_work_02272006/
6. Hans Hoffmann, “HDTV - EBU format
comparisons at IBC-2006“, EBU Technical
Review – October 2006
7. EBU-UER, “High Definition (HD) Image
Formats for Television Production”, EBUTech 3299, Geneva January 2010
*
Franco Visintin, Chairman della Sezione
Italiana di SMPTE, ha ricoperto il ruolo di
Capo Struttura Tecnica presso il Centro di
Produzione RAI di Milano
Sistemi Integrati - Audio/Video Volume 2 - 2012
31