Intel® VTune™ Amplifier XE 2013
CREA PROFILI DI PRESTAZIONI E THREAD
Descrizione prodotto
Caratteristiche principali
Ottimizza le prestazioni seriali e parallele
 Profila C, C++, C#, Fortran, Assembly e
Java.
Intel® VTune™ Amplifier XE 2013 è il profiler premier per C, C++, C#, Fortran, Assembly e Java*.
 Serie di dati completi sulle prestazioni
per aree sensibili, threading, attese
blocchi, DirectX*, larghezza di banda e
altro ancora
 La potente analisi consente di
ordinare, filtrare e visualizzare i
risultati sulla cronologia e sull'origine
 La riga di comando automatizza i test
di regressione e facilita la raccolta
remota
"Il nuovo VTune™ Amplifier XE
aggiunge ulteriore capacità a uno
strumento già indispensabile. Lo
stack di chiamate delle aree
sensibili basata sul campionamento
è davvero eccellente. Siamo rimasti
anche impressionati da come
l'analisi della simultaneità e delle
attese blocchi possano anche
fornire dati utili su applicazioni
complesse come Premiere Pro."
Rich Gerber - Engineering Manager,
MediaCore, Adobe Systems Inc.
Anche disponibile in:
 Intel® Parallel Studio XE
 Intel® C++ Studio XE
 Intel® Fortran Studio XE
 Intel® Cluster Studio XE
Prodotti interoperativi
 Intel® Graphics Performance
Analyzer
Compatibilità sistema operativo:
 Windows*
 Linux*
Facile
L'analisi delle prestazioni può essere impegnativa, la lo strumento che usi non deve esserlo.
 Nessuna build speciale - Usa una build di protezione con simboli dal compilatore normale.
 Profili di prestazioni preimpostati - Profili preimpostati offrono una facile configurazione "point-andshoot".
 Basso sovraccarico - Risultati accurati su cui puoi contare.
 Riga di commando - Automatizza l'analisi di regressione. Raccolta remota semplice.
Versatile – Serie completa di profili di prestazioni
Che si stia eseguendo una ottimizzazione per la prima volta o a livello avanzato, VTune Amplifier XE fornisce i dati
necessari per soddisfare una vasta gamma di esigenze di ottimizzazione.
 Analisi aree sensibili - Individua rapidamente il codice che sta occupando molto tempo. Visualizza le sequenze di
chiamate.
 Analisi leggera aree sensibili - Sovraccarico basso, alta risoluzione tramite l'hardware del processore.
 Attese blocchi - Ottimizza il threading. Trova gli oggetti della sincronizzazione che impediscono il ridimensionamento
delle prestazioni.
 Analisi approfondita del sistema - Ottimizza driver, moduli kernel e app multi-processo.
 Analisi conteggio chiamate - Trova il codice che trarrà beneficio dall'allineamento.
 Analisi larghezza di banda, memoria, diramazioni e altro - Analisi avanzata per eseguire l'approfondimento.
 Applicazioni MPI - Analizza le applicazioni ibride tramite MPI e OpenMP. Esegui l'installazione su un cluster.
Produttivo – Ordina, filtra e visualizza
Buoni dati non bastano. Hai bisogno di strumenti che estraggano i dati e ne semplifichino la comprensione.
 Visualizzazione origine - Visualizza i dati del profilo sulla tua origine e sull'assembly. (C, C++, C#, Fortran
e Java.)
 Cronologia - Visualizza le interazioni dei thread, bilancia i carichi di lavoro e filtra i dati.
 Filtra i risultati - Elimina gli elementi irrilevanti dai dati. Seleziona cosa desideri visualizzare.
 Annotazioni attività - Esegui annotazioni sull'origine per aggiungere etichette delle attività significative
alla cronologia.
 Analisi frame - Rileva i frame DirectX* e filtra i risultati per visualizzare il codice lento in frame lenti.
 Intel® Threading Building Blocks - Comprensione integrata del modello di programmazione parallelo.
 Evidenziazione problemi - Le potenziali opportunità di ottimizzazione sono evidenziate. Passa il mouse
per visualizzare suggerimenti.
Le funzioni che
utilizzano più
tempo CPU sono
posizionate in cima
all'elenco. Fai
doppio clic su una
funzione per
visualizzare
l'origine con dati
dettagliati del
profilo.
Caratteristiche principali
Individua rapidamente il codice che occupa molto tempo CPU
L'analisi delle aree sensibili visualizza un elenco ordinato delle funzioni che occupano
molto tempo CPU. Fai clic [+] per gli stack di chiamate. Fai doppio clic per visualizzare
l'origine.
Visualizza i risultati sull'origine
Un doppio clic sull'elenco delle funzioni visualizza l'area più sensibile nella funzione.
Ottimizza il threading con l'analisi delle attese blocchi
Trova rapidamente una causa comune delle prestazioni lente nei programmi paralleli:
attesa troppo lunga su un blocco mentre i core sono sottoutilizzati durante l'attesa. I
profili come le aree sensibili e le attese blocchi utilizzano un raccoglitore software che
funziona sia sui processori Intel che su quelli compatibili.
Estrai i dati con il filtraggio cronologia
Seleziona un intervallo di tempo nella cronologia per filtrare i dati (ad es. avvio applicazione) che
mascherano le informazioni di cui hai bisogno. Una volta eseguita la selezione e il filtraggio nella
cronologia, la griglia che elenca le funzioni che occupano molto tempo CPU si aggiorna per
visualizzare l'elenco filtrato per l'intervallo di tempo selezionato.
Visualizza il comportamenti dei thread
Visualizza quando i thread sono in esecuzione e in attesa e quando si verificano le
transizioni. Bilancia i carichi di lavoro.
Profiling di un'applicazione in esecuzione
Non è necessario arrestare e riavviare l'applicazione quando si esegue il profiling
 Allega a un processo in esecuzione
 Esegui il profiling dell'intero sistema con il campionamento eventi hardware
e filtra cosa hai bisogno in un secondo momento
Profiling hardware ad alta risoluzione/sovraccarico basso
Oltre all'analisi delle aree sensibili che funziona sia sui processori Intel sia su quelli
compatibili, VTune Amplifier XE offre un'analisi leggera delle aree sensibili che utilizza
l'Unità di monitoraggio prestazioni (PMU) sui processori Intel per raccogliere i dati con un
sovraccarico molto basso. La maggiore risoluzione (1 ms vs. 10 ms) può individuare le
aree sensibili nelle piccole funzioni a rapida esecuzione. Ora, con la raccolta stack
opzionale per identificare la sequenza di chiamate.
Profili eventi hardware predefiniti
Goditi la semplice configurazione di profiling per i processori più nuovi. Nessuna
memorizzazione di nomi di eventi complessi. I profili avanzati come l'analisi della
larghezza di banda della memoria, l'accesso alla memoria e le errate previsioni delle
diramazioni individuano le opportunità di ottimizzazione. Ora, con la raccolta stack
opzionale per identificare la sequenza di chiamate. I profili variano a seconda della
microarchitettura.
Opportunità evidenziate
La cella è evidenziata in rosa laddove vi è una potenziale opportunità di ottimizzazione.
Passa il mouse per visualizzare suggerimenti.
Dettagli
Ottimizza applicazioni parallele (e seriali)
I profiler vecchio stile forniscono solo i dati per l'ottimizzazione delle applicazioni seriali. Sebbene siano importanti, non sono
però sufficienti quando è necessario ottimizzare le applicazioni parallele moderne. L'analisi di simultaneaità e delle attese
blocchi di VTune Amplifier XE combinata con la cronologia threading offre gli strumenti necessari per eseguire l'ottimizzazione
della scalabilità e delle prestazioni parallele.
Potente analisi dei dati
Differentemente dalla maggior parte dei prodotti della concorrenza, Intel VTune Amplifier XE offre di più rispetto alla semplice
visualizzazione dei dati, consente di analizzarli.
Seleziona un intervallo di tempo utilizzando la cronologia e filtra i dati per escludere tutto ciò che non è relativo a tale intervallo
di tempo. Questa operazione aggiorna l'elenco delle funzioni che occupano molto tempo CPU per visualizzare cosa sta
consumando la CPU durante l'intervallo di tempo selezionato. Ciò consente di filtrare elementi irrilevanti come i problemi di
inizializzazione, accesso o prestazioni che si verificano solo in determinati intervalli di tempo.
Per impostazione predefinita, i dati vengono raggruppati per funzione, quindi per stack di chiamate in modo da ottenere un
elenco delle funzioni che occupano la maggior parte del tempo CPU. Tuttavia, i dati possono essere riraggruppati in diversi
modi. Ad esempio, riraggrupparli per funzione quindi per thread per verificare se la routine con thread è ben bilanciata.
La combinazione tra selezione e raggruppamento può essere specialmente potente. Ottimizzazione di una app grafica?
Raggruppare per frame per identificare i frame lenti. Selezionare i frame più lenti e filtrarli. Quindi raggruppare per funzione.
Ora viene visualizzato un elenco delle funzioni che occupano più tempo nei frame lenti. Questo è esattamente cosa è
necessario sapere quando si esegue l'ottimizzazione per accelerare i frame lenti.
Novità?
Caratteristica
Vantaggio
Ottimizzazione
dell'allineamento con i
conteggi chiamate
Se una funzione viene richiamata frequentemente, potrebbe avere senso "allineare" il codice ed eliminare il
sovraccarico della chiamata della funzione. VTune Amplifier XE fornisce ora i dati statistici relativi al conteggio
chiamate per aiutarti a prendere decisioni di allineamento più efficienti. Visualizza inoltre i risultati del profilo sul
codice sorgente, anche se il codice è allineato, facilitando l'interpretazione dei risultati del profilo.
Oltre al campionamento degli stack software che funziona sia sui processori Intel sia su quelli compatibili, VTune
Amplifier XE supporta ora il campionamento stack hardware tramite l'Unità di monitoraggio prestazioni (PMU) sui
processori. Ciò consente una più elevata frequenza di campionamento (1 ms vs. 10 ms) per una maggiore
risoluzione consentendo di individuare le aree sensibili nelle funzioni piccole a esecuzione rapida. Gli eventi
hardware avanzati come la mancanza di cache e le errate previsioni delle diramazioni possono ora avere stack
che facilitano l'individuazione delle opportunità di ottimizzazione.
VTune Amplifier XE esegue un'analisi più accurata della larghezza di banda della memoria per la lettura e
scrittura sulla cache e sulla memoria. Aggiunge inoltre l'analisi della larghezza di banda per tipi di processori
aggiuntivi.
Analizza il codice Java o il codice combinato nativo e Java. I risultati vengono visualizzati sull'origine Java originale.
L'API di annotazione attività è utilizzata per eseguire annotazioni sull'origine in modo che VTune Amplifier XE
possa visualizzare le attività in esecuzione. Ad esempio, se si etichettano le fasi della pipeline, queste saranno
contrassegnate nella cronologia e, al passaggio del mouse, verranno visualizzati i dettagli. Ciò facilità
notevolmente la comprensione dei dati di profiling.
Un'area lenta nella modalità di gioco? Non vuoi sapere dove stai sprecando molto tempo, vuoi sapere dove lo stai
sprecando e dove la frequenza dei fotogrammi è lenta. VTune Amplifier XE può ora rilevare automaticamente i
frame Microsoft DirectX* e filtrare i risultati per visualizzare cosa sta succedendo nei frame lenti. Non usi
DirectX*? È sufficiente definire l'area critica utilizzando l'API e l'analisi dei frame diventa un potente strumento
per analizzare la latenza.
Il profiling hardware è supportato per il coprocessore Intel® Xeon Phi™ e può essere avviata dall'interfaccia
utente grafica. Può raccogliere i dati sulle aree leggermente sensibili e su eventi avanzati ed è dotato di
marcatori temporali per la correlazione dei dati su schede multiple. La raccolta software (ad es. l'analisi delle
attese blocchi ) non è supportata sul coprocessore Intel® Xeon Phi™.
Differentemente dagli altri strumenti che misurano l'utilizzo medio della potenza, Power Analysis in VTune
Amplifier XE identifica la causa della riattivazione. Le interruzioni sono mappate su IRQ e i timer sono mappati sul
codice sorgente con uno stack di chiamate. Ciò fornisce informazioni utilizzabili per ridurre/consolidare le
riattivazioni, riducendo così l'uso della potenza e rimanendo in uno stato di bassa potenza per periodi di tempo
superiori.
Analizza le applicazioni ibride utilizzando sia MPI sia OpenMP (o altro threading). Facile installazione su un cluster.
Risultati ordinati per classificazione.
VTune Amplifier XE aggiunge costantemente supporto per i processori più recenti. Gli aggiornamenti vengono
rilasciati subito dopo l'annuncio di nuovi processori.
Campionamento stack
hardware
Migliore analisi della larghezza
di banda della memoria
Profiling Java
Analizza le attività utente
Rilevamento automatico frame
Microsoft
DirectX*
Ottimizzazione per
coprocessore Intel® Xeon Phi™
Analisi potente
Analizza le applicazioni MPI
Supporto per i nuovi processori
Opzioni di acquisto: Suite specifiche per linguaggi
Sono disponibili diverse suite che combinano strumenti per creare, verificare e sintonizzare la tua applicazione. I prodotti interessati in questa breve
descrizione sono evidenziati in blu. Sono disponibili licenze per utenti singoli e multipli con sconti per vendita all'ingrosso, università e studenti.
Intel®
Parallel
Studio XE
Intel®
C++
Studio XE
Intel® C / C++ Compiler
Intel®
Cluster
Studio
XE



Intel® Fortran Compiler


Intel® Integrated Performance Primitives3



Intel® Math Kernel Library3



Intel® Cilk™ Plus



Intel® Threading Building Blocks



Intel® Inspector XE




Intel® VTune™ Amplifier XE




Static Analysis




Intel® MPI Library

Components
Suites >>
Intel® Trace Analyzer & Collector
Rogue Wave IMSL*
Sistema operativo1
Nota:
Intel®
Fortran
Studio XE
Intel®
Composer
XE



Intel®
C++
Composer
XE

Intel®
Fortran
Composer
XE












Library2

W, L
W, L
W, L
W, L
W, L
W, L, O
W, L, O
1 Sistema
3
operativo: W=Windows, L= Linux, O= OS* X. 2 Disponibile in Intel® Visual Fortran Composer XE per Windows con IMSL*
Non disponibile singolarmente su OS* X, è incluso nelle suite Intel® C++ & Fortran Composer XE per OS X
Specifiche tecniche
Specifiche immediate
Supporto
processore
Processori Intel® e processori compatibili quando si analizzano applicazioni contenenti istruzioni Intel®. Molte funzioni di profiling
funzionano sia sui processori Intel® sia su quelli compatibili. Le funzioni che utilizzano l'unità di monitoraggio prestazioni del
processore richiedono un processo Intel® per la raccolta dei dati, ma i risultati possono essere analizzati su un processore compatibile.
Sistemi operativi
Windows* e Linux*
Ambienti e
strumenti di
sviluppo
Linguaggi di
programmazione
Requisiti di
sistema
Assistenza
Compatibile con i compilatori di fornitori che seguono gli standard delle piattaforme (ad es., Microsoft*, GCC, Intel).
Può essere integrato con Microsoft Visual Studio* 2008, 2010 e 2012.
Vedi http://www.intel.com/software/products/systemrequirements per i dettagli più recenti.
C, C++, C#, Fortran, assembly.
Comunità
Unisciti alla comunità di Intel® Support Forums per imparare, contribuire o semplicemente navigare!
http://software.intel.com/en-us/forums
Per i dettagli, vedi http://www.intel.com/software/products/systemrequirements
Sono inclusi per un anno tutti gli aggiornamenti del prodotto, i servizi Intel® Premier Support e gli Intel® Support Forums. In Intel
Premier Support sono presenti ingegneri che offrono assistenza sicura tramite internet.
Ulteriori informazioni su VTune Amplifier XE
Scarica una copia di valutazione gratuiti di 30 giorni
 Fai clic o accedi al link sotto:
http://intel.ly/vtune-amplifier-xe
 Fai clic o accedi al link sotto:
http://intel.ly/sw-tools-eval
 Oppure digitalizza il codice QR a sinistra
 Fai clic sul collegamento "Profiler di
prestazioni"
Avviso di ottimizzazione
Revisione avviso #20110804
I compilatori Intel non possono garantire l'ottimizzazione allo stesso livello dei microprocessori non Intel per le ottimizzazione che non sono esclusive dei
microprocessori Intel. Queste ottimizzazioni includono le serie di istruzioni SSE2, SSE3 e SSSE3 e altre ottimizzazioni. Intel non garantisce la disponibilità, la
funzionalità o l'efficienza di qualsiasi ottimizzazione su microprocessori non prodotti da Intel. Le ottimizzazioni dipendenti da microprocessori in questo
prodotto riguardano l'uso con i microprocessori Intel. Alcune ottimizzazioni non specifiche per microarchitettura Intel sono riservate ai microprocessori Intel.
Consultare le Guide utente e di riferimento applicabili per ulteriori informazioni relative alle serie di istruzioni specifiche trattate nel presente articolo.
© 2012, Intel Corporation. All rights reserved. Intel, the Intel logo, VTune, Cilk, Xeon Phi and Xeon are trademarks of Intel
Corporation in the U.S. and other countries. *Other names and brands may be claimed as the property of others.
Intel_VTune_Amplifier_XE_2013_PB/Rev090412