9. Problemi ricorrenti: ordinamento e ricerca Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Indice • Problemi ricorrenti in informatica: – Ordinamento di un vettore: • Ordinamento per selezione: – il metodo di selezione diretta (selection sort) • Ordinamento per scambio: – il metodo dell’affioramento(bubble sort) – Il metodo dell’ordinamento non decrescente(quick sort) • Ordinamento per fusione (merge-sort) – Ricerca in un vettore: • Ricerca sequenziale • Ricerca dicotomica Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Il problema dell’ordinamento • Il problema è quello di ordinare gli elementi di un insieme secondo una prefissata relazione d’ordine, che dipende dalla natura dei dati da ordinare • I metodi di ordinamento si applicano ad – insiemi di dati elementari (singoli numeri o lettere) – dati rappresentati in forma complessa: in generale si fa riferimento ad un insieme di strutture, delle quali si seleziona un campo che viene usato come campo chiave per l’ordinamento; il risultato dell’ordinamento sarà una ridisposizione dei record secondo l’ordinamento introdotto nel campo considerato. Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Metodi di ordinamento Classificazione: • Inserzione: Si considerano gli elementi uno alla volta e ciascun nuovo elemento viene collocato nella posizione che gli compete all’interno dell’insieme di elementi considerati in precedenza. • Selezione: Si scandisce l’insieme in modo da individuare l’elemento più piccolo, che viene separato dal resto dell’insieme. Dell’insieme rimasto viene ancora trovato il più piccolo elemento e lo si colloca di seguito a quello trovato in precedenza. Questo procedimento si itera fino a quando non si sono considerati tutti gli elementi. • Scambio: Si scandisce tutto l’insieme, se due elementi vengono trovati fuori posto si scambiano tra loro. Questo procedimento viene ripetuto fino a quando non si hanno più cambiamenti. • Fusione: Si sfrutta un’operazione più semplice dell’ordinamento, chiamata fusione, che consiste nel formare un insieme ordinato a partire da due insiemi già ordinati Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Prestazioni degli algoritmi di ordinamento • Misurate tramite due fattori: – Numero di confronti necessari per determinare gli elementi fuori posto – Numero di spostamenti da effettuare per riportare gli elementi al loro posto • Algoritmi con valore basso per i due fattori sopra esposti sono più efficienti: eseguono l’ordinamento in meno passaggi, cioè impiegando meno tempo e spazio Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ipotesi di lavoro Nel seguito: • come insieme di dati da ordinare considereremo un vettore di numeri interi V di dimensione N; V(i) indicherà l’i-esimo elemento del vettore. • La relazione d’ordine che si prenderà in considerazione è l’usuale ordinamento numerico (basato sui concetti di minore e maggiore) • Supporremo di realizzare un ordinamento crescente. • Con l’istruzione V(i) V(k) abbrevieremo il seguente blocco di istruzioni di scambio: – lavoro = V(i); – V(i) = V(k); – V(k)= lavoro; Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ordinamento per selezione Selection Sort : Il metodo di selezione diretta: • Il metodo fa uso di due indici di posizione : – i: è l’indice dell’elemento del vettore che delimita l’inizio dell’insieme dei valori presi in considerazione ad ogni singolo passo – j: è un cursore che ad ogni passo percorre l’insieme dei valori da scandire – k: è un indice che all’interno di ogni passo tiene traccia del minimo progressivo dell’insieme da scandire Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ordinamento per selezione Algoritmo di selezione diretta: • Passo 0: – All’inizio l’indice i viene posizionato sul primo elemento del vettore V; j invece comincia a scandire dal secondo elemento • Passo 1: – Il primo elemento viene confrontato con i rimanenti (scanditi da j), scambiando di posto il primo elemento e quello di valore minimo alla fine della scansione(posizione k) • Passo 2: – Al secondo passo l’indice i viene portato alla seconda posizione, perché il nuovo insieme dei valori da scandire non comprende il primo, che è sicuramente il minimo • Passi successivi: – L’indice j percorre l’insieme dei valori da scandire, a partire dall’elemento successivo a i; il processo riprende in maniera analoga al passo precedente e viene iterato finché l’indice i non giunge all’ultima posizione. Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi Esempio DEE - Politecnico di Bari 25 8 8 8 8 37 37 25 25 25 41 41 41 27 27 27 27 27 41 37 8 25 37 37 41 • le colonne rappresentano i passi dell’algoritmo • gli elementi evidenziati in azzurro rappresentano il sottoinsieme del vettore da scandire per l’ordinamento ad ogni passo • il cerchio rosso rappresenta l’elemento minimo di ognuno dei sottoinsiemi Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Prestazioni dell’algoritmo • Il metodo di selezione diretta presenta un numero di confronti proporzionale ad N2: – al primo passaggio si effettuano N-1 confronti, al secondo N-2 e così via, fino ad arrivare all’ultimo confronto; si ha pertanto: (N-1) + (N-2) + (N-3) + ….. +1 = N(N-1)/2 • Per quanto riguarda il numero di spostamenti essi sono al più N-1. • La prestazione del metodo per quanto riguarda il numero di confronti non è influenzata dalla configurazione iniziale dei dati(se sono ordinati o meno) Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi Selezione diretta: flow-chart DEE - Politecnico di Bari inizio i =1 • Le istruzioni di scambio si trovano nel ciclo scandito dalla i, per cui vengono eseguite N-1 volte AL PIU’ (solo se K!=i) falso i<N vero k=i •I confronti vengono effettuati N-1 volte per ognuno degli N cicli scanditi dalla i, perché si trovano in un’istruzione di controllo all’interno dei due cicli j = i+1 falso j<=N vero vero V(k)>V(j) k=j falso j++ fine k != i falso vero V(i) V(k) i++ Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Codice Sorgente N=input('Inserire la dimensione del vettore'); for i=1:N V(i)=input('Inserire un numero'); end for i=1:N k=i; for j=i+1:N if V(k) >V(j) k=j; end end if k~=i lavoro = V(i); V(i) = V(k); V(k)= lavoro; end end disp(V); Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ordinamento per scambio Il procedimento tipico di qualsiasi algoritmo di scambio è il seguente: • si considerano i primi due elementi dell’insieme; se il primo elemento della coppia è maggiore del secondo i due elementi vengono scambiati di posto tra di loro; • si considera ora una nuova coppia formata dal secondo e dal terzo elemento dell’insieme, si confrontano e si scambiano le posizioni se necessario; • questo procedimento si ripete, considerando coppie di elementi consecutivi, fino a quando non si è esaurito tutto l’insieme Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ordinamento per scambio Il metodo dell’affioramento (Bubble Sort) • Gli elementi più “pesanti” tendono ad andare verso il basso e quelli più leggeri verso l’alto: – ad ogni passo (step) dell’algoritmo l’elemento in assoluto più pesante sarà collocato nella posizione finale, che al passo successivo non verrà più scandita • Il numero massimo di passi è N-1 , ma dato che ad ogni passo più elementi potrebbero essere “a posto”, i passi potrebbero anche di meno Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi Esempio DEE - Politecnico di Bari 25 25 25 25 8 37 37 27 8 25 41 27 8 27 27 27 8 37 41 37 8 41 41 37 41 • le colonne rappresentano i passi dell’algoritmo • gli elementi evidenziati in azzurro rappresentano il sottoinsieme del vettore da scandire per l’ordinamento ad ogni passo • il cerchio rosso rappresenta l’elemento massimo di ognuno dei sottoinsiemi Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi Bubble Sort: Flow-chart DEE - Politecnico di Bari inizio • La variabile più importante usata nel procedimento è: step = 1, scambi=1 falso step < N && scambi == 1 vero scambi = 0 fine j=1 falso j <= N - step vero – scambi: viene inizializzata a 0 ad ogni passo e serve per controllare se ci sono stati scambi ad un certo passo: se non ce ne sono il resto di vettore è ordinato vero V(j)>V(j+1) falso V(j) V(j+1) scambi = 1 j=j+1 step = step + 1 Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Codice Sorgente N=input('Inserire la dimensione del vettore'); for i=1:N V(i)=input('Inserire un numero'); end step=1; scambi=1; while step<N && scambi==1 scambi=0; for j=1:N-step if V(j)>V(j+1) lavoro = V(j); V(j) = V(j+1); V(j+1)= lavoro; scambi=1; end end step=step+1; end disp(V); Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Prestazioni • Numero di confronti: – l’analisi del caso peggiore porta a concludere che il metodo è di ordine N2 ; il caso peggiore si ha quando l’insieme è ordinato in modo decrescente e da vita ad un numero complessivo di confronti pari a (N-1) + (N-2) + (N-3) + ….. +1 = N(N-1)/2 – Si può dimostrare che questa valutazione è vera anche nella media dei casi – Nel caso in cui in qualche passo vada a posto più di un elemento il numero di confronti complessivi da operare sarà inferiore • Numero di spostamenti: – Si segue un ragionamento analogo (nel caso peggiore sono N(N-1)/2). La prestazione del metodo è pertanto influenzata dalla configurazione iniziale dei dati Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Il problema della ricerca • Il problema è quello di cercare un elemento in un vettore • I metodi di ricerca si applicano ad – insiemi di dati elementari (singoli numeri o lettere) – dati rappresentati in forma complessa: in generale si fa riferimento ad un insieme di record, dei quali si cercano uno o più campi che vengono usati come campi chiave per la ricerca. Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Metodi di ricerca • Metodi basati sul confronto di chiavi: si confrontano gli elementi del vettore con l’elemento (chiave) che si vuole ricercare: – Ricerca lineare: si confronta ripetutamente la chiave con ciascuno degli elementi del vettore finché eventualmente non si trova la chiave – Ricerca dicotomica: Si confronta la chiave con l’elemento che si trova a metà del vettore (supposto ordinato). Se l’elemento individuato non è uguale a quello cercato si prosegue la ricerca nel semivettore inferiore o superiore a seconda che la chiave sia più piccola o più grande dell’elemento che si trova a metà. Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ipotesi di lavoro • Elementi utilizzati nell’analisi: – – – – – Vettore V di dimensione N Chiave di ricerca K Indice i per scorrere il vettore t = indice che punta all’inizio del vettore in cui ricercare u= indice che punta alla fine del vettore in cui ricercare Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ricerca lineare • Principio risolutivo: Si confronta ripetutamente la chiave K con ciascuno degli elementi del vettore finché non si trova V(i) = K (ricerca con successo) oppure finché non sono stati considerati tutti gli elementi del vettore senza trovarne nessuno uguale a K (ricerca senza successo). Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi Ricerca lineare: flow-chart DEE - Politecnico di Bari start i=1 K ≠ V (i) and i <= N no si i = i+1 no si i <=N Elemento Non trovato Elemento Trovato con indice i end Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Codice Sorgente N=input('Inserire la dimensione del vettore'); for i=1:N V(i)=input('Inserire un numero'); end K=input('Inserire elemento da cercare'); i=1; while i<=N&& K~=V(i) i=i+1; end if i<=N fprintf('Elemento trovato con indice %d\n',i); else disp('Elemento non trovato'); end Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari RICERCA LINEARE: Numero Confronti Due valutazioni diverse a seconda dell’esito della ricerca: • ricerca con successo: si fa riferimento al numero medio di confronti, che si ottiene dividendo il numero totale di confronti necessari per ricercare tutti gli elementi per il numero degli elementi stessi. Siccome per individuare il primo elemento si effettua un confronto, per il secondo due e così via, il numero totale di confronti è : 1+2+3+4+5+….. N = (N+1)/2 Il numero medio di confronti risulta (N+1)/2 • ricerca senza successo: l’algoritmo esamina sempre tutto il vettore, quindi il numero di confronti è sempre N Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ricerca in vettori ordinati Vantaggio: Il numero di confronti in caso di ricerca senza successo è lo stesso che nella ricerca con successo (N+1)/2, perché si procede alla scansione del vettore finché K ≤ V(i). A questo punto o K= V(i), e la ricerca è con successo, oppure si possono interrompere i confronti, e la ricerca risulta senza successo. Pertanto si determina il numero medio di confronti come in caso di successo Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari RICERCA BINARIA (detta dicotomica o logaritmica) • • • • • Si applica su vettori ordinati Si confronta la chiave K con l’elemento che si trova a metà del vettore. Se l’elemento individuato non è uguale a quello cercato si prosegue la ricerca nel semivettore inferiore o superiore a seconda che la chiave K sia più piccola o più grande dell’elemento che si trova a metà. Il procedimento continua iterativamente in modo da suddividere le sottotabelle via via individuate. La ricerca termina con successo quando l’elemento V(i) considerato ad un certo passo è proprio uguale a K. La ricerca termina con insuccesso quando la parte di vettore considerata è costituita da un solo elemento. Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ricerca dicotomica: flow-chart start t=1 u=N no t <= u && K ~=V (i) si i = ceil((t+u)/2) no K > V (i) u=i-1 si t=i+1 no si K ~=V (i) Elemento trovato posizione i Elemento Non trovato end Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ricerca dicotomica: codice (1/2) Versione iterativa //Ricerca dicotomica di una chiave K in un vettore V N=input('Inserire la dimensione del vettore'); for i=1:N V(i)=input('Inserire un numero'); end %Ordinamento for i=1:N k=i; for j=i+1:N if V(k) >V(j) k=j; end end if k~=i lavoro = V(i); V(i) = V(k); V(k)= lavoro; end end disp (V); %Ricerca K=input('Inserire elemento da cercare'); t=1; u=N; while t<=u && K~=V(i) i=ceil((t+u)/2); if K>V(i) t=i+1; else u=i-1; end end if K~=V(i) disp('Elemento non trovato'); else fprintf('Elemento trovato in posizione%d\n',i); end Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari Ricerca dicotomica: codice (2/2) Versione ricorsiva Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017 Sistemi Informativi DEE - Politecnico di Bari RICERCA DICOTOMICA: Numero Confronti • L’algoritmo è il più veloce tra quelli di ricerca basati sul confronto di chiavi. • In un vettore di dimensione N = 2h -1 l’algoritmo deve compiere h=log2(N+1) passi(e quindi confronti) per la ricerca senza successo, mentre i confronti possono essere di meno per la ricerca con successo. Informatica per l’Ingegneria- CDL in Ingegneria Informatica- A.A. 2016-2017