Anno 2005 Corso di Laurea Specialistica in Ingegneria delle Telecomunicazioni Corso di Misure per la qualificazione di reti di telecomunicazioni Professore Leopoldo Angrisani Lan Testing And Ethernet Troubleshooting Relazione a cura di: Amato Felicetta 887/41 Bramante Daniela 887/42 Cimmino Giovannina 887/43 Colella Ada 887/57 Di Febbraro Barbara 887/44 Indice Capitolo 1 1 1 Lan testing 1 1.1 Introduzione 1 1.2 LAN (Local Area Network) 2 1.3 Test di monitoraggio sulle LAN 5 1.3.1 Test in service 6 1.3.2 Test out of service 14 1.3.2.1 Test sui cavi 14 1.3.2.2 Interferenze esterne 24 1.4 Test di conformità ed interoperabilità sulle LAN 25 1.5 Test di carico sulle LAN 26 Capitolo 2 29 2 Ethernet troubleshooting 29 2.1 Introduzione 29 2.2 Strumenti 29 2.3 Linee guida del troubleshooting 30 2.4 Sintomi dei problemi in Ethernet 35 2.4.1 Collisioni 36 2.4.2 Collisioni remote e locali 37 2.4.3 Collisioni ritardate (late collision) 38 2.4.4 Altri sintomi di malfunzionamento 39 I 2.5 Problemi di cablaggio 43 2.6 Network Interface Card 44 2.7 MAU (Medium Attachment Unit) 46 2.8 Problemi con schede Ethernet e MAU 51 2.9 Sintomi e Cause di Malfunzionamenti di Schede e MAU 52 2.10 Ripetitori e Hub 57 2.10.1 Problemi causati dall’impiego di hub 61 2.10.2 Problemi dei ripetitori e hub: Sintomi e Cause 62 2.10.3 Problemi con ripetitori ottici in reti Ethernet 67 2.10.4 Problemi con ripetitori ottici non standard 69 2.11 Bridge 69 2.11.1 Funzioni dei bridge 71 2.11.2 Diagnostica dei problemi dei bridge 73 2.11.3 Sintomi e cause dei problemi nei bridge 74 2.12 I router e lo strato di rete 79 2.12.1 Instradamento gerarchico 83 2.12.2 Diagnostica dei problemi dei router 84 2.12.3 Sintomi e le cause connesse ai problemi di routing 85 II Capitolo 1 Lan testing 1.1 Introduzione Al fine di potersi assicurare che una rete di comunicazione, di qualunque genere essa sia, funzioni correttamente è necessario effettuare, durante il suo intero ciclo di vita, delle procedure di collaudo e misurazione, utili perché in grado di fornirci parametri prestazionali ed indicazioni tanto sui singoli elementi quanto sui servizi offerti dalla rete stessa. Ricordiamo che con il termine procedure di misurazione si intende indicare un insieme d’azioni coordinate il cui svolgimento ha l’obiettivo di conseguire un’informazione di misura, mentre con il termine collaudo, traduzione dell’anglosassone “test”, si intende indicare il confronto fra l’informazione così ottenuta ed un valore predefinito, al fine di poter stabilire se quanto osservato rispetta o meno certi vincoli che, secondo un qualche criterio, siano stati stabiliti. In questo capitolo, in particolare, ci si pone l’obiettivo di descrivere le principali tipologie di test che vengono effettuate in uno specifico tipo di reti di comunicazione, cioè le reti LAN, di cui è fornita di seguito una breve descrizione. 1 1.2 LAN (Local Area Network) Le LAN, o reti locali, sono reti di calcolatori private impiegate, ad esempio all’interno di un edificio o di un’università, per consentire lo scambio di informazioni e la condivisione di risorse tra i calcolatori e le stazioni di lavoro presenti in tali stabilimenti. Una caratteristica peculiare di queste reti è rappresentata dalle loro dimensioni che, essendo ridotte, al più di qualche centinaio di chilometri, sono tali che il peggior tempo di comunicazione tra due terminali, che di essa fanno parte, è limitato e noto a priori. Le LAN tipicamente usano una tecnologia di trasmissione che si serve di un solo cavo condiviso al quale tutte le macchine sono collegate; la velocità di trasmissione su di esse raggiungibile è molto elevata: infatti, se già negli anni ‘80 era possibile conseguire velocità di 10 Mbit/s, oggi sono molto comuni versioni a 100 Mbit/s e addirittura sono disponibili versioni a 1 Gbit/s. Per tali reti broadcast sono possibili differenti topologie che sono brevemente descritte di seguito. Un primo tipo di topologia è quella a bus, cioè a cavo lineare, ove effettivamente ogni sistema è collegato a tutti gli altri attraverso un unico mezzo trasmissivo broadcast così che, quando un sistema trasmette, tutti gli altri ricevono simultaneamente senza doversi preoccupare di effettuare ripetizioni o istradamenti. Figura 1.1 2 Il bus è realizzato tipicamente con cavi coassiali ed è ad esempio adoperato nelle LAN conformi alle tecnologie Ethernet 10Base2 e 10Base5 le quali, è bene ricordare, sono state le prime a diffondersi in maniera capillare, sebbene oggi stiano ormai cadendo in disuso. Una secondo tipo di topologia è quella ad anello (ring), impiegata ad esempio nelle LAN conformi alla tecnologia Token ring, la quale prevede di collegare ogni sistema al successivo con un mezzo trasmissivo punto-punto e di collegare poi l’ultimo sistema al primo. Figura 1.2 Ciò che ne risulta in tal modo è appunto un anello unidirezionale, in cui ogni sistema ha anche una funzionalità di ripetizione dei messaggi inviati dagli altri. In pratica quando un nodo dovrà trasmettere, esso inserirà il messaggio sull’anello così che questo possa giungere ai sistemi a valle, i quali si preoccuperanno poi di ripetere il messaggio fino a quando esso tornerà al mittente che, a questo punto, lo eliminerà dall’anello stesso. In particolare, il destinatario, oltre a ripetere il messaggio, lo riceverà e potrà modificare un bit nella coda del messaggio stesso così da confermare al mittente la sua avvenuta ricezione; questa caratteristica di “conferma dell’avvenuta ricezione”è peculiare solo delle reti ad anello. Un grave problema in cui però si incorre quando si 3 decide di adottare un tal genere di cablaggio consiste nel fatto che l’operatività dell’intera rete è compromessa nel caso in cui un sistema si guasti oppure semplicemente venga spento. Al fine di incrementare l’affidabilità è necessario allora ricorrere a delle soluzioni che consentano di escludere dalla rete sistemi o mezzi trasmissivi malfunzionanti. Una prima possibile soluzione, adoperata ad esempio nelle reti Token ring con una topologia cosiddetta ad anello stellato, consiste nell’adoperare un concentratore di fili, a cui ogni stazione verrà fisicamente collegata, il quale continuerà ancora ad assicurare, solo da un punto di vista logico, l’esistenza di un anello. Tale concentratore sarà dotato al suo interno di interruttori alimentati dalle stazioni stesse in modo tale che, in caso di un eventuale guasto di una di esse, la perdita di corrente da ciò derivante sarà tale da far aprire l’interruttore da questa alimentato così che il suo aggiramento sarà garantito. Un'altra possibile soluzione consiste invece nel ricorrere ad un cablaggio a doppio anello controrotante, quale quello adottato in FDDI, il quale prevede che, in caso di guasto di uno dei due anelli, si possa ricorrere all’altro che fungerà quindi da riserva. L’ultima topologia che infine consideriamo è quella a stella, in cui tutte le stazioni sono collegate tra loro attraverso un dispositivo centrale detto hub, che è sostanzialmente un ripetitore multiporta, a cui ogni nodo è collegato attraverso mezzi trasmissivi punto-punto. Figura 1.3 4 Tale topologia è adoperata ad esempio nelle LAN conformi a Ethernet 10BaseT e 100BaseT. I vantaggi derivanti dall’utilizzo di un tal genere di topologia sono molteplici. In primo luogo la presenza dell’hub permette di semplificare notevolmente la gestione della rete in quanto, ad esempio, qualora ci fosse un nodo malfunzionante, l’hub sarebbe in grado di rilevare il problema e automaticamente scollegarlo; inoltre molti hub sono anche in grado di ottenere informazioni da un host ad esso direttamente collegato e farne poi un resoconto. È chiaro che il corretto funzionamento di questo centro stella finirà però per divenire un punto critico per l’affidabilità della rete stessa. E’ bene sottolineare che, sebbene attualmente esistano molteplici tecnologie LAN, fra tutte Ethernet è sicuramente la più diffusa, non solo perché è stata la prima ad alta velocità a diffondersi ma soprattutto perché, a differenza delle altre tecnologie come FDDI e Token ring, essa è molto meno complessa e i costi dei suoi apparati sono ridotti (il suo hardware è infatti facilmente reperibile e si trova a costi contenuti). 1.3 Test di monitoraggio sulle LAN I primi test che procediamo con l’analizzare sono i test di monitoraggio, cioè quelli effettuati durante la fase operativa di una rete LAN, volti a controllare che tutto operi secondo quanto stabilito. E’ chiaro però che, affinché questo obiettivo possa essere conseguito, tutti i tasselli della rete devono ben funzionare. L’obiettivo dei test nella fase operativa è quindi effettuare un monitoraggio costante della rete (dei link, dei dispositivi..) per potere, attraverso le informazioni raccolte, sia rilevare eventuali suoi malfunzionamenti, così da consentire poi di individuare il guasto, isolarlo e repentinamente ripararlo, sia effettuare una procedura di benchmarking il cui fine è valutare se i parametri prestazionali seguono l’andamento desiderato e se 5 rientrano in particolari valori limite. I test effettuati durante la fase operativa di una LAN, in particolare, si dividono in due categorie: quelli “in service” e quelli “out of service”. I test in service sono effettuati sulla rete mentre essa è attraversata da traffico convenzionale, per questa ragione è necessario che essi siano quanto meno invasivi possibile, al fine di garantire che la rete sotto test possa continuare a funzionare correttamente senza che l’utenza avverta alcun disagio. Al contrario i test out of service sono effettuati interrompendo le normali operazioni effettuate sul link di comunicazione, il che chiaramente implica la sospensione dei servizi offerti, e procedendo ad una simulazione del flusso informativo. Mentre nella prima categoria di test è possibile inserire le misurazioni relative all’integrità del segnale (signal condition measurements), l’analisi di protocolli e varie misurazioni di tipo statistico, nell’ambito dei test che richiedono la sospensione della normale attività del segmento o componente sotto test è possibile invece inserire, ad esempio, i test effettuati sui cavi. 1.3.1 Test in service Misurazioni dell’integrità del segnale Come è noto, la trasmissione delle informazioni in forma digitale, richiede innanzitutto la codifica di tali informazioni in termini di bit; i dati digitali così ottenuti vengono poi trasmessi associando, mediante un’ulteriore codifica tipo la Manchester ad esempio, ogni bit ad un fenomeno fisico che può essere riprodotto a distanza attraverso il mezzo trasmissivo utilizzato. Tutti i fenomeni fisici adoperati si basano sul trasporto di una qualche forma d’energia che codifica l’informazione, a cui il sistema attraversato si oppone determinando un’attenuazione dell’energia trasmessa di un ammontare dipendente dalla 6 frequenza di lavoro. Il diverso comportamento del mezzo trasmissivo in funzione della frequenza genera anche distorsione, cioè l’alterazione dell’andamento nel tempo del segnale, ad alterare il quale concorre però anche il rumore, cioè la sovrapposizione al segnale utile di energia proveniente da elementi esterni o interni al sistema trasmissivo. L’insieme di questi aspetti ci fa intuire come realizzare delle misurazioni volte ad accertare l’integrità di un segnale, cioè volte ad assicurarsi che esso sia proprio come ce lo si aspetta, possa fornirci informazioni estremamente utili. Tali misurazioni, in pratica, saranno volte ad estrarre alcune informazioni dal segnale, come ad esempio la potenza che esso trasporta, il suo valore di picco, e a confrontare poi i valori osservati dei parametri d’interesse con quelli che ci si attendeva in base ad esempio al tipo di tecnologia e di modulazione adoperate o al canale trasmissivo impiegato. In realtà però queste misurazioni non sono nell’ambito di una LAN significative tanto quanto avrebbero potuto esserlo ad esempio per una WAN (Wide Area Network), in quanto dovendo i segnali viaggiare su distanze relativamente brevi il deterioramento introdotto è ivi sicuramente minore. Questo tipo di misurazioni richiede l’uso di un oscilloscopio al fine di determinare la forma fisica del segnale trasmesso, cioè il suo andamento nel tempo, e poter poi ad esempio verificare che rientri in una maschera specifica, la quale impone dei vincoli su grandezze quali il tempo e l’ampiezza. Questi segnali possono essere misurati sia direttamente al connettore, sia all’interfaccia di componenti attivi di rete, come ripetitori, bridge o router (questi, infatti, sono anche detti test d’interfaccia). Si noti che nel momento in cui si andrà a collegare l’oscilloscopio ad un’interfaccia di un elemento di rete, esso fungerà per quella stessa interfaccia come un ulteriore carico posto in parallelo a quello che, su di essa, era già presente, cioè la restante parte della rete ad essa collegata. Al fine di sostenere questo doppio carico quindi il trasmettitore presente su tale interfaccia dovrà 7 erogare più corrente. Si ricordi però che, per il corretto funzionamento dei circuiti digitali, la corrente non potrà crescere indefinitamente, ma avrà un valore oltre il quale si dice che il circuito satura, ovvero non è più in grado di fornire i livelli di tensione necessari in quanto vi è un tetto di potenza oltre il quale non è possibile andare. In conseguenza di ciò, è chiaro che un aumento della corrente che è necessario erogare in conseguenza del doppio carico presente, potrà comportare degli abbassamenti in tensione con tutti i problemi a ciò connessi. Per queste ragioni, è molto importante che, nell’effettuare tali test in service, l’oscilloscopio collegato all’interfaccia sia tale da non caricarla, cioè esso dovrà essere dotato di un’impedenza di ingresso molto elevata, praticamente tale da far sì che esso funga da circuito aperto. E’ bene sottolineare che sarebbe un grave errore dire in questo caso che l’oscilloscopio debba essere adattato all’interfaccia, in quanto, nel caso di test in service, questo adattamento già lo si ha in conseguenza del collegamento fra l’interfaccia stessa e l’altro troncone di rete ad essa collegato, che, appunto, se tutto funziona bene, funge proprio da carico adattato per quell’interfaccia. Di conseguenza, se supponiamo ad esempio che quest’impedenza di carico debba valere 50Ω, se si collegasse a tale interfaccia un oscilloscopio adattato, si finirebbe per avere due impedenze da 50Ω in parallelo, le quali equivarrebbero quindi ad un’impedenza di 25Ω; questo implicherebbe allora il venire meno delle condizioni d’adattamento e di conseguenza, non solo la rete verrebbe deteriorata, ma soprattutto tutte le informazioni di misura ricavate non avrebbero alcun senso. Quindi nel caso di test in service l’oscilloscopio non deve fungere da carico adattato ma anzi da carico elevato, teoricamente infinito, in quanto l’adattamento già c’è; per inciso è bene sottolineare che il discorso sarebbe perfettamente contrario nel caso di test out of service effettuati sui cavi, in quanto, poiché questa volta l’oscilloscopio verrebbe agganciato su un’interfaccia dopo aver da essa scollegato il restante troncone di rete, proprio al fine di conservare l’adattamento, sarebbe questa volta necessario servirsi invece di un 8 oscilloscopio con impedenza d’ingresso di 50Ω. Informazioni relative alla qualità dell’infrastruttura di cablaggio o all’interfaccia sotto test possono essere determinate a partire dalla forma del segnale visualizzata sull’oscilloscopio; per questa ragione questi test sono molto utili al fine di restringere il range di possibili cause di malfunzionamenti, qualora queste risiedano appunto in interfacce difettose nei nodi di rete, nei bridge o nei router o qualora ci siano problemi derivanti dall’infrastruttura di cablaggio. Analisi dei protocolli e misure statistiche Mentre i test precedentemente discussi sono sostanzialmente dei test di livello fisico che si servono quindi di strumenti tradizionali quali, come già detto, l’oscilloscopio, con i test protocollari si sente l’esigenza di salire nella pila protocollare e, per far ciò, è allora necessario ricorrere ad un altro genere di strumento che è il cosiddetto analizzatore di protocollo, unità in grado di espletare le seguenti funzionalità: - catturare i pacchetti in transito sul segmento di rete da esso controllato, operando nel modo meno intrusivo possibile, cioè non solo non facendo scomparire i pacchetti catturati, ma neppure introducendo un ritardo significativo che sarebbe causa di disturbo per l’utente in quanto andrebbe ad inficiare la qualità del servizio da lui percepita; - recuperare l’informazione in essi contenuta; - visualizzare a video tali informazioni relative ai vari livelli della pila protocollare. Inoltre gli analizzatori di protocollo più moderni sono anche in grado di riportare statistiche e trend relativi al traffico da essi analizzato. Nelle topologie broadcast (quali Ethernet a 10/100/1000 Mbit/s, Token ring a 4/16 Mbit/s e FDDI), un analizzatore di protocollo è collegato come ogni altro 9 nodo al segmento di LAN sotto test e può monitorare tutte e sole le comunicazioni in atto sul segmento su cui è installato; il traffico presente aldilà di un router o un bridge non può essere testato in conseguenza del fatto che tali componenti limitano il traffico locale al proprio segmento d’origine. Nella figura 1.4, di seguito riportata, vengono mostrati i modi in cui un analizzatore di protocollo può essere collegato ad un segmento LAN, a seconda della sua diversa topologia: - nel caso di una rete Ethernet 10Base2, ove si ricordi che ogni singolo nodo è collegato al bus adoperando connettori industriali standard BNC che formano una giunzione a T, l’analizzatore stesso è connesso adoperando appunto un connettore a T libero o un connettore a T extra; - nel caso di Ethernet 10BaseT, si connette l’analizzatore all’hub; - nel caso di una Token ring con configurazione ad anello stellato, si connette l’analizzatore ad una delle porte del centro stella. - nel caso di FDDI, si può o connettere l’analizzatore direttamente al doppio anello (nel qual caso però saranno necessarie due porte), oppure collegarlo ad esso tramite un concentratore di fili (nel qual caso una sola porta è sufficiente). 10 Figura 1.4 Se si desidera analizzare il traffico in due segmenti simultaneamente, ad esempio al fine di osservare come esso attraversa un particolare router o bridge, è necessario un analizzatore di protocollo a due porte; è, infatti, chiaro che non è possibile monitorare più segmenti contemporaneamente con un dispositivo a singola porta per il semplice fatto che esso non può essere connesso in due posti allo stesso tempo. Il monitoraggio di una rete più ampia poi, può essere realizzato servendosi di sistemi di monitoraggio distribuiti, composti da una stazione centrale, che raccoglie, correla ed analizza i dati provenienti da varie entità, detti agent, consistenti o in sonde di misurazione o in entità software, installati in tutti i segmenti LAN. Un’architettura del genere, offrendo una visione real-time di una vasta area della rete, che può essere monitorata da remoto, rende chiaramente più semplice l’analisi dei malfunzionamenti e consente di effettuare interventi repentini. L’analisi di rete diventa più complessa qualora, piuttosto che considerare come, finora fatto, delle LAN con una topologia broadcast, si considerino delle LAN con una topologia basata su un principio di commutazione, come le Switched 11 LAN, le quali, piuttosto che adoperare degli hub, dispositivi dello strato fisico, che si limitino a ricopiare su tutte le porte d’uscita qualunque pacchetto gli giunga su una porta d’ingresso, si servono di switch, i quali, essendo dispositivi in grado di esaminare l’indirizzo di destinazione di livello 2 precisato in ogni frame che giunge loro su un’interfaccia d’ingresso, inoltrano tale frame solo all’interfaccia da cui sarà possibile giungere alla destinazione desiderata. E’ allora chiaro che, in una tal topologia, non è possibile connettere direttamente l’analizzatore allo switch come se fosse un qualunque nodo in quanto, dal momento che nessun altro elemento è a conoscenza dell’esistenza dell’analizzatore stesso, non ci sarà del traffico ad esso specificamente inviato e lo switch quindi bloccherà la porta fisica a cui l’analizzatore è connesso. In questa condizione, l’analizzatore potrà catturare solo il traffico broadcast. Affinché quindi l’analizzatore possa monitorare almeno il traffico relativo ad una porta dello switch sarà necessario interporlo fra questa stessa porta e il server, la workstation o il segmento di LAN, che normalmente è ad essa connesso. Attraverso un tal genere di connessione quindi, se una data porta di uno switch LAN è connessa solo ad una singola stazione, ogni porta dell’analizzatore di protocollo potrà monitorare solo il traffico relativo ad essa. Figura 1.5 12 Se invece si desidera contemporaneamente allora monitorare sarà tutte necessario le porte adottare un dello switch analizzatore multiporta. Proprio per rispondere a questa esigenza si sono sviluppati analizzatori, con costi sempre più alti, che hanno 4, 8, 12 o più porte, le quali sono usate per monitorare il corrispondente numero di switch port. In alternativa a ciò molti commutatori, dotati di maggiori funzionalità, offrono la possibilità di definire delle cosiddette “mirror port”, cioè porte inutilizzate che vengono adoperate come porte di test e in cui vengono copiati tutti i pacchetti che giungono da quelle attive. Questa soluzione, se da un lato consente ad un analizzatore a singola porta di monitorare i dati provenienti da un certo numero di porte attive, dall’altro ha lo svantaggio che, in presenza di picchi di traffico, non è più in grado di garantire un monitoraggio affidabile in quanto la singola porta di test, di solito, ha esattamente la stessa capacità, in termini di buffer essenzialmente, di una qualunque di quelle monitorate, per cui in una condizione del genere i pacchetti che eccedono la sua capacità vengono scartati a caso e quindi persi. Il limite di questa seconda soluzione consiste quindi nel fatto che il grado di affidabilità dell’informazione ottenuta decresce all’aumentare del traffico prodotto sulle porte attive, raggiungendo in particolare il picco massimo di inaffidabilità quando tutti i link verso lo switch sono saturi. Nella seguente figura vengono mostrate tutte e due le possibili soluzioni adesso descritte, quella cioè in cui lo switch ha un’apposita porta di monitoraggio e quella in cui invece l’analizzatore fa da ripetitore tra lo switch ed il nodo d’interesse. 13 Figura 1.6 1.3.2 Test out of service 1.3.2.1 Test su cavi Come già detto prima, le misurazioni effettuate sui cavi sono le più comuni procedure di test che richiedono l’interruzione dell’attività svolta da un intero segmento di LAN. Le caratteristiche dei cavi che in particolare vengono misurate, variano in dipendenza dello specifico tipo di cavo adoperato: doppino, cavo coassiale o fibra ottica. 14 Test sui doppini I doppini in rame rappresentano il più economico e diffuso mezzo trasmissivo; sebbene essi siano nati per essere adoperati in telefonia, i continui miglioramenti loro apportati hanno fatto sì che potessero essere utilizzati per uno svariato range di applicazioni ed è così che essi hanno trovato ampio spazio nell’ambito delle reti locali, dove attualmente consentono di raggiungere velocità di trasmissione di 100 Mbit/s (categoria 5) o di addirittura 1 Gbit/s (categoria 6). Le tipiche caratteristiche che vengono misurate quando si considerano LAN cablate con doppini sono ad esempio lunghezza del cavo, attenuazione, diafonia, assegnazione dei pin, rumore e impedenza, descritte di seguito in dettaglio. Assegnazione dei pin La corretta assegnazione dei pin di un connettore di cavi dovrebbe essere la prima cosa da controllare prima che degli indicatori di qualità possano essere testati. Una scorretta assegnazione dei pin, oltre che essere ovviamente il risultato di un errore manuale effettuato durante il cablaggio, potrebbe anche essere dovuto all’uso di differenti sistemi di codifica basati sui colori: si pensi ad esempio al fatto che gli standard per i sistemi di cablaggio EIA/TIA 568A e EIA/TIA 568B definiscono due differenti modi per intestare un cavo UTP a 4 coppie su una presa RJ-45. Nella seguente figura viene mostrato un tale connettore e le due diverse possibili assegnazioni delle coppie. 15 Figura 1.7 L’assegnazione dei pin è testata connettendo il wall jack (presa utente) a differenti resistenze, effettuando poi delle misurazioni di resistenza al permutatore centrale (patch panel) per ogni coppia di fili che giunge qui a partire dalla presa utente e verificando infine che i risultati ottenuti corrispondano ai valori di resistenza settati su ciascuna coppia. Attenuazione Un importante parametro elettrico di un cavo è l’attenuazione, definita come il rapporto, in decibel, fra l’ampiezza del segnale in ingresso al cavo e quella misurabile all’altra estremità. Dato che esistono dei limiti ben specifici all’attenuazione totale che può essere tollerata su un certo segmento di rete, queste misurazioni sono un utile strumento per misurare quale sia la reale perdita in ampiezza del segnale trasmesso e verificare che essa non ecceda il 16 massimo valore permesso, detto “loss budget”. In particolare è chiaro che l’attenuazione misurata varierà in dipendenza della lunghezza del cavo e della frequenza a cui si sta lavorando. Diafonia Nei cavi in rame, ove più coppie scorrono affiancate le une alle altre all’interno della stessa guaina, la sorgente più significativa di disturbo è la diafonia, in inglese cross-talk, una quantità che indica quanto un cavo disturba un altro ad esso vicino, in conseguenza di fenomeni di accoppiamento fra essi esistenti. In particolare la diafonia viene misurata come rapporto, in decibel, fra l’ampiezza del segnale trasmesso, che genera disturbo, e quella del segnale indotto nel cavo vicino ed esistono, in linea di principio, due diversi modi per misurarla che differiscono per il lato ove effettivamente la misurazione è effettuata: se la misurazione del segnale indotto nel cavo vicino è effettuata dalla stessa parte del trasmettitore, si parla di paradiafonia o NEXT (Near End Cross-Talk), se invece tale misurazione è effettuata all’estremo opposto si parla di telediafonia o FEXT (Far End Cross-Talk). In pratica però si misura quasi sempre soltanto la paradiafonia, la quale è chiaramente molto più critica della seconda, che infatti rappresenta un’interferenza dovuta ad un segnale attenuato. Figura 1.8 Ciò a cui tipicamente si aspira è il conseguimento di un alto valore NEXT, il 17 quale ci starebbe ad indicare basso disturbo presente sulla linea e quindi alta qualità del percorso trasmissivo e inoltre sarebbe sicura garanzia di un ancor più alto valore FEXT (mentre si noti che il contrario non sarebbe invece vero). Anche la diafonia è però influenzata dalla frequenza del segnale trasmesso ed è per questo molto importante effettuare misurazioni a diverse frequenza e su ogni possibile combinazione di coppie, con questo si intende dire che, se ad esempio il cavo sotto test è un doppino a quattro coppie, almeno dodici misurazioni dovranno essere effettuate. Si tenga presente, fra l’altro, che proprio la necessità di minimizzare la diafonia è la ragione per cui i fili di rame di un doppino sono ritorti. Rapporto fra attenuazione e diafonia Allo scopo di conseguire una corretta ricezione non interessano tanto l’attenuazione assoluta del cavo o il suo valore di diafonia, quanto la combinazione di questi due parametri; proprio al fine di considerare in modo combinato entrambi i macroeffetti che sono causa di una degradazione della qualità dell’informazione è interessante valutare il cosiddetto ACR (Attenuation to Cross-talk Ratio), che esprime il rapporto tra il segnale attenuato, presente su una coppia, ed il segnale indotto dalla coppia vicina e varia anche esso in funzione della frequenza e della lunghezza del cavo. Tra l’altro, siccome tanto l’attenuazione quanto la diafonia sono espresse in decibel, cioè in termini logaritmici, il loro rapporto è ottenibile come loro differenza; se quest’ultima è troppo piccola, cioè si avvicina a zero dB, non è più possibile trasmettere sul cavo in modo affidabile, in quanto il segnale utile è troppo debole rispetto al rumore e quindi possono verificarsi troppi errori di trasmissione. L’ACR è quindi importante al fine di stimare gli effetti dell’attenuazione e della diafonia sul bit error rate caratteristico del percorso trasmissivo sotto analisi. 18 Rapporto segnale-rumore Il rapporto fra l’ampiezza del segnale e quella del rumore, cioè il cosiddetto rapporto segnale rumore (SNR), è quasi identico all’ACR, di cui precedentemente detto, in quanto l’unica differenza fra le due quantità sta nel fatto che l’SNR tiene conto, non solo dei disturbi dovuti alla diafonia, che però sono i più significativi, ma anche di quelli causati da altre possibili sorgenti di rumore. Impedenza L’impedenza è il parametro elettrico più importante per un cavo usato alle alte frequenze; essa, normalmente indicata con il simbolo Z ed espressa in Ω (ohm), è una grandezza complessa, che sintetizza in un solo valore resistenze, capacità ed induttanze presenti sul cavo. L’importanza dell’impedenza deriva dal fatto che, per la trasmissione di segnali a frequenze elevate, l’impedenza d’uscita del trasmettitore, quella d’ingresso del ricevitore e quella caratteristica del cavo devono essere uguali; si parla, in tal caso, di “sistemi adattati in impedenza”. Le variazioni d’impedenza lungo il cavo, che possono essere ad esempio provocate da alterazioni nella regolarità della geometria dei doppini stessi, provocano riflessioni del segnale, con conseguenti attenuazioni ed interferenze, causa a loro volta di jitter ed errori nei bit. A seguito di ciò, se si desidera ottenere una comunicazione che non risenta di un tal genere di problemi, è necessario fare in modo che l’impedenza rimanga quanto più possibile costante e vicina all’impedenza caratteristica del cavo stesso attraverso l’intero segmento. 19 Resistenza Un'altra caratteristica interessante di un doppino è la sua resistenza. È bene evidenziare immediatamente che, sebbene i concetti di impedenza e resistenza di un cavo potrebbero sembrare simili, essi sono invece, in realtà, profondamente diversi: mentre infatti quando si parla di impedenza di un cavo sostanzialmente ci si riferisce alla sua impedenza caratteristica e quindi alla sua capacità di trasferire informazioni ad alta frequenza senza che si generino, ad esempio, delle riflessioni, quando di parla di resistenza di un cavo, invece ci si riferisce ad una grandezza caratterizzante il materiale da cui il cavo stesso è costituito, cioè, nel caso del doppino, l’anima in rame che è all’interno di ogni suo singolo elemento. È chiaro che la resistenza di un cavo varia in dipendenza della sua lunghezza, nel senso che quanto maggiore sarà la lunghezza del tratto considerato tanto più alta sarà la resistenza sperimentata. Nel caso di un doppino UTP lungo 100 metri, ad esempio, la resistenza dovrebbe assumere un valore compreso fra i 9Ω e 12Ω, mentre per un STP della stessa lunghezza esso dovrebbe assumere un valore compreso fra i 6 e 7Ω. Le misurazioni di resistenza sono molto utili perché in grado di fornire indicazioni sull’integrità dei cavi stessi, in quanto ad esempio valori misurati diversi da quelli attesi potrebbero essere indice di connessioni imperfette, corto circuiti o cavi rotti. Riflessioni Come già precedentemente detto, anomalie d’impedenza danno origine a fenomeni di riflessione, che a loro volta causano sovrapposizioni fra i simboli che rappresentano i vari bit e di conseguenza generano distorsioni nella forma del segnale trasmesso. Questa distorsione può poi rendere più difficile al 20 ricevitore la ricostruzione del segnale di clock che è necessario conoscere al fine di capire qual è la cadenza con cui i bit del segnale trasmesso si succedono e senza il quale il ricevitore non sarebbe in grado di riconoscere il confine fra bit adiacenti e quindi di interpretare correttamente il segnale ricevuto. Si pensi ad esempio al caso in cui si codificano i dati digitali da trasmettere sul canale mediante codifica Manchester: ebbene in questo caso il ricevitore ricava l’informazione sul clock a partire dai fronti presenti nel segnale ricevuto in ogni intervallo di bit; è chiaro allora che, qualunque deformazione del segnale che renda più difficile determinare gli istanti in cui i fronti si verificano, contribuirà all’insorgere di jitter, nel senso che il clock ricostruito dal ricevitore sarà affetto da una certa instabilità in quanto il valore istantaneo della frequenza di clock varierà leggermente rispetto al valore nominale. Potendo quindi essere le riflessioni causa di un aumento di jitter, è bene che esse siano misurate (tipicamente in decibel), su un certo range di frequenze. Lunghezza del cavo La lunghezza di un segmento di cavo è misurata attraverso il metodo riflettometrico, cioè servendosi di un TDR (Time-domain reflectometer) che invia dei segnali impulsivi lungo il segmento sotto test e misura il tempo, in nanosecondi, che trascorre prima che esso possa ricevere il segnale riflesso generato alla fine del cavo. A partire da tale informazione e una volta nota la velocità con cui si propaga il segnale sul cavo (per i cavi in rame essa è tipicamente compresa fra il 55% ed il 75% di quella della luce nel vuoto), è possibile calcolare la lunghezza del cavo stesso. Quest’informazione è importante in quanto, per ogni topologia di rete LAN, esiste un limite massimo consentito per la lunghezza del segmento, superato il quale le prestazioni complessive della rete possono diminuire, in 21 quanto, ad esempio, l’attenuazione sperimentata dal segnale può divenire eccessiva. Inoltre, ricorrendo al metodo riflettometrico, è possibile anche individuare dei punti di guasto presenti sulla rete, in quanto tali guasti determineranno un disadattamento d’impedenza, la quale a sua volta sarà causa della generazione di un’onda riflessa; anche in questo caso misurando il tempo intercorrente tra l’invio del segnale e la ricezione dell’onda riflessa si può capire in quale punto è localizzato il problema sul link. Test sui cavi coassiali Un altro comune mezzo di trasmissione è il cavo coassiale. . Figura 1.9 Sebbene esso abbia avuto per lungo tempo notevole diffusione nelle reti locali, tanto è vero che è stato adoperato in due diversi cablaggi Ethernet (il 10Base5 e il 10Base2), esso sta gradualmente cadendo in disuso, soppiantato nella fascia ad alte prestazioni dalle fibre ottiche, e in quella a medie prestazioni dai doppini che, rispetto ai cavi coassiali, hanno i vantaggi di un minor costo, minore difficoltà d’istallazione e minor ingombro (si pensi che un cavo Ethernet 10Base2 trasporta un singolo segnale ed occupa circa lo stesso spazio di un cavo TP a 4 coppie, che può trasportare 4 segnali) ma soprattutto presentano una maggiore flessibilità e modularità. 22 Le caratteristiche più importanti da misurare nelle infrastrutture realizzate con cavi coassiali sono la lunghezza del segmento, l’attenuazione e le resistenze di terminazione (si ricordi infatti che le reti 10Base2 e 10 Base5, devono essere terminate su resistori a 50 ohm); le informazioni così ricavate aiutano nell’individuazione di problemi quali corto circuiti, connettori staccati, curvature dovute ad un inadeguato cablaggio, resistenze di terminazione imperfette o mancanti, eccessive lunghezze dei segmenti. Si noti che è molto importante quando ad esempio si effettuano dei test TDR che ogni ripetitore presente nel segmento sotto test venga disattivato prima di effettuare delle misurazioni, in quanto alcuni ripetitori sono dotati di una funzione di segmentazione automatica in grado di disattivare l’intero segmento su cui sono stati rivelati dei malfunzionamenti e poi trasmettere dei segnali di test ad intervalli regolari al fine di determinare se questi malfunzionamenti ancora persistono; ebbene è chiaro che questi segnali devierebbero i risultati dei test TDR e quindi, al fine di ottenere valori corretti, è necessaria una preventiva disattivazione di tali ripetitori. Test sulle fibre ottiche L’ultimo mezzo trasmissivo di cui parliamo sono le fibre ottiche. Figura 1.10 23 La trasmissione in fibra ottica si basa sulla propagazione di impulsi di luce, ciascuno dei quali rappresenta un bit. Il grande successo delle fibre ottiche è dovuto a diversi fattori fra cui: - totale immunità da disturbi elettromagnetici; - alta capacità trasmissiva; - bassa attenuazione; - dimensioni ridottissime e costi contenuti. I tipici test effettuati sulle fibre sono quelli volti alla misurazione dell’attenuazione e delle riflessioni lungo il percorso di trasmissione, per misurare le quali ci si serve di un riflettometro ottico nel dominio del tempo (OTDR), e quelli invece volti alla misurazione della potenza del segnale al trasmettitore e ricevitore, per misurare la quale invece ci si serve di misuratori di potenza ottica. Ricorrendo a questo genere di test è possibile evidenziare problemi relativi alla potenza della luce, ad un’eccessiva attenuazione lungo la fibra, ad interruzioni sulle linee e a perdite dovute alle giunture. 1.3.2.2 Interferenze esterne Seri problemi di trasmissione possono derivare dal rumore indotto nei cavi in rame, in ambienti caratterizzati da alti livelli di interferenza elettromagnetica (EMI). Qualora non si riesca ad individuare delle ovvie sorgenti di tal genere di disturbi nelle vicinanze, potrebbero essere d’aiuto delle misurazioni in frequenza effettuate attraverso un analizzatore di spettro, in quanto, in tal modo, si riescono a visualizzare i segnali presenti in un certo range di frequenze sul mezzo di trasporto; le più comuni sorgenti d’interferenze elettromagnetica, comunque sono quelle di seguito riportate: 24 Il modo più sicuro di prevenire i problemi di interferenza elettromagnetica consiste nell’adoperare delle fibre ottiche piuttosto che cavi in rame. 1.4 Test di conformità ed interoperabilità sulle LAN I test di conformità ed interoperabilità sono test da effettuare sulla rete in fase di sviluppo. In particolare i primi mirano a verificare che il dispositivo sotto test, funzioni in accordo alle sue specifiche di progetto. Tipicamente essi prendono in considerazione due diversi aspetti del dispositivo sotto test che sono: - la corretta implementazione dei protocolli specificati; - il soddisfacimento dei requisiti prestazionali dell’applicazione che dovrà essere eseguita su di esso. Generalmente la tecnica impiegata consiste nel sollecitare l’apparato con un set di messaggi protocollari noti, osservarne la risposta e confrontarla con un riferimento; si deve tener presente che più complesso diventa il protocollo e più complessi diventano questi test perché nel verificare la conformità protocollare occorre essere esaustivi, considerando tutte le possibili combinazioni di stimoli 25 protocollari che si possono inviare al sistema sotto test. I test di interoperabilità invece, più precisamente, mirano a verificare il comportamento congiunto di due o più elementi di rete e, poiché questi sono svolti sempre dopo essersi assicurati che i singoli dispositivi superino i test di conformità, nel caso in cui un test di interoperabilità dia un esito negativo, non sarà possibile attribuire un malfunzionamento né a uno dei due dispositivi né ad entrambi ma il malfunzionamento sarà dovuto solo al modo in cui essi interagiscono. La conformità ad uno standard protocollare non è tanto critica nelle LAN, in quanto le tecnologie LAN sono usate principalmente in reti dati private e pertanto l’aderenza a standard nazionali ed internazionali per i dispositivi di rete non è prescritta per legge. Tuttavia, vista la crescente complessità delle tecnologie LAN e l’importanza dell’interoperabilità tra gli elementi di rete, sono stati sviluppati un certo numero di suite di test da parte di vari forum industriali, quali ad esempio il Fast Ethernet Consortium e la Gigabit Ethernet Alliance. Si tenga presente che sono attualmente disponibili suite di test per tutte le principali tecnologie LAN, quali ad esempio Ethernet a 10/100/1000 Mbit/s, Token ring e FDDI, che forzano una certa standardizzazione in ambiente LAN anche se non strettamente necessaria. Comunque, data la complessità di questi test, essi sono di solito svolti dai costruttori di apparati che appunto testano i propri componenti LAN così da garantire la loro conformità agli standard e la loro interoperabilità. 1.5 Test di carico sulle LAN La conformità prestazionale può essere verificata dall’utente, controllando determinati aspetti dell’apparato sotto test prima della sua messa in operazione mediante istallazione, sottoponendolo cioè ai cosiddetti test di carico, i quali 26 mirano tipicamente a valutare quali siano le prestazioni limite dell’elemento di rete in esame, mandando in overload la rete. Si tenga presente infatti che attualmente, mentre i componenti di rete adoperati in tecnologie LAN tradizionali quali Ethernet a 10 Mbit/s, Token ring e FDDI, riescono generalmente ad operare ad un massimo carico senza incorrere in difficoltà, non altrettanto può dirsi per quei componenti adoperati in LAN ad alta velocità quali Ethernet a 100 o 1000 Mbit/s, in quanto in questo range di velocità, le capacità dei vari componenti possono variare molto a seconda della casa costruttrice. Sebbene tipicamente i costruttori pubblichino esiti di test prestazionali da loro eseguiti, tali risultati possono solo essere adoperati come linee-guida, che debbono poi essere interpretati in termini del traffico presente sulla rete in cui l’apparato si trova; ad esempio un costruttore di router potrebbe pubblicare una specifica prestazionale in cui stabilisce il numero di pacchetti per unità di tempo che possono essere instradati, tuttavia sono molti i fattori di cui egli potrebbe non aver tenuto conto nell’effettuare i propri test e che invece influenzano le prestazioni del dispositivo sotto test, quali ad esempio, la dimensione variabile dei pacchetti, il numero di indirizzi sorgente e destinazione presenti nella tabella di routing. Tutti questi aspetti hanno poi l’immediata conseguenza che quando quello stesso router sarà attivo all’interno di una rete in fase operativa, le sue reali prestazioni saranno solo una frazione di quelle dichiarate dalla casa costruttrice; è quindi sempre bene che l’utente effettui dei test, per così dire, “in-house”, prima di mettere il prodotto in operazione. La tecnica più comunemente adoperata per realizzare questo genere di test consiste nel catturare il traffico dalla rete reale e replicarla su una rete di test a cui sia stato connesso il dispositivo da testare per osservarne così i risultati. Questo è un esempio importante di “emulazione”metodo applicabile ad un qualunque scenario ma riferito in tal caso al traffico di rete; nel caso specifico la tecnica emulativa è impiegata per testare l’apparato di rete generando un traffico di rete uguale a quello che interviene nelle condizioni 27 reali. L’emulazione è a metà strada tra la simulazione e la realtà; emulare significa replicare una situazione reale con un opportuna strumentazione, simulare significa ricreare una situazione reale numericamente, costruendo modelli numerici per gli apparati e per il traffico. E’ molto importante inoltre che tutti i costruttori specifichino dei parametri prestazionali dei propri apparati adoperando fra l’altro un’adeguata terminologia e metodologia, in modo da rendere più semplice ad un utente il confronto fra le diverse case produttrici; per questa ragione l’IETF Benchmarking working Group ha steso una serie di documenti volti proprio a specificare quanto prima detto, fra i quali ad esempio annoveriamo: - Metologie di Benchmarking per dispositivi di commutazione delle LAN (RFC 2889); - Terminologie di Benchmarking per dispositivi di commutazione delle LAN (RFC 2285); - Terminologie di Benchmarking per strumenti di interconnessioni delle reti (RFC 1242); - Metologie di Benchmarking per strumenti di interconnessioni delle reti 2544); - Terminologie di Benchmarking per le prestazioni dei firewall (RFC 2647). I parametri prestazionali, di cui si dice in tali documenti sono ad esempio: - throughput di pacchetti; - ritardo subito dai pacchetti; - tasso di perdita dei pacchetti. 28 Capitolo 2 Ethernet troubleshooting 2.1 Introduzione Ethernet è la tecnologia LAN di gran lunga più diffusa e la seguente trattazione riguarderà il troubleshooting relativo a 10/100 /1000 Mbit/s Ethernet. Il Troubleshooting è una tipologia di collaudo delle reti che viene effettuata con lo scopo di identificare e localizzare i problemi nel funzionamento della rete e dei suoi componenti una volta che questi si siano presentati . Non esiste una procedura generale per fare troubleshooting ma vi sono delle linee guida che si possono seguire quando si presenta un determinato problema utilizzando opportuni strumenti. 2.2 Strumenti Gli strumenti impiegati per il troubleshooting in Ethernet sono principalmente gli analizzatori di protocollo che possono monitorare l’attività del solo segmento di rete sul quale sono installati; per estendere l’attività di monitoraggio a più segmenti si ricorre a sistemi distribuiti . Questi sistemi prevedono una stazione centralizzata di gestione della rete detta Management Station su cui gira una manager application che raccoglie i dati provenienti da entità sparse in diversi punti della rete, detti agent, ovvero 29 processi funzionanti nei dispositivi da gestire chiamati managed devices . La manager application può interagire con centinaia di managed devices attraverso il protocollo SNMP (Simple Network Management Protocol). Le informazioni raccolte dagli agent relativamente ad un managed object vengono memorizzate in una sorta di database detto MIB (Management Information Base). Il troubleshooting per individuare ,invece, problemi di livello fisico può essere realizzato mediante “cable tester”, multimetri. Nella definizione “cable tester” rientrano gli strumenti in grado di verificare l’integrità e la conformità alle specifiche delle infrastrutture di cablaggio. Un cable tester potrebbe essere un oscilloscopio o più semplicemente uno strumento in grado di realizzare una minima analisi sul segnale sufficiente per la specifica tecnologia. Quest’ultimo rispetto all’oscilloscopio, che è uno strumento più generale in grado di effettuare un grande numero di misure, presenterà un costo minore e un’affidabilità superiore nell’ambito dello specifico set di misure da esso reeaizzabili. 2.3 Linee guida del troubleshooting Il primo passo da compiere consiste nell’analisi della topologia della rete sotto test, dei componenti di rete, delle connessioni, dei mezzi trasmissivi e delle relazioni tra le sezioni che la compongono. Dopodiché si passa alla raccolta dei sintomi e caratteristiche di un problema, maggiori sono le informazioni a disposizione migliori sono le possibilità di risolvere il problema velocemente ed efficientemente. Se la rete è già in opera viene utilizzato un analizzatore di protocollo per la rilevazione delle principali statistiche operative di un singolo segmento di rete : - Percentuale d’uso della capacità di una rete cioè il rapporto tra la quantità di dati inviati sul canale e capacità massima del canale per cento (se questa 30 percentuale è < 40 % la rete sta funzionando in condizioni ottimali). È importante osservare che con la definizione dati inviati sulla rete si vuole indicare il throughput medio calcolato in un intervallo di tempo in quanto se si realizzasse un’osservazione istantanea del link quest’ultimo o sarebbe occupato alla massima capacità o non occupato. Quando invece si calcola il throughput, che è diverso dalla capacità, si fa un’analisi in un certo intervallo di tempo e si mediano zone di completa occupazione con zone di completa non occupazione. - Tasso di trasmissione (throughput) delle frame ovvero il tasso di frame immesso sulla rete in frame/s; ciascuna stazione non deve inviare più di 5000 frame/s, al fine di garantire che le altre stazioni della rete non vengano saturate dall’invio di troppi pacchetti. - Errori FCS (Frame check sequence) : nelle frame Ethernet è presente il campo FCS che consente di rilevare se i bit nella frame sono cambiati, l’FCS è ottenuto correlando gli altri bit nella frame (esclusi i bit nel preambolo). - Tasso di collisioni. - Percentuale dei pacchetti broadcast e multicast. - Numero di pacchetti sovradimensionati. - Numero di pacchetti sottodimensionati. - Numero di stazioni trasmittenti. 31 Figura 2.1 In molti casi l’analisi delle statistiche operative, ovvero, l’individuazione dell’esistenza o meno di correlazioni tra le informazioni rilevate e registrate sistematicamente nel tempo, consente di risalire direttamente alla sorgente del problema. Per esempio se viene osservata una correlazione tra il numero di stazioni attive, il numero di collisioni e l’uso della capacità della rete è altamente probabile che il problema riguardi componenti attivi nella rete (nodi di rete, ripetitori), invece se non c’è tale correlazione è più probabile che la sorgente del problema risieda nell’infrastruttura di cablaggio. Tuttavia il problema non sempre può essere localizzato perché i sintomi rilevati in un segmento possono essere causati da problemi in segmenti adiacenti o addirittura in parti più remote di una rete, in tal caso saranno necessarie misure contemporanee nei diversi segmenti mediante sistemi di monitoraggio 32 distribuiti. L’analisi dei risultati indicherà se sintomi in un segmento sono causati da problemi in altri. La localizzazione del segmento responsabile del problema che occorre è conseguita grazie ad un’analisi proattiva conosciuta come “baseling”, realizzata su più segmenti contemporaneamente nelle normali condizioni operative, che comprende le seguenti fasi : - la raccolta dei dati ad intervalli regolari - la creazione dei report ottenuti elaborando e correlando i dati - l’interpretazione dei risultati. L’analisi di rete proattiva consente di individuare i trend della rete e i potenziali problemi prima che essi si verifichino ma fornisce anche un potente strumento impiegato per localizzare i problemi quando essi si manifestano sottoforma di diversi sintomi. Difatti un confronto tra vecchie e più recenti analisi realizzate sulla rete durante l’occorrenza del problema può essere di grande aiuto al fine di restringere l’area interessata dal guasto. Tale fase presenta enormi difficoltà in quanto le reti LAN si sviluppano localmente con criteri specifici dell’ambiente in questione, non esistono, pertanto, dei veri e propri riferimenti, normative o standard che chi gestisce la rete deve essere in grado di costruirsi, sulla base della propria esperienza, accumulando risultati relativi a momenti diversi della vita della rete mediante la suddetta analisi. Una volta individuato il segmento responsabile del problema segue una fase che ha come obiettivo l’individuazione del guasto a tal fine si rilevano le principali statistiche operative del segmento in questione. La fase successiva alla rilevazione delle principali statistiche operative del segmento dipende dalla natura dei sintomi, difatti se i sintomi sono periodici o continui sono sufficienti delle misurazioni a breve termine ma se i sintomi occorrono ad intermittenza sono necessarie misurazioni a lungo termine, perché devono essere realizzate finché le statistiche operative non sono misurate durante l’occorrenza del problema. In ogni caso a questo punto la procedura di troubleshooting è applicata ai 33 componenti della rete più vicini al problema mediante un’analisi che viene effettuata su tutti i livelli della pila OSI procedendo per ordine dal livello più basso a quello più alto o viceversa, solitamente è consigliata una strategia di analisi bottom-up poiché l’80% dei guasti se non anche di più occorrono principalmente a livello fisico e a livello data link. Ad esempio se i problemi riguardano un singolo nodo di rete il passo successivo consiste nell’analisi dei componenti software e hardware della stazione ma se la sorgente del problema non è individuata il dominio di analisi è di volta in volta allargato. Se non viene rilevato alcun guasto l’analisi viene estesa al transceiver, al cavo mediante cui esso è connesso alla NIC del nodo, al connettore di potenza al cavo Ethernet, al wall-jack , al cavo verso l’hub , al cavo verso il server , e così via. Nel caso di sintomi intermittenti si possono definire anche filtri e allarmi per gli errori delle frame Ethernet , configurando l’analizzatore di protocollo in modo da catturare i pacchetti Ethernet che vengono trasmessi quando occorre un errore, inoltre è essenziale registrare l’esatto istante dell’evento errore, in quanto questa informazione può successivamente essere messa in correlazione con altri eventi nella rete su un determinato nodo come l’avvio di una specifica applicazione, connessioni attraverso i router, accesso a Internet. Se il problema non viene localizzato o se il problema che si pensava potesse essere localizzato effettivamente non lo è, si cerca la sorgente del problema mediante una segmentazione sistematica della rete. Al fine di operare la segmentazione suddetta della rete si ricorre alla documentazione di rete per identificare quanti hub sono coinvolti. Se è coinvolto un numero di hub limitato ha senso isolare un hub alla volta e controllare se il problema scompare. Se, invece, è coinvolto un numero grande di hub la rete deve essere fisicamente tagliata in due o più parti e monitorata. Individuata la porzione di rete che produce il problema, questa viene a sua volta segmentata finché viene trovato il segmento contenente la sorgente del 34 problema. La procedura di segmentazione consente di individuare la causa del problema velocemente mediante un’opportuna scelta dei punti di segmentazione ma è un metodo che può provocare considerevole disordine nelle operazioni di rete, è quindi applicata, come ultima risorsa, quando il problema comunque indebolisce pesantemente l’operatività della rete. Un altro metodo efficiente di troubleshooting consiste nel metodo di analisi e confronto il quale prevede il confronto di elementi di rete in questione con elementi di rete in opera simili o identici . Tuttavia questo metodo viene utilizzato poco perché gli odierni server e router sono raramente identici o magari soggetti ad usura differente. 2.4 Sintomi dei problemi in Ethernet Nelle reti Ethernet, molti sintomi dei problemi, quali carichi di traffico, presenza di collisioni occorrono anche nelle normali condizioni operative. Difatti il protocollo di accesso al mezzo usato in Ethernet è un protocollo di accesso casuale (CSMA/CD) che prevede il verificarsi di collisioni. Tuttavia l’avvento di certi tipi di pacchetti difettosi consente di individuare l’effettiva occorrenza dei problemi che non rientrano nel regolare funzionamento di una rete. I pacchetti difettosi possono essere suddivisi nelle seguenti categorie: - frammenti di collisioni locali (local collision) - frammenti di collisioni remote (remote collision) - frammenti di collisioni ritardate (late collision) - pacchetti sottodimensionati - pacchetti sovradimensionati - errori FCS (Frame Check Sequence) 35 - errori di allineamento - errori di rumore - errori di lunghezza Notiamo che i primi tipi di pacchetti difettosi sono una diretta conseguenza delle collisioni quindi, prima di descrivere in dettaglio i vari sintomi appena esposti, nel paragrafo successivo daremo una breve panoramica su cosa si intende per collisione in una rete Ethernet. 2.4.1 Collisioni Le collisioni occorrono quando due stazioni sullo stesso segmento cominciano a trasmettere frame Ethernet contemporaneamente. Con riferimento ad una rete Ethernet operante a 10Mbit/s in cui vengono rispettati i limiti imposti dallo standard sulla distanza massima (2.5 km), supponiamo che il nodo 1 voglia trasmettere dei dati ad un nodo 2 (vedi figura) e le due stazioni si trovano alla massima distanza possibile. 1 25.51μ s 25.51μ s Figura 2.2 Il primo bit di una frame, inviato dalla stazione 1, impiega 2 25.51µs per raggiungere il nodo 2 e se in un istante di tempo poco inferiore anche quest ultimo inizia a trasmettere una frame, questa collide con quella inviata dalla prima stazione. Nella collisione le tensioni dei due segnali si sommano e il segnale di collisione 36 risultante impiega un massimo di 25.51µs per ritornare al trasmettitore . Quindi il tempo più lungo che la stazione 1 impiega per riconoscere l’occorrenza di una collisione normale e fermare la trasmissione è 51.2 µs , o 512 bit pari a 64 byte; i frammenti di collisione normali sono, pertanto, di lunghezza inferiore a 64 byte. Ricordiamo che 64 byte è la lunghezza minima, prevista dallo standard, per una frame. Inoltre i frammenti di collisione sono tali che i contenuti della frame sono completamente distrutti e la checksum non è riconoscibile. 2.4.2 Collisioni remote e locali Le collisioni che occorrono in un segmento locale sono chiamate collisioni locali, precisamente avvengono lungo il link in una topologia 10Base2 o 10Base5 (senza ripetitori) o tra un host e l’hub in una topologia 10/100/1000BaseT. I frammenti di collisione locale sono di lunghezza minore di 64 byte e presentano un segnale di tensione più elevato delle frame normali ed un FCS non valido. Le collisioni remote sono, invece, collisioni che avvengono tra frame provenienti da nodi appartenenti a diversi segmenti di una rete trasportati da un ripetitore o hub all’esterno del proprio segmento di appartenenza. La collisione è remota perché è riferita a quello specifico hub e non ad un altro (spesso infatti alla porta di un hub potrebbe essere collegato un segmento Lan composto da più hub). I segnali di tensione relativi ai frammenti di collisione remoti non sono più elevati di quelli relativi a frame normali perché corretti dall’hardware del ripetitore. Quando il ripetitore rileva una collisione remota completa il frammento di collisione con una sequenza di bit jam ed inoltra il frammento di 37 collisione con l’aggiunta dei bit jam su tutte le porte in modo da evitare ulteriori collisioni e fermare le trasmissioni nei segmenti connessi. Sebbene l’occorrenza delle collisioni rientri nelle normali modalità operative di una rete Ethernet la crescita del numero di collisioni può dipendere da: - resistori di terminazione difettosi o non installati; le reti 10Base2 e 10Base5 devono essere terminate con resistori di 50Ω, le verifiche del valore di tale resistenza (48Ω<R<52Ω) possono essere realizzate con un multimetro - connettori a T allentati o difettosi; per individuare il problema è necessario controllare tutte le connessioni lungo il percorso trasmissivo d’interesse - numero eccessivo di stazioni in un segmento; tale numero non deve essere superiore a 100 in un segmento 10Base5 e 30 in un segmento 10Base2 - curvatura dei cavi; in tal caso per localizzare il danno si può utilizzare un “cable tester” - cavi non conformi allo standard 802.3; ciò potrebbe essere causato da chi installa o, qualora non sia lo stesso, da chi ha fornito all’installatore il materiale. E’ necessario controllare le specifiche dei cavi che si utilizzano. 2.4.3 Collisioni ritardate (late collision) Una collisione ritardata occorre quando due stazioni trasmettono contemporaneamente ma nessuna delle due rileva l’avvenuta collisione prima di aver trasmesso 64 byte; i frammenti di collisione ritardata sono, pertanto, di lunghezza maggiore di 64 byte e possono essere riconosciuti rilevando l’incremento del segnale di tensione nel caso di collisioni locali ritardate o per mezzo della mancanza di checksum e presenza di bit jam nel caso di collisioni remote ritardate. Le collisioni ritardate occorrono quando il tempo di propagazione del segnale da un nodo terminale all’altro è maggiore del tempo che impiega una stazione a mandare un pacchetto di dimensione minima sulla 38 rete. Le cause delle collisioni ritardate sono: - NIC (Network Interface Card) difettose; per l’individuazione del nodo responsabile si deve utilizzare un analizzatore di protocollo che raccolga informazioni come il numero di collisioni, i nodi attivi e le metta in correlazione. Se il problema non viene localizzato è necessario passare alla segmentazione della rete - impiego di un numero eccessivo di ripetitori in cascata; bisogna, in tal caso, limitare a 4 il numero di ripetitori o sostituire un ripetitore con un bridge o cambiare la configurazione di rete - cavi difettosi; per localizzare il problema deve essere impiegato un “cable tester” - cavi più lunghi della lunghezza massima specificata per una data topologia; i cavi devono essere misurati con un “cable tester”. 2.4.4 Altri sintomi di malfunzionamento Pacchetti sottodimensionati Un pacchetto corto presenta una lunghezza minore di 64 byte ma una FCS valida. Un runt è un pacchetto di lunghezza minore di 64 byte con una FCS non valida. Poiché tali frame presentano una dimensione minore di quella minima, non sempre è incluso l’indirizzo sorgente e risulta, pertanto, difficile associarle ad un particolare nodo. I pacchetti sottodimensionati sono l’effetto di collisioni locali o remote oppure sono prodotte da NIC difettose, in tal caso bisogna utilizzare un analizzatore di protocollo per cercare di catturare i pacchetti difettosi e identificare la stazione che li ha emessi mediante l’indirizzo sorgente, 39 se l’indirizzo sorgente non è leggibile si deve cercare di individuare la NIC difettosa mettendo in correlazione le informazioni raccolte. Pacchetti sovradimensionati I pacchetti lunghi sono frame di lunghezza maggiore di 1518 byte ma presentano una FCS valida. Ricordiamo che lo standard prevede, oltre che una dimensione minima, anche una dimensione massima per una frame pari a 1518 byte. Secondo lo standard IEEE 802.3 un jabber è una frame più lunga di 1518 byte con FCS non valida. Le cause dei pacchetti sovradimensionati sono: - NIC (Network Interface card) difettose; in tal caso si deve utilizzare un analizzatore di protocollo per identificare la NIC difettosa mediante l’analisi dell’indirizzo sorgente presente nelle frame - differenti riferimenti di potenziale nelle reti 10Base2 e 10Base5; ogni rete ha bisogno di un riferimento e per semplicità si sceglie come potenziale di riferimento il “ground” ovvero il potenziale di terra perché è quello che abbiamo a disposizione più facilmente, anche se nessuno ci vieta di sceglierne un altro. Nell’ambito di una rete Ethernet, che è geograficamente estesa, è possibile per ragioni di installazione, realizzazione, praticità, avere più punti diversi in cui riferirsi con potenziali di riferimento e visto che il riferimento di terra dovrebbe essere lo stesso in ogni punto è chiaro che posso avere più appoggi allo stesso riferimento. In realtà però ciò è vero solo teoricamente perché in pratica i potenziali di terra sono differenti a seconda della zona a cui ci si riferisce (ci potrebbe essere un apparato collegato ad un riferimento posto vicino ad un dispersore ed un altro no) e impiegando più agganci allo stesso potenziale in realtà mi sto agganciando a punti che sono a potenziale diverso e ciò genera una differenza di potenziale ed un 40 passaggio di corrente, generalmente continua o una corrente che sta alla frequenza industriale di 50Hz, nel cavo della rete. Scendendo un poco più nel dettaglio tale corrente diventa un problema perché va a polarizzare diversamente tutti i dispositivi elettronici, portandoli a lavorare a diverse condizioni di funzionamento (cioè non saranno più garantite quelle caratteristiche nominali e di conseguenza non avrò più quel preciso livello di segnale, quel guadagno, quella potenza e tutto ciò che era previsto a quel potenziale di riferimento) e quindi ad assumere un comportamento diverso da quello che dovrebbe essere in realtà. La verifica della presenza di corrente DC nella rete si può effettuare con un multimetro. Errori FCS Le frame che presentano una FCS non valida contengono un errore FCS, nella maggior parte dei casi l’header di queste frame sono leggibili e la stazione trasmittente può essere identificata da un analizzatore di protocollo che cattura e decodifica le frame. Gli errori FCS possono essere l’effetto di collisioni ma se l’analisi condotta da un analizzatore di protocollo non rileva una correlazione tra il numero di collisioni e il numero di errori FCS in un periodo di tempo le cause degli errori FCS possono essere: - NIC difettose; in tal caso si deve utilizzare un analizzatore di protocollo per misurare l’attività di una stazione sospetta, per esempio in frame/s, e il numero di errori FCS e se si riscontra una correlazione tra questi due fattori c’è una buona probabilità di aver trovato la causa del problema - connettori allentati o difettosi sulle NIC, ripetitori e hub; per individuare questo tipo di problema si devono controllare le connessioni su tutto il percorso trasmissivo - rumore e interferenza sulla rete prodotto da un riferimento di potenziale 41 difettoso o non presente; per controllare il livello di rumore sulla rete si può utilizzare un cable tester o un multimetro - energia elettromagnetica ambientale (causata per esempio da cercapersone, ascensori, telefoni mobili, etc..) che si disperde nei cavi Ethernet; tale segnale di disturbo si accoppia con il nostro segnale utile ottenendo un segnale risultante diverso da quello originario. Questo diventa un problema serio soprattutto se il segnale e il rumore esterno viaggiano alla stessa frequenza, in tal caso il segnale utile non si può più recuperare, invece qualora abbiano frequenze diverse, cioè siano spettralmente diversi e quindi localizzati in range di frequenza differenti, è possibile con un filtraggio recuperare la parte di interesse. Si può impiegare un multimetro per effettuare le misure di interferenza elettromagnetica - attenuazione del segnale trasmesso. Errori di allineamento Le frame Ethernet che non terminano con un ottetto di bit, ovvero il numero di bit in tale pacchetto non è un multiplo intero di 8, presentano un errore di allineamento. Le frame con errori di questo tipo possono essere l’effetto dell’occorrenza di collisioni altrimenti possibili cause sono: - NIC difettose che trasmettono qualche bit in più dopo l’FCS; la NIC difettosa può essere localizzata con un analizzatore di protocollo che cattura le frame con gli errori di allineamento e risale attraverso esse all’indirizzo sorgente - problemi elettrici nella rete. 42 Errori dovuti al rumore (noise errors) Gli errori di rumore sono causati da tensioni indotte nei cavi della rete da sorgenti esterne tali da far ritenere alle altre stazioni che il mezzo sia occupato dalla trasmissione di dati. Gli errori di rumore provocano un basso uso delle capacità della rete e calo delle prestazioni della stessa. Le cause degli errori di rumore sono: - riferimenti di potenziale difettosi - dispersione elettrica nel cablaggio. In entrambi i casi si possono fare delle verifiche utilizzando un multimetro. Errori di lunghezza L’errore di lunghezza si manifesta in un disaccordo tra il campo lunghezza della frame Ethernet e l’effettiva lunghezza del suo campo dati. 2.5 Problemi di cablaggio I problemi di cablaggio, come già evidenziato nel precedente capitolo, sono ancora molto comuni nelle reti Ethernet. Cause tipiche dell’occorrenza di tali problemi sono: - cavi difettosi o di bassa qualità. I problemi possono essere causati da una curvatura dei cavi o da una non conformità dei cavi alle specifiche - scorretta impedenza caratteristica dei cavi - cavi di lunghezza superiore a quella specificata per una data topologia - resistori di terminazione di un segmento di rete difettosi - dispersione elettrica 43 - interferenza elettromagnetica che può essere dovuta alla presenza di dispositivi quali fotocopiatrici, telefoni mobili, cercapersone oppure ad un riferimento di potenziale difettoso. 2.6 Network Interface Card Nelle reti Ethernet due tipi di Network Interface Card (NIC) sono usate: quelle con MAU (Medium Attachment Unit) integrato, in cui la NIC è connessa direttamente al mezzo di comunicazione tramite BNC, RJ-45 o connettori per fibre ottiche e quelle con MAU esterno, in cui il collegamento tra la NIC e il MAU avviene con un cavo AUI (Attachment Unit Interface) come mostra la seguente figura. Figura 2.3 La scheda di rete ha la funzione di collegare il nodo alla rete ed è formata da due interfacce: l’interfaccia verso il bus del calcolatore e l’interfaccia verso la linea (si veda figura 2.4). 44 Figura 2.4 L’interfaccia con il bus è responsabile della comunicazione con il nodo in cui è inserita la NIC, essa trasferisce dati e informazioni di controllo tra la CPU del nodo e la scheda di rete. L’interfaccia con il link è responsabile dell’implementazione del protocollo dello strato di collegamento effettuando operazioni come, per esempio, framing e deframing, ricerca dell’errore, accesso casuale, codifica Manchester, link management. Per scegliere una scheda di rete da inserire in un impianto, si deve conoscere: - il tipo di rete (ogni tipo di rete richiede un tipo preciso di NIC corrispondente); - il tipo di cavo necessario (ad esempio cavo twisted pair, cavo coassiale, cavo FDDI o altro); - il tipo di BUS presente nel computer dove deve essere inserita la scheda. Nell’installare una scheda di rete bisogna fare attenzione che essa lavori correttamente con altre periferiche collegate al computer. Ogni componente, infatti, può interagire con la CPU tramite un’opportuna linea di interrupt e per evitare malfunzionamenti e confusioni ogni componente deve avere la propria. Tale linea di interrupt da la possibilità alla scheda di rete di essere servita con una certa priorità dalla CPU. La CPU, infatti, al verificarsi dell’interrupt, e, sulla base della priorità ad esso associato, può interrompere le operazioni intraprese per avviare un opportuna routine (detta routine di risposta all’interrupt) grazie alla quale interagire con la scheda di rete per ricevere delle informazioni che possono essere, per esempio, 45 tutti i pacchetti da inviare allo strato applicativo. Se non ci fosse stata la linea di interrupt, invece, la scheda avrebbe dovuto aspettare e sarebbe stata servita solo dopo che la CPU avrebbe completato le operazioni già intraprese con altre periferiche. 2.7 MAU (Medium Attachment Unit) A livello fisico vengono definite tutte le componenti che intervengono nella trasmissione dei dati tra i dispositivi. Queste componenti servono a specificare: le caratteristiche elettriche e meccaniche di cavi e connettori, il significato dei contatti dei connettori, il livello del segnale elettrico utilizzato nella codifica di linea, la temporizzazione e la relativa durata del bit (bit time) e il transceiver. Come mostra la figura seguente: Figura 2.5 il modello IEEE 802 suddivide il livello fisico in quattro sottolivelli che sono Physical Layer Signalling (PLS), Attachment Unit Interface (AUI), Physical Medium Attachment (PMA) e Medium Dependent Interface (MDI). PMA e 46 MDI insieme formano il Medium Attachment Unit (MAU). Il Physical Layer Signalling (PLS) che si interfaccia con il sovrastante sottolivello MAC è il sottolivello che si occupa di segnalare al MAC stesso tutte le condizioni del mezzo fisico (per esempio mezzo occupato/libero, collisione avvenuta). Queste funzioni sono realizzate nel transceiver, conosciuto anche come MAU. Figura 2.6 L’Attachment Unit Interface (AUI) definisce le specifiche del cavo transceiver (cavo AUI o cavo drop) che è costituito da cinque coppie di conduttori schermati (con l’aggiunta di una schermatura globale) che hanno il seguente significato (vedi figura 2.6): 47 - “Data Out” per trasmettere i dati dalla stazione al MAU; - “Data In” per trasmettere i dati dal MAU alla stazione; - “Control In” per trasmettere (ordinari) segnali di controllo dal MAU alla stazione; - “Control Out” per la trasmissione di segnali opzionali di controllo tra il MAU e la stazione; - “Voltage” per fornire alimentazione al MAU (dalla stazione). Bisogna sottolineare che tali collegamenti sono sempre realizzati a coppia per poter prelevare una differenza di potenziale, infatti la segnalazione che si ottiene su ciascun collegamento viene vista come variazione rispetto ad un potenziale di riferimento. Nel nostro caso ci riferiamo alle quattro coppie destinate rispettivamente per la trasmissione, ricezione, rilevamento delle collisioni e alimentazione. Sono utilizzati in tal caso otto cavi in rame quattro dei quali costituiscono i collegamenti di riferimento per ogni coppia. Se, invece, avessimo impiegato quattro collegamenti in rame e un unico cavo comune da cui prelevare il livello di tensione di riferimento, avremmo rischiato di sovraccaricare tale collegamento. La segnalazione su ciascun collegamento è data dalla differenza di potenziale per determinare la quale c’è bisogno di una corrente e quest unico collegamento avrebbe potuto non sopportare tutta la corrente che viene generata quando tutti i collegamenti sono attivi. Un’alta corrente, inoltre, può creare un alto accoppiamento magnetico provocando interferenze condotte che si propagano lungo i cavi. Per tali ragioni conviene sempre avere più vie di fuga per la corrente in modo da non sovraccaricare la parte circuitale che gestisce i collegamenti. Il connettore terminale del cavo AUI è a 15 contatti di tipo "D". Il cavo AUI presenta un’impedenza di 78 ohm e la sua lunghezza è limitata a 50 metri. La tabella elenca il significato dei contatti del cavo AUI. La definizione dei collegamenti è diversa per i cavi Ethernet v2.0 e IEEE 802.3. 48 Assegnazione dei contatti e loro descrizione per i cavi IEEE 802.3 Contatto n. Ethernet v2.0 IEEE 802.3 1 Shield Control in shield 2 Collision presence + Control in A 3 Transmit + Data out A 4 Reserved Data in shield 5 Receive + Data in A 6 Power return Voltage common 7 Reserved Control out A 8 Reserved Control out shield 9 Collision presence - Control in B 10 Transmit - Data out B 11 Reserved Data out shield 12 Receive - Data in B 13 Power Voltage 14 Reserved Voltage shield 15 Reserved Control out B Connector shield - Protective ground L’AUI e il MAU sono entità sempre presenti ma non sempre visibili, dipende dallo standard MDI usato. Nel caso dello standard 10Base5, il transceiver è un dispositivo esterno alla scheda di rete della stazione (si veda figura 2.3). In questo caso la connessione al mezzo fisico è realizzata tramite cavo AUI e transceiver. Negli altri casi MAU e AUI sono integrati nella scheda di rete. 49 Il Signal Quality Error è un segnale inviato dal MAU alla scheda d’interfaccia quando segnali non standard come le collisioni sono ricevuti. Comunque non tutte le interfacce di rete usano i segnali SQE allo stesso modo. Le schede Ethernet 2.0, per esempio, lavorano in heartbeat mode richiedendo un segnale SQE dopo ogni operazione di lettura e scrittura. Tale modalità di funzionamento permette alla NIC di tenere sotto controllo l’integrità del circuito di collisione ed era indispensabile soprattutto quando i transceiver erano esterni alla scheda. Il Physical Medium Attachment rappresenta l’interfaccia funzionale con il mezzo fisico e definisce le operazioni eseguite dal transceiver. Le funzioni principali di un MAU sono: - trasmissione dei segnali elettrici sul mezzo fisico; in tal caso il MAU si occupa della trasmissione della stringa di bit ricevuti sui conduttori Data Out sul mezzo fisico - ricezione dei segnali elettrici dal mezzo fisico - funzione di rilevamento della collisione; in tal caso il MAU intercetta le collisioni che avvengono sul mezzo fisico e avvisa il sottolivello MAC dell’avvenuta collisione tramite i conduttori Control In. Inoltre, al termine di ogni trasmissione, sempre sui conduttori Control In viene trasmesso il segnale di Signal Quality Error (SQE) - funzione di jabber; è stata inclusa nello standard IEEE 802.3 allo scopo di prevenire la possibilità che una stazione occupi il mezzo fisico oltre un determinato periodo di tempo. Il meccanismo garantisce che il MAU non occupi il mezzo fisico per oltre 30 secondi consecutivi. Se viene superata la finestra temporale di trasmissione, l’inoltro dei dati sul mezzo fisico viene interrotto automaticamente dal MAU, e allo stesso tempo viene trasmesso un segnale SQE alla stazione relativa. 50 2.8 Problemi con schede Ethernet e MAU Il primo passo per localizzare una scheda d’interfaccia malfunzionante è di identificare i nodi sospetti sulla rete. A tal fine si possono utilizzare gli analizzatori di protocollo che forniscono informazioni relativamente ai nodi che trasmettono pacchetti difettosi utilizzando programmi di test automatici. Se gli indirizzi sorgente dei pacchetti difettosi non sono validi e non possono essere decodificati si ricorre al metodo di correlazione: si inizia con il mappare l’attività dei nodi sospetti e il numero dei pacchetti difettosi sul segmento, se c’è una correlazione probabilmente è stata trovata la NIC malfunzionante. Se anche questa strategia fallisce la sola alternativa è il metodo di segmentazione descritto prima. In ambito diagnostico, infatti, si parla di Fault Detection and Isolation intendendo con tali termini tutto ciò che serve per rilevare (Detection) la presenza di un malfunzionamento mediante dei sintomi e circoscrivere il problema (Isolation) una volta rilevato il sintomo per stabilire qual è l’elemento o l’apparato del sistema che produce degli effetti che poi si traducono in quei sintomi. Una volta isolati, i nodi sospetti sono sottoposti a test singolarmente. Schede di interfaccia con connettori AUI sono testati usando un adattatore installato tra il connettore AUI e il transceiver. L’adattatore di test indica lo stato dei segnali di linea, il signal quality error (SQE) e la potenza di alimentazione. Se i pacchetti inviati non attivano i corrispondenti LED sul test adapter allora la scheda d’interfaccia non è configurata correttamente o è difettosa. Il passo successivo allora è di controllare i parametri settati sulla scheda e gli hardware switch che per esempio, permettono di passare dalla modalità SQE a quella heartbeat. Se la configurazione della scheda è corretta, allora necessariamente il problema risiede nell’hardware, e bisognerà sostituire la scheda stessa. 51 Se il MAU è integrato nella scheda essa è testata collegandola in una minirete (emulazione) piuttosto che lasciandola nella rete di origine. Una minirete 10Base2 Ethernet consisterà in un connettore a T con due terminazioni di 50Ω, invece una minirete 10/100/1000BaseT consisterà in un computer con una NIC e un mini-hub. In tal caso per verificare se la scheda funziona correttamente si inviano loopback packet (pacchetti IP all’indirizzo 127.0.0.1 che vengono elaborati dal localhost). 2.9 Sintomi e Cause di Malfunzionamenti di Schede e MAU Sintomi caratteristici di schede Ethernet malfunzionanti sono: - Pacchetti con un campo FCS non valido - Alti tassi di collisione - Pacchetti jabber e late collision - Intermittenti problemi di connessioni in singoli nodi di rete. Le principali cause sono: - MAU non funzionanti correttamente - Blown fuse (fusibili distrutti) sulla scheda - Errori nell’operazione di configurazione della scheda. Sintomo: pacchetti con FCS non valido e riduzione dell’efficienza della rete Checksum non valide sono un effetto delle collisioni che in numero limitato sono una normale conseguenza dell’algoritmo CSMA/CD. Se gli errori sulle 52 FCS avvengono insieme con le collisioni e se il loro numero rientra in certi limiti non c’è ragione di preoccuparsi. Usando un analizzatore di protocollo si può misurare il numero di collisioni e il numero di errori FCS su un periodo di tempo, confrontando le curve risultanti si verifica se ci sono correlazioni. In assenza di corrispondenza tra numero di collisioni ed errori FCS allora la causa di questi ultimi può risiedere nelle NIC. Per determinare se una scheda malfunzionante è la sorgente di tali errori FCS bisogna generare statistiche di tutti i pacchetti difettosi originati da un nodo di rete (questo è un report standard prodotto automaticamente dalla maggior parte degli analizzatori di protocollo). Se così si individua una stazione sospetta, si può misurare la sua attività (in pacchetti al secondo per esempio) e metterla in relazione con il numero di errori FCS che avvengono sul segmento. Se i due numeri sembrano essere correlati allora molto probabilmente abbiamo trovato la causa del problema. Bisogna tener presente che molti problemi che riguardano la scheda di rete avvengono in maniera intermittente, per esempio solo dopo che la scheda ha raggiunto una certa temperatura, infatti, lo stato di polarizzazione di un circuito elettronico dipende fortemente dalla temperatura. Per tale motivo è necessario fare misurazioni su un lungo periodo di tempo. Sintomo: alti tassi di collisione e riduzione dell’efficienza della rete Alti tassi di collisione spesso sono causati da MAU difettosi. In tal caso infatti la funzione di carrier sense non opera e la stazione trasmette i pacchetti senza tener conto del traffico trasmesso da altre stazioni sul segmento. Anche in tal caso raccogliere statistiche (grazie ad analizzatori di protocollo) riguardo i nodi attivi e il numero di collisioni per poi confrontarle è utile per individuare i nodi 53 malfunzionanti. Sintomo: pacchetti jabber e late collision La causa di tali problemi spesso risiede in schede di rete o MAU che non funzionano correttamente. Per scoprire tali dispositivi malfunzionanti si possono usare analizzatori di protocollo per raccogliere statistiche sui nodi che inviano pacchetti difettosi per poi dedurre correlazioni tra il numero di collisioni e l’attività di un nodo. Se non si riescono ad individuare tali correlazioni si ricorre al metodo della segmentazione. Sintomo: problemi intermittenti di connessione dovuti a short o jabber packets Schede di rete difettose spesso sono la causa della generazione di frame troppo brevi (short packet) o troppo lunghe (jabber packet) che portano a problemi di connessione nel segmento. Tali pacchetti difettosi si possono catturare usando un protocol analyzer e si può così risalire alla scheda di interfaccia di rete malfunzionante attraverso l’indirizzo sorgente. Se tale indirizzo è corrotto si raccolgono statistiche per risalire a correlazioni o si effettua la segmentazione. Sintomo: perdita di connessione di un singolo nodo La perdita improvvisa (breakdown) di connessione di un singolo nodo di rete è spesso causata da: - Plug del MAU non è connesso bene (loose connector) - Errori nella configurazione della NIC 54 - Problemi di Signal Quality Error (modalità SQE o heartbeat) - Cablaggio IEEE 802.3 invece di Ethernet v2.0 - Scheda di rete difettosa: fusibili distrutti (blown fuse). Loose connector Problemi intermittenti spesso sono causati da loose connector. Testare i connettori non è sempre semplice, infatti, il cavo AUI potrebbe essere sotto il pavimento e quindi non accessibile e in tal caso non si possono testare le connessioni dei plug direttamente. Si ricorre allora a test di loopback. Bisogna tener presente che in reti 10Base2 o 10Base5 si devono controllare anche i resistori di terminazione poiché non è rarissimo che un MAU venga non correttamente connesso alla fine del cavo in luogo del resistore. Se invece si riescono a testare le connessioni dei plug ma il problema continua a persistere, allora, per localizzare il problema si deve disconnettere il MAU dalla rete e connetterlo ad una minirete. Se qui il test di loopback può essere fatto senza problemi allora il nodo, il cavo AUI e il MAU funzionano correttamente e il problema è sulla rete. Se il test di loopback fallisce allora bisogna continuare a testare per vedere se il malfunzionamento è nel MAU, nella scheda o nel cavo AUI. Errori nella configurazione della NIC Se la stazione non può trasmettere o ricevere pacchetti la prima cosa da controllare sono i parametri settati nella configurazione della NIC. Errori comunemente commessi sono: - sulla carta è attivata una porta sbagliata per esempio un connettore RJ-45 invece di un connettore AUI o viceversa; 55 - l’identificativo di interrupt (che serve alla NIC per comunicare con la CPU) è già in uso da qualche altro dispositivo del calcolatore. Inviando pacchetti di loopback si verifica se la scheda lavora e se i pacchetti vengono trasmessi e ricevuti. Si può inoltre sostituire il nodo con un sistema che si sa funzioni correttamente (notebook) per determinare se il problema è nel nodo o sulla rete a cui esso è connesso. Problemi di Signal Quality Error Il MAU può operare sia in modalità SQE (standard IEEE 802.3) che heartbeat (Ethernet v2.0). Allora se un MAU che opera in modalità heartbeat è connesso ad una scheda di rete conforme allo standard IEEE 802.3, quest’ultima interpreterà tutti i segnali SQE, inviati dal MAU per riscontrare ogni operazione di lettura e scrittura, come collisioni e di conseguenza interromperà la trasmissione. Per accorgersi di tale problema bisogna monitorare i LED sul MAU. Se le luci relative al segnale SQE si accendono ad ogni trasmissione si deve disattivare la modalità heartbeat nel MAU. Cablaggio IEEE 802.3 invece di Ethernet v2.0 Usare un cablaggio AUI conforme allo standard IEEE 802.3 insieme con schede di rete e MAU Ethernet 2.0 può creare problemi perché, come abbiamo visto, il pinning è diverso in particolare i pin 1 e 4 sono invertiti nei due standard. Secondo lo standard IEEE 802.3 il pin 4 è collegato al potenziale di riferimento (ground), mentre il pin 1 è assegnato al segnale in linea. Tali assegnazioni sono invertite in Ethernet v2.0. 56 Scheda di rete difettosa Se la NIC è connessa alla rete attraverso un MAU esterno si usa un cavo AUI di test per controllare l’interazione tra la scheda e il transceiver. Si può misurare la tensione che la scheda eroga al MAU tra il pin 13 e 6. Essa dovrebbe essere tra 11.28V e 15.75V. Alcune schede hanno delle protezioni (una sorta di fusibile) per prevenire danneggiamenti hardware dovuti a picchi di tensione. Se tali protezioni si sono fuse la NIC non alimenta più il MAU e il nodo non è più connesso alla rete. 2.10 Ripetitori e Hub I ripetitori sono usati per connettere diversi segmenti Ethernet consentendo in tal modo di superare le limitazioni imposte dallo standard relativamente alla massima estensione di un singolo segmento. Figura 2.7 Come mostra la figura, il ripetitore opera a livello fisico della pila protocollare OSI e ripete i segnali ricevuti da una porta a tutte le altre. I ripetitori multiporta presenti nelle topologie a stella come 10/100/1000BaseT sono detti Hub. 57 Figura 2.8 Le loro funzioni di base, comunque, sono identiche a quelle definite dallo standard IEEE 802.3 per i ripetitori e sono di seguito elencate. - Rigenerazione dell’ampiezza del segnale e rimozione del jitter di fase. - Immagazzinamento temporaneo delle frame per ritemporizzare i bit da trasmettere. A tal fine il ripetitore decodifica (da Manchester) le frame ricevute da una porta e le ricodifica (in Manchester) prima di ritrasmetterle a tutte le altre porte. - Carrier-Sense cioè, come previsto dal protocollo di Ethernet CSMA/CD, monitora il canale prima di trasmettere i segnali. - Reintroduzione dei bit persi nel preambolo. Ogni frame, aderente sia allo standard 802.3 che allo standard proprietario Ethernet, inizia con sette byte di preambolo, ognuno costituito da una sequenza di ‘10101010’ bit, necessari affinché il nodo ricevente si possa sincronizzare correttamente sullo stream dei dati, seguiti dal byte start of frame, ‘10101011’, che indica al ricevitore l’inizio della frame. Ma i chip odierni presenti nei dispositivi delle NIC hanno bisogno di circa 30 bit di tempo per sincronizzarsi e di conseguenza alcuni bit del preambolo saranno persi nell’attraversare un nodo. Per tale ragione ogni ripetitore aderente allo standard 802.3 dovrà anche svolgere il compito di rigenerare tali bit altrimenti il campo preambolo svanirebbe dopo l’attraversamento del secondo ripetitore. Al contrario i ripetitori aderenti allo standard proprietario Ethernet ignorano la parte persa e 58 iniziano a trasmettere dal primo bit utile quindi lo standard limita a due il numero massimo di ripetitori che possono essere attraversati da una trama; in tal modo si evita di compromettere i dati veri e propri della frame. - Estensione dei frammenti. Se durante una trasmissione di dati avviene una collisione si genereranno frammenti di frame di lunghezza inferiore a 96 bit (incluso il preambolo) che si propagheranno. Quando giungeranno all’hub, esso avrà il compito di estendere tali frame con una particolare sequenza di bit del tipo ‘1010..’, chiamati bit di jam, fino al raggiungimento di 96 bit. L’estensione di questi ultimi permette a tutte le stazioni presenti sulla rete di accorgersi dell’avvenuta collisione. - Propagazione delle collisioni. Se l’hub riceve una sequenza di jamming su una porta non generata da lui ma da altri nodi della rete o altri hub a lui collegati, la rigenera prima di ritrasmetterla su tutte le altre porte. - Collision Detection e generazione di jam bit. Quando un ripetitore si accorge di una collisione su una porta (grazie alla funzione di collision detection presente nel protocollo di accesso al mezzo CSMA/CD) trasmette un rumore aggiuntivo, chiamato appunto sequenza di jam, per permettere a tutte le stazioni presenti sulla rete di accorgersi dell’avvenuta collisione e evitare in questo modo ulteriori trasmissioni da parte di questi che porterebbero solo ad uno spreco in banda. Affinché la sequenza dei bit di jam possa essere rilevata da tutti, la lunghezza di tali frame deve essere scelta opportunamente. Lo standard 802.3 prevede per la sequenza di jam una lunghezza di 32 bit (per Ethernet varia da 32 a 48 bit) quindi aggiungendo i 64 bit di preambolo si arriva a far propagare sulla rete una sequenza di 96 bit che sicuramente sarà rilevata da tutti. - Automatic Partitioning. Il ripetitore può monitorare il numero di collisioni che osserva su una porta collegata ad un segmento. Se si raggiunge un alto tasso di collisione, 30 collisioni successive, i ripetitori disattivano tale porta. Quest’ultima sarà riattivata solo dopo che il ripetitore riceverà 500 bit liberi 59 da collisione. - Protezione dal jabber. In tal caso l’hub, come il MAU, disattiva una porta se da questa riceve un jabber, cioè una frame di lunghezza superiore a 1518 byte. - Monitoraggio dello stato del transceiver 10BaseT collegato ad ogni porta. Su tali interfacce, infatti, i transceiver inviano degli impulsi di test durante i periodi di assenza di traffico per verificare l’integrità del link detti idle pulse. Se su tali interfacce non arrivano ne idle pulse ne frame l’hub può allora disabilitare la porta sospettando che il cavo non funzioni correttamente. I ripetitori moderni sono modulari e capaci di connettere segmenti cablati con diversi mezzi di comunicazione (cavo coassiale, twisted pair e fibra ottica). I ripetitori, infine, non sono in grado di instradare le frame ad una specifica porta di uscita (come invece vedremo che ciò accade nei bridge e router) e di conseguenza tutti i segmenti connessi all’hub costituiranno un unico dominio di collisione come mostra la figura seguente. Figura 2.9 Formando un unico dominio di collisione si hanno limiti definiti dallo standard 60 riguardo al numero massimo di nodi, alla distanza massima tra due host e al numero di livelli consentiti. Inoltre i ripetitori, essendo apparati dello strato fisico, non possono rilevare errori come campo FCS non valido o dimensioni errate di una frame. 2.10.1 Problemi causati dall’impiego di hub In questo paragrafo verranno brevemente enunciati alcuni dei problemi che si potrebbero presentare nell’adoperare hub come mezzi di interconnessione tra segmenti di rete. Localizzazione del dominio di collisione Come abbiamo detto, una volta rilevata una collisione, l’hub inizia a trasmettere bit di jam a tutte le porte. Dal momento che, grazie a tale dispositivo, i domini di collisione dei vari segmenti ad esso connesso vengono unificati, una collisione che avviene in un segmento viene percepita da tutti gli altri segmenti come una collisione remota. Se effettuiamo delle misurazioni simultanee in tutti i segmenti collegati ad un hub e rileviamo una correlazione tra una remota collisione in un segmento e una locale collisione in un altro segmento allora la fonte della remota collisione è stata facilmente trovata. Questa strategia appena enunciata però può essere praticata solo nei cablaggi 10Base2 e 10Base5, che adottano una topologia a bus, mentre nei cablaggi 10/100/1000BaseT, che adottano una topologia a stella per cui ogni nodo è connesso con un proprio segmento all’hub, è necessario impiegare una diversa strategia. Si potrebbe pensare di correlare il carico di rete dovuto dai nodi più attivi con il tasso di collisione e se quest ultimo sembra essere correlato con l’inoltro delle frame da parte di uno di questi nodi allora 61 questa stazione potrebbe essere la causa delle collisioni. Phantom Addresses (Indirizzi Fantasma) Se si utilizza un analizzatore di protocollo, nel tentativo di localizzare il dominio di collisione, esso riporterà frame Ethernet con degli strani indirizzi di sorgente e destinazione (Phantom Address) del tipo 5555 5555. Pacchetti difettosi spesso contengono questi tipi di indirizzi che a prima vista sembrano indicare misteriosi errori di trasmissione ma se analizziamo la corrispondente rappresentazione binaria di 5555 5555 otteniamo 1010 1010 1010 1010 1010 1010 1010 1010 tali 32 bit non rappresentano altro che la sequenza di jam inviata dal ripetitore a tutti i segmenti connessi una volta rivelata la collisione. Si osservi che tali 32 bit preceduti dai 64 bit di preambolo danno luogo ai 96 bit al segnale di jam complessivo. 2.10.2 Problemi dei ripetitori e hub: Sintomi e Cause Sintomi tipici che segnalano problemi relativi ad hub sono per esempio degrado delle prestazioni della rete, perdite intermittenti di connessioni, alti tassi di collisioni e alcune cause sono descritte qui di seguito. 62 Perdita di pacchetti dovuta a Inter Frame Gap troppo breve Come mostra la figura, due frame consecutive vengono sempre distanziate di un intervallo di tempo minimo di 9.6µs detto Inter Frame Gap (IFG). Figura 2.10 Se una scheda di interfaccia di rete non mantiene tale spaziatura tra frame successive, i ripetitori più lenti non saranno in grado di inoltrarle velocemente ne potranno memorizzarle provocando così la perdita delle frame o una ritrasmissione non corretta; in alcuni casi le frame mutano in jabber. Solo i protocolli di livello più alto si accorgeranno di tali perdite e richiederanno la ritrasmissione e di conseguenza le prestazioni di alcune applicazioni ne risentiranno. Si potrebbe impiegare un analizzatore di protocollo per monitorare l’IFG e identificare così, tramite l’analisi dell’indirizzo di sorgente, la NIC difettosa. Anche i frammenti di pacchetti possono causare una riduzione dell’IFG poiché, come abbiamo visto, ogni hub estende tali frammenti fino al raggiungimento di 96 bit (incluso il preambolo). Se un frammento inferiore a 64 bit è ricevuto dall’hub esso aggiunge i 32 bit di jam e ciò comporta una riduzione del gap tra quest ultimo e la frame seguente di 32 bit di tempo (32µs). Questo può far divenire il gap molto breve. I moderni hub comunque utilizzando dei buffer sono in grado di mantenere un 63 IFG costante. Queste cause comporteranno delle perdite intermittenti di connessione che spesso sono riconoscibili solo a livello di applicazione. Applicazioni di tipo filetransfer, per esempio, risentono fortemente di ciò e possono essere significativamente più lente tra due stazioni che comunicano attraverso un hub piuttosto che tra due stazioni localizzate nello stesso segmento. Se tutti i pacchetti TCP prima del ripetitore presentano un corretto sequence number ma dopo l’hub si perdono i numeri di sequenza allora la causa risiede nell’hub. Le prestazioni del file-transfer sono degradate ovviamente poiché i pacchetti persi devono essere ritrasmessi. Differenti riferimenti di potenziale in reti 10Base2 e 10Base5 Alti tassi di collisione o addirittura un completo breakdown del funzionamento della rete spesso sono la conseguenza di problemi di differenti riferimenti di potenziale. Come abbiamo già illustrato in precedenza, in segmenti 10Base2 o 10Base5 è possibile avere diversi agganci al potenziale di terra in diversi punti della rete. Può accadere per molteplici motivi, quali la presenza di un dispersore in prossimità di un aggancio, che il potenziale di riferimento sia differente e ciò inevitabilmente genererà una corrente DC che circolerà nel cavo del segmento provocando interferenze e quindi collisioni e problemi di intermittenza di connessione. Tramite un cable tester si può monitorare il riferimento di potenziale nella rete e rilevare la corrente DC. Comunque è importante che per tali reti il riferimento di potenziale sia solo in un punto. 64 Problemi dovuti ad un eccessivo numero di ripetitori nel path di trasmissione Ogni hub presente nella rete introduce un ritardo sul tempo di trasmissione di una frame. La tabella riporta i limiti imposti dallo standard relativamente al ritardo di trasmissione introdotto sulle porte di un ripetitore Ethernet operante a 10Mbit/s che, ovviamente, non devono essere superati. In conseguenza di ciò, se una frame deve attraversare non solo lunghe distanze ma anche un gran numero di ripetitori, si può eccedere il massimo ritardo di trasmissione (25.6μs). Le collisioni allora si presentano nella forma di late collision provocando perdita di pacchetti di cui ci si accorgerà solo a livello superiore il che causa una riduzione delle performance della rete e perdite intermittenti di connessione. Per tali motivi è necessario limitare il numero di ripetitori a quattro o sostituire al posto degli hub bridge oppure cambiare la configurazione di rete. 65 Errori nell’installazione, configurazione e hardware Frequentemente i problemi con hub sono dovuti ad una sua installazione o configurazione non corretta, come: - porte configurate in modo non corretto (per esempio alcune porte vengono configurate in modo da operare a 10Mbit/s invece di 100Mbit/s) - perdite di connessione di un nodo collegato ad un hub (in questo caso ciò potrebbe essere dovuto a causa di connettori non agganciati bene o a seguito di un automatic partitioning da parte dell’hub) - interruzione del funzionamento dell’hub dopo poco tempo dalla sua installazione. Ciò potrebbe essere dovuto da molteplici cause come la temperatura dell’ambiente in cui tale apparato è stato inserito; infatti tra le specifiche di un hub sono riportati anche il range di valori per la temperatura dell’ambiente circostante che assicurano un corretto funzionamento dell’hub. Se tali valori sono stati rispettati è utile andare a verificare che le aperture che consentono la ventilazione e il riciclo dell’aria all’interno dell’hub non siano ostruite. Infine la causa è da ricercarsi in una perdita di potenza, potenza fluttuante o in una mancata potenza di alimentazione. Anche l’hardware può avere problemi ma tramite un: - monitoraggio sui connettori - monitoraggio sulla potenza di alimentazione - attivazione della funzione di self-test dell’hub possono essere facilmente localizzati. 66 2.10.3 Problemi con ripetitori ottici in reti Ethernet Tra le varie tecnologie Ethernet è stata anche implementata la 10BaseF, operante a 10Mbit/s, che introduce e regolamenta l’utilizzo della fibra ottica come mezzo trasmissivo per le LAN. In esso, a differenza della 10/100/1000BaseT, l’elemento centrale non è più un hub bensì uno splitter ottico. Esistono vari tipi di cablaggi in fibra per le reti LAN e tra questi lo standard 10BaseFP che utilizza stelle passive e lo standard 10BaseFB in cui sono presenti delle stelle attive. Il cablaggio 10BaseFP (FP: Fiber Passive) permette l’utilizzo della topologia a stella come mostra la seguente figura. Figura 2.11 Con la fibra ottica si possono realizzare solo collegamenti punto-punto quindi per poter connettere più di due stazioni si è fatto uso di stelle passive. Una stella passiva è basata sul concetto dello splitter ottico, ovvero un ripartitore di segnale luminoso in cui il segnale che giunge da una porta non viene rigenerato nelle altre porte ma suddiviso e ciò provoca un’ovvia perdita di gran parte del 67 segnale luminoso nella stella stessa. In tale topologia gli unici elementi attivi sono i transceiver ottici. Il cablaggio 10BaseFB (FB: Fiber Backbone) è mostrato in figura. Figura 2.12 In tal caso la fibra ottica è utilizzata in dorsali che collegano due ripetitori ottici (active optical star) che sono in grado di svolgere tutte le funzioni definite per i ripetitori IEEE 802.3 come: - rigenerazione del segnale - estensione dei frammenti - collision detection - generazione di jam bit. Qui, a differenza del cablaggio 10BaseFP, i transceiver ottici sono integrati nei ripetitori. Se la potenza ottica emessa da un ripetitore è di scarsa intensità si possono avere problemi di attenuazione che portano ad una diminuzione delle prestazioni della rete o all’occorrenza di numerosi short packet (runt). Bisogna allora monitorare e se necessario modificare il livello di potenza emesso da un ripetitore. 68 2.10.4 Problemi con ripetitori ottici non standard Spesso in luogo dei ripetitori ottici che implementano tutte le funzioni definite dallo standard IEEE 802.3 si utilizzano semplici convertitori elettro-ottici. Quando il numero di questi ultimi è elevato si possono presentare dei problemi i cui sintomi sono per esempio runt, IFG insufficiente o rumore, generato principalmente perché spesso tali convertitori non provvedono all’amplificazione dei segnali ne all’eliminazione del jitter. 2.11 Bridge I Bridge sono dispositivi di livello 2 (MAC) della pila OSI, identificati da un indirizzo MAC di 48 bit, che interconnettono segmenti LAN. Figura 2.13 In realtà ciascuna porta del bridge è identificata da un indirizzo MAC, le porte poi sono sequenzialmente numerate e l’indirizzo del bridge corrisponde a quello della porta 1. Un bridge opera in modalità “store and forward”, cioè 69 quando riceve una frame Ethernet la immagazzina prima di inoltrarla; ciò significa che i vari bit che viaggiano serialmente sul link fisico vengono poi per essere parallelizzati nel dispositivo fisico. Quindi a differenza degli hub che inoltrano semplicemente i bit del segnale, i bridge eseguono una conversione seriale-parallelo (all’arrivo della frame) e parallelo-seriale (alla ritrasmissione della frame). Queste operazioni introducono naturalmente un ritardo aggiuntivo detto di trasmissione (si ricordi che il ritardo di propagazione è quello legato al trasferimento fisico dell’informazione sul link, che richiede un certo tempo finito). Inoltre i bridge hanno una capacità di filtraggio, consistente nell’inoltrare la frame, se indirizzata ad una LAN diversa da quella di appartenenza della stazione trasmittente, solo all’interfaccia che la porterà a destinazione. Figura 2.14 Il bridge per operare in tale modalità si serve dell’indirizzo LAN presente nella frame e le informazioni contenute in tabelle di instradamento settate manualmente da un operatore o costruite con un processo di apprendimento proprio dei bridge, se la topologia della rete è ad albero, in cui i bridge ogni volta che ricevono una frame scrivono l’indirizzo LAN nella tabella solo se non è ancora presente, o con un algoritmo detto “spanning tree”, se la topologia 70 della rete è a maglia. In tal caso una topologia di una rete a maglia viene riconfigurata in una topologia ad albero, per evitare percorsi chiusi ,”loop”, la presenza di percorsi alternativi e la conseguente duplicazione dei pacchetti. Quindi a differenza dei ripetitori che operano a livello fisico ritrasmettendo semplicemente i bit di una frame a tutte le porte di uscita, i bridge, scartano i pacchetti difettosi eseguendo il controllo del campo FCS ed esercitando la suddetta funzionalità di “filtering”, mantengono i domini di collisione isolati, consentendo pertanto di: - evitare diffusione di traffico inutile in rete - superare i limiti di una particolare topologia di rete come il massimo numero di nodi, il ritardo di trasmissione, o i limiti sulla distanza. Si noti che i bridge garantiscono l’inoltro dei pacchetti nell’esatto ordine di arrivo e talvolta può essere installato su di essi un protocollo non standard di load-balancing che consente di distribuire il traffico di rete su diversi percorsi trasmissivi in parallelo. Infine bridge di versioni più recenti sono plug and play, cioè non richiedono interventi del servizio di assistenza della rete o dell’utente. In altre parole quando un amministratore installa un bridge non deve fare altro che collegare i segmenti LAN all’interfaccia del bridge, senza configurare le tabelle di instradamento nè all’inserimento né alla rimozione di un host da un segmento di rete. 2.11.1 Funzioni dei bridge Bridge filters I bridge possono essere configurati tramite operazioni manuali in modo che operino come filtri; i criteri su cui viene realizzato il filtraggio sono vari e 71 possono essere: indirizzo sorgente e di destinazione, il campo tipo presente nella frame (indicante il protocollo di livello superiore a cui sono destinati i dati). I bridge filters possono essere pertanto strumenti in grado di limitare il traffico di rete, ma il loro impiego è limitato in quanto essi sono dispositivi statici e per alcuni protocolli degli strati sovrastanti, come FTP o Telnet, che cambiano dinamicamente il numero di porta non fornirebbero un corretto filtraggio. Bridge di commutazione MAC L’ultima generazione di bridge presenta le funzioni tipiche dei bridge combinate con la funzione di commutazione tipica del livello MAC. Tali bridge sono capaci di prendere decisioni di inoltro e di instradare contemporaneamente diversi pacchetti, cioè operano in modo tale da instradare ciascuna frame direttamente al suo segmento di destinazione senza bloccare le altre stazioni sulla stessa rete. Tali apparati garantiscono un incremento considerevole della larghezza di banda. Bridge remoti Figura 2.15 Nel progetto OSI i bridge sono stati concepiti per interconnettere LAN su base 72 locale, mentre l'interconnessione su base geografica è demandata ai router, tuttavia, sono stati modificati per operare anche su scala geografica e sono nati i cosiddetti bridge remoti questi ultimi sono in grado di connettersi a locazioni remote mediante link WAN. I protocolli usati sui link WAN sono il PPP (Pointto-Point Protocol) o l’HDLC (High-Level Data Link Control Protocol). Si ricordi che un bridge può mettere in comunicazione reti LAN eterogenee (Ethernet, Token Ring, FDDI, ATM) operando una conversione delle frame. Figura 2.16 2.11.2 Diagnostica dei problemi dei bridge Per localizzare in una rete problemi connessi ai bridge è necessario implementare un attento processo di analisi dei segmenti LAN al fine di individuare una correlazione tra i sintomi (basse prestazioni di rete in alcuni segmenti, perdita permanente o intermittente di connessioni verso particolari stazioni, fallimento di servizi) e la causa stessa. In tale fase si utilizzano pertanto sistemi di monitoraggio basati sull’impiego di sonde capaci di effettuare le misurazioni nei diversi link, procedendo così via 73 via ad una circoscrizione del problema a componenti specifiche. In particolare se i sintomi possono essere relazionati a specifiche connessioni si può iniziare con il controllare tutti i bridge allocati sul corrispondente percorso trasmissivo. Il primo passo consiste, pertanto, nel preparare una lista di tutte le stazioni, connessioni, servizi e protocolli affetti dal problema e confrontare la misura dei parametri correnti prestazionali nei diversi nodi di rete (throughput, uso della capacità del CPU e del buffer di memorizzazione) con le statistiche effettuate nelle normali condizioni operative. Ad esempio per misurare i tempi di risposta delle connessioni attraverso i bridge in analisi si trasmettono dei loop-back packets (Ethernet configuration test packets, IP pings). Inoltre misure sui tempi di risposta a lungo termine (utili soprattutto nel caso di problemi intermittenti) possono essere effettuate utilizzando degli agent distribuiti nella rete. Infine è buona norma verificare se sono stati effettuati variazioni nella topologia della rete poco prima dell’insorgere degli errori. 2.11.3 Sintomi e cause dei problemi nei bridge Problemi di throughput La capacità di troughput dei bridge è generalmente misurata in frame a secondo, dove il valore nominale si riferisce alla lunghezza più breve della frame consentita dalla topologia di rete in questione. E’ pertanto necessario il confronto tra il throughput corrente e quello nominale per limitare i problemi nella rete, tale pratica è comunque realmente indispensabile solo nei bridge di vecchio modello, in quanto quelli più recenti hanno capacità così elevate da rendere sporadico il verificarsi di colli di bottiglia. 74 Tali situazioni d’allarme comportano il riempimento dei buffer e la conseguente perdita di frame integre che il bridge non riesce ad inoltrare a destinazione. Un’ulteriore causa di perdita dei pacchetti è dovuta allo scarto delle frame memorizzate nel buffer per un tempo superiore ad un limite stabilito dai bridge stessi all’inizio del funzionamento della rete (generalmente 4 s). Si noti che un limite di latenza troppo breve potrebbe causare gravi problemi nelle reti con traffico pesante. Problemi connessi ai Bridge Filter L’errata configurazione dei bridge con funzionalità di filtraggio, può provocare il blocco di interi flussi dati, ad esempio in reti che presentano più percorsi verso una stessa destinazione in cui è quindi possibile definire rotte di backup, queste ultime possono rimanere inutilizzate. In generale, e in misura diversa a seconda dell’architettura di rete, i bridge mostrano una significativa riduzione delle prestazioni quando un certo numero di filtri è attivo sulla rete. Pertanto, è consigliabile consultare i manuali di lavoro forniti dai produttori che stabiliscono in che modo i filtri possono influenzare l’attività dei bridge e quindi quale è il numero massimo di Bridge Filter ammissibile su una rete, cioè tale da non compromettere le prestazioni della rete stessa. Errori dovuti a pacchetti fuori sequenze Come precedentemente detto, i bridge inoltrano i pacchetti nello stesso ordine nel quale sono ricevuti, perciò se utilizza un protocollo di distribuzione del carico (Load balancing), per il quale i pacchetti di un singolo processo di comunicazione sono distribuiti sui vari link , la loro sequenza può variare 75 rispetto all’ordine in cui erano stati inviati e conseguentemente i bridge li inoltreranno a destinazione nell’ordine sbagliato. Pertanto solo quei protocolli (TCP) che tollerano cambiamenti nell’ordine di sequenza possono comunicare con successo attraverso i bridge operanti in tale modalità. Per tali ragioni le applicazioni UDP, lavorano correttamente solo all’interno di un segmento locale ma presentano problemi quando si lavora attraverso bridge e router infatti UDP richiede che i pacchetti siano nel giusto ordine sequenziale. E’ chiaro che in situazioni d’allarme si può decidere di disattivare la funzione di distribuzione del carico. Problemi legati alla tabella degli indirizzi I bridge stabiliscono un tempo massimo di registrazione delle informazioni contenute nelle tabelle di instradamento. Se si opera in modalità dinamica, scaduto tale tempo le entry sono eliminate con la conseguente interruzione delle relative comunicazioni. Spesso i bridge operano in modalità protetta cioè hanno una tabella degli indirizzi statica che viene settata manualmente, in tal caso gli indirizzi delle nuove stazioni non sono inserite automaticamente nella tabella che sono perciò incapaci di comunicare con i bridge. E’ chiaro che ciò causa interruzioni nelle comunicazioni con gravi ripercussioni su tutta la rete. L’unica soluzione a tali problemi è ancora una volta effettuare una costante politica di monitoraggio della tabella degli indirizzi. 76 Settaggio errato della modalità operativa e problemi di configurazione Spesso le porte dei bridge che operano in accordo alla versione Ethernet v2.0 invece che secondo il cablaggio IEEE 802.3, hanno problemi con schede di interfaccia di rete (NIC) meno recenti che non hanno la capacità di cambiare automaticamente la loro modalità operativa. Perdite di una o più connessioni al bridge sono dovuti ad una errata configurazione delle porte del dispositivo (predisposto ad esempio a lavorare in una rete Ethernet a 100 Mbit/s è installato invece in una a 10 Mbit/s), errori di connessioni (connettori allentati) e di installazione dei componenti. Problemi dovuti a differenti topologie di rete Le differenti velocità di trasmissione e i diversi meccanismi di accesso che caratterizzano differenti topologie di rete causano problemi nei bridge che le interconnettono. Per esempio se una lunga sequenza di frame viene trasmessa da una Token ring a 16 Mbit/s ad una rete LAN Ethernet a 10 Mbit/s il bridge non può inoltrare il traffico alla stessa velocità a cui gli arriva e dovrà memorizzare i pacchetti in un buffer che potrebbe andare in overflow. Un altro problema è legato alla diversa lunghezza massima del campo dati (1518 byte per 802.3, 4478 byte per FDDI, 17749 per Token ring); infatti poiché non è possibile violare tali dimensioni massime e poiché un bridge non implementa l’operazione di frammentazione tipica del livello 3 quando esso riceve una frame di dimensione superiore alla massima prevista per la LAN di destinazione la scarta. Pertanto, la lunghezza massima dei pacchetti, che possono essere trasmessi da un bridge e che può essere settata manualmente, deve essere fissata ad un valore abbastanza elevato per limitare ulteriori perdite 77 di pacchetti. Si consideri ora l’interconnessione tra una Token-ring e una LAN Ethernet , in tal caso un'altra fonte d’errore è dovuta all’assenza in Ethernet del campo Frame status in cui ci sono due bit (A e C) che forniscono un riscontro automatico per ogni frame. In questo caso, quando una frame arriva all’interfaccia della stazione di destinazione, questa attiva il bit A mentre la frame passa, e quello C se essa è anche copiata nel buffer (una stazione può fallire nel copiare una frame per varie ragioni quali la mancanza di spazio di memoria). In tal modo quando il mittente preleva il frame dall’anello capirà se la trasmissione è andata a buon fine. Per superare la mancanza di tale funzionalità in una rete Ethernet un bridge può essere configurato per default per settare i bit A e C a 1 (“pacchetto ricevuto” e “frame copiato”), ciò causerà notevoli problemi perché il trasmettitore crederà che il suo pacchetto sia stato processato con successo anche quando in realtà la stazione ricevente non era attiva e non ha ricevuto la frame in questione, o quando lo era ma la frame non è stata accettata. Dall’esempio fatto, si comprende che in questi casi il bridge diventa una vera e propria interfaccia tra 2 LAN diverse e di conseguenza quanto maggiori saranno le differenze tra le 2 parti, tanto maggiore sarà il lavoro del bridge e il tempo per far in modo che le cose procedano correttamente. Problemi Hardware E’ chiaro che ci possono essere problemi dovuti all’hardware del dispositivo, in tal caso per localizzarli bisogna controllare la potenza fornita e attivare le modalità di automonitoraggio dei bridge. 78 Problemi con Bridge remoti Come è stato precedentemente detto, spesso LAN a 10 o 100 Mbit/s sono distribuite geograficamente tra loro e connesse tramite bridge remoti a link WAN la cui velocità di trasmissione massima è pari a 2,048 Mbit/s. In questo caso è ovvio che solo una piccola porzione del traffico totale generato dalle LAN riesce a viaggiare su questi collegamenti, di più bassa qualità, che causano perdita di pacchetti, elevati BER e scadenza dei timeout. Questo problema può essere risolto facendo compressione dei dati e naturalmente con l’introduzione di collegamenti WAN aventi una più ampia larghezza di banda. Anche frequenti controlli sullo stato di utilizzo della capacità dei link mediante un analizzatore di protocollo sono utili per evitare seri problemi di comunicazione. 2.12 I router e lo strato di rete Lo strato di rete si occupa di trasportare pacchetti da una sorgente ad una destinazione, e di determinare pertanto, in base alla topologia della rete stessa, il tragitto appropriato che devono seguire i pacchetti. Per raggiungere la destinazione può essere necessario attraversare lungo il percorso diversi router intermedi. I router sono componenti inter-networking che connettono segmenti di rete. Un router, in inglese letteramente instradatore, è un dispositivo di livello 3 del modello OSI che si occupa di instradare pacchetti tra reti diverse ed eterogenee. 79 figura 2.17 Esso è costituito da: - porte di ingresso - porte di uscita - dispositivo di commutazione - processore di instradamento Alcune architetture dello strato di rete richiedono che i router lungo il percorso si scambino un handshake in modo da impostare lo stato prima che i dati inizino a fluire; tale processo definito impostazione della chiamata, è invece assente in Internet. I router così come i bridge sono commutatori store and forward, essi rigenerano solo i pacchetti corretti, modificando non il payload ma l’intestazione (es.decremento del campo Time to Live del pacchetto IP), e scartano i pacchetti danneggiati che dovranno essere ritrasmessi. Inoltre, anche i router sono in grado di mantenere domini di collisione isolati, ma differentemente dai bridge, non sono plug and play, il loro indirizzo e quello degli host ad essi collegati deve essere configurato, e utilizzano indirizzi dello strato di rete. L’indirizzamento di rete (spesso gerarchico) sebbene provochi un aumento dei tempi di elaborazione dei pacchetti, dovendo analizzarne i campi fino al livello 80 3 della pila ISO-OSI, evita il formarsi di percorsi ciclici attraverso i router. Infatti, i pacchetti non sono costretti a fluire attraverso lo spanning tree anche quando ci sono percorsi più diretti tra sorgente e destinazione. Il router resiste meglio alle tempeste broadcast, infatti se un host impazzisce e trasmette un flusso senza fine di frame broadcast, i bridge li inoltreranno causando il collasso della intera rete, tali indirizzi di livello MAC non passeranno viceversa attraverso i router. Pertanto, nel primo caso il traffico broadcast viene ricevuto da tutte le stazioni sulla rete, nel secondo caso sarà ricevuto solo dagli host che si trovano sullo stesso segmento di rete. Pertanto di interesse per il troubleshooting dei router sono solo i protocolli di livello 3, perché è a questo livello che avviene il trasporto. La maggior parte dei router oggigiorno sono Multi-protocol, capaci cioè di gestire contemporaneamente diversi stack protocollari. Esistono infatti diverse architetture di rete che differiscono per i servizi offerti dai vari livelli, per le modalità di indirizzamento, per le dimensioni massime dei pacchetti, e così via. Pertanto per connettere tra loro reti eterogenee è necessario superare tali difformità ed utilizzare quindi attrezzature particolari come i già menzionati router Multi-protocol. Sistemi moderni sono inoltre in grado di implementare contemporaneamente sia il routing che il bridging. I router possono essere normali computer che fanno girare un software apposito o - sempre più spesso - apparati specializzati, dedicati a questo solo scopo. I router di fascia più alta sono basati su architetture hardware specializzate per ottenere prestazioni wire speed, letteralmente alla velocità della linea. Questo significa che un router wire speed può inoltrare pacchetti alla massima velocità delle linee a cui è collegato, in tal caso sono i link stessi che provocano colli di bottiglia durante il trasferimento dei dati tra canali trasmessivi di diverse capacità, in tal caso sono necessari buffer più ampi in grado di non rendere vano il grosso sforzo di elaborazione dei router. Per garantire la massima affidabilità e lo sfruttamento ottimale dei 81 collegamenti in caso di reti complesse costituite da molte sottoreti diverse e variamente interconnesse, i router si scambiano periodicamente fra loro informazioni su come raggiungere le varie reti che collegano l'un l'altro. Esistono vari modi per classificare gli algoritmi di instradamento, un primo modo è funzione del fatto che essi siano globali o decentralizzati. Un algoritmo di instradamento globale calcola il percorso di minor costo fra una sorgente ed una destinazione usufruendo di conoscenze complete sulla rete, sulla connettività e sui costi dei link. Si noti che il costo di un link può riflettere varie metriche (il livello di congestione, la distanza fisica coperta dal link stesso). Viceversa, in un algoritmo di instradamento decentralizzato ciascun nodo ha inizialmente solo la conoscenza del costo dei link ad esso collegati e solo attraverso un processo iterativo di calcolo e scambio di informazioni con i nodi ad esso vicini calcola gradualmente il percorso di minor costo verso una destinazione o un gruppo di destinazioni. Un secondo modo per classificare gli algoritmi di instradamento è in base al fatto che siano statici o dinamici. I primi sono utilizzati per rotte che cambiano molto lentamente nel tempo, spesso conseguentemente ad interventi umani, e che hanno caratteristiche di trasmissione fissate (larghezza di banda, bit-error-rate), tali algoritmi sono usati in particolare, quando si vuole implementare una stringente politica di sicurezza. Gli algoritmi dinamici, invece, modificano il percorso di instradamento non appena varia il traffico in rete o la topologia, sono largamente diffusi nelle reti locali. Gli algoritmi dinamici maggiormente utilizzati oggigiorno nei protocolli di routing sono il decentralizzato distance vector (Bellmann-Ford) e lo shortest path first algorithm basato sullo stato globale dei link. L’algoritmo distance vector è distribuito perché l’instradamento ottimo non viene calcolato da un solo nodo, ma c’è una collaborazione fra tutti i nodi del sistema. Ciascun nodo infatti ha solo informazioni dei costi dei link verso uno o più vicini ai quali è direttamente collegato e riceve da questi informazioni sui rispettivi nodi ad essi adiacenti, dopodiché eseguito un calcolo ridistribuisce 82 i risultati ottenuti solo ai nodi vicini. Operando in tal modo, ciascun nodo costruisce una tabella indicizzata di instradamento contenente per tutte le destinazioni una registrazione, suddivisa in 2 parti: la linea di uscita prescelta per quella destinazione e il rispettivo costo. La tabella così ottenuta viene poi spedita periodicamente, ogni T secondi. In un algoritmo basato sullo stato del link, la topologia della rete e tutti i costi dei link sono noti a tutti i nodi, ciò si realizza mediante la trasmissione da parte di ciascun nodo dei costi dei link ad esso collegati a tutti i router della rete, che calcoleranno indipendentemente la propria tabella di instradamento. Si noti che in tale algoritmo la dimensione dei pacchetti inviati per aggiornare le tabelle di routing non dipende dalla dimensione della rete, in quanto ciascun nodo trasmette a tutti gli altri solo le informazioni riguardanti i nodi adiacenti. Pertanto un router potrà al massimo trasmettere un costo incoerente per uno dei link ad esso adiacente e non potrà mai notificare percorsi sbagliati verso tutte le destinazioni. 2.12.1 Instradamento gerarchico All’aumentare del numero dei router in una rete l’overhead dei calcoli, della memoria necessaria per immagazzinare le informazioni nonché del numero di trasmissioni delle tabelle di instradamento può diventare proibitivo. Questo problema può essere risolto mediante l’aggregazione di router in regioni o Autonomus System, all’interno delle quali è utilizzato lo stesso algoritmo di instradamento detto pertanto intra-system. Naturalmente è necessario collegare gli AS tra loro, ci saranno pertanto dei router gateway preposti alla comunicazione inter-sistema che utilizzeranno protocolli di instradamento inter-sistema come il BGP(Border Gateway Protocol). I protocolli maggiormente usati in Internet per la comunicazione intra-system il RIP(Routine Internet Protocol) e OSPF (Open Shortest Path First) e l’IGRP(Interior- 83 Gateway Routing Protocol). 2.12.2 Diagnostica dei problemi dei router Il troubleshooting dei problemi dei router inizia con l’analisi dei protocolli di instradamento utilizzati nei segmenti di rete in esame, a meno che gli errori non siano causati da problemi hardware o di installazione. Pertanto, il primo passo per avere una panoramica dello stato operativo della rete è utilizzare un analizzatore di protocollo per ottenere le statistiche delle prestazioni dei protocolli stessi. Ad esempio in una rete IP, questo potrebbe includere statistiche quali porzione del traffico IP rispetto al carico totale della rete, Pacchetti di routing, broadcast IP, messaggi ICMP. Inoltre potrebbe essere utile analizzare anche le statistiche operative di tutti i router attivi. Diversi comandi possono essere impiegati per recuperare dati quali: - uso della capacità di memorizzazione - numero di pacchetti trasmessi e ricevuti per protocollo - timeouts - frammentazioni - numero di connessioni Se i problemi riscontrati possono essere relazionati ad una particolare connessione si può iniziare con il controllare tutti i router presenti su quel path. In particolare per ciascun router sospetto è poi necessario controllare che siano corretti: - gli indirizzi presenti nelle tabelle di instradamento - le rotte scelte per raggiungere la rete di destinazione - i valori configurati per i vari timer - la configurazione del default gateway - le porte e le connessioni verso link WAN 84 2.12.3 Sintomi e le cause connesse ai problemi di routing Problemi Hardware e software L’insorgere di situazioni problematiche negli instradatori di livello tre del modello ISO-OSI può essere causato, come menzionato precedentemente, da problemi di natura hardware o software. Nel primo caso è consigliabile controllare i connettori, i livelli di potenza, e attivare funzioni di automonitoraggio nei router stessi, nel secondo caso per individuare tali problemi è necessario monitorare l’attività di routing e analizzare il contenuto dei protocolli di instradamento con il supporto di analizzatori di protocollo. Problemi di throughput La tendenza sempre più spiccata verso reti ad alta velocità, rende inevitabile il formarsi di ingorghi durante i picchi di traffico, nonostante allo stato dell’arte le attuali prestazioni dei router siano molto elevate. I dispositivi di interconnessione hanno infatti capacità limitate di gestione del traffico, questo vuol dire che quando viene inondato da una mole di traffico che è maggiore della sua capacità di gestione allora andrà in sovraccarico e comincerà a perdere pacchetti. In particolare se i produttori forniscono dettagliate caratteristiche operative dei router basati su test standardizzati, questi dati possono essere confrontati con i picchi di traffico che si sono verificati nella rete e attraverso questi confronti si può così stimare se è lecito che tali picchi attraverso il router causino l’insorgere di problemi di throughput. Inoltre il superamento della 85 capacità dei buffer nei router dovuto a traffico intenso lungo il percorso, può causare rallentamenti nella rete ed elevati tempi di risposta, pertanto l’analisi delle statistiche operative (numero di porte utilizzate, uso della capacità di memoria) può essere d’aiuto per rilevare tali problemi. Ad esempio la misura dei tempi di risposta di un router, attraverso pacchetti sonda (ping), può identificare il dispositivo stesso come causa della riduzione delle prestazioni della rete. In tal caso è necessario riconfigurare i dispositivi di rete riducendone il carico. Problemi connessi alla tabella degli indirizzi Molti problemi nei router sono connessi a tabelle degli indirizzi affette da errori o non aggiornate, a seguito di cambiamenti nella configurazione della rete. Spesso rilevare questi problemi può richiedere ore o addirittura giorni, ovvero il tempo necessario affinché il servizio affetto dal problema sia utilizzato. Infatti se i cambiamenti che avvengono nella rete non sono documentati, come spesso accade, rilevare una correlazione tra la comparsa di un disservizio (problemi in un database, un mancato accesso ad Internet) e una alterazione nella configurazione nella rete può essere estremamente problematico e oneroso in termini temporali. Problemi connessi alla mancanza di un Default Gateway Quando sono possibili dirette connessioni solo tra sottoreti direttamente collegate ai router, mentre quelle che avvengono attraverso router più distanti necessitano dell’instradamento dei pacchetti da parte di un Default Gateway, la sua mancanza o l’errata configurazione dell’indirizzo di default sul router interessato alla trasmissione, può provocare il fallimento di tali connessioni. Si 86 ricordi, infatti che un pacchetto non destinato ad una delle reti esplicitamente elencate nella tabella di instradamento (facente parte dell’authonomus System) è generalmente inviato su un’interfaccia di rete di default. Configurazioni errate dei Timer Una delle principali cause dei ritardi nella distribuzione delle informazioni di routing è un’errata configurazione sui router dei timer previsti nei protocolli di instradamento. Tale problema diviene particolarmente significativo quando si utilizzano in una stessa rete, router di diversi produttori, in tal caso per evitare l’insorgere di situazioni d’allarme è necessario attuare un attenta politica di controllo per poter intervenire in caso di necessità. Errori di configurazione e installazione Anche nei router, così come nei bridge e negli hub, gravi problemi possono essere causati da errori di configurazione da parte degli operatori (porte di accesso non attive, modalità operative errate) oppure errori di connessione (cavi o connettori con perdite). Ad esempio una errata configurazione di router, con funzioni di filtraggio degli ingressi può causare il blocco di intere rotte di backup,e di connessioni di un intero segmento di rete al resto della rete. Alcuni router infatti possiedono anche un firewall incorporato, poiché il punto di ingresso/uscita di una rete verso l'esterno è ovviamente il luogo migliore dove effettuare controlli sui pacchetti in transito. Inoltre durante la fase di installazione della rete è necessario verificare che il numero di router interconnessi non sia tale da provocare ritardi di trasmissione inaccettabili per la rete stessa, e la scadenza dei timeouts previsti dai protocolli di routing. 87 Problemi connessi alle WAN I router , come già detto precedentemente, sono utilizzati per interconnettere reti LAN su area geografica. figura 2.18 Pertanto, una fonte d’errore nell’interconnessione è costituita da problemi nei link di comunicazione delle reti WAN (insufficienza della larghezza di banda, lunghi tempi di ritardo, elevati BER, errate configurazioni dei protocolli utilizzati). Per evitare allora situazioni di stallo è consigliabile attuare una politica di controllo della capacità e del carico dei link, del BER e del tasso di frame con FCS invalide usando un analizzatore di protocollo. Configurazioni errate delle maschere di sottorete. Un router ha in generale molte interfacce, una per ciascuno dei link ad esso collegati, a ciascuna interfaccia è associato un indirizzo IP, di 32 bit. In generale ciascun indirizzo è costituito da una parte che identifica la rete e da una parte che identifica l’interfaccia dell’host o del router. Spesso le reti possono essere suddivise in sottoreti ed in tal caso il router deve 88 tener traccia solo degli indirizzi degli host appartenenti alla sua stessa sottorete e degli indirizzi delle varie sottoreti. Infatti all’arrivo di un pacchetto il router ne esamina l’indirizzo ed esegue un AND booleano con la maschera di sottorete della rete, determinando così l’interfaccia verso cui instradarlo. Pertanto è necessario un controllo sistematico delle maschere di sottorete per evitare gravi problemi di indirizzamento (un indirizzo di un singolo host può diventare un indirizzo broadcasts) ed il fallimento di connessioni. 89