1 Psicologia Cognitiva tratto dai libri consigliati dal Prof Pessa e la Prof.ssa Penna Il Comportamentismo Il “Comportamentismo” nasce nel 1913 negli Stati Uniti grazie all’opera di J.B. Watson; termini che sembrerebbero naturali in una scienza come la Psicologia, quali “mente”, “coscienza”, pensiero”, sono stati banditi dal linguaggio psicologico da parte dei comportamentismi, i quali hanno sostenuto che occorre utilizzare esclusivamente termini riferiti a fatti di osservazione. La Psicologia si riduce, in questo modo,unicamente allo studio del comportamento osservabile e le sue ipotesi consistono nel descrivere le possibili associazioni tra stimoli e risposte. Ne consegue che il ruolo mediatore dell’organismo e le cosiddette variabili che ne descrivono lo stato “interno” non possono essere assolutamente presi in considerazione, dato che riguardano entità non direttamente osservabili. Per quanto concerne il problema della conoscenza la posizione comportamentista si può riassumere dicendo che, secondo questa corrente, non si può in alcun modo parlarne, dal momento che la conoscenza non è un dato osservabile. In realtà tutto quello che si può fare è parlare egli effetti prodotti dalla conoscenza. L’insufficienza del paradigma stimolorisposta viene ben presto evidenziata, sia sul piano della Psicologia, che su quello della Filosofia della Scienza, già fin dagli anni Trenta. Nell’ambito della prima ricercatori come Tolman e Hull mettono in luce che il comportamentismo, anche a livello animale, può essere descritto solo ricorrendo a concetti che implicano qualche tipo di rappresentazione interna della conoscenza dell’organismo (le mappe cognitive introdotte da Tolman). Tolman ammette la possibilità che il comportamento sia guidato da finalità e predisposizioni, senza le quali non sarebbe possibili neanche la descrizione dei fenomeni più semplici, quali nel caso dei ratti la ricerca del cibo o le reazioni di evitamento. Esistono numerose teorie associazionistiche dell’apprendimento proposte dai Behavioristi, che si differenziano tra loro per diversi aspetti: livello di analisi, natura delle associazione. Per quanto riguarda il livello di analisi si distingue tra teorie: Macroscopiche: prendono in considerazione situazioni-stimolo e situazioni di risposta in modo globale; Microscopiche: suppongono che ogni situazione osservata sia a sua volta composta da elementi microscopici, di per se non facilmente osservabili, che costituiscono, però, i veri oggetti di cui si deve occupare la teoria. Per quanto riguarda la natura delle associazioni, bisogna distinguere: Associazioni dirette: ogni stimolo è associato a una o più risposte; Associazioni indirette: ogni stimolo è associato a uno o più costrutti intermedi, che a loro volta sono associati alle risposte. La teoria di Thorndike Questa teoria è anche nota con il nome di connessionismo, si tratta di una teoria macroscopica, di tipo diretto e basata sul rinforzo; Thorndike parla di una forza della connessione tra un dato stimolo e una data risposta, intesa come probabilità che, al presentarsi di questo stimolo, segua quella risposta. Secondo lui questa forza aumenta in presenza di un rinforzo provocato dall’effetto positivo della risposta emessa e diminuisce nel caso di un rinforzo negativo (legge dell’effetto). La teoria di Guthrie 2 È una teoria microscopica, di tipo diretto e basata sulla contiguità temporale; secondo Guthrie esistono solo due possibili casi di associazione tra un microstimolo e una microrisposta: o l’associazione è presente o è assente (legge del tutto o nulla). La teoria di Tolman Si tratta di una teoria macroscopica, di tipo indiretto basata sull’aspettativa; quest’ultima è intesa come associazione tra segni presenti nell’ambiente e significati che essi assumono per l’organismo. L’associazione segni-significati viene a dipendere dall’esperienza fatta dal soggetto; naturalmente l’introduzione del concetto di aspettativa (mappa cognitiva, si riferisce alla struttura dell’associazioni segnisignificati relativi all’organizzazione spaziale di un particolare ambiente). La teoria di Estes della campionatura dello stimolo (SST) La SST costituisce una formulazione matematica della teoria i Guthrie, ottenuta utilizzando i metodi del calcolo delle Probabilità, ma a differenza della teoria di Guthrie, la SST è in grado di prevedere la forma generale della curva di apprendimento. In particolare W. Estes ha cercato di costruire un modello che cercasse di spiegare come mai in certe circostanze l’apprendimento avviene bruscamente, con modalità del tipo “tutto o nulla”,, mentre in altre richiede un gran numero di ripetizioni o di esperienze precedenti. Nell’ambito della Filosofia della Scienza ci si rende conto ben presto che la pretesa di utilizzare termini del linguaggio teorico corrispondenti a fatti osservazione è una pura illusione. Infatti non è possibile aver una corrispondenza biunivoca tra termini teorici e dati di osservazione. Così il “Neo-comportamentismo” è costretto a introdurre dei costrutti ipotetici per spiegare l’esistenza di variabili intervenenti che modulano l’associazione tra stimoli e risposte. Così facendo il comportamentismo mette in evidenza i motivi stessi che ne hanno prodotto la crisi, sfociata negli anni ’60 con il Cognitivismo. In conclusione il comportamentismo non riesce a descrivere o a costruire modelli coerenti dei principali processi in cui interviene la conoscenza. Va inoltre ricordato che uno schema di associazioni stimolo-risposta non è in grado di spiegare sequenze comportamentali, sia pure di minima complessità. La Teoria dell’Informazione e Cibernetica La Teoria dell’Informazione nasce nel 1949 fondata da Shannon e Weaver, in seguito alla nascita della Cibernetica del 1944 ad opera di Norbert Wiener. La comparsa di queste nuove discipline è concomitante allo sviluppo del calcolatore elettronico digitale, inventato e realizzato nel 1944 da J. Von Neumann. Per quanto riguarda la Cibernetica, essa si presenta inizialmente come una teoria generale dei processi di retroazione, o di feedback, ovvero di quei processi in cui lo stato di uscita del sistema viene riportato in ingresso al sistema stesso per controllarne la performance. Un esempio è quello di un sistema guida automatico di un missile, che agisce sui motori in base alla differenza tra la direzione effettiva di volo e quella voluta. La Cibernetica, secondo Wiener, ha dunque una duplice valenza: lo studio dei suoi concetti fondamentali, da un lato, permette di comprendere il comportamento degli esseri viventi e dall’altro può essere alla base della progettazione di nuovi dispositivi artificiali “intelligenti”. Per quanto riguarda la Teoria dell’Informazione essa prende in esame la situazione standard in cui si verifica un processo di comunicazione, dove intervengono un emettitore di segnali, un canale di comunicazione e un ricevitore. 3 Il processo di emissione è un processo fisico, in cui viene liberata dell’energia, così come sono processi fisici la trasmissione del segnale lungo il canale, in cui si ha il passaggio dell’energia e la sua ricezione, in cui l’energia viene assorbita. Eppure secondo la Teoria dell’Informazione questa descrizione fisica non è sufficiente per descrivere ciò che effettivamente accade in un processo di comunicazione. È necessario introdurre un qualcosa, che si può denominare L’”aspettativa” del ricevitore relativamente ai possibili segnali che gli possono arrivare. Questa aspettativa viene rappresentata in modo formalizzato tramite uno schema di probabilità, tipico di ogni ricevitore, che gli consente di assegnare ad ognuno dei possibili messaggi una probabilità a priori che esso si presenti all’ingresso. Ad es. nel caso in cui i messaggi siano di due tipi, come la cifra 0 o la cifra 1, entrambi con uguali probabilità a priori, date dal 50%, l’informazione ricevuta quando si presenta effettivamente uno dei due messaggi vale esattamente 1. Nel linguaggio della Teoria dell’informazione si dice che in questo caso è stato ricevuto 1 bit di informazione. Come si vede in questo modo si viene ad introdurre, oltre ad una quantità di natura non fisica, come l’informazione anche un elemento soggettivo, quale il sistema di probabilità a priori del particolare ricevitore. Senza questo elemento soggettivo non si potrebbe addirittura parlare di informazione. Questa perdita di oggettività viene arginata ipotizzando che un gran numero di ricevitori possieda schemi di probabilità a priori identici almeno per certe classi di messaggi, si tende così ad identificare queste probabilità con la frequenza relativa con cui messaggi stessi compaiono. Due sono però i pericoli: 1. l’identificazione della frequenza con la probabilità è matematicamente corretta solo se si verificano 2. infiniti casi (circostanza impossibile); trascurare il significato,nella teoria di Shannon, il significato non viene preso in considerazione, in quanto l’interesse è incentrato su come minimizzare gli effetti di distorsione del segnale provocati dal rumore durante il processo di trasmissione; Il fatto di eliminare il significato dalla descrizione dei processi di comunicazione toglie alla Teoria dell’Informazione molto della capacità di descrivere processi effettivi in cui interviene la conoscenza, riducendola ad uno schema teorico utile, tutt’al più, per trattare processi di trasmissione di dati lungo una linea telefonica. Così Facendo, la teoria dell’informazione ha introdotto l’idea che sistemi naturali e sistemi artificiali possono essere studiati in modo unitario, utilizzando lo stesso linguaggio e per questo motivo ha dato un forte impulso allo sviluppo di programmi per il computer volti a simulare comportamenti umani o animali. Psicologia Cognitiva e intelligenza artificiale: il ceno-comportamentismo: Il termine ceno-comportamentismo è stato coniato nel 1968 da Berlyne per indicare quella fase del comportamentismo nella quale gli psicologi hanno rivolto la loro attenzione al ruolo dei processi interni dell’individuo, nell’intento apparente di chiarire il ruolo del sistema nervoso centrale in rapporto al comportamentismo. La Teoria di Hebb (“Assembramenti cellulari”) Hebb ha proposto una teoria detta degli “Assembramenti cellulari”, fondata su ipotesi di carattere neofisiologico, rivolta a spiegare i processi i mediazione, cioè quei processi nei quali l’individuo non risponde immediatamente allo stimolo, ma si comporta come se avesse a disposizione timoli e risposte “interni”, derivanti da strutture esistenti nel suo sistema nervoso.Processi di questo genere si hanno nei fenomeni attentivi e percettivi. Secondo Hebb nel sistema nervoso esisterebbero gruppi di neuroni interconnessi, i cosiddetti assembramenti cellulari” nei quali si verifica l’eccitazione simultanea di tutti i neuroni appartenenti ad un dato 4 gruppo in seguito all’eccitazione anche di uno solo dei suoi membri. Quando l’eccitazione di un neurone è seguita dall’eccitazione di un secondo neurone ad esso interconnesso, Hebb postula che l’efficacia sinaptica del collegamento trai due neuroni aumenti (Legge di Hebb). Secondo la teoria di Hebb non vi è distinzione concettuale tra memorizzazione e percezione. Quando arriva una stimolazione esterna essa attiva un particolare assembramento cellulare, che fornisce con il suo stato di attivazione, la rappresentazione interna dello stimolo stesso ed è disponibile per ulteriori elaborazioni. Il fatto che questi assembramenti possono eccitarsi reciprocamente anche in assenza di stimolazioni esterne consente ad Hebb di spiegare i vari processi di utilizzo e trasformazione della conoscenza, nonché il pensiero e le emozioni. In particolare la conoscenza viene identificata direttamente con la struttura delle connessioni sinaptiche tra i neuroni. Mentre l’acquisizione della conoscenza deriva dalla interazione tra le stimolazioni interne e la struttura interna delle connessioni. La cessione e l’utilizzo della conoscenza si verificano quando la struttura delle connessioni determina i pattern effettivi di attivazione dei vari assembramenti cellulari, in grado di dare origine a risposte sia esterne che interne. L’intelligenza artificiale: Questa disciplina ha origine dai tentativi di simulazione del comportamento umano tramite programmi per il computer. L’intelligenza Artificiale è definita come la scienza che si occupa della progettazione di macchine in grado di esibire comportamenti intelligenti. 1. Il test di Turing : il test di turino è stato elaborato da A.M. Turing per valutare le capacità di pensiero intelligente di un dispositivo artificiale, come un calcolatore. Secondo Turing si può considerare una macchina intelligente quando un essere umano, che osservi le risposte delle macchina stessa di fronte a domande che lui pone senza conoscere la natura della fonte di queste risposte, non è più in grado di decidere correttamente se le risposte medesime sono fornite da un uomo o da una macchina. Si tratta di una impostazione di carattere comportamentista. 1. Due diverse impostazioni: intelligenza artificiale “dura” e intelligenza artificiale “soft” La prima sostiene che la capacità di pensiero intelligente sia definibile interamente in termini algoritmici, ovvero di procedimenti di calcolo, e che quindi possa essere implementata, in linea di principio su una macchina con procedure molto diverse da quelle usate dagli esseri umani. La seconda sostiene che il pensiero intelligente è una capacità tipica degli esseri umani, in particolare ciò che conta non è ottenere comportamenti intelligenti con qualunque mezzo, ma cercare di riprodurre per quanto possibile, le caratteristiche effettive dei processi di pensiero umano compresi errori e mancato raggiungimento degli obbiettivi nella speranza di migliorare le prestazioni dei calcolatori esistenti. Il prodotto più interessante dell’intelligenza artificiale è costituito dai c.d. “Sistemi Aperti” in grado di emettere conclusioni, valutazioni e diagnosi a partire da una base di conoscenza immessa precedentemente. Essi si comportano come un esperto umano nel particola dominio cui si riferisce la conoscenza che essi hanno inserito. 1. L’unità T.O.T.E. Si tentò da parte di Miller, Galanter e Pribram di fondare direttamente la Psicologia con i concetti della Cibernetica: la c.d. unità T.O.T.E. (test-operate-test-exit) anziché una associazione stimolo-risposta, è una rappresentazione generale di un anello feedback nel quale, il risultato di un’azione effettuata da un soggetto viene confrontato, con gli obbiettivi che esso intende raggiungere e l’eventuale discrepanza tra i sue registrata nel confronto viene utilizzata come segnale di ingresso per determinare la nuova azione da eseguire per ridurre la discrepanza stessa. Il “Cognitivismo” Negli anni ’60 tutte queste teoria hanno delineato la nascita di una nuova corrente della Psicologia, che si contrappone al comportamentismo: il Cognitivismo: 5 Le principali caratteristiche sono: a) La psicologia deve focalizzare la sua attenzione sulle peculiarità dei processi di mediazione che l’organismo introduce tra stimolo e risposta; b) La conoscenza, ovvero l’informazione, può essere misurata in bit ed i processi di acquisizione, richiamo e utilizzo della conoscenza sono da considerarsi strutturalmente equivalenti ai metodi del computer. c) La conoscenza è rappresentata solo esclusivamente sotto forma di sequenze di simboli ed i processi di elaborazione cognitiva altro non sono se non programmi di calcolo, basati su opportuni algoritmi, che consentono di elaborare simboli, proprio come avviene nei programmi per computer. Psicologia cognitiva e Intelligenza artificiale debole tendono a coincidere in un’unica disciplina, fatto che ha notevoli risvolti sia sul piano concettuale che su quello applicativo. Ma una vera elaborazione dell’informazione presuppone un ricevitore in grado di cogliere il significato dei messaggi che riceve e questo è proprio quello che un computer,da solo, non è in grado di fare. L’analogia uomo-computer appare dunque rischiosa e fuorviante. L’approccio Connessionista Fin dagli anni ’70, si è messo in luce che esistono altre forme di rappresentazione della conoscenza, differenti da quella simbolica. Vi è da considerare che l’utilizzo di processi di elaborazione simbolica può anche presentare svantaggi. Infatti essi, generalmente richiedono una assoluta precisione nei dati da elaborare e nelle operazioni da eseguire. Modelli di elaborazione della conoscenza basati su processi di calcolo agenti su strutture simboliche darebbero inevitabilmente luogo alla previsione di errori catastrofici o di tempi di elaborazione eccessivamente lunghi rispetto a quelli realmente osservati. Il Connessionismo non si discosta di molto dal Cognitivismo tradizionale, da cui differisce unicamente per la forma di rappresentazione adottata per descrivere gli stati mentali: pattern di attività di reti neurali anziché sequenze simboliche. Da qui la necessità di una nuova impostazione nell’ambito della Psicologia dei processi Cognitivi, il “connessionismo”: L’impostazione connessionista descrive l’azione mediatrice dell’organismo come equivalente a quella esercitata da una opportuna rete i unità in grado di attivarsi, tra loro interconnesse tramite collegamenti che consentono lo scambio reciproco di segnali. Queste reti sono chiamate “Reti Neurali” (la cui nascita ufficiale risale al 1943 ad opera di W.J.McCulloch e W.Pitts) Si tratta i un punto di vista che privilegia un’impostazione procedurale della conoscenza e dei processi in cui essa è implementata. Il grosso vantaggio delle reti neurali è quello di costituire dei sistemi la cui evoluzione è in certa misura indipendente dagli errori o dalle incompletezze dei pattern di ingresso. In secondo luogo, esse eliminano il problema della localizzazione dell’informazione dato che essa è contenuta nella struttura stessa delle interconnessioni tra le unità di una rete. Il connessionismo identifica la conoscenza con la strutture delle interconnessioni di una rete e la misura tramite i valori numerici attribuiti alla forza di ciascuna di esse. L’acquisizione della conoscenza va identificata con i processi di modifica di queste forze, chiamati anche processi di apprendimento. L’utilizzo della conoscenza coincide con i processi che danno origine a pattern di uscita in seguito alla presentazione di pattern di ingresso, e questo coincide con l’esecuzione effettiva di procedure. 6 Le reti neurali si sono dimostrate di notevole utilità nel fornire modelli di processi di riconoscimento e categorizzazione di stimoli, nonché di fornire modelli di memorie associative, cioè memorie il cui contenuto può essere richiamato in base alla somiglianza con un opportuno pattern si richiamo. Il Perceptrone (Reti Neurali) Il perceptrone è stato progettato Rosenblatt nel 1958. Esso è costituito da due strati di unità, uno di ingresso e l’altro di uscita, collegati da opportune connessioni che vanno solo nella direzione dall’ingresso verso l’uscita. Nella fase di addestramento vengono presentati alla rete opportuni pattern che attivano dapprima le unità di ingresso e questa attività attivazione si propaga poi, attraverso le connessioni, alle unità di uscita, in modo che ogni pattern provoca una particolare risposta da parte della rete. Quest’ultima viene confrontata con la risposta corretta che la rete avrebbe dovuto fornire in seguito alla presentazione di quel pattern e la differenza tra le due innesca un processo di modifica dei pesi delle connessioni. Viene poi presentato in ingresso un nuovo pattern e la procedura si ripete, L’apprendimento ha termine quando, su ognuno dei pattern di addestramento, la differenza tra uscita effettiva e uscita desiderata scende al di sotto di un valore prefissato dallo sperimentatore. Questa rete non è in grado di apprendere tutti i tipi di classificazione. Il Perceptrone Multistrato Molto più potenti sono le reti multistrato, in cui viene inserito, tra ingresso e uscita, almeno uno strato di unità intermedie, le cosiddette unità nascoste. Nel 1985 Rumelhart, Hinton e William, hanno trovato un algoritmo di modifica dei pesi per queste reti che consente di risolvere ogni problema di classificazione. Esso è noto come algoritmo “Error Back-Propagation” e oggi ne esistono numerose varianti, costruite allo scopo di rendere più efficiente e rapido il processo di apprendimento. L’ingresso della conoscenza: la percezione Con questo termine si indica una serie di processi che intervengono sui pattern di stimolazione e producono come risultato qualche forma di cambiamento della stato “interno” del sistema percepente. La percezione non è una copia della realtà ma una sua ricostruzione; la percezione è un atto di ricostruzione operato dal soggetto. Ci sono diverse teorie a proposito, che si possono suddividere a seconda di due diverse caratteristiche: 1) 2) Il ruolo che esse attribuiscono alle caratteristiche dello stimolo fornito da un ambiente esterno; La scomponibilità dei processi percettivi in stadi separati; Riguardo alla prima caratteristica dello stimolo, distingueremo tra: Teorie basate sullo stimolo (che ipotizzano che il risultato del processo percettivo dipenda unicamente dalle caratteristiche dello stimolo esterno; Teorie basate sui fattori interni o costruttiviste, introdotte da Rock, che assegnano ai fattori interni il ruolo fondamentale nel determinare il risultato della costruzione percettiva; Riguardo la seconda caratteristica a stadi, distingueremo tra: Teorie a stadi, nelle quali l’elaborazione percettiva è suddivisa in più stadi, ognuno successivo all’altro; 7 Teorie olistiche, in cui la percezione, per così dire, avviene in un unico atto. Teorie a Stadi Teorie basate sullo stimolo Teoria di Marr e Poggio Teorie basate sui fattori esterni Teoria di Rock Pandemonium Teoria dell’informazione strutturale Teoria di Gibson Modelli connessionistici Teoria della Gestalt Teorie olistiche Teoria del confronto di Sagoma I registri sensoriali Il ruolo di e registri sensoriali è stato evidenziato per prima volto da G. Sperling (con l’esperimento della matrice) nel 1960. In questo contesto il registro sensoriale viene chiamato memoria iconica, nel caso di percezione visive, e memoria ecoica quando ci si occupa di percezione acustica. Le caratteristiche dei registri sensoriali sono: a) Breve ritenzione dell’informazione; b) Natura preattentiva e automatica; c) Specificità nei confronti del tipo di analizzatore sensoriale. Nel 1980 Coltheart ha ipotizzato che la memoria iconica sia formata da due componenti principali: La persistenza visiva: riguarda ciò che effettivamente continua ad essere visto anche dopo che lo stimolo è scomparso; La persistenza informazionale: richiede un più alto livello di elaborazione e, pur non riguardando qualcosa che effettivamente viene visto, conserva l’informazione relativa alla posizione spaziale ed alla struttura degli elementi del pattern di stimolazione. Successivamente altri ricercatori, in particolare Irwin e Yeomans nel 1986, hanno introdotto una ulteriore suddivisione della persistenza informazionale in due componenti: Una rappresentazione analogica visiva: contiene le informazioni di tipo spaziale relative agli elementi dello stimolo; Un codice di identità non visivo: codifica la categoria cui appartengono gli elementi stessi. Infatti la persistenza visiva diminuisce all’aumentare della durata dello stimolo che della sua intensità; al contrario, la durata della rappresentazione analogica visiva non sembra influenzata dalla durata e dall’intensità dello stimolo. La visione tridimensionale 8 Il problema di come avviene la visione tridimensionale è fondamentale per la comprensione della vera natura dei processi percettivi. Da un punto di vista strettamente fisico la percezione della tridimensionalità non può derivare altro che da una costruzione effettuata dal soggetto, dal momento che le immagini formate sulla retina, in seguito alle stimolazioni luminose ricevute, sono tutte bidimensionali. Teoria di Marr e Poggio (teoria basta su principi di carattere locale) Una delle teorie più interessanti a proposito è quella formulata da Marr e Poggio verso la fine degli anni ’70, che ammette l’esistenza di due rappresentazioni primitive del contenuto dell’immagine retinica, una per ciascun occhio, derivanti da un’analisi preliminare nella quale vengono individuati i contorni dei pattern e i posti in cui hanno termine linee e spigoli. Su queste due rappresentazioni, che Marr e Poggio chiamano primal sketchs agisce un opportuno modulo, che si occupa delle possibili reciproche corrispondenze, in modo da ottenere, informazioni adatte a fornire indici di profondità Questo modulo chiamato da Marr e Poggio sketchs 2½-dimensionale opera in modo da soddisfare a due vincoli ben precisi, consistenti nel richiedere che ogni elemento di ciascuno dei due primal sketchs corrisponda ad un singolo elemento del pattern tridimensionale che si intende costruire e che i contorni non possano presentare forte discontinuità nel senso della profondità. La Psicologia della Gestalt Per quanto riguarda le teorie basate su principi di carattere globale, la Psicologia della Gestalt ha suggerito un certo numero di principi di carattere generale potenzialmente in grado di spiegare la fenomenologia relativa alla percezione tridimensionale. Essi come fa notare Koffka si riducono tutti a postulare che noi percepiamo un particolare tipo di rappresentazione dei pattern di stimolazione in quanto essa è la più semplice tra le interpretazioni possibili. Tale affermazione nota come Principio di semplicità o principio del minimo acquista un reale potere esplicativo e predittivo solo se si precisa adeguatamente che cosa si intende per “semplicità” di una interpretazione. Nel 1953 Hochberg e McAlister hanno tentato di definire la semplicità in termine di numero di segmenti e di angoli differenti richiesti da una particolare interpretazione. Così supponendo di avere un pattern come questo raffigurato, la sua interpretazione in termini tridimensionali verrebbe preferita a quella bidimensionale in quanto più semplice in termini di numero totale di segmenti e di angoli differenti tra loro. Le teorie basate su principi di minimo globale, hanno incontrato gravi difficoltà nello spiegare gli effetti che si verificano nella percezione delle cosiddette “Figure Impossibili”, ovvero quelle figure la cui interpretazione tridimensionale è in contrasto con le leggi di fisica e della geometria. 9 Per questo motivo ricercatori come Simon, nel 1967 e Attneave nel 1982 hanno proposto di utilizzare il principio di minimo locale che consentono di interpretare ogni particolare regione del pattern di stimolazione nel modo più semplice in relazione alle interpretazioni date dalle regioni che con essa confinano. Riconoscimento di configurazioni e di oggetti Le teorie relative al riconoscimento hanno una grande importanza non solo nella Psicologia, ma anche nell’ambito dell’Intelligenza Artificiale, dove costituiscono la base per la progettazione di dispositivi di riconoscimento automatico, utilizzabili in un gran numero di situazioni. Si possono classificare in due tipi di teorie: a) Teorie a Stadi: nelle quali il processo di riconoscimento è visto come una sequenza di fasi successive di analisi e sintesi del materiale di stimolazione; b) Teorie di campo: che vedono il processo di riconoscimento come costituito da una singola fase, nella quale l’oggetto e l’ambiente in cui appare immerso vengono considerati come un’unica entità globale (Teoria della Gestalt); Il Pandemonium (Selfridge e Neisser) Esso può essere rappresentato tramite una rete multistrato come una struttura gerarchica e connessioni tra vari strati unicamente di tipo feedforward cioè dirette dall’ingresso verso l’uscita. Ogni strato contiene un certo numero di unità, convenzionalmente chiamati demoni, ciascuna delle quali è deputata alla rilevazione di particolari caratteristiche degli ingressi che essa riceve. Stimolo esterno demoni dello stimolo demoni dei tratti demoni cognitivi demoni della decisione USCITA ovvero DECISIONE > Demoni dello stimolo: sono semplicemente rilevatori di stimolazione che si limitano a trattenere per breve tempo un registrazione del segnale eventualmente ricevuto dall’esterno; > Demoni dei tratti: sono specializzati ognuno nella rilevazione della presenza di una particolare caratteristica nel pattern di stimolazione trasmesso dai demoni dello stimolo. La rilevazione da parte di un demone di una caratteristica provoca l’attivazione del demone stesso, che nel linguaggio di Naisser “grida” la rilevazione della caratteristica; > Demoni cognitivi: sono progettati in modo che ognuno di essi è deputato a rilevare la presenza di una particolare configurazione di caratteristiche è quando è presente la “grida”; > Demone decisionale: ascolta le grida dei demoni cognitivi e in base alla loro intensità decide come catalogare il pattern di stimolazione presente in ingresso; L’esempio che Neisser e Selfridge preferiscono per illustrare il funzionamento del Pandemonium è quello del riconoscimento delle lettere dell’alfabeto. 10 Sul piano neurofisiologico, le ricerche di Hubel e Wiesel (1952, 1968), hanno mostrato che esiste un gran numero di cellule celebrale (neuroni) ognuna delle quali risponde a caratteristiche differenti dello stimolo. Esistono in particolare: > Cellule semplici: in grado di rilevare contorni su scala locale, altre configurazioni di cellule semplici sono in grado di rilevare fessure o linee; > Cellule complesse: in grado di riconoscere linee di un dato orientamento ed una data larghezza indipendentemente dalla posizione che esse occupano nel campo visivo; > Cellule ipercomplesse: che rispondono solo a configurazioni di tipo particolare, caratterizzate dalla presenza contemporanea di più caratteristiche; Tale organizzazione sembra far supporre che esistano nella corteccia cerebrale altre cellule paragonabili direttamente ai demoni cognitivi. Disgraziatamente, questa ipotesi si è rivelata infondata: gli studi sperimentali hanno mostrato che non ci sono cellule disposte gerarchicamente a livello superiore rispetto a quelle ipercomplesse. La teoria del confronto di sagoma Tra le teorie a stadi la più semplice formulata in proposito è quella del confronto di sagoma (template matching). Esso si ispira alle idee dei Gestaltisti e presuppone che nel cervello esistano delle sagome precostituite (corrispondenti, per esempio, all’attivazione di particolari gruppi di neuroni), con le quale viene confrontato il pattern di ingresso. Se questo confronto da esito positivo, allora il pattern di ingresso viene riconosciuto come identico alla sagoma e, di conseguenza, collocato in una certa classe. La teoria del confronto di sagoma venne presto abbandonato, in quanto non realistica: il numero di sagome corrispondenti alle differenti prestazioni, orientazioni, vedute anche di un singolo oggetto è talmente grande che nessuna memoria potrebbe contenere tutte le sagome necessarie per riconoscere le immagini che si incontrano continuamente nella vita quotidiana. Inoltre, i tempi di riconoscimento con questo metodo, sarebbero talmente lunghi che nessun essere vivente sarebbe in grado di utilizzarlo per interagire efficacemente con l’ambiente circostante. La teoria del riconoscimento basato sulle componenti: (Biederman) Secondo Biederman il riconoscimento degli oggetti e delle scene visive è basato su schemi percettivi costituiti da combinazioni di un numero relativamente piccolo di costituenti elementari, chiamati geoni (Biederman ne identifica 36). Ogni geone è costituito da una forma tridimensionale, che generalizza i coni ed è caratterizzata dal fatto che i suoi spigoli siano diritti oppure curvi, dal fatto che si espanda o resti costante, dal fatto che sia simmetrica oppure no, dal fatto che possiede un asse curvo oppure diritto e così via. I geoni costituiscono una specie di “vocabolario” fondamentale per scomporre e ricostruire qualsiasi pattern visivo. Secondo Biederman, quindi, il processo di riconoscimento degli oggetti è basato su una sequenza di stadi di elaborazione, che può essere sintetizzata così: 11 1. estrazione dei contorni degli oggetti osservati; 2. identificazione delle principali caratteristiche strutturali di questi contorni; 3. attivazione degli schemi basati sui geoni e individuazione delle loro relazioni reciproche; 4. attivazione dei modelli degli oggetti osservati; 5. identificazione degli oggetti medesimi. La teoria di Biederman postula essenzialmente processi di elaborazione del tipo bottom-up. La teoria di Gibson della percezione Al contrario delle precedenti teoria a stadi, Gibson è un sostenitore della teoria diretta della percezione. Nella Teoria della Percezione di Gibson, l’osservatore e l’ambiente esterno vengono visti come costituenti un unico sistema e la percezione non è un affare privato del soggetto ma un aspetto di un processo di interazione che coinvolge sia l’organismo che il mondo circostante. Il punto chiave dell’impostazione di Gibson sta nel negare che la percezione sia un processo mentale e nel vederla come un prodotto dell’interazione organismo-ambiente, anzi una attività che deriva dalla cooperazione di entrambe queste entità, ma che non è riconducibile né ad un processo puramente fisico né a un processo puramente mentale; è, come dice Gibson, un’attività “psicosomatica” di un essere vivente immerso nell’ambiente. A questo proposito Gibson distingue tra la percezione della persistenza, che consiste nel fatto di percepire che un dato oggetto continua ad esistere, ad essere presente nell’ambiente esterno, e la persistenza del percetto, che è dato dalla circostanza per cui si continua a percepire un oggetto anche dopo che è cessato l’arrivo di energia luminosa proveniente da esso. Il legame tra percezione e movimento, tra percezione e azione è enfatizzato da Gibson tramite il concetto di “affordance”. Questo termine indica ciò che gli oggetti presenti offrono ai fini di un’azione, ovvero l’utilità funzionale di un oggetto per un essere vivente dotato di certe capacità di agire. L’affordance di un oggetto è il significato stesso dell’oggetto per un particolare osservatore appartenente ad una particolare specie vivente. Gran parte delle ricerche di Gibson è stata dedicata all’applicazione di questi concetti al problema della percezione dell’aspetto tridimensionale di oggetti e scene. A questo scopo, Gibson fu il primo ad introdurre il concetto di “tessitura” di una superficie e ha identificato nel gradiente di tessitura, cioè nella variazione spaziale degli elementi che compongono una tessitura e delle loro distanze reciproche, il fattore principale responsabile della nostra percezione della tridimensionalità. Secondo Gibson, tutta l’informazione di cui abbiamo bisogno per percepire l’aspetto tridimensionale del mondo è già contenuto nell’immagine retinica. Il sistema percettivo, dunque, analizza una scena visiva unicamente in termini di superficie e di oggetti, anziché in termini di unità elementari, come pixel, contorni, geoni….etc. 12 A proposito della percezione delle tessiture è da ricordare la teoria dei textons di Julesz secondo la quale la discriminazione tra tessiture differenti è basata su misure effettuate sull’insieme dei textons. In particolare egli ha proposto il modello di elaborazione basato sulla densità, secondo il quale i meccanismi preattentivi conterebbero il numero dei textons di un certo tipo in opportune aree campione delle varie tessiture e ricaverebbero così il valore della densità di textons. Ma secondo una critica di Taylor e Badcock che hanno osservato molte situazioni sperimentali i soggetti non appaiono tanto misurare le differenze di densità dei textons, ma rilevano semplicemente la presenza o l’assenza di textons di un certo tipo. La Psicologia della Gestalt Il lavoro degli psicologi della Gestalt ha condotto a importanti risultati nell’ambito dell’individuazione delle leggi che presiedono alla percezione delle forme dei pattern visivi e che costituiscono vincoli imprescindibili per qualunque teoria del campo percettivo. Tra le più importanti, proposte da Wertheimer si riportano: 1) La legge della vicinanza: maggiore è la vicinanza tra i singoli elementi che compaiono in un campo percettivo, tanto più vengono percepiti come configurazione globale forma; 2) Legge della Somiglianza: maggiore è la somiglianza tra gli elementi, tanto più vengono percepiti come un’unica forma; 3) Legge della continuità della direzione: due elementi di cui il secondo costituisce la normale continuazione del primo lungo una data direzione vengono percepiti come un’unica forma; 4) Legge della chiusura: contorni non completamente chiusi tendo ad essere visti come chiusi; 5) 6) Legge della Pregnanza: questa legge coincide con il “principio del minimo”; Legge dell’Esperienza Passata: elementi che nella nostra esperienza passata sono stati abitualmente associati tra loro tendono ad essere percepiti come un’unica forma; Secondo i Gestaltisti questi principi agiscono spesso in competizione reciproca e la percezione risultante deriva dagli effetti di questa competizione. Dopo la nascita della Cibernetica e della Teoria dell’informazione, si è assistito ad una serie di tentativi per caratterizzare i concetti Gestaltisti in modo più conforme alle procedure delle cosiddette Scienze Esatte. È così che nasce La teoria dell’informazione strutturale di Leeuwenberg, essa è stata applicata ai problemi della distinzione figura-sfondo, dello studio dei margini quasi-percettivi e della percezione di pattern complessi. Inoltre in questa teoria l’informazione strutturale viene definita essenzialmente tramite il numero di segmenti e di angoli presenti nell’oggetto percepito. Un aspetto importante è che gli elementi costitutivi di un pattern vengono rappresentati tramite un opportuno codice simbolico, che descrive il percorso idealmente compiuto da un osservatore per ricostruire i contorni del pattern in questione. 13 La teoria dell’informazione strutturata da Leeuwenberg, può essere considerata la versione moderna della psicologia della Gestalt. Essa, per altro, incontra grossi problemi nella spiegazione di fenomeni che avvengono nella percezione delle “figure ambigue” e delle cosiddette “figure impossibili” di M.Escher, che presentano proprietà contraddittorie tra loro sul piano dell’interpretazione fisica. Lo studio dei Processi Attentivi In questo ambito, i modelli proposti sono sempre stati strettamente legati a particolari paradigmi sperimentali, che si distinguono in: a. Paradigma dell’attenzione selettiva, si riferisce a situazioni in cui si misura la capacità del soggetto di elaborare alcuni tipi di informazioni, mentre simultaneamente ne deve ignorare altre; b. Paradigma dell’attenzione divisa, si riferisce genericamente a situazioni in cui il soggetto deve elaborare contemporaneamente diversi tipi di informazioni, come nei così detti dualtask ,in cui egli deve eseguire due diversi compiti simultaneamente. Gli esperimenti possono essere a loro volta suddivisi in varie categorie: > Esperimenti di selezione: richiedono al soggetto di individuare un opportuno stimolobersaglio (target) all’interno di un certo pattern di stimolazione. > Esperimenti di filtraggio: si basano sulla presentazione continua di un insieme di stimoli, tra i quali, a ogni istante il soggetto deve selezionare quello rilevante, in base ad opportuni criteri stabiliti dallo sperimentatore. L’esempio più celebre è l’ascolto dicotico , in cui alle due orecchie del soggetto arrivano contemporaneamente due messaggi diversi e il suo compito è quello di prestare attenzione solo a uno dei due messaggi, ignorando l’altro. (ciò può essere attuato attraverso la tecnica dello shadowing che consiste nel chiedere al soggetto di ripetere a voce alta il messaggio cui deve prestare attenzione man mano che esso arriva). La storia degli esperimenti condotti sull’attenzione è dominata da varie metafore, che sono: > Filtro; > Fascio di luce; > Serbatoio. L’attenzione come filtro: L’attenzione non è altro che un filtro che serve a selezionare i segnali provenienti dall’ambiente esterno, in modo da evitare, da un lato, un sovraccarico di elaborazione da parte del sistema cognitivo, e dall’altro, far pervenire alla memoria soltanto le informazioni più rilevati. La teoria del filtro proposta da D.E. Broadbent utilizzando metodi di ascolto dicotico, postula che entrambi i messaggi pervengano ai registri sensoriali e che quindi vengono ritrasmessi in direzione della memoria a breve termine. Questa trasmissione, però, è ostacolata dal fatto che esiste un unico canale di comunicazione con questo tipo di memoria b.t. , canale che, ha una limitata capacità di 14 trasmissione. Lungo questo canale, quindi si trova un filtro che lascia passare solo le informazioni che hanno certe caratteristiche. Prove sperimentali contro questa teoria sono state apportate dagli esperimenti condotti da Moray in cui si mostra come i soggetti siano in grado di accorgersi se, nel messaggio cui NON devono prestare attenzione, compare il loro stesso nome di battesimo. Quindi una nuova teoria fu proposta dalla Treisman nel 1960, chiamata teoria del filtro attenuato che postula l’esistenza di più canali di trasmissione dell’informazione dai registri sensoriali alla memoria a breve termine. Inoltre ogni canale (ad es. percettivo, lessicale, semantico etc…) è associato a una opportuna enfasi che , momentaneamente il soggetto attribuisce ad esso. Questa enfasi è la causa di una certa attivazione trasportata dal segnale che percorre quel canale. Al termine dei vari canali vi è una soglia comune. La superano,giungendo alla memoria a breve termine, soltanto i segnali provenienti dai canali con una attivazione sufficientemente elevata. Quindi i segnali non sono affatto filtrati, come nella teoria del filtro, ma riescono tutti ad entrare nel sistema. L’effetto delle varie enfasi è solo quello di attenuarne alcuni a favore di altri. Il problema di questa teoria è che non esiste un meccanismo preciso che spieghi come e perché l’enfasi attribuita ai singoli canali possa variare nel tempo. Secondo invece un’altra visione proposta da Deutsch e Deutsch e quella di Norman nel 1968, il filtro non avrebbe affatto il compito di selezionare l’informazione che deve essere trasmessa al sistema cognitivo, ma servirebbe solo a selezionare, dopo che le informazioni sono tutte giunte alla memoria a breve termine, quali di queste informazioni debbono andare alla memoria a lungo termine. L’impossibilità di scegliere una teoria univoca sul filtro ha fatto si che questa metafora fosse abbandonata dagli psicologi (1960-1970) L’attenzione come serbatoio La metafora del serbatoio va fatta risalire a Kahneman e consiste sostanzialmente nel vedere l’attenzione come una sorta di serbatoio contenente un opportuno numero di risorse, le cosiddette risorse attentivi. Siccome le dimensioni del serbatoio, e quindi le risorse attentivi sono limitate, questa circostanza può creare dei problemi quando il soggetto deve eseguire più compiti contemporaneamente. A questo proposito si può notare che esistono alcuni tipi di compiti, quelli svolti automaticamente che richiedono molto meno risorse attentive di quelli svolti sotto un diretto controllo cosciente da parte del soggetto. L’Effetto Stroop, è un esempio dell’esistenza di questa distinzione tra compiti automatici e compiti controllati; Esso consiste nel presentare al soggetto delle parole, ciascuna delle quali rappresenta il nome di un particolare colore. Il compito del soggetto è quello di riferire il nome del colore dell’inchiostro usato usato per scrivere la ciascuna parola; L’effetto consiste nel fatto che i soggetti fanno molta più fatica a riferire il nome del colore quando quest’ultimo è differente dal nome del colore rappresentato dalla parola. La Teoria delle risorse multiple proposta da Wickens fin dal 1984, sostiene che i compiti da eseguire richiedano l’impiego di risorse mentali, che si distinguono tra loro a seconda delle caratteristiche: 15 > Tipo di canale sensoriale richiesto (visivo o uditivo); > Tipo di elaborazione richiesta (tipo di risposta motoria o verbale); > Livello di elaborazione (centrale o periferico). L’assunto fondamentale di questa teoria è che l’interferenza tra due compiti è minima quando essi richiedono risorse mentali completamente differenti tra loro. L’anali si della teoria/metafora del serbatoio è stata abbandonata per il suo carattere troppo generico. L’attenzione come fascio di luce L’origine della metafora del fascio di luce si possono fare risalire allo studio di Yarbus nel 1967 sui movimenti oculari effettuati durante la percezione di una scena visiva complessa. In questo studio si evidenziava come tali movimenti consistessero in sequenze complicate di fissazioni, in cui l’occhio era pressoché fermo, e di saccadi, in cui l’occhio si muoveva velocemente passando da una zona di fissazione a una nuova zona di fissazione. Come fa il sistema visivo a decidere quali zone della scena fissare? La risposta consiste nell’ipotizzare che il funzionamento del sistema visivo richieda l’intervento di due processi di elaborazione distinti e successivi: uno pre-attentivo, che scandaglia in parallelo l’intero campo visivo, al fine di evidenziare le zone che presentano un qualche interesse, seguito da uno attentivo, di natura seriale, che decide in base all’output del processo precedente quali zone del campo visivo prendere in considerazione. Eriksen e Yeh nel 1985 hanno ipotizzato la metafora del fascio di luce: l’attenzione sarebbe come un fascio di luce in grado di scandagliare solo ciò che è presente nella zona illuminata dal fascio, ma la decisione di dove puntare il fascio è presa a livelli più elevati e non dipende dalla natura degli stimoli illuminati. L’interrogativo rimasto aperto di questa metafora è se l’output dei processi pre-attentivi dipenda unicamente dalla natura degli stimoli stessi (processi preattentivi controllati con modalità bottomup, che consiste nello scegliere o meno di ricevere tali stimoli) o se dipenda da controlli del tipo top-down (che consiste nel ricevere appunto gli stimoli). Il paradigma della ricerca visiva In generale, nei compiti della ricerca visiva il soggetto dei trovare uno o più stimoli bersaglio (target) all’interno di un certo pattern di stimolazione. Esistono numerose varianti di questo paradigma generale: in alcune il soggetto deve necessariamente fissare un particolare punto nello schermo, mentre in altre può compiere movimenti oculari per trovare target. Per quanto riguarda questi ultimi, in certi tipi di esperimenti vi è un solo target da cercare, mentre in altri vi sono più target, a volte corrispondenti a caratteristiche differenti da un target all’altro. Nel primo caso, i compiti di ricerca visiva ricadono nei paradigmi di attenzione selettiva, mentre nel secondo caso si possono considerare come appartenenti ai paradigmi di attenzione divisa. 16 Conviene illustrare brevemente i due casi particolari del paradigma della ricerca visiva più frequentemente adoperati dai ricercatori: Il paradigma dei tempi di reazione e il paradigma dell’accuratezza: > Il paradigma dei tempi di reazione: In questo paradigma ogni pattern i stimolazione può contenere al massimo un solo target. Il compito del soggetto è quello di decidere se il target è presente o non è presente nel pattern di stimolazione che gli viene presentato. La variabile dipendente è costituita dal tempo di reazione del soggetto. La variabile indipendente è invece costituita dalla dimensione del pattern di stimolazione, ovvero dal numero complessivo di item differenti in esso contenuti. > Il paradigma dell’accuratezza: In questo paradigma ogni pattern di stimolazione può contenere anche molti target. A differenza del paradigma precedente, però, il tempo di presentazione del pattern è prefissato ed è generalmente abbastanza breve, in modo da essere più corto di quello richiesto per compiere movimenti oculari. Al termine della presentazione dello stimolo viene fatto seguire uno stimolo di mascheramento che funge da indicatore per il soggetto che il processo di ricerca dei target è terminato e che egli deve indicare quanti ne conteneva il pattern appena presentato. Il tempo intercorrente tra la scansione del pattern di stimolazione e l’inizio della presentazione dello stimolo di mascheramento chiamato SOA costituisce in questo paradigma la variabile indipendente. Mentre la variabile dipendente è costituita invece dalla correttezza della risposta del soggetto, spesso misurata, su più prove e più soggetti dalla percentuale di risposte corrette. Negli anni ’70 e ’80 questi risultati sono stati interpretati come indicanti l’esistenza di due tipi di ricerca attentiva: > Seriale: significa che i rilevatori devono scandagliare gli item per individuare il target con un maggiore dispendio di tempo. > Parallela: significa che l’elaborazione avviene individuando tutti gli item contemporaneamente. Una ricerca attentiva di tipo parallelo si verificherebbe tutti i casi in cui i target sono definiti da un’unica caratteristica elementare (come quando ad esempio, occorre ricercare un target rosso in una popolazione di distrattori verdi.), mentre in tutti gli altri casi (come quando, ad esempio, il target è definito dalle congiunzioni di più caratteristiche) si verificherebbe una ricerca attentiva di tipo seriale. [Treisman in Feature Integration Theory]. La Memoria, l’immagazzinamento ed il richiamo della conoscenza Lo studio dei processi di memorizzazione e di richiamo delle informazioni ha costituito uno de principali filoni di ricerca della Psicologia Cognitiva. Per studiare questi processi bisogna distinguere tra due filoni, quelli di natura: > Episodica: in cui il materiale di stimolazione dipende fortemente dal contesto sperimentale; 17 > Semantica: in cui tale materiale è parzialmente indipendente dal contesto. Vi è inoltre una ulteriore distinzione per ciò che riguarda la natura della risposta che il soggetto deve fornire: > Risposte di richiamo: il soggetto deve riferire esplicitamente uno o più elementi di un pattern di stimolazione presentato in precedenza; > Risposte di confronto: il soggetto deve solo fornire un giudizio relativo al confronto tra i pattern presentatogli in quel momento e un pattern presentato in precedenza. · Decadimento esponenziale: La prestazione nei compiti di richiamo diminuisce all’aumentare del tempo di latenza (cioè l’intervallo di tempo intercorrente tra la presentazione dello stimolo e la risposta del soggetto) secondo una legge di tipo esponenziale. · Saturazione: la prestazione nei compiti di richiamo non raggiunge mai il 100 per cento, anche quando il tempo di latenza è nullo, se il numero di item da ricordare è superiore a un certo valore critico, che si può stimare intorno a 7±2, quando il compito di richiamo è di tipo seriale, cioè richiede di riferire gli item appresi esattamente nello stesso ordine in cui sono stati presentati al soggetto. · Effetto di recenza: la presentazione nei compiti di richiamo dipende dall’ordine in cui gli item da memorizzare sono stati presentati al soggetto: gli item meglio ricordati sono gli ultimi, oppure talvolta i primi. Normalmente gli item presentati in posizione intermedia vengono ricordati peggio degli altri. · Interferenza: più precisamente si parla di interferenza retroattiva, quando l’apprendimento di nuovi item produce un peggioramento delle prestazioni sugli item appresi in precedenza; in altri casi l’interferenza è proattiva, cioè la prestazione sul nuovo materiale è peggiore di quella relativa al vecchio. · Principio di specificità della codifica: nei compiti di tipo episodico in cui il richiamo è basato sulla presentazione di un particolare indizio, si vede che la prestazione migliora se gli indizi usati sono identici a quelli a quelli che erano presenti al momento della memorizzazione. · Memoria Semantica: I tempi di reazione dei soggetti in compiti di valutazione di verità o falsità di una frase contenente una connessione tra due concetti sono parzialmente indipendenti dalle relazioni di natura logica esistenti tra i concetti stessi, nonché dal fatto che la frase in questione sia effettivamente vera o falsa. Il modello di Atkinson – Shiffrin: Esso presuppone l’esistenza di tre sottoinsiemi di memoria: 18 Il registro sensoriale è caratterizzato da una durata limitatissima, e da una capacità illimitata. Invece la memoria a breve termine è caratterizzata da una capacità limitata e da un accesso immediato. Infine, la memoria a lungo termine ha una capacità e una durata entrambe illimitata, anche se l’accesso alle informazioni che essa contiene può essere talvolta difficile o addirittura impossibile. Il modello di Tulving: Si tratta di un modelli della memoria a lungo termine, che postula una suddivisione in tre differenti sottoinsiemi: a. La memoria episodica: che elabora il contenuto delle nostre esperienze passate; b. La memoria semantica: che contiene i concetti e le relazioni tra i concetti; c. La memoria procedurale: che contiene schemi o sequenze ordinate di azioni dirette ad uno scopo. Questi sottoinsiemi hanno relazioni reciproche e generalmente cooperano in modo tale che la memoria funziona come un sistema integrato. Il modello è di tipo gerarchico, poiché in esso la memoria procedurale è considerata il primo e il più basilare tra tutti i sottoinsiemi di memoria. La memoria semantica si svilupperebbe poi come una parte specializzata della memoria procedurale, mentre, a sua volta, la memoria episodica andrebbe vista come derivante da una ulteriore specializzazione della memoria semantica. La Strutturazione della Conoscenza (come la conoscenza viene codificata nella memoria) La teoria del doppio codice: La questione della forma sotto la quale la conoscenza è effettivamente codificata in memoria è stata, però, trascurata. Il modello più celebre formulato in proposito è la cosiddetta Teoria del doppio codice, proposta da Paivio fin dal 1971. In essa si postula l’esistenza di due distinte forme di codifica della conoscenza: verbale e non-verbale. Nella prima le informazioni sono descritte tramite parole, mentre nella seconda sono rappresentate sotto forma di immagini mentali. Paivio ipotizza che le parole che fanno riferimento a oggetti, luoghi, persone concrete tendano più facilmente ad essere codificate anche sotto forma di immagini mentali. Ciò invece non avverrebbe per le parole che si riferiscono a concetti astratti. Così le parole concrete potrebbero essere codificate in entrambe le forme, verbale e non verbale, mentre le parole astratte tenderebbero ad essere codificate solo sotto la forma verbale. 19 Il numero di differenti tipi di codifica, secondo Paivio, sarebbe collegato alla facilità di richiamo della memoria. In questo modo le parole concrete verrebbero ricordate meglio di quelle astratte. Anderson (1993), invece di parlare di codifica verbale e non verbale, parla di ordinamenti lineari e di immagini. I primi sono forme di rappresentazione che dispongono gli elementi di informazione secondo un ordine sequenziale, eventualmente derivante dall’ordine temporale con cui le informazioni stesse sono state presentate al soggetto, mentre le seconde rappresentano le informazioni sotto l’aspetto della disposizione spaziale. La codifica verbale sarebbe riconducibile ad un ordinamento lineare, in quanto le parole vengono memorizzate in successione. Nel 1986 Paivio ha esteso la sua teoria, proponendo che la codifica verbale e quella non verbale siano elaborate da due distinti sottoinsieme di rappresentazione, reciprocamente interconnessi. Il sistema di codifica verbale sarebbe composto di una unità di base, che egli chiama “logogeni” ognuna delle quali contiene l’informazione che è associata all’uso di una singola parola. Queste unità vengono attivate sequenzialmente, il che spiega la preferenza per gli ordinamenti lineari. Invece le unità di base del sistema di codifica non-verbale sarebbero gli “imageni”, corrispondenti a singoli oggetti, parti di oggetti o raggruppamenti naturali di oggetti. Esse si attiverebbero con modalità parallela, con la possibilità di analisi simultanea delle parti da cui queste unità possono essere a loro volta composte. Anderson ha proposto l’esistenza, oltre le due precedenti, di un terzo tipo di codifica: quella preposizionale astratta. Essa rappresenta quello che costituisce il significato di una proposizione concreta, composta da una ben precisa sequenza di parole. Le Immagini Mentali: Le immagini mentali sono rappresentazioni interne della strutturazione spaziale degli eventi che fanno parte della nostra esperienza fenomenica. Riguardo alla natura delle immagini mentali, gli studiosi si suddividono in due categorie: > Gli Immaginisti: (M. Kosslyn)i quali sostengono che esse sono immagazzinate sotto forma di figure geometriche, non necessariamente connesse a informazioni di tipo simbolico, le immagini mentali sono codificate inte4rnamente sotto forma di immagini vere e proprie. Anche se gli immaginasti non sono assertori di un perfetto isomorfismo tra immagini mentali e oggetti reali (in quanto presuppongono l’esistenza di deformazioni delle immagini rispetto alla realtà), tuttavia sono convinti dell’esistenza di una parziale corrispondenza tra proprietà delle immagini e proprietà degli oggetti; Va comunque osservato che una prova a favore della validità del punto di vista degli Immaginisti è costituita dal fatto che la capacità di ricordare le informazioni visive è molto maggiore di quella relativa alle informazioni verbali. > I Proposizionalisti: (Z. W. Pyltshyn)che considerano le immagini connesse a rappresentazioni descrittive, di tipo simbolico, consistenti essenzialmente in 20 proposizioni, ovvero in asserzioni relative alle relazioni spaziali tra le componenti delle singole immagini. Gli esperimenti condotti dagli Immaginisti, iniziati da R. Shepard, per trovare sostegno alla loro posizione si possono suddividere nelle seguenti categorie: 1. Effetti di distanza: l’eventuale esistenza di isomorfismi tra la struttura spaziale del pattern di stimolazione (espressa tramite le relazioni di distanza tra gli elementi che lo compongono) e struttura spaziale del pattern di stimolazione. Gli esperimenti condotti da Kosslyn hanno portato al risultato che evidenziava che i tempi di reazione dei soggetti erano direttamente proporzionali alle distanze fisiche esistenti nella cartina sottoposta ai soggetti tra le coppie di elementi nominati in successione. 2. Effetti di grandezza: cioè se il tempo necessario a rilevare la presenza, in un immagine mentale, di una data caratteristica, aumenta o no al diminuire delle dimensioni della caratteristica stessa, come avverrebbe nel caso in cui si dovesse ispezionare un oggetto reale. Gli esperimenti condotti da Kosslyn dimostrano che il tempo necessario a rilevare una data caratteristica in una immagine mentale, aumenti al diminuire delle dimensioni della caratteristica stessa, proprio come avverrebbe se dovessimo esplorare visivamente un’immagine reale, in cui la presenza di un dettaglio piccolo è più difficile da rilevare di quella di una caratteristica su grande scala. 3. Effetti di trasformazione mentale: cioè l’eventuale capacità dei soggetti di sottoporre le immagini mentali a trasformazioni geometriche, quali rotazioni e traslazioni, identiche a quelle cui possono essere sottoposti i corrispondenti oggetti reali; in particolare sono state studiate le rotazioni mentali. In particolare si è cercato di mostrare che le immagini mentali possono essere ruotate, nel piano e nello spazio, o ribaltate in modo speculare in modi del tutto analoghi a quelli che riguardano i pattern fisici di stimolazione (Shepard, Cooper). Secondo quest’ultimi autori, il tempo di reazione dei soggetti è direttamente proporzionale all’angolo di cui era necessario ruotare il primo pattern per sovrapporlo al pattern di base (in modo da poterlo confrontare). Le Mappe Cognitive: Le mappe cognitive costituiscono un altro dei modi con cui viene rappresentata internamente la conoscenza. Esse si riferiscono specificamente all’organizzazione delle informazioni necessarie per pianificare gli spostamenti che si intendono compiere in un ambiente strutturato in modo complesso e accessibile solo su piccola scala alla percezione visiva immediata. Un ambiente del genere può essere costituito, ad es., dall’interno di un edificio, da un parco, da una città, da una regione. Le mappe cognitive sono state introdotte per prime da Tolman nel 1932, per spiegare l’improvviso aumento della performance nel compito di trovare il punto meta in un labirinto da parte di ratti precedentemente non rinforzati, una volta che avevano ricevuto un primo rinforzo. Ad occuparsi sistematicamente dopo Tolman di mappe cognitive fu Lynch, che nel 1960 si è interessato al modo con cui le persone si formano uno schema di orientamento per muoversi all’interno di una città. Lynch ha enunciato così 5 elementi base per le mappe cognitive di orientamento in una città: le vie, i bordi, i distretti, i punti nodali, i punti di riferimento. L’apprendimento dei Concetti 21 La più importante delle rappresentazione interne della conoscenza è quella basata sui concetti. In questo contesto il termine concetto verrà utilizzato come sinonimo di “categoria”, ovvero modo per raggruppare insieme più oggetti o eventi. L’utilizzo dei concetti è fondamentale per l’attività cognitiva in quanto, da un lato, consente di considerare come equivalenti entità diverse e, dall’altro, elimina la necessità di manipolare le entità concrete, limitando i processi cognitivi alla elaborazione di entità più astratte quali sono, per l’appunto, i concetti. Per quanto riguarda le teorie sui concetti possiamo distinguer tra: § Teorie Olistiche: che considerano ogni concetto alla stregua di un tutto non ulteriormente analizzabile, che deriva in parte da una base innata (Fodor). § Teorie basate sulle caratteristiche o tratti: impiegate dagli psicologi per lo studio dei processi che riguardano la struttura concettuale, si distinguono in tre classi: a. Teorie classiche: che postulano che ogni concetto sia definito da un insieme finito di caratteristiche, ciascuna delle quali è necessario che sia posseduta dagli esemplari del concetto stesso. È questo il modo con cui sono definiti i concetti in Matematica e nella Logica formale. Si tratta di una rappresentazione assai vantaggiosa sul piano sperimentale, in quanto consente di studiare i processi di acquisizione e di utilizzo dei concetti in modi facilmente manipolabili dallo sperimentatore. Uno dei problemi più importanti affrontati dalle teorie classiche è quello dell’individuazione delle regole che vengono più spesso usate nel selezionare le proprietà che definiscono i concetti. A questo proposito sono state condotte ricerche prevalentemente sull’impiego di alcuni tipi particolari di regole: affermativa, congiuntiva, disgiuntiva, condizionale e bicondizionale. Una serie di importanti esperimenti condotti da Hunt e Neisser, ha mostrato che , nei compiti di apprendimento, queste regole vengono apprese con difficoltà crescente, nel senso che i concetti più facili sono quelli basati sulla regola affermativa; poi seguono, in ordine, quella congiuntiva, quella disgiuntiva, quella condizionale, e quella bicondizionale. Inoltre vari esperimenti di Bourne nel 1970, hanno mostrato come la difficoltà di apprendimento di queste regole decresca con la pratica, cioè con l’aumento del numero di volte in cui la regola viene utilizzata dallo stesso soggetto. I risultati ottenuti in queste ricerche hanno senso solo nell’ambito di una teoria classica dei concetti, che riesce a descrivere unicamente esperimenti di laboratorio in cui si manipolano concetti semplici come quelli mostrati. Ben diversamente vanno le cose se ci riferiamo ad altri tipi di concetti, come quelli che utilizziamo normalmente e di cui si occupano le ricerche di memoria semantica b. Teorie basate sui tratti differenziali: Smith, Shoben e Rips, hanno proposto una teoria nella quale le proprietà che definiscono un concetto vengono ripartite in due insiemi: quello delle proprietà che definiscono la categoria in quanto tale e quello della proprietà che sono possedute dagli esemplari della categoria la maggior parte delle volte, ma non sono definitorie di per se nei riguardi della categoria. Questa teoria va incontro alla grossa difficoltà dell’individuazione delle caratteristiche definitorie che in molti casi sembra essere del tutto assente. 22 c. Teorie basate sui Prototipi (Rosch): esse postulano che ogni concetto venga rappresentato direttamente tramite un particolare esemplare, considerato come il “prototipo” del concetto stesso, e che l’appartenenza degli altri esemplari al concetto venga giudicata in base alla maggiore o minore somiglianza col prototipo. Un aspetto critico della teoria del prototipo è quello relativo al modo con cui il prototipo di un concetto viene identificato. Secondo la Rosch esso è quell’esemplare che massimizza la correlazione tra i vari attributi posseduti dai diversi appartenenti alla categoria. La sua identificazione è dunque nuovamente basata sull’esame di opportune proprietà. La Teoria del Contesto di Medin e Smith, secondo la quale la formazione di un concetto procede attraverso un confronto tra i nuovi esemplari che vengono a far parte dell’esperienza del soggetto e quelli precedentemente immagazzinati in memoria, sulla base dell’esperienza precedente. In questo modo la prototipicità non deriverebbe dal confronto di proprietà, ma semplicemente dalle esperienze avute dal soggetto. Nella loro teoria Medin e Smith postulano che l’esemplare venga memorizzato sotto duplice forma: in quanto tale e in quanto caratterizzato da alcune proprietà generali, che gli rimangono associate tutte le volte che viene utilizzato per dei confronti. La soluzione dei Problemi A questo proposito bisogna prendere in considerazione i modi in cui la conoscenza viene impiegata per risolvere dei problemi. Le teorie si suddividono in due categorie: I. Le teorie cognitive: le prime attribuiscono un ruolo fondamentale, nel processo di soluzione di un problema, alle strutture cognitive del soggetto, ovvero al modo con cui egli si rappresenta il problema; II. Le teorie stimolo-risposte: focalizzano la loro attenzione esclusivamente sui comportamenti che conducono alla soluzione e sul modo con cui essi sono influenzati dagli stimoli ricevuti. La teoria cognitiva per eccellenza è costituita dalla Psicologia della Gestalt e i concetti che essa ha formulato derivano inizialmente dalle osservazioni effettuate, dal gestaltista W. Kohler sul comportamento delle scimmie antropoidi. Il concetto fondamentale introdotto da Kohler è quello di “Insight” che indica un processo di rapido conseguimento della soluzione, consistente nella percezione delle corrette relazioni tra gli elementi del problema. Secondo Kohler un problema è un “Gestalt”, cioè una forma, ne più ne meno che come le Forme che osserviamo nel campo visivo. Esso consiste in un certo numero di elementi, connessi tra di loro da certe relazioni. Il problema consiste nel fatto che questa struttura inizialmente non costituisce una Forma “buona”, ma una Forma “disturbante”, in cui certe relazioni sono incongruenti. Questa rapida ristrutturazione, che spesso consiste in un vero e proprio processo 23 percettivo (una nuova visione della situazione) è l’insight e la nuova forma è la soluzione del problema. Il punto di vista di Kohler, rappresentava all’epoca una grossa novità, in quanto si opponeva decisamente a quanto sostenevano le teorie stimolo-risposta, che vedevano il processo di soluzione di un problema come basato su una successione di prove ed errori, in cui il ruolo fondamentale era giocato dall’esperienza passata. Alla Formazione graduale delle corrette associazioni tra situazione stimolo e comportamenti di soluzione, in seguito ai successivi rinforzi ottenuti (come inizialmente sostenuto da Thorndike), Kohler opponeva le sue osservazioni di scimmie che, dopo aver condotto per lungo tempo esperienze con gli elementi della situazione problemica senza ottenere alcun progresso verso la soluzione, improvvisamente “comprendevano” la corretta relazione tra questi elementi e, di colpo, risolvevano il problema senza alcun sforzo. Nell’ambito delle teorie cognitive, l’opera di Wertheimer riprende il concetto di “ristrutturazione” della situazione problemica, introducendo la distinzione tra: a. pensiero produttivo: nel quale tale ristrutturazione ha luogo, è un pensiero che ci porta ad acquisire nuove conoscenze, pur non essendoci nuovi elementi di conoscenza nella situazione problemica (ad esempio sotto forma di Insight); b. pensiero riproduttivo: si manifesta come la riproduzione o la replica pura e semplice di un’azione o di una procedura di soluzione a un problema precedentemente appresa o emessa. Wertheimer ebbe il merito di applicare la teoria, che originariamente Kohler aveva proposto solo per le scimmie antropoidi, a tutti i processi di pensiero umani, non solo a quelli connessi alla soluzione dei problemi ma anche a quelli che entrano in gioco nella creazione di nuove teorie scientifiche. Uno dei grossi problemi lasciati insoluti dalle teorie cognitive è quello del motivo per cui i processi di ristrutturazione molte volte non si verificano, nonostante la presupposta tendenza spontanea verso una “buona Forma”. Una possibile soluzione è stata proposta da K. Dunker che si è reso conto che il concetto di Insight così come formulato da Kohler e Wertheimer, era assolutamente inadatto a descrivere i processi di soluzione di problemi complessi. Secondo Dunker tali problemi vanno visti come una sequenza di fasi, ciascuna delle quali rappresenta un passo in avanti nei confronti della soluzione. Quali sono gli ostacoli che si oppongono alla ristrutturazione? Essi sono di 3 tipi: 1. la fissità funzionale: essa è la tendenza ad attribuire a un elemento sempre una particolare funzione, quella connessa al suo uso più frequente (es. il martello e la corda utilizzati come pendolo da Maier); 24 2. Le abitudini: danno origine alla tendenza ad applicare a un problema nuovo un metodo che si è già rivelato utile nella soluzione di un problema apparentemente simile; 3. la complessità dei problemi: in questi casi la soluzione si ottiene attraverso una serie di fasi, ciascuna delle quali ha carattere di soluzione per quella che la precede e carattere di soluzione per quella che la segue; volendo, all’interno di una singola fase si può anche parlare di insight, ma si tratta di insights parziali; Le soluzioni che favoriscono il superamento di questi ostacoli: 1. 2. 3. · la capacità di generare soluzioni alternative; un uso opportuno di regole euristiche, cioè di appropriate strategie di ricerca della soluzione; la capacità di recuperare informazioni dalla memoria. Teoria comportamentista della soluzione dei problemi di Hull Hull ha introdotto la distinzione tra due meccanismi di associazione stimolo-risposta: I meccanismi divergenti: essi sono caratterizzati dal fatto che uno stesso stimolo è connesso, con forze diverse, a più risposte. I meccanismi convergenti: più stimoli sono connessi, con forze diverse, alla stessa risposta. Combinando questi due elementi si ottengono gerarchie di sequenze stimolo-risposta. Nella terminologia di Hull, una singola associazione tra un particolare stimolo e una particolare risposta viene denominata abitudine. Di conseguenza, con l’espressione famiglia di abitudini indica una sequenza comportamentale complessa, costituita da più associazioni stimolo-risposta. · Soluzione dei problemi nell’Intelligenza Artificiale La situazione del problema viene descritta ricorrendo ai cosiddetti “stati problemici”, che descrivono ad ogni momento del processo di soluzione, gli elementi noti del problema e le loro relazioni.La formulazione iniziale del problema corrisponde ad uno stato problemico iniziale, mentre la sua soluzione allo stato problemico desiderato, ovvero allo stato-meta (goal). Uno dei compiti dell’intelligenza artificiale è quello di costruire programmi per il computer in grado di evidenziare cammini ottimali fra stato iniziale e stato meta, usufruendo di opportune informazioni, codificate sia sotto forma di dati che, soprattutto, sotto forma di regole per l’elaborazione della conoscenza. Tra le realizzazioni più interessanti in questo ambito va citato il “General Problem Solver (GPS)” di Newell, Shaw, e Simon, un programma costruito con l’ambizione di fornire uno strumento in grado di risolvere qualunque tipo di problema, indipendentemente dal suo contesto. 25 La teoria di Kieras – Polson (l’analisi cognitiva delle interfacce) · L’interfaccia: si può definire l’interfaccia come il dominio dell’interazione uomo programma. La teoria di Kieras e Polson, si propone esclusivamente un metodo di valutazione di interfacce già progettate e non come uno strumento di progettazione di nuove interfacce. Inoltre formula predizioni di tipo quantitativo relativamente a due parametri d’uso: 1. il tempo di apprendimento dell’uso corretto dell’interfaccia esaminata: gli autori suppongono che esso sia direttamente proporzionale al numero di nuove regole che occorre apprendere per eseguire correttamente il compito per cui l’interfaccia è stata progettata. 2. La produttività: considerata equivalente al tempo medio impiegato dall’utente, una volta che l’apprendimento sia avvenuto, per conseguire, tramite l’interfaccia, gli scopi per cui quest’ultima è stata progettata. Nella teoria di Kieras Polson, le previsioni quantitative vengono ottenute mediante simulazioni sul computer del processo di esecuzione di un compito tramite l’interfaccia che si intende valutare. Per quanto riguarda il contenuto della conoscenza posseduta dall’utente, Kieras e Polson suppongono che essa possa essere suddivisa in tre distinte categorie: 1. quella relativa a quali compiti possono essere svolti impiegando il sistema studiato (situazione del compito) 2. come attuare le procedure man mano richieste per svolgere particolari compiti (come si fa), quindi come realizzare un obiettivo; 3. ciò che l’utente è riuscito a comprendere sul modo in cui il sistema risponde agli stimoli in ingresso (come funziona), quindi, come funziona un dato sistema. L’utilizzo delle conoscenze su come realizzare un obiettivo sono state particolarmente studiate dal cosiddetto modello GOMS, costruito da Card, Moran e Newell, nel 1983. Goms è un acrostico, e le sue iniziali costituiscono le componenti di queste conoscenze: G sta per “goals” obiettivi, O sta per “operations” rappresentazioni di azioni fisiche o cognitive, M sta per “methods” sequenze di operazioni per conseguire un sotto-obiettivo, S sta per “Selection rules” regole. Nella teoria di Kieras Polson, la struttura degli scopi, delle operazioni, dei metodi e delle regole di selezione viene rappresentata facendo uso di un sistema di produzioni. Più precisamente indichiamo un sistema di produzioni con un complesso di tre entità: 26 1. un insieme di regole: ogni regola è costituita da una coppia condizione azione del tipo: SE (condizione) ALLORA (azione). 2. una memoria di lavoro: contiene informazioni riguardanti gli scopi immediati da conseguire, le attività in corso e le condizioni dell’ambiente esterno. 3. un interprete: opera secondo cicli di attività, ciascuno delle quali è suddiviso in due modalità: · riconoscimento: l’interprete verifica la corrispondenza tra il contenuto della memoria di lavoro e le condizioni che compaiono nelle singole regole e, in base all’esito di questo confronto, decide qual regola debba essere attivata. · azione: la regola attivata provoca l’esecuzione dell’azione, che essa prevede.