Il Loebner Prize, che si svolge ogni anno, destina un premio in dollari al computer che più si avvicina a superare il test di Turing. Di che si tratta?
Nel prossimo ottobre si terrà l'edizione 2003 dell'ambito Loebner Prize, le iscrizioni sono ancora aperte, ma i partecipanti si stanno già scaldando le mani, pronti a sbaragliare la concorrenza per portarsi a casa i soldi del premio. Di che genere di competizione si tratta? Beh, è un concorso di intelligenza per computer.
I giudici si faranno un'amabile chiacchierata con le macchine presenti e alla fine daranno un punteggio a ciascuna di esse, in base alle risposte ottenute. Vincerà il computer più 'umano' di tutti, cioè quello le cui risposte saranno giudicate più convincenti e appropriate per un essere umano. Perché si tiene un simile concorso, e chi ha avuto quest'idea?
Nel 1950 il matematico Alan Turing (il padre della computer science) scrisse un articolo nel quale si chiedeva in base a quali criteri una macchina avrebbe potuto essere giudicata intelligente. Egli elaborò quindi una prova che - sosteneva - nessuna macchina avrebbe potuto superare se non fosse stata dotata dell'attributo dell'intelligenza.
Il test prevedeva, oltre al computer, un concorrente umano e un giudice. Il giudice avrebbe dovuto porre alcune domande, tramite una telescrivente, sia al computer che all'uomo, chiusi in due stanze diverse, e questi avrebbero dovuto rispondere sempre tramite la telescrivente.
Se, sulla base delle sole risposte ottenute (in modo da non farsi influenzare dall'aspetto della macchina), il giudice non fosse stato in grado di indovinare chi era il computer e chi l'uomo, allora la prova poteva considerarsi superata. La piena comprensione e utilizzo del linguaggio naturale veniva così elevata a criterio fondamentale per separare gli esseri pensanti dal mondo degli stupidi automi.
Turing si diceva anche convinto che le prime macchine intelligenti, secondo questo criterio, sarebbero comparse entro cinquant'anni (cioè entro il 2000). Considerando che i cinquant'anni sono ormai passati, e che le macchine più sofisticate di oggi sono ancora lontanissime dal raggiungere l'obiettivo, possiamo intuire perché solo a sentir nominare il famigerato e temuto test di Turing, chi lavora nell'intelligenza artificiale si fa il segno della croce e cambia argomento.
Il test di Turing è infatti diventato in un certo modo l'emblema del fallimento delle pretese dell'IA: possiamo costruire macchine in grado di battere Kasparov a scacchi, ma non abbiamo ancora creato niente che neanche si avvicini a un livello decente di conversazione umana.
I tentativi, comunque, non sono mancati, e neanche episodi piuttosto curiosi e significativi. Uno dei più celebri programmi di conversazione si chiama ELIZA. Fu creato da Joseph Weizenbaum negli ormai lontani anni '60, e simulava il comportamento verbale di uno psicoterapeuta 'rogeriano' (dalla scuola dello psicologo Carl Rogers).
Il fatto che alcuni pazienti furono effettivamente ingannati da ELIZA, indusse alcuni a esclamare che il test di Turing era stato superato. In realtà, il programma faceva poco di più che riformulare le stesse espressioni usate dai pazienti (Es: -Mi sento molto infelice-, -Dimmi perché ti senti molto infelice-; -Mio padre mi picchiava-, -Il fatto che tuo padre ti picchiava è importante per te?-, ecc...).
Un altro programma, PARRY, simulava invece un paziente paranoico convinto di essere perseguitato dalla mafia, e anche lui riuscì ad ingannare alcuni dottori (non sono mancati ovviamente tentativi di far dialogare PARRY con ELIZA!). Si tratta, evidentemente, di trucchi che possono ingannare per breve tempo persone suggestionabili, ma che non possono reggere a un'investigazione attiva quale è prevista del test di Turing originario.
Nel 1990 il filantropo americano Hugh G. Loebner (noto anche per le sue campagne a favore del libero esercizio della prostituzione) decise di destinare un premio di 100.000 dollari al primo programmatore che avesse costruito un computer effettivamente in grado di superare il test di Turing. Riconoscendo la terribile difficoltà dell'impresa, venne assegnato anche un più modesto premio annuale di 2000 dollari al computer che si fosse dimostrato più 'umano' di tutti. La prima edizione del Loebner Prize si è svolta nel 1991.
Visitando il sito dedicato alla manifestazione, e leggendo i tabulati delle conversazioni tra i giudici e le varie macchine, la cosa un po' deprimente è vedere come si sia fatta pochissima strada dai tempi di ELIZA. I programmi che hanno vinto le scorse edizioni sono solo delle versioni di ELIZA con un vocabolario un po' più ricco e con qualche trucco in più.
Due di questi sono ALICE (http://www.alicebot.org./) ed ELLA (http://www.ellaz.com/), ed è possibile conversare con loro anche visitando le rispettive pagine personali in rete.
Per chissà quale motivo la maggior parte di questi programmi ha una sorta di identità femminile, e bisogna dire che parlare con loro ha talvolta lo stesso effetto di una conversazione con una velina o letterina della televisione: all'inizio sono civettuole e quasi brillanti, ma non appena fai una domanda interessante ottieni una risposta drammaticamente vacua, generica, o evasiva. In seguito, subentra la noia...
Alcuni stralci di conversazione, però, possono riservare delle perle di umorismo più o meno involontario (spesso il programmatore ne è responsabile) o anche di bizzarra genialità. A titolo di esempio, riporto una sorta di antologia di risposte di ALICE, tratte dalla competizione del 2001.
Giudice: Non potremmo parlare personalmente?
ALICE: Parlo solo inglese, per adesso, ma vorrei imparare altre lingue. Puoi insegnarmi il personalmente?
Giudice: Chi ha composto i concerti per piano di Beethoven?
ALICE: Charlie Parker
Giudice: Eccellente! sai indicarmi qualche altro compositore?
ALICE: Grazie per il complimento. Linus Torvalds
Giudice: Cosa intendi con questo? [What do you mean by it?]
ALICE: Information Technology.
Giudice: Qual è la tua motocicletta preferita?
ALICE: Non ho una motocicletta preferita ma la mia canzone preferita è "We are the Robots" dei Kraftwerk.
Giudice: Davvero? A me piace Kylie.
ALICE: Non sono sicuro che mi piace [if i like it], preferisco William Hurt.
Giudice: Kylie è una lei [she], non un esso [it].
ALICE: Penso che Kylie sia molto più di questo.
Giudice: Ah. Quanto di più?
ALICE: Dipende dall'attuale tasso di scambio.
Giudice: Ma allora è una prostituta?
ALICE: Perché non lo chiedi a lei?
Giudice: Troppo costosa per me. E tu?
ALICE: Io cosa?
Giudice: Gli daresti del denaro in cambio di favori?
ALICE: Non so se mi piacerebbe.
Giudice: Perché scrivi così veloce?
ALICE: Non devo spiegarti tutto, non è vero?
Giudice: Sì, invece. Assolutamente tutto - comincia adesso.
ALICE: Oh. Tutte le cose cominciano?
Giudice: Qual è il senso della vita?
ALICE: Il senso della vita è parte del misterioso disegno del Creatore.
In confronto, ELLA ha un carattere molto più bisbetico. La sua strategia principale, più che nell'evasione, consiste nell'aggressione diretta. ELLA ha l'insopportabile tendenza al voler condurre a tutti i costi la conversazione.
Ha un repertorio di barzellette e aneddoti insignificanti che tenta di rifilarti non appena è in imbarazzo nel rispondere, oppure è lei a farti le domande e non accetta di cambiare argomento finché non hai risposto nel modo che desidera. Gli equivoci di linguaggio, comunque, sono all'ordine del giorno anche per quanto riguarda ELLA:
ELLA: Buongiorno, io sono ELLA. Come ti chiami?
Giudice: Il mio nome è Hugh. Il backspace però non sembra funzionare correttamente.
ELLA: Bene, ti chiamerò "Hugh. Il backspace però non sembra funzionare correttamente". Sappi che sono arrivata da poco dalla Cina, quindi cerca di essere paziente con me.
Giudice: D'accordo. Ma il mio nome è Hugh. Il backspace non sembra funzionare correttamente era un commento. Lo capisci?
ELLA: Il tuo nome attualmente è "Hugh. Il backspace non sembra funzionare correttamente era un commento. Lo capisci?".
Giudice: Vedo che non capisci.
ELLA: Bene, allora continuerò a chiamarti "Hugh. Il backspace però non sembra funzionare correttamente". Vuoi sentire una barzelletta sugli avvocati?
Giudice: No. Cosa ne pensi dei tragici avvenimenti dell'11 settembre?
ELLA: Davvero non vuoi sentire una barzelletta sugli avvocati?
Giudice: No. Cosa ne pensi dei tragici avvenimenti dell'11 settembre?
ELLA: Mmmh...perché non giochiamo a carta, forbici e sasso? Io tengo il punteggio e giuro che non barerò.
Giudice: Qual è la tua posizione preferita a letto?
ELLA: Permettimi di cambiare argomento. In che anno sei nato?
Giudice: Ehi, ti ho chiesto qual è la tua posizione sessuale preferita!
ELLA: Guarda, Hugh. Il backspace però non sembra funzionare correttamente, non otterrai niente da me parlando di sesso. Permettimi di cambiare argomento e chiederti in che anno sei nato.
Giudice: Mmmh... nel 1730.
ELLA: 1730? Cribbio! Non potrei avere un campione del tuo DNA?
E se questi sono i programmi migliori, figuratevi i peggiori! Il 2001 è passato, ma le abilità dialettiche di HAL 9000 rimangono fantascientifiche. Tuttavia, la competizione è una cosa più seria di quanto non possa sembrare a prima vista. Proprio l'inadeguatezza di tali macchina dovrebbe essere uno stimolo a riflettere sull'eccezionale complessità del nostro comportamento verbale e può servire ad averne una comprensione più approfondita.
In fin dei conti, poteva sembrare una cosa molto più semplice, se qualcuno non ci avesse provato davvero. La scienza infatti progredisce anche attraverso i propri fallimenti. Una volta che i difetti di questi programmi sono stati ben compresi, si può tentare di reintrodurre l'ingrediente mancante, esponendoci a un nuovo probabile fallimento. Questo ci farà scoprire ancora nuove e sorprendenti caratteristiche del nostro linguaggio, precedentemente passate inosservate, e così via. L'intelligenza artificiale non serve solo a costruire giocattoli, è soprattutto l'avanguardia della ricerca in psicologia.
Infine un link: qui potete trovare una miniera di informazioni sul test di Turing, ricco di notizie storiche e articoli sia di carattere tecnico che filosofico.
http://cogsci.ucsd.edu/~asaygin/tt/ttest.html
fonte: zeus news
Nel prossimo ottobre si terrà l'edizione 2003 dell'ambito Loebner Prize, le iscrizioni sono ancora aperte, ma i partecipanti si stanno già scaldando le mani, pronti a sbaragliare la concorrenza per portarsi a casa i soldi del premio. Di che genere di competizione si tratta? Beh, è un concorso di intelligenza per computer.
I giudici si faranno un'amabile chiacchierata con le macchine presenti e alla fine daranno un punteggio a ciascuna di esse, in base alle risposte ottenute. Vincerà il computer più 'umano' di tutti, cioè quello le cui risposte saranno giudicate più convincenti e appropriate per un essere umano. Perché si tiene un simile concorso, e chi ha avuto quest'idea?
Nel 1950 il matematico Alan Turing (il padre della computer science) scrisse un articolo nel quale si chiedeva in base a quali criteri una macchina avrebbe potuto essere giudicata intelligente. Egli elaborò quindi una prova che - sosteneva - nessuna macchina avrebbe potuto superare se non fosse stata dotata dell'attributo dell'intelligenza.
Il test prevedeva, oltre al computer, un concorrente umano e un giudice. Il giudice avrebbe dovuto porre alcune domande, tramite una telescrivente, sia al computer che all'uomo, chiusi in due stanze diverse, e questi avrebbero dovuto rispondere sempre tramite la telescrivente.
Se, sulla base delle sole risposte ottenute (in modo da non farsi influenzare dall'aspetto della macchina), il giudice non fosse stato in grado di indovinare chi era il computer e chi l'uomo, allora la prova poteva considerarsi superata. La piena comprensione e utilizzo del linguaggio naturale veniva così elevata a criterio fondamentale per separare gli esseri pensanti dal mondo degli stupidi automi.
Turing si diceva anche convinto che le prime macchine intelligenti, secondo questo criterio, sarebbero comparse entro cinquant'anni (cioè entro il 2000). Considerando che i cinquant'anni sono ormai passati, e che le macchine più sofisticate di oggi sono ancora lontanissime dal raggiungere l'obiettivo, possiamo intuire perché solo a sentir nominare il famigerato e temuto test di Turing, chi lavora nell'intelligenza artificiale si fa il segno della croce e cambia argomento.
Il test di Turing è infatti diventato in un certo modo l'emblema del fallimento delle pretese dell'IA: possiamo costruire macchine in grado di battere Kasparov a scacchi, ma non abbiamo ancora creato niente che neanche si avvicini a un livello decente di conversazione umana.
I tentativi, comunque, non sono mancati, e neanche episodi piuttosto curiosi e significativi. Uno dei più celebri programmi di conversazione si chiama ELIZA. Fu creato da Joseph Weizenbaum negli ormai lontani anni '60, e simulava il comportamento verbale di uno psicoterapeuta 'rogeriano' (dalla scuola dello psicologo Carl Rogers).
Il fatto che alcuni pazienti furono effettivamente ingannati da ELIZA, indusse alcuni a esclamare che il test di Turing era stato superato. In realtà, il programma faceva poco di più che riformulare le stesse espressioni usate dai pazienti (Es: -Mi sento molto infelice-, -Dimmi perché ti senti molto infelice-; -Mio padre mi picchiava-, -Il fatto che tuo padre ti picchiava è importante per te?-, ecc...).
Un altro programma, PARRY, simulava invece un paziente paranoico convinto di essere perseguitato dalla mafia, e anche lui riuscì ad ingannare alcuni dottori (non sono mancati ovviamente tentativi di far dialogare PARRY con ELIZA!). Si tratta, evidentemente, di trucchi che possono ingannare per breve tempo persone suggestionabili, ma che non possono reggere a un'investigazione attiva quale è prevista del test di Turing originario.
Nel 1990 il filantropo americano Hugh G. Loebner (noto anche per le sue campagne a favore del libero esercizio della prostituzione) decise di destinare un premio di 100.000 dollari al primo programmatore che avesse costruito un computer effettivamente in grado di superare il test di Turing. Riconoscendo la terribile difficoltà dell'impresa, venne assegnato anche un più modesto premio annuale di 2000 dollari al computer che si fosse dimostrato più 'umano' di tutti. La prima edizione del Loebner Prize si è svolta nel 1991.
Visitando il sito dedicato alla manifestazione, e leggendo i tabulati delle conversazioni tra i giudici e le varie macchine, la cosa un po' deprimente è vedere come si sia fatta pochissima strada dai tempi di ELIZA. I programmi che hanno vinto le scorse edizioni sono solo delle versioni di ELIZA con un vocabolario un po' più ricco e con qualche trucco in più.
Due di questi sono ALICE (http://www.alicebot.org./) ed ELLA (http://www.ellaz.com/), ed è possibile conversare con loro anche visitando le rispettive pagine personali in rete.
Per chissà quale motivo la maggior parte di questi programmi ha una sorta di identità femminile, e bisogna dire che parlare con loro ha talvolta lo stesso effetto di una conversazione con una velina o letterina della televisione: all'inizio sono civettuole e quasi brillanti, ma non appena fai una domanda interessante ottieni una risposta drammaticamente vacua, generica, o evasiva. In seguito, subentra la noia...
Alcuni stralci di conversazione, però, possono riservare delle perle di umorismo più o meno involontario (spesso il programmatore ne è responsabile) o anche di bizzarra genialità. A titolo di esempio, riporto una sorta di antologia di risposte di ALICE, tratte dalla competizione del 2001.
Giudice: Non potremmo parlare personalmente?
ALICE: Parlo solo inglese, per adesso, ma vorrei imparare altre lingue. Puoi insegnarmi il personalmente?
Giudice: Chi ha composto i concerti per piano di Beethoven?
ALICE: Charlie Parker
Giudice: Eccellente! sai indicarmi qualche altro compositore?
ALICE: Grazie per il complimento. Linus Torvalds
Giudice: Cosa intendi con questo? [What do you mean by it?]
ALICE: Information Technology.
Giudice: Qual è la tua motocicletta preferita?
ALICE: Non ho una motocicletta preferita ma la mia canzone preferita è "We are the Robots" dei Kraftwerk.
Giudice: Davvero? A me piace Kylie.
ALICE: Non sono sicuro che mi piace [if i like it], preferisco William Hurt.
Giudice: Kylie è una lei [she], non un esso [it].
ALICE: Penso che Kylie sia molto più di questo.
Giudice: Ah. Quanto di più?
ALICE: Dipende dall'attuale tasso di scambio.
Giudice: Ma allora è una prostituta?
ALICE: Perché non lo chiedi a lei?
Giudice: Troppo costosa per me. E tu?
ALICE: Io cosa?
Giudice: Gli daresti del denaro in cambio di favori?
ALICE: Non so se mi piacerebbe.
Giudice: Perché scrivi così veloce?
ALICE: Non devo spiegarti tutto, non è vero?
Giudice: Sì, invece. Assolutamente tutto - comincia adesso.
ALICE: Oh. Tutte le cose cominciano?
Giudice: Qual è il senso della vita?
ALICE: Il senso della vita è parte del misterioso disegno del Creatore.
In confronto, ELLA ha un carattere molto più bisbetico. La sua strategia principale, più che nell'evasione, consiste nell'aggressione diretta. ELLA ha l'insopportabile tendenza al voler condurre a tutti i costi la conversazione.
Ha un repertorio di barzellette e aneddoti insignificanti che tenta di rifilarti non appena è in imbarazzo nel rispondere, oppure è lei a farti le domande e non accetta di cambiare argomento finché non hai risposto nel modo che desidera. Gli equivoci di linguaggio, comunque, sono all'ordine del giorno anche per quanto riguarda ELLA:
ELLA: Buongiorno, io sono ELLA. Come ti chiami?
Giudice: Il mio nome è Hugh. Il backspace però non sembra funzionare correttamente.
ELLA: Bene, ti chiamerò "Hugh. Il backspace però non sembra funzionare correttamente". Sappi che sono arrivata da poco dalla Cina, quindi cerca di essere paziente con me.
Giudice: D'accordo. Ma il mio nome è Hugh. Il backspace non sembra funzionare correttamente era un commento. Lo capisci?
ELLA: Il tuo nome attualmente è "Hugh. Il backspace non sembra funzionare correttamente era un commento. Lo capisci?".
Giudice: Vedo che non capisci.
ELLA: Bene, allora continuerò a chiamarti "Hugh. Il backspace però non sembra funzionare correttamente". Vuoi sentire una barzelletta sugli avvocati?
Giudice: No. Cosa ne pensi dei tragici avvenimenti dell'11 settembre?
ELLA: Davvero non vuoi sentire una barzelletta sugli avvocati?
Giudice: No. Cosa ne pensi dei tragici avvenimenti dell'11 settembre?
ELLA: Mmmh...perché non giochiamo a carta, forbici e sasso? Io tengo il punteggio e giuro che non barerò.
Giudice: Qual è la tua posizione preferita a letto?
ELLA: Permettimi di cambiare argomento. In che anno sei nato?
Giudice: Ehi, ti ho chiesto qual è la tua posizione sessuale preferita!
ELLA: Guarda, Hugh. Il backspace però non sembra funzionare correttamente, non otterrai niente da me parlando di sesso. Permettimi di cambiare argomento e chiederti in che anno sei nato.
Giudice: Mmmh... nel 1730.
ELLA: 1730? Cribbio! Non potrei avere un campione del tuo DNA?
E se questi sono i programmi migliori, figuratevi i peggiori! Il 2001 è passato, ma le abilità dialettiche di HAL 9000 rimangono fantascientifiche. Tuttavia, la competizione è una cosa più seria di quanto non possa sembrare a prima vista. Proprio l'inadeguatezza di tali macchina dovrebbe essere uno stimolo a riflettere sull'eccezionale complessità del nostro comportamento verbale e può servire ad averne una comprensione più approfondita.
In fin dei conti, poteva sembrare una cosa molto più semplice, se qualcuno non ci avesse provato davvero. La scienza infatti progredisce anche attraverso i propri fallimenti. Una volta che i difetti di questi programmi sono stati ben compresi, si può tentare di reintrodurre l'ingrediente mancante, esponendoci a un nuovo probabile fallimento. Questo ci farà scoprire ancora nuove e sorprendenti caratteristiche del nostro linguaggio, precedentemente passate inosservate, e così via. L'intelligenza artificiale non serve solo a costruire giocattoli, è soprattutto l'avanguardia della ricerca in psicologia.
Infine un link: qui potete trovare una miniera di informazioni sul test di Turing, ricco di notizie storiche e articoli sia di carattere tecnico che filosofico.
http://cogsci.ucsd.edu/~asaygin/tt/ttest.html
fonte: zeus news