Există o mare tentatie în a afirma că sistemele de calcul pot întelege lumea reală. Chiar asa să fie oare ?

Efectul ELIZA

Ioan Iacob

Pe la mijlocul anilor ‘60, Joseph Weizenbaum a scris un program faimos pe care l-a denumit ELIZA. Scopul declarat al acestui program era imitarea comportării unui psihoterapeut. Altfel spus, el trebuia să răspundă lamentatiilor "tastate" ale pacientilor printr-o serie de întrebări care nu erau altceva decât ecoul cuvintelor proprii - multe dintre întrebări încercând să forteze nota pentru a asigura continuarea conversatiei. Cele mai simple "smecherii sintactice" au convins multi oameni, care au interactionat cu ELIZA, crezând că programul întelege ceea ce spun ei si cunoaste necazurile exprimate.

Atunci când se exagerează în aprecierea posibilitătii calculatoarelor de a modela lumea reală avem de-a face cu ceea ce se numeste "efectul ELIZA". Acest efect poate fi definit prin susceptibilitatea oamenilor în ceea ce priveste întelegerea de către calculator a unor siruri de simboluri. De multe ori se pot auzi afirmatii de genul: calculatoarele scriu nuvele, calculatoarele înteleg cutare sau cutare fenomen, calculatoarele judecă abstract, calculatoarele fac descoperiri stiintifice.

De fapt toate aceste asa zise descoperiri, creatii sau analogii realizate de către calculator nu reprezintă decât o simplă prelucrare a unei scurte liste de asertiuni ca: Lichid(apă), MaiMare(Greutate(adult), Greutate(nounăscut)) si asa mai departe. În spatele acestor asertiuni nu există nici o altă reprezentare. Calculatorul nu are o reprezentare a ceea ce înseamnă un "lichid" sau a ceea ce înseamnă "mai mare". Practic, pentru a ne simti confortabil atunci când afirmăm că un calculator poate face o analogie între curgerea apei si transferul căldurii între două metale aflate în contact, ar trebui ca sistemul să stie că: apa este un lichid inodor si incolor care uneori se transformă într-o multime de picături mici, apa este afectată de gravitate luând forma vasului în care se află, poate acumula căldură, lemnul pluteste pe apă si multe altele.

Efectul Eliza este justificabil prin publicitatea exagerată pe care o realizează unele ziare si reviste pentru asa zisele realizări revolutionare în IA (Inteligentă Artificială). În realitate este vorba despre persistenta mentalitătii pe baza căreia se acceptă foarte usor caracterizarea antropomorfică a actiunilor calculatorului. Căderea în aceste capcane este o urmare a faptului că nu există încă o definitie larg acceptată a inteligentei, a modului în care lucrează mintea umană. Fiecare grup de cercetători încearcă să aducă dovezi pentru sustinerea propriilor teze privind modul în care lucrează mintea si pentru directiile de urmat în domeniul inteligentei artificiale. În continuare nu trebuie să vedem altceva decât o prezentare a unei noi modalităti de abordare a domeniului, apartinând scolii lui Douglas Hofstadter.

Intrarea în scenă

Douglas Hofstadter propune, prin intermediul cărtii sale Fluid Concepts and Creative Analogies (BasicBooks, 1995), un program de cercetare care îi poate enerva pe unii, îi poate inspira pe altii si pe cei mai multi îi bine-dispune. Afirmatiile lui Hofstadter apar ca o provocare pentru modul în care este abordat domeniul inteligentei artificiale în ziua de astăzi. Analogiile, spune el, reprezintă un mecanism foarte important atunci când ne referim la inteligentă si, în consecintă, ar trebui studiate mai atent în cadrul oferit de inteligenta artificială. De asemenea, majoritatea proiectelor de cercetare din prezent încearcă să modeleze gândirea fără a lua în considerare mecanismul perceptiei. Or pentru filozofie si psihologie este clar, de mult timp, că rationamentul nu poate fi despărtit de mecanismul perceptiei. Să vedem cum apare problema perceptiei în viziunea lui Douglas Hofstadter.

Încă din timpul lui Immanuel Kant este recunoscut faptul că fenomenul perceptiei are loc pe mai multe nivele: perceptia de nivel jos sau sensibilitatea priveste acumularea în formă brută a informatiilor despre mediul înconjurător prin intermediul organelor de simt; perceptia de nivel înalt se referă la organizarea datelor brute astfel încît ele să reflecte cât mai bine experienta în raport cu lumea înconjurătoare. În cazul perceptiei de nivel înalt avem de-a face cu două aspecte: 1) extragerea unui înteles din datele initiale apelând la concepte si 2) structurarea datelor la nivel conceptual. Acest domeniu se întinde de la recunoasterea obiectelor până la dezvoltarea unor relatii abstracte.

Perceptia de nivel înalt ne conduce direct la problema reprezentării mentale. Reprezentările sunt fructe ale perceptiei. Pentru ca datele brute să fie structurate într-un mod coerent ele trebuie să treacă printr-un proces de filtrare si organizare. Acest proces de filtrare va da nastere unei reprezentări structurate care să poată fi utilizată de minte în cât mai multe situatii. Una dintre primele întrebări care se pun în raport cu reprezentările mentale priveste structura lor precisă. De aceeasi importantă este întrebarea privind modul în care se formează aceste reprezentări pornind de la datele brute. Procesul formării reprezentărilor mentale naste o serie de întrebări: Cum sunt influentate reprezentările de context? Cum se poate modifica radical perceptia noastră în raport cu o situatie, atunci când este necesar? În care fază a procesului de perceptie se accesează conceptele?

Microdomenii

De-acum este foarte clar că avem nevoie de un model al perceptiei de nivel înalt. Problema este că acest model trebuie să aibă la bază perceptia de nivel jos. Or aceasta din urmă este foarte complexă si succesul în modelarea ei este foarte limitat la ora actuală. Distanta dintre perceptia de nivel jos (celule ale retinei, pixelii ecranului, undele sonore) si cea de nivel înalt este foarte mare la ora actuală.

Există totusi o posibilitate de a atinge acest scop. Realitatea poate fi foarte complexă dar dacă se restrânge domeniul atunci totul devine fezabil. Dacă în locul încercării de modelare a lumii reale se creează o lume artificială, mai simplă, pentru studiul perceptiei de nivel înalt atunci problemele devin rezolvabile. Din păcate, ne spune Hofstadter, microdomeniile au căzut în dizgratie în cazul inteligentei artificiale datorită pe de o parte imposibilitătii atingerii succesului într-o perioadă scurtă de timp, iar pe de altă parte datorită ambitiei de a modela "lumea reală". În cazul proiectelor care afirmă că realizează modelarea lumii reale, nu este vorba despre altceva decât despre simple structuri bazate pe logica predicatelor. Desi microdomeniile reprezintă niste lumi artificiale, ele permit studierea problemelor perceptiei si rationamentului datorită evitării complexitătii lumii reale. Odată ce se întelege modul în care se desfăsoară procesele cognitive într-un domeniu restrâns, s-a făcut un pas spre întelegerea aceluiasi fenomen în lumea reală.

Ceea ce este important de relevat, spune Hofstadter, este că realizarea analogiilor ajută la formarea perceptiilor din fiecare zi. Cu alte cuvinte perceptia este dependentă de procesul analogiilor. Oamenii interpretează, în mod constant, noile situatii în termenii situatiilor mai vechi, deja cunoscute. În momentul în care ei fac acest lucru, spunem că utilizează analogiile pentru a construi reprezentări îmbogătite ale diverselor situatii. În sustinerea afirmatiilor Hofstadter dă o multime de exemple din viata reală, exemple dintre care am selectat unul.

Atunci când controversata carte Versete Satanice a fost interzisă de către iranieni si autorul cărtii a fost amenintat cu moartea, multi americani au avut o reactie imediată în ceea ce priveste condamnarea actiunilor musulmanilor iranieni. Interesant este faptul că unele dintre figurile de seamă ale bisericii crestine din America au avut o reactie foarte diferită. Văzând o analogie între carte si filmul Ultima ispită a lui Hristos, care a fost interzis fiind considerat o blasfemie, aceste figuri ale bisericii crestine au avut o atitudine ezitantă în condamnarea actiunii iraniene. Perceptia lor asupra situatiei a fost modificată semnificativ de analogia realizată între cele două fenomene.

FARGonautii

Bineînteles că teoria ar trebui sustinută si de o serie de aplicatii practice. Or cartea amintită prezintă proiectele dezvoltate pe parcursul ultimilor 15 ani si planurile de viitor ale grupului de cercetare. Profesorul Douglas Hofstadter a fost ajutat în implementarea ideilor sale de grupul FARGonautilor - acronimul FARG provenind de la Fluid Analogies Research Group. De ce Analogies am explicat putin mai înainte. Interesantă este motivatia pentru folosirea analogiei dintre un fluid si filozofia adoptată de grupul FARG.

Un fluid răspunde presiunilor suplimentare schimbându-si în mod constant forma într-o manieră suplă. În acelasi timp, un fluid nu suferă de rigiditate ca în cazul unui solid, sau în cazul unui gaz. De unde provin aceste proprietăti speciale? Bineînteles că este vorba despre stratul molecular invizibil.

Moleculele de apă, conform teoriei, realizează asociatii ca urmare a atomului de hidrogen care este atras de atomul de oxigen al celeilalte molecule, atunci când cele două molecule sunt suficient de apropiate. Dacă acest model este corect atunci înseamnă că în cadrul fiecărei picături de apă, trilioane de legături moleculare se fac si se desfac în fiecare microsecundă, într-o liniste totală si invizibil ochiului uman. Datorită acestui substrat instabil, dinamic, stohastic, apa prezintă o serie de proprietăti care ne apar de o manieră stabilă. În acelasi mod, filozofia grupului FARG este un rezultat al nenumăratelor acte subcognitive care se desfăsoară în paralel. Conceptele sunt caracterizate de fluiditate si analogiile reprezintă o manifestare a chintesentei acestora.

Seeking Whence

Pentru cei care au tinut în mână o revistă de rebus (si nu sunt putini) sau o carte de matematică distractivă, nu sunt străine probleme de genul "Care este următorul termen al seriei 1, 2, 2, 3, 3, 3, 4, 4, 4, 4.....?". Pentru a da un răspuns problemei, încerc să ghicesc o solutie bazându-mă pe ideea sugerată de primele numere ale seriei. Apoi calculez câtiva termeni si dacă solutia ghicită în prima fază se confirmă, totul este OK. De obicei mă trezesc într-o buclă care mă obligă să trec de mai multe ori prin faza de ghicire a solutiei si apoi prin faza de verificare a acesteia.

Pentru început, preocupările lui Hofstadter au vizat crearea de programe capabile să rezolve inteligent probleme simple, folosind analogiile. Unul dintre acestea este chiar cel denumit "Seeking Whence", program ce încearcă să rezolve analogii de tipul celei de mai sus. Un program bun trebuie să găsească următorul termen pentru oricare dintre seriile de mai jos:

1, 4, 9, 16, 25, 36, ...
2, 3, 5, 7, 11, 13, 17, 19, ...
3, 5, 11, 17, 31, 41, 47, 59, ...
1, 1, 3, 4, 2, 2, 5, 6, 7, ...
2, 1, 2, 1, 1, 4, 1, 1, 6, 1, 1, ...

Hofstadter încearcă să modeleze, cât mai bine posibil, felul în care rezolvă el o astfel de problemă. Cu alte cuvinte el nu încerca să proiecteze cel mai bun rezolvitor de probleme ci încerca să realizeze cel mai bun model al felului în care oamenii rezolvă problemele ce implică secventele de numere întregi. Se poate spune că avem de-a face cu o încercare de modelare a activitătii mentale.

Dat fiind faptul că nu este foarte clar cum se poate caracteriza activitatea mentală a omului (adică nu se poate spune cum lucrează mintea pentru a rezolva problemele ce implică secventele de numere întregi) Hofstadter a tăiat nodul gordian bazându-se pe introspectie. El încerca să-si releve care sunt pasii urmati în rezolvarea acestor probleme si căror erori era expus.

Oricum, la prima încercare de proiectare a programului a căzut într-o cursă. Având o serie de cunostinte despre proprietătile numerelor (27 este un cub, toate numerele a căror ultimă cifră este 5 pot fi o putere a lui 5 si asa mai departe), le-a inclus în cadrul programului. Or gândindu-se mai târziu la calea abordată în scrierea programului, a ajuns la concluzia că era gresită dacă scopul propus privea studiul inteligentei în general. Cu cât programul se baza mai mult pe cunostintele privind proprietătile numerelor cu atât se folosea mai putin de strategiile generale de rezolvare a problemelor. După cum spune el, a căzut în cursa sistemelor expert: credinta că esenta inteligentei este reprezentată de tot mai multe si mai multe cunostinte.

De la Seek-Whence la Jumbo si Copycat

În momentul în care primul proiect a fost definitivat, s-au conturat câteva idei care guvernează modelarea proceselor mentale cu ajutorul calculatorului. Aceste idei au devenit fundamente ale filozofiei FARG, pe baza lor realizându-se următoarele proiecte de cercetare. Iată-le:

În următorii ani grupul FARG a proiectat o serie de aplicatii care implementau ideile enuntate mai înainte.

"Jumbo" este numele unui program proiectat pentru rezolvarea anagramelor care apar în mod obisnuit în revistele de rebus. Ceea ce trebuie remarcat în mod deosebit relativ la acest program este faptul că, la proiectarea sa, a fost evitată capcana sistemelor expert. Altfel spus, programul nici nu dispune măcar de un dictionar - lucru iesit din comun, din punctul de vedere al abordării actuale, pentru o aplicatie care se ocupă de identificarea cuvintelor. Atunci se pune întrebarea, totusi, cum reuseste să găsească solutiile problemelor?

Programul Jumbo "construieste cuvintele" prin referire la regulile despre limba engleză, pe care le contine. Regulile se referă la modul în care se pot forma grupurile de litere din consoane si vocale, cum se formează silabele din grupurile de litere, cum se construiesc cuvintele din silabe. La reconstruirea unui cuvânt, Jumbo începe prin izolarea unitătilor atomice (litere) si continuă prin construirea graduală a diferitelor "molecule conceptuale". Aceste molecule conceptuale se situează pe diferite nivele: grupuri de litere, silabe si cuvinte. Acum poate că este destul de clar de ce nu se utilizează un dictionar: este irelevant în modelarea proceselor mentale.

Un alt proiect al grupului FARG este reprezentat prin programul "Numbo". Acesta are ca scop construirea unui număr întreg prin aplicarea unei serii de operatii de adunare, înmultire, împărtire asupra unui set de cinci sau mai multe numere. O problemă specifică microdomeniului investigat de acest program poate fi următoarea: "Obtineti numărul 114 prin aplicarea operatiilor aritmetice asupra lui 11, 20, 7, 1 si 6". În rezolvarea acestor probleme, Numbo aplică aceleasi principii ca si programul Jumbo. Practic se poate afirma că Numbo si Jumbo reprezintă acelasi program aplicat unor domenii diferite.

Unul dintre cele mai substantiale proiecte este intitulat CopyCat. Acest program rezolvă analogii de genul: "Sirul abc se transformă în abd. Fă acelasi lucru cu sirul xyz" sau "Sirul abc este transformat în abd. Aplicati aceeasi transformare sirului mrj".

Există de asemenea un poiect denumit Letter Spirit ce are ca scop proiectarea unor noi grupuri de fonte pe baza celor existente, prin extrapolarea unor modele (pattern). Explicatii suplimentare relativ la proiectele amintite aici se pot găsi în cadrul cărtii sau vizitând paginile celor care au participat la realizarea lor - profesori de la MIT, Universitatea din Indiana etc.

Dacă ar fi să răspund la întrebarea "Cum vi se par toate aceste proiecte?" cred că as răspunde prin afirmatia: realizările FARG sunt extrem de interesante si foarte promitătoare. Suntem oare calati pe directia cea bună sau mai avem de asteptat?.

Concluzii

Prin sustinerea acestei directii de cercetare Hofstadter nu neagă retelele neuronale, de exemplu. Fiecare dintre directiile urmate au adus un beneficiu care nu poate fi negat. Fapt este că se simte nevoia unei revolutionări a domeniului. Si, în orice caz, întrebarea de bază persistă. Pot masinile să devină inteligente? Probabil că nu putem să ne asteptăm la un răspuns satisfăcător în etapa actuală - era informatională. Dar cine stie, poate că în era post-informatională... nu va mai fi nevoie să găsim un răspuns.

Singurul lucru de care nu trebuie să uităm este că prin exagerarea capacitătii programelor nu putem ajunge la rezolvarea problemelor ce ne preocupă. Cu alte cuvinte: "Atentie la efectul ELIZA!".

Domnul Ioan Iacob este redactor la BYTE România. Îl puteti contacta prin e-mail la:  iiacob@agora.ro.

(C) Copyright Computer Press Agora