Computerul care învaţă singur

Tendinte (de , October 7, 2010)

De la începutul acestui an, o echipă de cercetători de la Carnegie Mellon University, Pittsburgh, susţinută prin granturi provenite de la Defense Advanced Research Projects Agency şi Google, şi folosind un supercomputer furnizat de Yahoo, a pus la punct un sistem care încearcă să stăpânească semantica, învăţând ca un om. „Inima” sa este un computer subţire, de culoare gri argintiu, localizat într-un centru de computere din subsolul universtităţii, care calculează 24 de ore pe zi, şapte zile din şapte. Computerul a fost prevăzut de cercetători cu o serie de cunoştinţe primare în diverse categorii şi lăsat să rătăcească pe web cu misiunea de a învăţa singur.

Sistemul Never-Ending Language Learning system, sau NELL, scanează sute de milioane de pagini Web pentru modele de text pe care le foloseşte pentru a acumula cunoştinţe, 390.000 până în prezent, cu o acurateţe estimată de 87 de procente. Aceste cunoştinţe sunt grupate în categorii semantice – oraşe, companii, echipe sportive, actori, universităţi, plante şi alte 247 de categorii. Categoriile de cunoştinţe sunt de tipul „San Francisco este un oraş” şi „Floarea soarelui este o plantă”.

Cunoştinţele învăţate se adaugă la baza de date în continuă creştere a NELL, pe care cercetătorii o numesc „bază de cunoştinţe”. O bază mai extinsă, spune Dr. Tom M. Mitchell, conducătorul echipei de cercetare, va ajuta la perfecţionarea algoritmilor de învăţare folosiţi de NELL, astfel încât acesta va găsi cu timpul informaţii mult mai eficient şi cu o mai mare acurateţe. Scopul său este de a construi un sistem de învăţare continuă, care să deţină abilitatea de a extrage informaţii structurate din pagini Web nestructurate.

NELL învaţă, de asemenea, informaţii prin care să facă legături între membrii a două categorii. De exemplu, Peyton Manning este un jucător de fotbal (categorie). Indianapolis Colts este o echipă de fotbal (categorie). Prin scanarea modelelor de text, NELL poate deduce cu o un nivel ridicat de veridicitate că Peyton Manning joacă pentru Indianapolis Colts, deşi nu a citit niciodată că Manning joacă pentru Colts. „Joacă pentru” este o legătură şi există 280 de astfel de legături. Numărul de categorii şi legături s-a dublat de la începutul anului şi este în continuă expansiune.

NELL este doar unul dintre proiectele din domeniul din ce în ce mai vast de cercetare şi investiţii menit să le permită computerelor să înţeleagă mai bine sensul limbajului. Multe dintre aceste iniţiative folosesc Web-ul ca pe o resursă bogată de text, pentru a ajuta computerele să mimeze înţelegerea umană. Idealul este discutat de ani buni, iar cu peste un deceniu în urmă, Sir Tim Berners-Lee, cel care a inventat software-ul care stă la baza World Wide Web, a schiţat o versiune a „Web-ului semantic”.

Astăzi, computerele din ce în ce mai rapide, explozia de date de pe Web şi tehnicile software îmbunătăţite deschid calea către un progres rapid. Cercetători din cadrul universităţilor, laboratoare guvernamentale, Google, Microsoft, IBM şi alţii urmăresc descoperiri majore în domeniu.
Totuşi, experţii în domeniul inteligenţei artificiale sunt de acord că abordarea cercetătorilor de la Carnegie Mellon este inovatoare. Multe sisteme de învăţare semantice, precizează aceştia, sunt pasive, create în mare masură de programatori, în timp ce NELL are un nivel înalt de automatizare. „Interesant şi semnificativ la acest sistem este învăţarea continuă, în condiţiile în care NELL îşi exersează singur curiozitatea, cu puţin ajutor uman”, spune Oren Etzioni, cercetător la Universitatea din Washington, conducătorul unui proiect numit TextRunner, care citeşte pagini Web pentru a extrage cunoştinţe.

Computerele care înţeleg limbajul, spun experţii, ar putea deveni extrem de utile la un moment dat. Aplicaţiile potenţiale variază de la căutări mai inteligente (oferind răspunsuri în limbaj natural, nu doar link-uri către pagini Web) până la asistenţi virtuali care pot răspunde la întrebări privind discipline specifice sau activităţi ca sănătate, educaţie, călătorii sau cumpărături.

Sursa: The New York Times


Tags: , , , , , , , , ,

Trackbacks

Leave a Trackback