Machine learning, mai aproape de lumea reală

Tendinte (de , June 4, 2018)

Businessman explorers the digital world

Machine learning le permite computerelor se rezolve sarcini care, în mod normal, erau efectuate doar de oameni. De la maşinile autonome până la recunoaşterea vorbirii, machine learning generează o explozie a capabilităţilor inteligenţei artificiale, ajutând software-ul să înţeleagă lumea reală. Dar ce înseamnă exact machine learning şi ce face posibil actualul boom din acest domeniu?

La un nivel foarte înalt, machine learning reprezintă procesul de a învăţa un computer cum să facă predicţii exacte pe baza datelor introduse. De exemplu, aceste predicţii pot reprezenta răspunsuri la întrebări de tipul dacă un fruct dintr-o fotografie este măr sau banană, să indice persoane care traversează strada prin faţa unei maşini autonome, dacă să folosească cuvântul book într-o propoziţie legată de o carte sau de rezervarea unui hotel, dacă un email este spam sau să recunoască cu suficientă acurateţe vorbirea astfel încât să genereze titluri pentru un videoclip YouTube.

Principala diferenţă faţă de un software tradiţional este aceea că în cazul software-ului un dezvoltator a scris codul care îi arată sistemului cum să facă diferenţa între un măr şi o banană. În schimb, un model machine-learning a fost învăţat cum să facă diferenţa fiabilă între fructe, prin instruirea pe o cantitate mare de date, în acest caz un număr imens de imagini etichetate ca banană sau măr. Datele, multe date, constituie cheia care face machine learning posibil.

Care este diferenţa dintre AI şi Machine Learning?

Machine Learning s-a bucurat de un succes considerabil în ultima perioadă, dar reprezintă doar o metodă pentru obţinerea inteligenţei artificiale. La momentul apariţiei domeniului, la începutul anilor ’50, inteligenţa artificială a fost definită ca orice maşină capabilă să realizeze o sarcină care, în mod obişnuit, necesită inteligenţă umană. Sistemele AI demonstrează în general măcar o parte din următoarele caracteristici: planificare, învăţare, raţionament, rezolvarea problemei, reprezentarea cunoştinţelor, percepţie, mişcare şi manipulare, şi, într-o măsură mai mică, inteligenţă socială şi creativitate.

Alături de machine learning, există numeroase alte abordări folosite pentru a construi sisteme AI, inclusiv calculul evolutiv, unde algoritmi suferă mutaţii aleatorii şi combinaţii între generaţii în încercarea de a evolua soluţii optime şi sistemele expert, unde computerele sunt programate cu reguli care le permit să imite comportamentul unui expert uman într-un domeniu specific, de exemplu un sistem autopilot pentru avioane.

Care sunt principalele tipuri de machine learning?

Machine learning este în general împărţit în două categorii principale: învăţarea supervizată şi cea nesupervizată.

Ce înseamnă învăţarea supervizată?

Prin această abordare, maşinile învată, în principiu, prin exemple. În timpul instruirii pentru învăţarea supervizată, sistemele sunt expuse la o cantitate mare de date etichetate, de exemplu imagini ale unor cifre scrise de mână adnotate pentru a indica cărui număr îi corespund. Dându-i suficiente exemple, un sistem de învăţare supervizat ar învăţa să recunoască grupuri de pixeli şi forme asociate cu fiecare număr şi, eventual, să fie capabil să recunoască numere scrise de mână şi să facă distincţie cu acurateţe între numerele 9 şi 4 sau 6 şi 8.

Totuşi, instruirea acestor sisteme necesită volume imense de date etichetate, anumite sisteme fiind necesar să fie expuse la milioane de exemple pentru a stâpâni o sarcină.

Ca rezultat, seturile de date folosite pentru a instrui aceste sisteme pot fi vaste, ca de exemplu Open Images Dataset de la Google, cu aproximativ nouă milioane de imagini, depozitul video You Tube-8M cu legături la şapte milioane de fişiere video etichetate şi ImageNet, una dintre primele baze de date de acest tip, cu 14 milioane de imagini pe categorii. Iar dimensiunea acestor baze de date de instruire este în creştere, Facebook anunţând recent că a compilat 3,5 miliarde de imagini disponibile public pe Instagram, folosind hashtag-uri ataşate la fiecare imagine ca etichete. Folosirea unui miliard dintre aceste poze pentru a instrui un sistem de recunoaştere a imaginilor a obţinut niveluri record de acurateţe – 85,4 procente – într-un benchmark ImageNet.

 


Tags: ,

Trackbacks

Leave a Trackback