Vino si tu pe pagina de Facebook pentru o stire de stiinta, explicata simplu, in fiecare zi!
Pagina de Facebook!
În fiecare zi, o nouă fotografie din universul nostru fascinant împreună cu o explicaţie scrisă de către un astronom profesionist: Astronomy Picture Of the Day
   
Fizica Povestita

I
Fizica Povestita

Mecanismul prin care neuronii învață prin recompense și pedepse, descoperit la Cluj

Un cercetător clujean a descoperit un mecanism prin care o rețea de neuroni simulați pe calculator poate să învețe să aibă un anumit comportament, doar pe baza recompenselor și pedepselor primite de la cel care antrenează rețeaua. Mecanismul a fost descoperit prin deducție matematică și eficacitatea lui a fost demonstrată ulterior prin simulări pe calculator. Articolul care prezintă această descoperire a apărut în revista Neural Computation, cea mai importantă revistă științifică din domeniul rețelelor neuronale, revistă editată de prestigiosul Massachusetts Institute of Technology (MIT) din SUA.

Învățarea prin recompense și pedepse este tipul de învățare prin care, de exemplu, se dresează un animal. Chiar dacă un câine nu înțelege inițial care este sensul unei comenzi, dacă execută din întâmplare comanda și este apoi recompensat cu o bomboană, va învăța ulterior să facă lucrul cerut doar auzind comanda. Analog, dacă un animal sau un copil este pedepsit pentru că a făcut un anumit lucru, comportamentul respectiv va fi făcut mai rar în viitor. Mecanismul descoperit de Răzvan Florian, de la Centrul de Cercetări Cognitive și Neuronale (Coneural) din Cluj, elucidează modul în care această învățare poate avea loc prin modificarea tăriei conexiunilor dintre neuroni (celulele din creier). Modificarea tăriei unei conexiuni (sinapse) depinde de intervalele de timp dintre pulsurile emise de cei doi neuroni conectați și de mărimea recompenselor, respectiv a pedepselor primite.

Mecanismul a fost descoperit prin deducție matematică și eficacitatea lui a fost demonstrată ulterior prin simulări pe calculator. De exemplu, un vierme simulat pe calculator a învățat pe baza acestui mecanism să găsească o sursă de mâncare. Mecanismul folosește componente deja observate de neurologi în creier, și este deci foarte probabil ca să funcționeze și în creierul nostru.

Articolul care prezintă această descoperire a apărut în revista Neural Computation, cea mai importantă revistă științifică din domeniul rețelelor neuronale, revistă editată de prestigiosul Massachusetts Institute of Technology (MIT) din SUA. Este pentru prima dată când un articol din România este acceptat spre publicare în această revistă, înființată acum 18 ani.

Cercetătorii clujeni vor folosi în viitor metoda de învățare descoperită pentru instruirea roboților. „Prin acest tip de învățare, roboții ar putea fi instruiți de către orice utilizator, și ar putea să îndeplinească o gamă variată de sarcini, spre deosebire de roboții care pot avea doar comportamente stereotipe, implementate de programatori înainte de livrarea roboților către utilizatorii finali”, spune Florian.

Capacitatea de a învăța permanent, în interacțiune cu mediul, este crucială pentru ca roboții să poată fi folosiți în medii ale căror caracteristici se schimbă tot timpul, așa cum sunt o banală bucătărie, în care permanent apar schimbări în pozițiile obiectelor sau obiecte noi. Mecanismele de învățare de genul celui descoperit de Răzvan Florian sunt deci elemente critice pentru ca să putem avea în viitor roboți care să facă curățenie sau de mâncare în casă. Conform fondatorului Microsoft, Bill Gates, robotica va fi în următorii ani cel mai „fierbinte” domeniu al tehnologiei, urmând ca roboții să fie din ce în ce mai prezenți în viața noastră, în domenii cum ar fi asistența pentru oamenii în vârstă sau cu dizabilități sau industria construcțiilor.

Articolul științific în care a fost publicată descoperirea: R. V. Florian (2007), Reinforcement learning through modulation of spike-timing-dependent synaptic plasticity. Neural Computation 19 (6), pp. 1468-1502. http://www.mitpressjournals.org/doi/abs/10.1162/neco.2007.19.6.1468

Site-ul Centrului pentru Cercetări Cognitive și Neuronale: http://www.coneural.org/

2007-07-19

cristipresura
M-am născut în 1971 și am urmat studiile facultăților de electrotehnică și fizică. Am lucrat la Institutul de Fizică Atomică iar în 2002 am obținut doctoratul în fizică la Universitatea Groningen, Olanda, unde am caracterizat proprietățile optice ale sistemelor corelate de electroni, colaborând cu Anthony J Leggett, membru al comisiei de doctorat și laureat al premiului Nobel în fizică 2003. Am publicat în reviste de specialitate ca Physical Review Letters și Science. În prezent sunt cercetător la compania Philips, Olanda unde, împreună cu echipa mea, am inventat și introdus pe piață primul ceas capabil să măsoare pulsul sportivilor numai pe baza senzorilor optici. Sunt membru al asociației cercetătorilor români Ad Astra și fondator al asociației Știință pentru Toți.
cristipresura
Eindhoven (Olanda)

Abonează-te la newletter:

Caută în site



Formular de contact

Advertisment ad adsense adlogger