Rad Marije Brbić, Frana Supeka i suradnika sa Zavoda za elektroniku, objavljen je u uglednom časopisu Nucleic Acids Research, koji se bavi najnovijim dostignućima u molekularnoj biologiji, i koji spada među šest posto najboljih časopisa u kategoriji.
"Naš tim je stvorio algoritme koji uče kako raspoznavati značajke različitih vrsta bakterija kroz analize tekstova Wikipedije, studentskih radova, te stručnih izvora", objašnjava Fran Supek i dodaje da je važnost takvih algoritama velika jer je obim znanstvene literature i sveukupnog sadržaja na internetu sve veći i veći, pa istraživači teško mogu pratiti sve nove informacije koje se pojavljuju.
Istraživanjem su znanstvenici usavršili računalne statističke tehnike koje mogu u samo nekoliko minuta "pročitati" i "razumjeti" tisuće tekstova u dovoljnoj mjeri da iz njih prepoznaju značajke živih organizama, za koje bi inače istraživačima trebale godine iščitavanja literature, kaže se.
Gensko susjedstvo
Taj rad otkriva da i poredak gena na kromosomima, koji se znatno razlikuje između živih organizama, vrlo dobro odražava mnoge njihove značajke.
Primjerice, mikrobi koji stvaraju spore i time preživljavaju teške uvjete čak i stotinama godina, pokazuju vrlo karakteristična "genska susjedstva" koja nisu prisutna u mikrobima koji ne mogu stvoriti spore.
"Umjetna inteligencija razmatrala je više od milijun kombinacija raznovrsnih značajki i bakterijskih vrsta. Za provjeru svake od njih čovjeku-istraživaču trebale bi godine iščitavanja literature. Naši algoritmi će s lakoćom obrađivati i nadolazeću literaturu u budućnosti, i automatski je povezati sa genskim zapisom organizama", zaključuje Supek.
Rad je nastao u okviru projekta Europske unije pod nazivom MAESTRA, te uključuje suradnju sa skupinom Anite Kriško s Mediteranskog Instituta za istraživanje života u Splitu.
Rezultati računalnih predviđanja su slobodno dostupni preko Web baze podataka, koju je izradio Matija Piškorec s Instituta Ruđer Bošković.