Specialistii de la Universitatea din Cambridge au realizat un studiu pentru a demonstra rolul pe care il joaca modelele de prelucrare ale limbajului natural in descifrarea limbajului biologic al bolilor neurodegenerative, precum Alzheimerul, Parkinson si bolile Huntington.
In realizarea obiectivului, oamenii de stiinta au adoptat o metoda similara cu cea utilizata de companiile tehnologice pentru a genera predictii pe baza comportamentului anterior al utilizatorilor, cum ar fi textul sugerat in e-mailuri, mesaje sau recomandari de continut.
Unul dintre autorii studiului, Kadi Liis Saar, a pus bazele unui limbaj pe scara larga pentru a putea observa ce schimbari apar in organism in momentul in care proteinele, elemente complexe si esentiale pentru functia, structura si reglarea tesuturilor, urmeaza un curs defectuos, crescand riscul de a dezvolta boli.
Unul dintre domeniile pe care cercetatorii s-au concentrat mai mult in ultimii ani a fost comportamentul proteinelor in conditii neurodegenerative. Se pare ca in cazul bolilor mentionate mai sus, proteinele formeaza aglomerari si ucid celulele nervoase sanatoase. De asemenea, cercetatorii au descoperit ca o parte dintre aceste agregari periculoase formeaza picaturi de proteine condensate care nu au membrana si care se imbina liber intre ele, iar spre deosebire de agregatele proteice, condensatele proteice se pot forma si reforma.
Cercetatorii au introdus toate datele detinute despre proteinele cunoscute, astfel incat modelul lor sa poata invata sa prezica „limbajul proteinelor” in acelasi mod in care modelele invata sa prezica limbajul uman, iar pe baza rezultatelor obtinute, oamenii de stiinta au reusit sa isi dea seama de tiparele care conduc doar anumite proteine la formarea condensatelor care ii va conduce pe acestia la o mai buna intelegere despre cum functioneaza aceste reguli care stau la baza functionarii „limbajului bolii”.