Boltz-1 - primul model complet open-source pentru predicția structurilor biomoleculare

©

Autor: Redacția ROmedic

Boltz-1 - primul model complet open-source pentru predicția structurilor biomoleculare

O echipă de oameni de știință de la Massachusetts Institute of Technology (MIT) a lansat un model AI puternic, denumit Boltz-1, care ar putea accelera semnificativ cercetarea biomedicală și procesul de dezvoltare a medicamentelor. Proiectul a fost derulat în cadrul Jameel Clinic for Machine Learning in Health de la MIT și s-a concretizat în primul model complet open-source, cu performanțe la nivelul AlphaFold3, tehnologia dezvoltată de Google DeepMind pentru predicția structurilor 3D ale proteinelor și altor molecule biologice.

Un proiect pentru comunitatea științifică

Studenții doctoranzi de la MIT, Jeremy Wohlwend și Gabriele Corso, s-au aflat în prima linie a dezvoltării Boltz-1, împreună cu cercetătorul afiliat Jameel Clinic Saro Passaro și profesorii MIT Regina Barzilay și Tommi Jaakkola. Ei au subliniat că principalul lor obiectiv este să promoveze o colaborare deschisă la nivel global, să grăbească descoperirile și să ofere un punct de plecare solid pentru îmbunătățirea modelării biomoleculare.

„Există un motiv pentru care l-am numit Boltz-1 și nu doar Boltz,” a spus Corso. „Vrem să-l îmbunătățim continuu și să atragem cât mai multă contribuție din partea comunității.”

Proteinele joacă un rol esențial în aproape toate procesele biologice, iar forma lor 3D influențează direct funcțiile pe care le îndeplinesc. Acest aspect face vitală înțelegerea structurii proteinelor pentru proiectarea de medicamente noi și pentru ingineria unor proteine cu proprietăți specifice. Totuși, procesul prin care lanțurile de aminoacizi se pliază în structuri 3D este deosebit de complex, iar predicția exactă a acestei structuri a reprezentat o provocare majoră de zeci de ani.

Boltz-1 vs. AlphaFold3

Deși AlphaFold2 – modelul anterioar de la DeepMind – a adus un salt remarcabil în predicția structurilor proteinelor (premiu Nobel pentru chimie, 2024), AlphaFold3 merge mai departe integrând un model AI de tip difuzie. Astfel, abordează într-un mod superior incertitudinea inerentă în predicțiile asupra proteinelor complexe. Cu toate acestea, AlphaFold3 nu este în totalitate open-source și nu poate fi folosit în scop comercial. Situația a generat controverse în comunitatea științifică și a declanșat o cursă globală pentru dezvoltarea unui model open-source.

 

În timp ce au folosit aceeași abordare inițială de tip difuzie ca AlphaFold3, cercetătorii de la MIT au analizat diferitele componente ale modelului și au introdus optimizări, concentrându-se pe algoritmi care sporesc acuratețea predicțiilor. În plus, ei au publicat întreg fluxul de lucru – de la antrenare la rafinare a modelului – pentru ca și alți specialiști să poată îmbunătăți varianta Boltz-1.

„Sunt extrem de mândră de echipa Jameel Clinic pentru lansarea Boltz-1,” a afirmat Barzilay. „Acest proiect a necesitat multă muncă și perseverență, iar ideile de viitor vor fi și mai interesante.”

Provocări în construirea unui model robust

Echipa a depus eforturi considerabile pentru a gestiona datele heterogene din Protein Data Bank (PDB), care reunește de peste 70 de ani structuri biomoleculare rezolvate prin metode experimentale. Wohlwend spune că organizarea și uniformizarea acestor date necesită o înțelegere aprofundată a domeniului, dar că investiția de timp a meritat:

„A fost nevoie de multe nopți târzii pentru a rezolva aceste date,” explică el. „Nu există scurtături; trebuie să cunoști foarte bine domeniul.”

În final, experimentele lor demonstrează că Boltz-1 poate atinge același nivel de acuratețe cu AlphaFold3 pe un set divers de structuri biomoleculare complexe.

„Realizările lor sunt impresionante,” adaugă Jaakkola. „Au muncit din greu pentru a extinde accesibilitatea în comunitatea științifică și acest pas va impulsiona semnificativ progresele în domeniul științelor moleculare.”

Planuri de viitor și invitație la colaborare

Cercetătorii intenționează să îmbunătățească în continuare Boltz-1, concentrându-se pe creșterea vitezei de predicție. Ei încurajează comunitatea științifică să testeze modelul, disponibil pe GitHub, și să se alăture Slack-ului dedicat, pentru schimb de idei și experiențe.

„Apreciem că există încă mulți ani de lucru pentru a perfecționa aceste modele,” spune Wohlwend. „Suntem nerăbdători să vedem contribuțiile și ideile ce vor veni din întreaga lume.”

Proiectul Boltz-1 a fost susținut de U.S. National Science Foundation, Jameel Clinic, Defense Threat Reduction Agency (DOMANE), precum și de Cancer Grand Challenges (prin parteneriatul Cancer Research UK – U.S. National Cancer Institute).


Data actualizare: 31-12-2024 | creare: 31-12-2024 | Vizite: 71
Bibliografie
Massachusetts Institute of Technology https://www.mit.edu/
Boltz on GitHub: https://github.com/jwohlwend/boltz

Image by freepik
©

Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!