Risolto il mistero del ripiegamento delle proteine, una scoperta che potrebbe rivoluzionare la ricerca medica (VIDEO)

Una ricerca scientifica durata 50 anni e risolta grazie all’intelligenza artificiale. La struttura delle proteine è correlata a quasi tutte le malattie

[1 Dicembre 2020]

Nel suo discorso di accettazione per il Premio Nobel per la Chimica del 1972, Christian Anfinsen postulò che, in teoria, la sequenza di amminoacidi di una proteina  dovrebbe determinare completamente la sua struttura. Un’ipotesi che ha dato il via a una ricerca durata quasi 50 anni per cercare di prevedere computazionalmente la struttura 3D di una proteina basata esclusivamente sulla sua sequenza di amminoacidi 1D come alternativa complementare a metodi sperimentali costosi e che richiedono tempo. Un grosso e apparentemente irrisolvibile problema era “il ripiegamento delle proteine”, visto che il numero di modi in cui una proteina potrebbe teoricamente piegarsi prima di stabilizzarsi nella sua struttura 3D finale è astronomico. Nel 1969 Cyrus Levinthal notò che sarebbe stato necessario più tempo dell’età dell’universo conosciuto per enumerare tutte le possibili configurazioni di una normale proteina mediante e stimava in 10 ^ 300 le possibili conformazioni  per una proteina comune. Eppure, in natura, le proteine ​​si piegano spontaneamente, alcune in pochi millisecondi, una dicotomia che viene indicata come  il paradosso di Levinthal.

I ricercatori di DeepMind, un AI lab londinese, spiegano che «Le proteine ​​sono essenziali per la vita, supportando praticamente tutte le sue funzioni. Sono molecole grandi e complesse, costituite da catene di amminoacidi e quel che fa una proteina dipende in gran parte dalla sua struttura 3D unica». Per capire in che modo si ripiegano le proteine hanno addestrato il sistema con idati disponibili pubblicamente costituiti da circa 170.000 strutture proteiche provenienti dalla  protein data bank  e con   grandi database  contenenti sequenze proteiche di struttura sconosciuta. A DeepMind spiegano ancora che il sistema «Utilizza circa 128  TPUv3 core (equivalenti approssimativamente a ~ 100-200 GPU) eseguiti in poche settimane, che è una quantità relativamente modesta di elaborazione nel contesto della maggior parte dei modelli all’avanguardia utilizzati oggi nel machine learning».

Ieri, dopo quasi 50 anni di ricerche, sull’abstact book del “Fourteenth Critical Assessment of Techniques for Protein Structure Prediction”un team di ricercatori di DeepMind e dell’università nazionale di Seoul ha reso note le anticipazioni dello studio “High Accuracy Protein Structure Prediction Using Deep Learning” e che sembrano aver risolto il “problema del ripiegamento delle proteine”.  A DeepMind  sottolineano che »In un importante progresso scientifico, l’ultima versione del nostro sistema AI AlphaFold è stata riconosciuta come una soluzione a questa grande sfida dagli organizzatori della biennale Critical Assessment of protein Structure Prediction (CASP). Questa svolta dimostra l’impatto che l’AI può avere sulla scoperta scientifica e il suo potenziale per accelerare notevolmente il progresso in alcuni dei campi più fondamentali che spiegano e modellano il nostro mondo».

All’interno di ogni cellula, migliaia di proteine ​​diverse costituiscono il meccanismo che mantiene in vita e in salute tutti gli esseri viventi, dagli esseri umani e dalle piante ai batteri. Quasi tutte le malattie, i<compreso il  cancro, la demenza e persino le malattie infettive come il Covid-19, sono correlate al modo in cui funzionano queste proteine. I ricercatori hanno annunciato sul 14esimo CASP ​​(CASP14)  di aver trovata una soluzione a questa sfida utilizzando l’intelligenza artificiale.

Basandosi sul lavoro di centinaia di ricercatori in tutto il mondo, il programma di intelligenza artificiale AlphaFold ha dimostrato di essere in grado di determinare la forma di molte proteine e con un livello di precisione paragonabile a quello ottenuto con esperimenti di laboratorio costosi e che avevano richiesto moltissimo tempo.

CASP14 è organizzato da John Moult, dell’università del Maryland, Krzysztof Fidelis e Andriy Kryshtafovych, dell’università della California – Davis;  Torsten Schwede, dell’università di Basilea e dell’Istituto svizzero di bioinformatica SIB e Maya Topf dell’Università di Londra e del Centre for Structural Systems Biology  di  Amburgo. E Moult ricorda che «Le proteine ​​sono molecole estremamente complicate e la loro precisa struttura tridimensionale è fondamentale per le molte funzioni che svolgono, ad esempio l’insulina che regola i nostri livelli di zucchero nel sangue e gli anticorpi che ci aiutano a combattere i livelli di zucchero nel sangue e le infezioni, Anche piccoli riarrangiamenti di queste molecole vitali possono avere effetti catastrofici sulla nostra salute. Quindi uno dei modi più efficaci per comprendere la malattia e trovare nuovi trattamenti è studiare le proteine ​​coinvolte. Ci sono decine di migliaia di proteine ​​umane e molti miliardi nelle altre specie, inclusi batteri e virus (…) Ecco perché la nostra comunità di scienziati ha lavorato alla sfida biennale del CASP».

I team che partecipano al CASP ricevono le sequenze di amminoacidi di un pool di circa 100 proteine. Mentre gli scienziati studiano le proteine ​​in laboratorio per determinarne la forma sperimentalmente, circa 100 team CASP partecipanti da più di 20 paesi cercheranno di fare lo stesso usando i computer. I risultati vengono valutati da scienziati indipendenti.

Fidelis spiega che «L’approccio CASP ha creato un’intensa collaborazione tra i ricercatori che lavorano in questo campo della scienza e abbiamo visto come ha accelerato i progressi scientifici. Da quando abbiamo accettato la sfida per la prima volta nel 1994, abbiamo assistito a una serie di scoperte, ognuna delle quali ha risolto un aspetto di questo problema, così che i modelli informatici delle strutture proteiche sono diventati progressivamente più utili nella ricerca medica».

Vincendo l’ultimo round della sfida, AlphaFold di DeepMind ha determinato la forma di circa due terzi delle proteine ​​con una precisione paragonabile agli esperimenti di laboratorio. Anche la precisione di AlphaFold è stata con la maggior parte delle altre proteineè stata elevata, anche se non del tutto a quel livello.

Gli organizzatori del CASP evidenziano che «Questo successo si basa sui risultati ottenuti nei precedenti round del CASP, sia dal team DeepMind che da altri partecipanti. Anche altri team che partecipano a CASP14 hanno prodotto alcune strutture ad alta precisione durante questo round».

Kryshtafovych sottolinea che «Quel che ha ottenuto AlphaFold è davvero notevole e l’annuncio di oggi è una vittoria per DeepMind, ma è anche un trionfo per la scienza di team. Il modo unico e intenso con cui collaboriamo con ricercatori di tutto il mondo il mondo attraverso CASP e il contributo di molti team di scienziati nel corso degli anni ci hanno portato a questa svolta. Essere in grado di studiare la forma delle proteine ​​in modo rapido e accurato ha il potenziale per rivoluzionare le scienze della vita. Ora che il problema è stato ampiamente risolto per le singole proteine, è aperta la strada per sviluppo di nuovi metodi per determinare la forma dei complessi proteici: raccolte di proteine ​​che lavorano insieme per formare gran parte del meccanismo della vita e per altre applicazioni».

Un valutatore CASP, Andrei Lupas, direttore del Max-Planck-Institut für Entwicklungsbiologie, sottolinea che «I modelli sorprendentemente accurati di AlphaFold ci hanno permesso di risolvere una struttura proteica sulla quale eravamo rimasti bloccati per quasi un decennio, rilanciando il nostro lavoro per capire come i segnali vengono trasmessi attraverso le membrane cellulari».

Dame Janet Thornton, direttrice emerita dell’EMBL’s European Bioinformatics Institute (EMBL-EBI), che non è affiliato con CASP o a DeepMind, ha commentato così i risultati della ricerca: «Uno dei più grandi misteri della biologia è il modo in cui le proteine ​​si piegano per creare strutture tridimensionale squisitamente unico. Tutto, dai più piccoli batteri alle piante, agli animali e all’uomo, è definito e alimentato dalle proteine ​​che lo aiutano a funzionare a livello molecolare. Fino ad ora, questo mistero era rimasto irrisolto e determinare la struttura di una singola proteina spesso ha richiesto anni di sforzi sperimentali. E’ straordinario vedere il trionfo della curiosità, dello sforzo e dell’intelligenza umana per risolvere questo problema. Una migliore comprensione delle strutture delle proteine ​​e la capacità di prevederle utilizzando un computer significa una migliore comprensione della vita, dell’evoluzione e, ovviamente, della salute e delle malattie umane».

Videogallery

  • Protein folding explained

  • AlphaFold: The making of a scientific breakthrough