Da dove vengono i virus? L’intelligenza artificiale sta trovando le risposte
L'intelligenza artificiale (IA) sta aiutando a ridisegnare l'albero genealogico dei virus. Le strutture proteiche previste generate da AlphaFold e i "modelli di linguaggio proteico" ispirati ai chatbot hanno scoperto alcune sorprendenti connessioni in una famiglia di virus che include agenti patogeni che infettano gli esseri umani e minacce emergenti.
Lo studio “Mapping glycoprotein structure reveals Flaviviridae evolutionary history”, pubblicato su Nature da un team di ricercatori delle università di Sydney e Glasgow dimostra la forza di un approccio basato sulla struttura nei flavivirus, un gruppo che include i virus dell'epatite C, della dengue e dello Zika, nonché alcuni importanti patogeni e specie animali che potrebbero rappresentare nuove minacce per la salute umana.
All’università di Glasgoe spiegano che «Gran parte della comprensione dell'evoluzione virale da parte degli scienziati si basa su confronti di genomi. Ma l'evoluzione fulminea dei virus, in particolare quelli con genomi scritti in RNA, e la loro tendenza ad acquisire materiale genetico da altri organismi significano che le sequenze genetiche possono nascondere relazioni profonde e distanti tra i virus, che possono anche variare a seconda del gene esaminato. Al contrario, le forme, o strutture, delle proteine codificate dai geni virali tendono a cambiare lentamente, il che rende possibile scoprire queste connessioni evolutive nascoste».
Ma Joe Grove, virologo molecolare dell’università di Glasgow che ha guidato il team di ricerca, ricorda che «Fino al nascere di strumenti come AlphaFold, che possono prevedere le strutture proteiche su larga scala, non era possibile confrontare le strutture proteiche in un'intera famiglia virale».
Infatti, gran parte della comprensione scientifica dell'evoluzione dei flavivirus si basava su sequenze di enzimi a lenta evoluzione che copiano il loro materiale genetico. Ma i ricercatori sanno molto poco sulle origini delle proteine che i flavivirus usano per invadere le cellule e che determinano la gamma di ospiti che possono infettare. Grove sostiene che «Questa lacuna ha rallentato lo sviluppo di un vaccino efficace contro l'epatite C , che uccide centinaia di migliaia di persone ogni anno. A livello di sequenza, le cose sono così divergenti che non possiamo dire se sono correlate o meno. L'avvento della previsione della struttura proteica svela l'intera questione e possiamo vedere le cose molto chiaramente».
I ricercatori hanno utilizzato il modello AlphaFold2 di DeepMind ed ESMFold, uno strumento di previsione della struttura sviluppato dal gigante della tecnologia Meta, per generare più di 33.000 strutture previste per proteine da 458 specie di flavivirus. ESMFold si basa su un modello linguistico addestrato su decine di milioni di sequenze proteiche. A differenza di AlphaFold, richiede solo una singola sequenza di input, anziché basarsi su più sequenze da proteine simili, quindi potrebbe essere particolarmente utile per esaminare i virus più misteriosi.
Le strutture previste hanno permesso agli autori dello studio di identificare proteine che favoriscono l’ingresso virale con sequenze molto diverse da quelle dei flavivirus noti. Hanno scoperto alcuni collegamenti inaspettati: «Ad esempio, il sottoinsieme di virus che include l'epatite C infetta le cellule utilizzando un sistema simile a quello scoperto nei pestivirus, un gruppo che include il virus della peste suina classica, che causa la febbre emorragica nei maiali, e altri patogeni animali».
I confronti consentiti dall'intelligenza artificiale hanno dimostrato che questo sistema di ingresso è distinto da quelli di molti altri flavivirus. Grove fa notare che «Per l'epatite C e i suoi parenti, non sappiamo da dove provenga il suo sistema di ingresso. Potrebbe essere stato “inventato” da quei virus molto tempo fa».
Le strutture previste hanno anche rivelato che le proteine che favoriscono i virus di Zika e dengue hanno le stesse origini di quelle che Grove descrive come «Flavivirus strani e meravigliosi, con genomi giganti», tra cui il virus della zecca Haseki, che può causare febbre negli esseri umani. Un'altra grande sorpresa è stata la scoperta che alcuni flavivirus hanno un enzima che sembra essere stato rubato ai batteri.
la virologa Mary Petrone, dell'università di Sydney e principale autrice dello studio “A ~40-kb flavi-like virus does not encode a known error-correcting mechanism” pubblicato a luglio su PNAS, evidenzia che questo «Sarebbe senza precedenti, se non fosse per la scoperta fatta quest'anno dal mio team di un furto simile in una specie di flavivirus particolarmente strana e meravigliosa. La pirateria genetica potrebbe aver giocato un ruolo più importante nel plasmare l'evoluzione dei flaviviridi di quanto si pensasse in precedenza».
David Moi, un biologo computazionale dell'Université de Lausanne che non ha partecipato allo studio, ha commentato su Nature: «Lo studio sui flavivirus è la punta dell'iceberg e le storie evolutive di altri virus e persino di alcuni organismi cellulari saranno probabilmente riscritte con l'intelligenza artificiale. Racconteremo le loro storie con una nuova generazione di strumenti. Ora che possiamo vedere un po' più lontano, tutte queste cose dovranno avere un piccolo aggiornamento».