Dicembre 4, 2022

NbaRevolution

Covid crisi politica in Italia

Meta afferma di aver creato un modello di ripiegamento proteico di nuova generazione • The Register

I ricercatori di intelligenza artificiale di Meta affermano di aver sviluppato il più grande modello di ripiegamento proteico del suo genere fino ad oggi e che è in grado di prevedere la struttura di oltre 600 milioni di proteine.

Il gruppo il petto Il modello basato sull’adattatore ESM-2 di 15 miliardi di varianti e un database per le sue previsioni sulla struttura delle proteine, soprannominato Atlas Metagenomic ESM, Martedì. Questo database include isoforme proteiche che gli scienziati non hanno ancora osservato.

Le proteine ​​sono molecole biologiche complesse contenenti fino a 20 tipi di aminoacidi e svolgono tutti i tipi di funzioni biologiche negli organismi viventi. Fondamentalmente, sono piegati in complesse strutture 3D e la loro forma è vitale per il loro funzionamento; Sapere che aspetto ha aiuta gli scienziati a capire come funziona e da ciò li aiuta a scoprire modi per imitare, cambiare o contrastare quel comportamento.

Sfortunatamente, non puoi semplicemente prendere la composizione dell’amminoacido e lavorare immediatamente sulla struttura finale. Puoi eseguire simulazioni o sperimentare per scoprirlo, ma ciò richiede molto tempo. Al giorno d’oggi, è possibile fornire un software di apprendimento automatico opportunamente addestrato alla struttura chimica di una proteina e il modello prevederà rapidamente e, in modo relativamente accurato, la struttura.

In effetti, DeepMind ha dimostrato molto con il suo modello AlphaFold, che vincere – vincere Concorso biennale internazionale di piegatura delle proteine ​​CASP nel 2020. A causa di una catena di input di amminoacidi, AlphaFold e altri software di apprendimento automatico possono generare la struttura 3D corrispondente.

Da allora, i ricercatori della DeepMind con sede a Londra hanno migliorato il loro sistema orgoglioso La struttura di oltre 200 milioni di proteine ​​è nota alla scienza. L’ultimo sistema ESM di Meta è andato ancora oltre, prevedendo centinaia di milioni di persone dopo essere stato addestrato su milioni di sequenze proteiche.

Documento preliminare del team Meta – Lin et al – che spiega il design dell’ESM-2 può essere trovato qui. Interessante, secondo Ricercatori, il sistema è in effetti un grande modello linguistico progettato “per apprendere modelli evolutivi e generare accurate previsioni strutturali end-to-end direttamente dalle sequenze proteiche”. AlphaFold, ad esempio, non è un linguaggio modello e utilizza un approccio diverso.

READ  Il nuovo sistema Sennheiser AMBEO Soundbar Plus porta un'esperienza cinematografica a casa

Come osserva Boffin nel loro articolo, questi modelli linguistici di grandi dimensioni possono essere utilizzati per molto di più della semplice gestione dei linguaggi umani: “I modelli linguistici moderni con decine o centinaia di miliardi di parametri sviluppano capacità come la traduzione linguistica a scatto ridotto, il ragionamento logico e la matematica Risoluzione dei problemi Tutto senza esplicita supervisione.

“Queste osservazioni sollevano la possibilità di una forma parallela di apparizione da parte di modelli linguistici addestrati su sequenze proteiche”.

Il risultato è ESM-2, a cui, nonostante un modello linguistico, è stato insegnato a prevedere la forma fisica di una proteina da una stringa di testo che rappresenta gli amminoacidi.

ESM-2 è il modello più grande del suo genere, apparentemente prevede strutture più veloci di sistemi simili; È fino a 60 volte più veloce degli ultimi sistemi precedenti come AlphaFold o Rosetta, che possono richiedere più di dieci minuti per generare un output, secondo Meta.

Il modello è stato in grado di creare l’Atlante metagenomico ESM e ha previsto più di 600 milioni di strutture MGnify90 Database delle proteine ​​in sole due settimane con 2000 GPU. Su una singola GPU Nvidia V100, ci vogliono solo 14,2 secondi per simulare una proteina composta da 384 aminoacidi. Dal documento di ricerca risulta che Meta ha affermato che il suo sistema corrisponde principalmente, ma non completamente, ad AlphaFold in termini di precisione, sebbene la sua velocità sia la cosa fondamentale, consentendogli di prevedere più proteine.

“Utilizzare gli attuali strumenti computazionali all’avanguardia, prevedere le strutture di centinaia di milioni di catene proteiche in un lasso di tempo pratico può richiedere anni, anche utilizzando le risorse di un importante istituto di ricerca. Per fare previsioni a livello di metagenomica, una svolta nella velocità di previsione è fondamentale”, ha affermato il proprietario di Facebook.

READ  A Resident Evil: Infinite Darkness Cocalero sarà disponibile a luglio

Meta spera che l’Atlante metagenomico dell’ESM-2 e dell’ESM farà avanzare la scienza aiutando gli scienziati a studiare la storia dell’evoluzione o ad affrontare le malattie e il cambiamento climatico. “Per estendere ulteriormente questo lavoro, stiamo studiando come i modelli linguistici possono essere utilizzati per progettare nuove proteine ​​e contribuire a risolvere le sfide relative alla salute, alle malattie e all’ambiente”, ha concluso Pease. ®