CodeFP: Un Nuovo Modello per la Progettazione De Novo di Proteine Funzionali
Uno studio pubblicato su arXiv (2605.00948) presenta CodeFP, un modello co-generativo progettato per creare proteine funzionali da zero. Questo modello decodifica efficacemente sia i token di sequenza che di struttura, consentendo di raggiungere la funzionalità e la ripiegabilità desiderate, affrontando così le carenze degli attuali metodi di mappatura diretta e disaccoppiata. Utilizzando strutture locali funzionali, CodeFP arricchisce le codifiche semantiche e incorpora una supervisione funzionale ausiliaria per mitigare le ambiguità di addestramento associate alle mappature struttura-funzione uno-a-molti. Le implicazioni di questa ricerca sono particolarmente rilevanti per i campi della biotecnologia e della medicina.
Fatti principali
- CodeFP è un modello linguistico proteico co-generativo per la progettazione de novo di proteine funzionali.
- Decodifica simultaneamente token di sequenza e struttura.
- Mira a raggiungere sia funzionalità che ripiegabilità.
- Gli approcci esistenti spesso non riescono a ottenere entrambi simultaneamente.
- CodeFP utilizza strutture locali funzionali per arricchire le codifiche semantiche.
- Introduce una supervisione funzionale ausiliaria per ridurre l'ambiguità dell'addestramento.
- L'articolo è disponibile su arXiv con ID 2605.00948.
- Le applicazioni includono biotecnologia e medicina.
Entità
Istituzioni
- arXiv