ARTFEED — Contemporary Art Intelligence

scpFormer: Modello Fondamentale per l'Integrazione della Proteomica a Singola Cellula

other · 2026-04-24

I ricercatori hanno presentato scpFormer, un modello fondamentale basato su transformer, progettato per la proteomica a singola cellula, pre-addestrato su oltre 390 milioni di cellule. Questo modello innovativo sostituisce la tokenizzazione tradizionale basata su indici con un metodo continuo e ancorato alla sequenza, combinando Evolutionary Scale Modeling (ESM) e embedding di espressione sensibili al valore per allineare pannelli anticorpali variabili in uno spazio semantico unificato, evitando la discretizzazione artificiale. Produce rappresentazioni cellulari globali che eccellono nell'integrazione batch su larga scala e nel clustering non supervisionato. Inoltre, la sua architettura a vocabolario aperto facilita l'espansione in silico dei pannelli, supportando la ricostruzione di varietà biologiche in dataset clinici sparsi. Lo studio approfondisce anche la logica appresa della co-espressione proteica, affrontando le sfide poste dai pannelli anticorpali mirati frammentati nell'integrazione dei dati proteomici a singola cellula.

Fatti principali

  • scpFormer è un modello fondamentale basato su transformer per la proteomica a singola cellula.
  • Pre-addestrato su oltre 390 milioni di cellule.
  • Utilizza una tokenizzazione continua e ancorata alla sequenza invece di quella basata su indici.
  • Combina Evolutionary Scale Modeling (ESM) con embedding di espressione sensibili al valore.
  • Mappa pannelli anticorpali variabili in uno spazio semantico condiviso senza discretizzazione artificiale.
  • Genera rappresentazioni cellulari globali per l'integrazione batch e il clustering.
  • L'architettura a vocabolario aperto facilita l'espansione in silico dei pannelli.
  • Aiuta la ricostruzione di varietà biologiche in dataset clinici sparsi.

Entità

Fonti