Texas A&M conduce l'analisi dati di sequenziamento RNA a singola cellula con MATLAB

Progetto per la promozione dell’uso del calcolo quantistico nelle scienze della vita

"MATLAB fornisce un ambiente affidabile e senza soluzione di continuità per lo sviluppo di algoritmi di calcolo quantistico. Il suo pacchetto di calcolo quantistico offre vantaggi significativi in termini di usabilità, stabilità e portabilità e ha migliorato notevolmente la nostra ricerca."

Risultati chiave

  • MATLAB Support Package for Quantum Computing consente di testare facilmente gli algoritmi localmente per uno sviluppo rapido e una validazione dei metodi
  • MATLAB offre vantaggi rispetto ad altri software di sviluppo per il calcolo quantistico, come Qiskit®, in termini di usabilità, stabilità e portabilità
  • MATLAB Support Package for Quantum Computing è chiaro, ben strutturato e facile da comprendere per una rapida implementazione di algoritmi quantistici
Tre grafici che mostrano rispettivamente: la traiettoria della differenziazione cellulare dalle cellule staminali embrionali alle cellule endoteliali, l'espressione genica standardizzata nel tempo pseudotemporale utilizzando LASSO e le differenze nelle tendenze di espressione genica tramite QUBO.

Nel pannello C, le linee verdi evidenziano i 18 geni identificati sia dai metodi basati su LASSO che da quelli basati su QUBO, mentre le linee non evidenziate rappresentano i geni identificati esclusivamente dal metodo basato su QUBO.

Presso il College of Veterinary Medicine and Biomedical Sciences della Texas A&M, il professor James Cai sta guidando un progetto interdisciplinare che utilizza il calcolo quantistico per analizzare i dati sull'espressione genica delle singole cellule. Il team del professor Cai sta utilizzando l'informatica quantistica basata su gate per costruire reti che mostrano come i geni si regolano a vicenda. Stanno anche utilizzando un metodo chiamato annealing quantistico simulato (QA) con ottimizzazione binaria quadratica non vincolata (QUBO) per scegliere geni importanti dai dati scRNA-seq che sono coinvolti nei processi di cambiamento e sviluppo cellulare.

L'implementazione della ricerca Tabu di MATLAB® viene utilizzata, insieme alla ricottura simulata, per risolvere i problemi QUBO. Ad esempio, un algoritmo di selezione delle caratteristiche basato su QUBO ha identificato 10 interazioni geniche apparentemente non lineari dalle 50 caratteristiche inizialmente selezionate su 5.000. Tra queste 50 caratteristiche, solo 18 coincidevano con quelle identificate utilizzando il metodo di selezione comparativa LASSO. Questo dimostra che l'approccio QUBO-QA cattura non solo le espressioni geniche lineari di base, ma rivela anche complessi schemi di espressione genica non lineare.

Statistics and Machine Learning Toolbox™ è utilizzato ampiamente per tutto il progetto, in particolare nei workflow di elaborazione dei dati. Il professor Cai ha sviluppato scGEAToolbox per facilitare le analisi dei dati scRNA-seq nell'ambiente MATLAB. Contiene un set completo di funzioni per la normalizzazione dei dati, la selezione delle feature, il clustering cellulare, l'annotazione del tipo di cellula, l'analisi pseudotemporale, la costruzione di reti geniche, l'analisi del knockout genico virtuale e l'analisi della comunicazione cellula-cellula. Curve Fitting Toolbox™, Parallel Computing Toolbox™ e Image Processing Toolbox™ sono utilizzati anche per la visualizzazione e per complementare le analisi.

Il progetto è un esempio pionieristico di come l'informatica quantistica possa essere applicata alle scienze della vita. Con MATLAB, i collaboratori possono replicare e sviluppare ulteriormente questo lavoro iniziale per promuovere l'applicazione del calcolo quantistico, in particolare per la ricerca sulla trascrittomica. A lungo termine, potrebbe cambiare profondamente il modo in cui l'informatica quantistica viene utilizzata per sviluppare diagnosi e trattamenti personalizzati basati su dati genetici individuali.