Il progetto Domino prevede
l'utilizzo di Next generation sequencing, che è
appunto uno strumento in grado
di sequenziare il genoma in maniera
molto innovativa e molto
veloce. È Una delle caratteristiche
della NGS è di produrre
una grande quantità di dati,
dati che poi devono venire processati
attraverso algoritmi, software e anche
computer particolari. Lo sviluppo
tecnologico sempre più intenso ci
permette di spingere
sempre più in là quella che è
la digitalizzazione della realtà,
attraverso strumenti
e tecniche sempre più sofisticate
che ci permettono appunto di acquisire
in modo digitale la realtà
e di ricevere un sacco di dati.
E noi in Exact Lab ci occupiamo
appunto di questo, cioè siamo bravi ad analizzare
grandi quantità di dati i cosiddetti
big data attraverso appunto quello che
si chiama performance computing
quindi calcolo ad alte prestazioni
che è in grado attraverso
particolari calcolatori e soprattutto
particolari conoscenze delle persone
quindi dei team che operano
questi calcolatori di ricevere acquisire
il dato di analizzarlo di processarlo
e poi di estrarre
appunto il significato che sta
dietro ai dati che
acquisiamo per restituirlo ad
un utente finale. I server,
quindi i calcolatori e
le performance computing, non
sono macchine che mettiamo sotto
il comodino o che mettiamo sopra
il tavolo, quindi dei portatili, ma sono
dei server che mettiamo a rete,
quindi degli armadi in cui vanno
infilati questi server
uno sopra l'altro e possiedono
caratteristiche diverse da quelle
che appunto sono di utilizzo comune
nelle nostre case. Hanno un numero
di correnti di processori
molto superiori 24, 32 48
64 ma anche sopra 100
hanno un quantitativo di appunto
di RAM quindi di memoria
molto superiore e queste
cose qua queste componenti le rendono
operabili appunto per simulazioni
numeriche molto specifiche
che possono essere utili a risolvere
problemi in diversi
campi matematica, fisica,
ingegneria,
biologia, finanza, climatologia e
quant'altro. Si parla
quindi di decine di terabyte che
devono venire memorizzate
su supporti appositi che non
sono più magari i dischi che possiamo
avere dentro il computer, oppure le schede
di memoria che stanno
dentro i nostri cellulari,
ma sono dei dispositivi molto veloci che
possiamo interrogare
quando dobbiamo fare delle analisi.
Dati che poi sono vincolate
appunto al tempo perché il tempo
appunto è la risorsa più
preziosa che abbiamo. In questo senso prima
processiamo il dato meglio è per noi
la sfida principale nel progetto
Domino è quella di creare procedure
automatiche che permettano di andare
dall'acquisizione del dato
fino al la restituzione del valore dietro
il dato all'utente
finale. Tutti i pezzi all'interno
della catena devono
funzionare correttamente, devono funzionare
in maniera automatica nel caso
dei calcolatori, in modo
che ogni pezzo dopo
l'acquisizione sia in grado
di restituire il suo
output con la sua uscita
al pezzo successivo e così
via. E da questo punto di vista
la sfida più interessante è stata
appunto creare quelle che si chiamano
le pipeline, ovvero dei flussi
di lavoro in maniera automatica,
in modo che la procedura
fosse automatizzata.
Abbiamo raggiunto il risultato
nel senso che le pipeline sono state
automatizzate, ma ovviamente
c'è ancora tanto lavoro da fare
perché è necessario anche
l'ottimizzazione
delle stesse e tutto quanto
naturalmente adesso è
in fase prototipale pensando
ad un futuro utilizzo
commerciale. Naturalmente ci sarebbe
da prendere i dovuti accorgimenti per fare
in modo che la soluzione
possa scalare a livello commerciale,
quindi non solo,
magari con un utilizzo pilota
con un ospedale, ma con più
ospedali o con più ambienti.
Ovviamente quando si lavora in un progetto
del genere e si tocca
con mano i tecnicismi
o si è molto operativi,
magari ci si scorda a un certo
punto di quello che si sta facendo, Però è
sempre necessario fare un passo
indietro e cercare di guardare
dall'esterno. Nel complesso
quello che stai facendo e ricordarsi
che si è un elemento
molto utile all'interno
di un progetto più complesso che
prevede diverse diverse fasi e diversi
attori. E tu sei un anello
di una catena, appunto,
che è imprescindibile dal resto e
quindi in questo senso è molto importante
il contributo che stiamo cercando
di dare. Quando quand'ero piccolo sarebbe
stato difficile pensare
dove ci avrebbe portato oggi
lo sviluppo tecnologico
quindi pensare che quando avevo
dieci anni che un giorno
saremmo stati in grado di sequenziare
il genoma umano e grazie ai computer
mettere in relazione questa sequenza
con sequenze simili di malattie
rare e quindi cercare
di capire di che
malattie. È affetto. Certo paziente,
questa cosa qua quand'ero piccolo
sembrava impossibile ed era impossibile
effettivamente nello sviluppo
con la tecnologia di allora. Ma oggi è
una cosa che è
reale e si può fare.