Progetto Dreamlab

Il calcolo distribuito per la ricerca

Progetto Dreamlab

Gli smartphone che abbiamo in tasca sono sempre più potenti e ci permettono di fare una moltitudine di cose: navigare sul web, ascoltare musica, guardare video, spedire e ricevere e-mail, fare fotografie e persino lavorare. Ormai queste cose le diamo per scontate ma in realtà richiedono una grande potenza di calcolo e di memoria. A questo punto sorge spontanea una domanda: smartphone e computer possono essere utili anche per altri scopi, in particolare per la ricerca? Grazie a questa storia scopriremo che lo sfruttamento della potenza di questi dispositivi ormai così diffusi ha consentito e consente tuttora di aprire nuove possibilità per la ricerca. 

L’Asker Chiara si è imbattuta, sul sito di Vodafone, nella descrizione del progetto Dream Lab[1]. Trattasi di un progetto che secondo il sito permette di sfruttare la potenza di elaborazione collettiva degli smartphone, per dare un contributo alla ricerca contro il coronavirus. Il progetto si propone di analizzare miliardi di combinazioni di farmaci e alimenti al fine di trovare componenti antivirali utili contro il SARS-CoV-2. Per contribuire basta scaricare un’app e collegare il telefono al caricabatterie. Il resto avviene tutto in automatico. Sul sito si dice che Vodafone Collabora anche con AIRC.  

Incuriosita da  queste informazioni Chiara ha deciso di contattare Vodafone per chiedere maggiori dettagli. In particolare le sue domande si sono concentrate su questi  aspetti: quali pubblicazioni riguardanti il COVID 19 hanno beneficiato di questo progetto? Come funziona il processo di invio, elaborazione e ricezione dei dati? Chi invia i dati all’applicazione, Vodafone o l’istituto di ricerca?

L’ufficio stampa di Vodafone ha risposto che il progetto è nato in collaborazione con l’Imperial College di Londra[2].  Il progetto Dream ha aiutato l’Imperial College a completare la fase 1 del progetto, i cui risultati sono pubblicati sulla rivista Human Genomics in un articolo peer reviewed “Network machine learning maps phytochemically-rich ‘Hyperfoods’ fight COVID-19”.[3] L’obiettivo è di scovare molecole utili contro il SARS-CoV-2 presenti nei cibi. L’obiettivo finale dichiarato dagli autori del lavoro e’ quello di poter informare le scelte sperimentali sulla ricerca di regimi alimentari di supporto alla cura della malattia. L’algoritmo è stato prima calibrato, o come dicono “addestrato”, su dei medicinali con proprietà anti covid già confermate sperimentalmente. Una volta calibrato è stato usato per trovare nuove sostanze con possibili proprietà medicinali nei cibi. L’algoritmo identifica le suddette sostanze basandosi sul seguente assunto: identifica quelle che nell’organismo seguono lo stesso percorso seguito dal virus e che coinvolgono gli stessi meccanismi cellulari, ma con un effetto regolatore (al contrario dell’effetto negativo del virus). Questo è un approccio seguito anche in altri ambiti, per la ricerca di farmaci utili contro il cancro ad esempio.  La ricerca ha prodotto 52 risultati. In particolare ci sono sostanze contenute in cipolle, mele, mirtilli. Ma non fate indigestione di cipolle! Lo studio e’ esplorativo e presenta dei limiti:oltre a richiedere validazione sperimentale, ad esempio, non si conosce ancora se nei cibi sopracitati vi è una quantità di sostanza sufficiente affinché sia utile. Non si sa inoltre se certi metodi di cottura possano distruggere le sostanze, l’interazione con eventuali farmaci e altro ancora. Inoltre aggiungiamo noi, una simulazione al computer delle interazioni di una molecola con le proteine che hanno un ruolo nei meccanismi di azione del SARS-CoV-2, cosa che possiamo assimilare a uno studio preclinico, non è certo indicativa di quello che sarà l’effetto della sostanza su un intero organismo umano. Serviranno ulteriori studi, i classici studi clinici insomma. Tuttavia rappresenta un promettente punto di partenza, uno spunto di ricerca ottenuto in tempi ragionevoli grazie al progetto.  

Per fare questo genere di ricerche occorre elaborare una mole enorme di dati e potrebbe volerci molto tempo, per accelerare i tempi si utilizza la vasta platea di smartphone come fosse un unico supercomputer. Il numero di operazioni necessario per studiare queste molecole viene distribuito su tutti i dispositivi che aderiscono al progetto DreamLab. Successivamente l’app restituisce i dati al server centrale di Vodafone, il quale poi li restituisce elaborati all’Imperial College. 

L’app Dreamlab viene utilizzata anche per un altro progetto: “Genoma in 3D di IFOM” istituto FIRC per l’oncologia molecolare. Il progetto vuole comprendere come mutazioni delle porzioni del DNA che non codificano per le proteine influiscono sulla capacità del DNA di “attorcigliarsi” nel nucleo. Lo studio vuole indagare una possibile correlazione tra queste mutazioni e l’insorgenza del cancro. Queste regioni che rappresentano la maggior parte del genoma, non codificano direttamente le proteine ma hanno comunque delle funzioni importanti. Ad esempio, regolano se e quando i geni codificanti devono essere individuati e in che modo[4]. 


 

                                                        ahBL8xYLmd7hY_rMGHdNF_MGAgyu-BnekixGEAK80Od-JcTW4uLm0WnuMD7bixbPaezMf-ffvJKl7suq_I4QhCiHZzZtu4LhuGutGCnMA2fK3HzmAzJYIw67uGL2Eq36ZxklS0dD

Esempio di processo seriale (a) e distribuito (b). Il problema e’: separare le tessere nere da quelle bianche. Nel caso (a) l’intera collezione viene controllata da un singolo “processo”, mentre nel caso (b) viene suddivisa in due processi. Nel secondo caso l’intera collezione verrà controllata nella metà del tempo. Rimane il problema di come (e se) raggruppare in un singolo processo i risultati ottenuti, sulla base di come questo viene gestito si distinguono diversi tipi di calcolo distribuito.


 

Il progetto Dreamlab si inserisce tra i sistemi di calcolo distribuito. Esistono diversi generi di parallelismo nelle scienze informatiche, quello utilizzato in questo caso lo si puo’ capire intuitivamente nel seguente modo: immaginate di voler giocare a briscola con un amico ma avete il mazzo da scala, dovete dunque separare gli 8,9,10, jolly e i vari doppioni. La cosa più logica e’ dividere il mazzo con l’amico, andreste molto più veloci, sicuramente veloci quanto il più lento di voi a controllare la sua parte delle carte (ma dovrete poi comunque controllare i doppioni…). In modo più astratto: un problema, cioè una serie di operazioni da svolgere per ottenere un risultato, viene suddiviso in più “lavoratori” - in questo caso i telefonini - che si prendono carico in modo indipendente della loro parte di operazioni da svolgere.[5] 

Vodafone Dream Lab non è certo il primo di questi progetti, forse vi ricorderete del famoso SETI@Home, il progetto lanciato nel maggio del 1999 con l’obiettivo di analizzare i segnali captati dai radiotelescopi, con il fine di cercare segnali di civiltà extraterrestri.[6] Tuttavia ve ne sono molti altri [7]. 

L’utilizzo dell’intelligenza artificiale sta rivoluzionando la ricerca di nuovi medicinali. Spesso le compagnie farmaceutiche investono molto tempo e molto denaro nei test preclinici in candidati che poi vengono scartati nei test clinici. L’utilizzo di metodi di machine learning come quello usato nello studio dell’Imperial College sopra descritto, può contribuire a ridurre tempi e costi della ricerca. Allo stesso modo molte tecniche di simulazione numerica e di analisi di grossi campioni statistici come quelle che sono state confrontate nello studio dell’istituto FIRC[4] hanno avuto un enorme sviluppo negli ultimi tempi, rendendo possibile analisi più precise e riguardanti sistemi più grossi di quanto non si potesse fare in precedenza. L’utilizzo di app come Dream Lab, e dei sistemi di calcolo distribuito in genere, può contribuire ulteriormente a potenziare questo processo fornendo delle risorse computazionali adeguate. Tutto questo porterà, si spera, a una diminuzione dei tempi e dei costi per la ricerca di nuovi farmaci. Quando i primi medicinali sviluppati grazie a questi processi saranno approvati saremo in grado di dire se l’investimento in quest’area ne sarà valso la pena. 

 

[1]https://www.vodafone.it/nw/vodafone-italia/fondazione-vodafone-italia/attivita/progetti/dreamlab.html

[2]https://www.imperial.ac.uk/news/210153/citizen-scientists-help-accelerate-covid-19-research/

[3] https://humgenomics.biomedcentral.com/articles/10.1186/s40246-020-00297-x 

[4] https://www.airc.it/news/dreamlab-lapp-di-fondazione-vodafone-per-aiutare-la-ricerca-0519

      https://www.ifom.eu/it/area-stampa/news-comunicati/ferrari-DNA-in-3D.php

[5] https://blog.stackpath.com/distributed-system/  

[6] https://setiathome.berkeley.edu/sah_about.php

[7] https://it.wikipedia.org/wiki/Progetti_di_calcolo_distribuito