La Scienza dei Dati è una scienza nuova; essa è basata sul grande
sviluppo dei dati digitali, e sul loro utilizzo sempre più pervasivo e a
volte intrusivo nella vita delle persone e nelle attività delle aziende
e pubbliche amministrazioni. I dati digitali sono utilizzati nella
ricerca e nelle attività produttive, per nuove scoperte scientifiche,
per prendere decisioni più efficaci e per poter predire o interpretare
fenomeni. Alla base della scienza dei dati sono la statistica e la
informatica, che forniscono le tecniche e le tecnologie per elaborare e
analizzare i dati nel loro ciclo di vita, e più in generale le scienze
sociali, che studiano l’effetto dei dati e tecnologie digitali sulla
comunicazione e sulla qualità della vita, l’economia digitale, le cui
leggi innovano profondamente rispetto alla economia dei beni e dei
servizi, le scienze giuridiche, che investigano le regole per applicare e
per difendersi dalle nuove tecnologie, e l’etica, che fornisce gli
strumenti per un corretto uso dei dati.
- Docente: Carlo Batini
- Docente: Fabio Stella
La data science richiede necessariamente la capacità di gestire e analizzare i dati tramite computer, in quanto le dimensioni dei dati non permettono di utilizzare procedure manuali.
In questo corso viene introdotto il linguaggio di programmazione Python, che è uno dei principali linguaggi di programmazioni utilizzati nel mondo, e come questo linguaggio può essere usato efficacemente per gestire e analizzare dati. Il corso è disegnato per potere essere fruito anche da chi non ha precedenti esperienze di programmazione e porterà lo studente ad essere in grado di scaricare dati pubblici ed sfruttarli per rispondere ad alcune domande basilari, fra cui:
- da un dataset che contiene i risultati di tutte le gare di Formula 1, quale pilota ha vinto più gare, e quale ha corsi più GP?
- da un dataset di dati socio-economici, quali nazioni hanno maggiormente migliorato la propria situazione sanitaria?
- Docente: Mirko Cesarini
- Docente: Gianluca Della Vedova
- Docente: Dario Pescini
Il linguaggio R è diventato negli anni lo standard di fatto nel mondo della statistica e della data science. Diversamente da altri linguaggi, R è proprio nato per esplorare, analizzare e rappresentare dati e implementa al suo interno molte di quelle strutture di dati che in altri linguaggi devono essere importate per mezzo di estensioni e librerie esterne. Un’ulteriore forza di R è che è open source e vanta migliaia di pacchetti scritti da scienziati e practitioners di tutto il mondo che ne estendono e aggiornano le funzionalità.
Questo corso introduce il linguaggio R, cercando di chiarirne da subito la logica di lavoro. In tale modo il discente sarà meno soggetto agli errori tipici del neo-utilizzatore/programmatore R. Per meglio capire e memorizzare gli elementi del linguaggio R, invitiamo il discente ad installare R e RStudio sul proprio computer per potere esercitarsi replicando e facendo girare il codice esposto nelle lezioni e svolgendo gli esercizi suggeriti dal docente.
Il corso è adatto a tutti coloro che abbiano già un’idea, per quanto vaga, degli elementi di base di un linguaggio di programmazione (variabili, operatori, funzioni, strutture di controllo quali if-then-esle e cicli for).
- Docente: Gianna Monti
- Docente: Matteo Pelagatti