Analisi


In questa sezione vengono raccolte alcune analisi dati. In qualche caso si sono mantenute separate la parte di analisi esplorativa dei dati dalla realizzazione del modello.

Parte di queste analisi sono frutto di challenge Data for Good del sito Kaggle o da spunti derivanti da iniziative della Johns Hopkins University.


Smart Water Analytics

L’ analisi promossa da Acea è prevedere il livello e le portate d’acqua per ogni giorno dell’anno in un corpo idrico (sorgenti, lago Bilancino, Arno, falde acquifere) per gestire i consumi giornalieri. I dati hanno uno storico di alcuni anni ed il lavoro effettua una previsione dei livelli di un mese. Il lavoro studia un unico modello di Machine Learning per tutti i corpi idrici con un metodo “ensemble” che corregge i risultati di Random Forest. Per creare il modello si sono confrontati diversi modelli base tipici per serie temporali e non: Arima, Arfima, Random Forest, Xgb, Gbm, LSTM networks. Il lavoro comprende anche la comparazione tra variabili esogene ed endogene

(Link alla analisi dati)


Torino Come Stai

torinocomestai è un’indagine sociale nell’ambito della iniziativa Torino Social Impact ed è stata condotta per determinare lo stato di salute fisico/emotivo durante il primo lockdown raccogliendo circa 6000 questionari di cittadini Torinesi. DataforGood ha provato a dare una vista diversa dei dati disponibili sul sito https://torinocomestai.org/ non ripetendo le analisi già fatte dalla iniziativa ma cercando di determinare dei profili e relative caratteristiche tramite Machine Learning (k-means) .

(link alla analisi dati)


Covid-19 Italia

Lo studio ha l’obiettivo di fornire una fotografia del contagio ed una una panoramica dei suoi impatti su alcuni settori importanti a livello nazionale: lavoro, mobilita’, sistema sanitario. Lo studio fornisce anche una ipotesi di modello di diffusione del contagio basandosi su informazioni a livello nazionale ed internazionale. Il dettaglio delle informazioni è sia a livello regionale che in alcuni casi provinciale. Il documento fotografa la situazione durante la prima ondata Covid e si basa su dati provenienti da: Protezione Civile, Istituto Superiore di Sanita’, Johns Hopkins University, Kaggle Covid-19 lockdown dataset, Apple Mobility Trends .

Lo studio contiene anche una animazione riguardante la diminuzione di mobilità tra i principali comuni a seguito del lockdown.

(link alla analisi completa)


International Migrations

Lo studio mostra le stime 2015 sulle migrazioni internazionali e si basa su due set di dati: Nazioni Unite ed UNICEF. Il Dataset delle Nazioni Unite contiene la matrice origine-destinazione dei migranti ed il Dataset UNICEF contiene informazioni sulla migrazione infantile, sui rifugiati, sui richiedenti asilo e sugli sfollati.

(link alla analisi dati)


DonorsChoose

Fondato nel 2000 da un insegnante di storia del Bronx, DonorsChoose.org ha raccolto 685 milioni di dollari per le scuole americane. Gli insegnanti di molte le scuole pubbliche degli Stati Uniti utilizzano il sito di crowdfunding per raccogliere fondi per progetti scolastici dei loro studenti. Il team DonorsChoose voleva essere in grado di mettere in contatto i donatori con i progetti più vicini alla loro sensibilità.

(link alla esplorativa dati) (link al modello)


Kiva 

Kiva è un network globale che mette in contatto i finanziatori individuali e piccoli imprenditori dei paesi in via di sviluppo. Questo è concretamente possibile grazie alla partnership con gli istituti di microcredito (Field Partners) che in tutto il mondo raccolgono le necessità dei piccoli imprenditori bisognosi di prestiti. Fondamentale per questo modello è la stima dei livelli di povertà dei residenti nelle regioni in cui Kiva ha prestiti attivi. L’analisi è divisa in una fase esplorativa dei dati e la definizione del modello per individuare i livelli di povertà (Poverty Index). In questa analisi, oltre ai dati forniti da Kiva stessa (loans) sono state integrate fonti dati esterne quali l’OPHI SubNational Decomposition HeadCount MPI (Multidimensional Poverty Index) ed alcuni dataset World Bank Open Data (Employments, Sub-National Population,…)

(link alla esplorativa dati) (link al modello)


PASS NYC

PASSNYC è un’organizzazione volontaria senza scopo di lucro dedicata ad ampliare le opportunità educative per gli studenti di talento di New York che frequentano distretti scolastici poco performanti. L’obiettivo è valutare le esigenze degli studenti per quantificare le sfide che devono affrontare nel superare il test SHSAT (Specialized High School Admissions Test).

(link al modello)


Emissioni di Co2

Il progetto mostra le emissioni globali di CO2 pro capite in tutto il mondo nel periodo (2008-2011).

(link alla analisi)


Analisi di eventi meteorologici gravi

Le tempeste ed altri gravi eventi meteorologici possono causare problemi di salute pubblica ed economici per le comunità: infortuni mortali, lesioni e danni alla proprietà. Prevenire tali esiti è una preoccupazione fondamentale negli Stati Uniti. L’analisi affronta 2 domande principali:
– Quali tipi di eventi sono più dannosi per la salute della popolazione?
– Quali tipi di eventi hanno le maggiori conseguenze economiche?

I dati provengono dallo Storm Events Database dal National Oceanic and Atmospheric Administration (NOOA)

(link alla analisi)


Analisi delle Associazioni Nord-Ovest

Le associazioni Nord-Ovest tramite l’analisi dati dei Bandi ORA! 2016 e OPEN 2015 e 2016 (Compagnia di San Paolo)

A partire dal 2015, la Compagnia di San Paolo con il bando “OPEN” sostiene le iniziative che mirano ad ampliare e diversificare la domanda culturale da parte dei cittadini attraverso la sperimentazione di nuove forme di coinvolgimento attivo del pubblico. Il Bando “ORA!” si propone di favorire a livello nazionale la produzione culturale attraverso il sostegno a progetti nelle arti visive, performative e negli altri linguaggi espressivi della
cultura contemporanea, in un’ottica cross-disciplinare e con un’attenzione specifica alle nuove tecnologie. E’ stata costruita una base dati che sintetizza alcuni punti chiave dei progetti presentati ed informazioni relative al soggetto proponente ed il budget presentato.
I dati sono rilasciati al pubblico secondo la licenza Italian Open Data (IODL) v1.0, il cui testo completo è disponibile al seguente indirizzo: http://www.formez.it/iodl/

Compagnia di San Paolo. (2015-2016) Partecipanti ai bandi ORA! 2016 e OPEN 2015 e 2016. Domingo Scisci (UniData-Bicocca Data Archive) [Producer]. UniData-Bicocca Data Archive, Milano. Codice indagine SN174. Versione del file di dati 1.0
doi:10.5072/unimib/unidata/SN174-1.0

Lascia un commento

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.