NLP ed indicatori d’impatto (parte seconda)


L’analisi del testo può aiutare nella valutazione degli indicatori d’impatto?

Nel precedente articolo abbiamo applicato tecniche di Natural Language Processing (NLP) ad informazioni provenienti dal monitoraggio degli indicatori d’impatto. I dati associati ai vari indicatori sono memorizzati in una “Griglia Quali-Quantitativa” a cui faremo riferimento per il calcolo.

Griglia “Quali-Quantitativa”, Tassonomia e dati esterni

In questo secondo articolo cerchiamo di mettere a valore le informazioni estratte, integrandole con altre disponibili da enti istituzionali e anche più genericamente da fonti dati in rete. Questo approccio ci consente non solo di arricchire i dati in nostro possesso ma fornisce un riferimento per i dati raccolti, una sorta di Baseline di riferimento.

Ricordiamo che l’ipotetico Ente vuole verificare l’impatto diretto dei grant erogati in termini di sviluppo culturale ed economico.Vediamo qualche idea di utilizzo della NLP e dati esterni nella valutazione degli indicatori. Nel nostro esempio l’ente ha erogato dei Grant per l’organizzazione di alcuni Eventi culturali e gli indicatori sono organizzati secondo aree tematiche.

Inizieremo con il valutare le prime tre aree per poi continuare con le successive nel prossimo articolo:

  • Coinvolgimento dei Residenti e Brand
  • Qualità della proposta turistica
  • Iniziative culturali e di conoscenza del territorio

Coinvolgimento dei Residenti e Brand

Indice 1.1 Azioni per la creazione di identità locali innovative per i residenti “storici” o “consolidati” (proposte di innovazione sociale “endogena”)

Per il calcolo di questo indice possiamo utilizzare direttamente il risultato della estrazione dei termini provenienti dalla griglia Quali-Quantitativa. Dai numeri emergono un certo numero di azioni (progetti, spazi, sito), il coinvolgimento di persone nell’organizzazione (artisti, volontari, aziende) e la partecipazione del pubblico (visitatori, presenze). Sicuramente una problematica è l’individuazione della origine territoriale delle presenze, le persone coinvolte nell’organizzazione si presume siano prevalentemente locali ma per una migliore precisione sarebbe necessaria una verifica.

Griglia “Quali-Quantitativa” per l’indice 1.1

Indice 1.2 Azioni per la costruzione di un’immagine locale comunicabile all’esterno (“brand” territoriale)

Per valutare quanto le attività hanno avuto impatto sul Brand esistono diverse possibilità, dalle semplici ricerche in rete analizzando ricorrenze del brand nei risultati, sino all’utilizzo di google trends per ottenere informazioni quantitative di dettaglio. Un ulteriore metodologia di indagine è l’utilizzo della Sentiment Analysis nei forum o nelle social networks. La Sentiment Analysis è una tecnica NLP che valuta i termini e classifica le frasi che li contengono tipicamente in 3 categorie: positive, negative, neutre. Vi sono classificazioni più fini come quelle utilizzate nella nostra analisi e dettagliate in figura.

Google Trends, Sentiment Analysis

Qualità della proposta turistica

Indice 2.1 Individuazione dell’offerta attuale attiva per l’accoglienza (hotel, B&B, appartamenti, ristoranti, bar, negozi specifici, ecc.)

Dai dati di monitoraggio possiamo identificare il numero di strutture che sono state contattate rispetto all’evento per cui sono stati erogati Grant. Questo valore è assoluto e può essere comparato con dati istituzionali di contesto per avere un idea della percentuale relativa raggiunta.

Strutture contattate e dati di contesto

Indice 2.3 Analisi dei bacini geografici di provenienza dei flussi turistici

Anche in questo caso dati di contesto possono aiutare a capire in modo relativo l’efficacia delle attività svolte. Rispetto all’obiettivo dell’indice rileviamo una carenza nelle informazioni in quanto non si conoscono le nazionalità dei visitatori. Queste carenze possono essere stimolo per migliorare la qualità della raccolta dati. Uno spunto in questo senso potrebbe essere l’analisi delle statistiche di accesso al sito web dell’evento identificando la nazionalità di chi accede tramite indirizzo IP. Il fine è di verificare la distanza tra interesse dimostrato ed effettiva partecipazione all’evento. Vedremo meglio il dettaglio di questo approccio quando parleremo del tema “Media e Nuove Tecnologie“.

Bacini Geografici dell’utenza

Iniziative culturali e di conoscenza del territorio

Indice 3.1 Eventi performativi teatrali e musicali (luogo, tipo e quantità di pubblico, ecc.)

Per questo indice possiamo fare riferimento a dati analoghi utilizzati per l’indice 1.1. In questo caso sarebbe importante utilizzare tecniche di Entity Recognition per passare da informazioni generiche come “spettacoli” o “progetti” ad informazioni precise sul titolo dell’evento specifico (approfondiremo nel prossimo articolo questa tecnica applicandola ad alcuni indici successivi)

Griglia “Quali-Quantitativa” per l’indice 3.1

Indice 3.2 Progettazione e infrastrutturazione di itinerari, percorsi, sentieri con strumenti cartacei, su strumenti multimediali o altre azioni

Tra i dati identificati nel monitoraggio possiamo utilizzare le sotto categorie ottenute nella categorizzazione automatica. In questo caso tutte le attività di comunicazione e divulgazione sono utili al fine della conoscenza del territorio e sono numericamente quantificabili. Anche in questo caso potrebbe essere interessante applicare tecniche di Sentiment Analysis ad eventuali questionari proposti all’utenza al fine di verificarne il gradimento.

Quantificazione sotto categorie

Nella terza parte dell’articolo proseguiremo con altri indicatori: Patrimonio culturale e paesaggio, Beni Connettività e fruizione, Cultura ed attività produttive, Formazione, Media e nuove tecnologie.

Le analisi sono state effettuate con il linguaggio R e l’ambiente open source RStudio .

Continua (Parte Terza)