Statistica e musica: il dato che porta al cuore delle note

Troppo spesso vediamo i numeri come qualcosa di freddo, impassibile, imperturbabile. Tuttavia, senza rendercene conto, quando vogliamo conoscere un nuovo fenomeno, una nuova persona, il nostro istinto è quello di quantificare ciò che stiamo osservando e di chiedere, dunque, informazioni quantitative: quanti anni hai? Da quanto tempo vivi qui? I numeri, se letti, interpretati e ascoltati correttamente, danno la possibilità di entrare dentro il fenomeno osservato e di raggiungere un livello di conoscenza che va oltre l’aspetto numerico. Karl Pearson diceva: “Statistics is the grammar of science”. Come la grammatica fornisce gli strumenti necessari per la comunicazione e per la comprensione scritta e orale, allo stesso modo la statistica fornisce degli strumenti teorici generali che possono essere applicati a tutti i fenomeni analizzabili da un punto di vista quantitativo. Tra questi la musica, grazie a sofisticate metodologie statistiche volte ad analizzare le caratteristiche musicali dei brani e allo stesso tempo a cogliere il sentimento generato dalla lirica. Tra le tecnologie della comunicazione, la musica oggi assume un ruolo predominante in quanto parte integrante delle nostre vite e strumento essenziale per esprimere e descrivere le nostre emozioni quando nessuna parola ci riesce. Anche la musica sta subendo una svolta epocale, diventando digitale ed entrando nel mondo dei social media. Se da un lato questo rappresenta un motivo di crisi per le industrie discografiche, dall’altro l’analisi costante delle interazioni sui social è diventata fondamentale per la raccolta di dati che aiutino gli operatori del settore a capire e a orientare il mercato musicale. Diverse aziende, in collaborazione con società specializzate nei big data, hanno sviluppato sofisticati software allo scopo di creare un predictive profiling del fan musicale, non solo per comprenderne personalità e gusti ma, soprattutto, per studiarne le affinità con prodotti di largo consumo. Le tecniche di data mining e di apprendimento automatico possano aiutare la navigazione all’interno del nuovo mondo della musica. Ma che tipo di dato è la musica? E, soprattutto, che tipo di analisi statistiche si possono condurre su questo tipo di dato? Un brano musicale può contenere più dati: ad esempio, quelli costituiti da file audio musicali o metadati come il titolo o il nome dell’artista. Il data mining musicale prevede metodi specifici per rispondere alle più diverse domande: la classificazione del genere musicale, l’identificazione di artisti, il rilevamento di umore/emozione, il riconoscimento dello strumento, la ricerca della somiglianza musicale, la sintesi musicale e così via.

ASPETTI TECNICI

I file musicali generalmente supportano una struttura nota come ID3, progettata per memorizzare i metadati musicali quali il nome dell’artista, il titolo della traccia, la descrizione della musica e il titolo dell’album. Pertanto, non risulta troppo complicato estrarre il contenuto informativo dal formato dati ID3. La forma più semplice per reperire metadati musicali online richiede l’esecuzione di questi mediante l’uso di Api (Application programming interface). Alcune delle più note applicazioni di base per la gestione di metadati musicali, ad esempio All Music Guide e FreeDB, rappresentano delle piattaforme flessibili per gli appassionati di musica per cercare, caricare e gestire i metadati musicali

Spotify consente agli utenti di dare uno sguardo agli ascolti totali mensili del proprio artista preferito e a quelli relativi a una singola canzone. L’indice di popolarità di una traccia è dunque, dal punto di vista statistico, un indice compreso tra 0 e 100 ed è calcolato attraverso un algoritmo che si basa sul numero totale di volte in cui il brano è stato riprodotto in streaming e su quanto siano più o meno recenti queste riproduzioni. Altra tecnica statistica di rilevanza notevole nel contesto dell’analisi dei metadati musicali è rappresentata dai metodi di clustering che mirano a individuare gruppi di canzoni simili e consentono di valutare quantitativamente la distanza tra un brano e un altro. Queste tecniche sono alla base degli algoritmi di raccomandazione musicale. L’analisi testuale dei brani trasforma le parole in dati. L’informazione non è più un numero ma una parola e la domanda è: quanto spesso una singola parola viene ripetuta all’interno di un brano? Quanto spesso all’interno di un album? Il concetto che sta alla base del text mining è “ottenere piccole pepite di informazioni desiderate da montagne di dati testuali senza dover leggere tutto”. L’esito dell’analisi è riportato in forma grafica attraverso l’utilizzo del word cloud, ovvero la rappresentazione grafica della distribuzione di frequenza dei termini presenti in un testo: maggiore è la frequenza di un termine, più grande sarà la dimensione della parola riportata nel cloud.

L’ANALISI DEL SENTIMENTO

Mettendo insieme le caratteriste audio e le caratteristiche testuali, è possibile analizzare il sentimento trasmesso dall’ascolto di un brano. Attraverso l’uso di un indice statistico noto in letteratura come Gloom Index, introdotto per la prima volta da Charlie Thompson nel 2008, è possibile valutare quanto triste sia una canzone. L’indice, che assume valori tra 0 e 100, è definito come segue:

 

dove:

  • Valence (Positività): descrive la positività di un brano; da 0 (canzoni depresse o arrabbiate) a 1 (canzoni felici o euforiche)
  • LyricalDensity: indica il numero di parole al secondo
  • pctSad: è la percentuale di parole tristi dei vari brani in base al Nrc Word-Emotion Association Lexicon.

Più alto è il valore dell’indice più gioiosa sarà la canzone!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Dimensione massima del file: 50MB Formati consentiti: jpg, gif, png Drop file here