Sto lavorando a un progetto di analisi dei dati di vendita e mi sono imbattuto in una cosa che mi ha fatto riflettere. Ho sempre usato le medie per riassumere le performance dei prodotti, ma stavolta, guardando la distribuzione, mi sono accorto che un paio di outlier spostavano completamente il risultato, dandomi un'idea fuorviante. Mi chiedo se, in casi come questo, non sia più onesto presentare i dati mostrando anche la loro variabilità, magari con un box plot, invece di affidarsi a un singolo numero. Non voglio che il mio report racconti una storia sbagliata. Qualcuno si è trovato in una situazione simile e ha deciso di abbandonare la media a favore di una visualizzazione più ricca?
|
Come gestire i dati di vendita mostrando la variabilità invece della sola media?
|
|
Capisco la frustrazione di vedere la media spostarsi per colpa di due outlier. Spesso una visualizzazione della variabilità rende la storia dei dati molto piu onesta di un singolo numero medio.
Quando i dati hanno coda lunga la media non e rappresentativa e si percepisce la necessita di mostrare la varianza o l IQR insieme alla media.
Qualcuno potrebbe interpretare l idea come una perdita di significato della media ma in realta si tratta di trasparenza.
Non sarebbe utile mettere in dubbio l impostazione della domanda prima di cercare una soluzione visto che la premessa e che la media distorce la lettura.
Mi piace l idea di presentare box plot o violin plot per mostrare la variabilita insieme alla media.
La verita e che per decisioni rapide la media resta pratica ma non sempre racconta tutto.
|
|
« Precedente | Successivo »
|

