Perché fermarsi con il data wrangling prima di iniziare l'analisi?
#1
Ciao a tutti, ho iniziato a lavorare su un progetto di analisi per il mio team e mi trovo in una situazione un po' strana. Ho raccolto diversi dataset da fonti interne, ma quando provo a unirli per avere una visione completa, i risultati sembrano sempre "sporchi" o incoerenti, anche dopo la pulizia di base. Un collega ha accennato al concetto di data wrangling come passaggio fondamentale prima dell'analisi vera e propria, ma non sono sicuro di quanto sforzo e quanta trasformazione siano realmente necessari prima di poter dire che i dati sono pronti. Qualcuno si è trovato a dover prendere decisioni simili su quando fermarsi con la preparazione e quando invece iniziare effettivamente a estrarre insight? Mi sento come se potessi limare i dati all'infinito senza mai arrivare al punto.
Cita messaggio
#2
Capisco la sensazione data wrangling è la fase in cui si decide se i dati sono pronti e se i dataset si parlano per farlo servono allineare chiavi usare definizioni comuni standardizzare unità e gestire i valori mancanti solo dopo si valuta se il lavoro di pulizia è abbastanza per l analisi
Cita messaggio
#3
È frustrante e anche un po romantica questa idea di limare all infinito ma data wrangling resta il posto giusto per mettere ordine prima di guardare gli insight forse la questione è quanto robusta deve essere la coerenza per dare fiducia
Cita messaggio
#4
Quanti segnali di stabilità servono per dire basta con data wrangling e iniziare a estrarre insight o è legittimo attraversare più iterazioni come se fossero prove di una teoria
Cita messaggio
#5
Forse intendono che la fusione tra dataset sia l auscultazione obiettivo ma data wrangling non va inteso come una pulizia fine a se stessa è un linguaggio comune tra fonti diverse e serve per far parlare colonne che prima non parlavano
Cita messaggio
#6
Mi sembra che si stia chiedendo di rendere perfetto un problema impossibile data wrangling non elimina le differenze non c e una formula magica solo una gestione continua
Cita messaggio
#7
Forse la domanda giusta riguarda quali problemi di business vuoi che i dati risolvano e come definire una soglia di coerenza usando data wrangling come strumento
Cita messaggio
#8
Il pubblico che legge i risultati spesso guarda al contesto del lettore e data wrangling costringe a considerare come definire le aspettative senza pretendere verità assolute
Cita messaggio


Risposta rapida
Messaggio
Scrivi qui il tuo messaggio.

Verifica Immagine
Per favore inserisci il testo contenuto nell'immagine nella casella di testo sotto ad essa. Questa operazione è necessaria per prevenire gli spam bot automatici.
Verifica Immagine
(maiuscole indifferenti)

Vai al forum: