Ciao a tutti, ho un dubbio che mi è venuto lavorando al mio ultimo progetto. Ho un dataset di vendite con molti attributi sui clienti e mi chiedevo se, per prevedere il valore a vita di un cliente, avesse più senso concentrarmi su un modello predittivo classico o se fosse il caso di provare un approccio di apprendimento automatico non supervisionato per segmentarli prima in gruppi omogenei. Ho letto qualcosa a riguardo, ma non sono sicuro di come questa scelta possa influenzare concretamente i risultati finali e se qualcuno ci si è già trovato davanti.
|
Come scegliere tra modello predittivo e clustering non supervisionato per CLV?
|
|
Per valore a vita del cliente l idea di partire con un modello predittivo classico resta sensata. Magari una regressione o un modello GLM per stimare CLV, con feature engineering sui margini e su recency frequency monetary.
Mi prende un po di emozione nel pensare di dividere i clienti in gruppi ma temo di perdere la visione del valore a vita del cliente se non leggo bene le variabili chiave.
Non e detto che l unsupervised migliori CLV a volte i cluster sembrano artefatti e scollegati dal valore a vita del cliente e va bene validarli su fuori campione.
Forse utile riformulare non chiedersi quale modello e migliore ma quali domande vogliamo rispondere riguardo al valore a vita del cliente e come l uso di segmentazione cambia la gestione online e offline.
Una strada ibrida prima segmentare per omogeneità senza pretendere separazione perfetta poi costruire modelli per stimare il valore a vita del cliente in ogni segmento.
Aspettati che le metriche di valutazione siano diverse tra CLV assoluto e segmenti e resta la chiave la flessibilità nel prendere decisioni sul valore a vita del cliente.
|
|
« Precedente | Successivo »
|

