Análisis de supervivencia para rotación de clientes

El pasado día 15 de octubre de 2015 en la reunión del grupo R de madRid, Jesús Herranz  nos dio una interesante charla sobre “Introducción a los modelos de Supervivencia”. En los comentarios posteriores mi admirado Carlos Gil Bellosta comentó que estos modelos no se merecen permanecer en una esquina de los libros de estadística y que son muy interesantes para el estudio de aspectos de negocio como permanecer o no como cliente de una empresa.

No puedo estar más de acuerdo, y por eso llevo varios años dándole vueltas a esta familia de modelos estadísticos y al final me he animado a preparar un ejemplo con un dataset de dominio público.

Quizás la documentación me ha quedado un poco larga, y por eso decidí hacer dos vídeos, uno más teórico y centrado en el ejemplo y otro más enfocado hacia el código R y algunos detalles técnicos para gente más interesada en este aspecto.

Las diapositivas están aquí.

El código R está en mi github.

Y estos son los dos vídeos explicativos, el primero más conceptual, el segundo más técnico.

Advertisements

2 thoughts on “Análisis de supervivencia para rotación de clientes

  1. Buenos días Pedro,

    Asistí ayer a tu charla en el grupo de R de madrid, en la que nos presentaste estos post y me ha parecido muy interesante.

    Me gustaría usar estos métodos de análisis de supervivencia a la posibilidad de que nuestros clientes dejen de usar nuestro servicio, pero me surge una duda para saber si puede ser aplicable o no:

    El concepto de “evento” no es claro, ya que nuestros clientes hacen un uso “puntual” del servicio, sin mediar un contrato por medio. No existe una “baja” del servicio, por lo que todas las observaciones quedarían censuradas.

    ¿Es aplicable un modelo de supervivencia a esta casuística? ¿O crees que quedaría completamente desvirtuado?

    Se me ocurre por ejemplo, considerar que clientes que no han usado el servicio en tres meses han causado baja en el mismo, pero temo que sea peor el remedio que la enfermedad.

    Like

    1. Hola! Disculpas por el retraso en contestar, no estoy muy ducho en esto del wordpress.
      Existen métodos o modelos survival para eventos recurrentes, no el tradicional de “muerte”, que es la dicotómica por antonomasia. No los conozco pero existen.
      Te comento un caso y tú valoras si te resulta aplicable: por ejemplo un cliente prepago de telefonía. Aunque no use el teléfono sigue siendo cliente, y si se queda sin saldo o pasan unos meses, entonces sí que se tramita la baja. Evidentemente no puedes esperar a que esto suceda, necesitas una alerta temprana (evento) de que el cliente se va. Pueden ser 2 semanas, 1 mes. Por tanto haces una definición operativa (motivada por tu interés en lo que quieres predecir) de “baja” o “evento” (o “inactividad”).
      Y puede ser recurrente, claro. No se trata, creo yo de modelizar los usos puntuales (esto sí que me parece raro para un modelo de este tipo) pero sí cuando un cliente que hasta entonces hacía un uso más o menos regular, más o menos interesante para ti como proveedor, entra en riesgo.
      En suma: el evento se puede definir de muchas maneras y de hecho es lo que se hace, probar varias definiciones operativas (2 vs. 4 semanas) para ver cómo funciona, y probar modelos.
      No sé si la librería randomForestSRC admite hechos recurrentes, sí sé que admite más de dos eventos que se conoce como riesgos competitivos (p.ej., activo – inactivo – perdido).
      Espero que te haya resultado útil. Gracias por el comentario!!!

      Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s