Para la ingeniería informática, nuestro proyecto principal es la predicción de abandono para las telecomunicaciones, pero necesito registros detallados de llamadas. ¿Dónde puedo encontrar estos datos?

Suponiendo que tiene acceso a datos de abandono existentes no triviales (¿equivalentes a varios miles de clientes?), Eso es más que suficiente para que al menos presente una regresión para predecir la tasa de abandono.

A menos que su hipótesis indique que la principal “causa” o característica que afecta la rotación es la calidad de la llamada (como en CCR o ALOC), no necesita CDR para esto. Si la QoS es un elemento dominante, puede hacer que Spectra o Brix simulen los datos de la llamada para confirmar. Si su red “” apesta “en un determinado par de llamadas de origen y destino, su informe de abandono probablemente le dará pistas incluso con CDR sintéticos (datos de prueba). Además: generalmente hay un registro de quejas de clientes asociado que lleva a la transferencia de su servicio (En el mundo inalámbrico de hoy en día, esto puede ser una huella de red o una suscripción excesiva que causa tales problemas de calidad de servicio)

Dicho todo esto, una conjetura educada es que la caída de las telecomunicaciones es causada por la guerra de precios. La oferta adicional de OTT (como las ofertas de calificación cero) o las nuevas actualizaciones con descuento son batallas de precios disfrazadas. Si lo desea: haga una correlación entre las fechas de salida o abandono del cliente frente a las promociones de la competencia y vea cuánto porcentaje de los datos de abandono recientes cae en esa categoría. Espero que esto no sea un negocio real sino académico. De lo contrario, su negocio es demasiado reactivo. Si esto es solo una lección de modelado o regresión de grandes datos, hable con su profesor. En el mundo real, las razones de la cancelación no estarán en los registros de llamadas sin procesar. Incluso si se debe a lagunas en la calidad, la “theta” significativa será de información derivada, como ALOC cortada y cortada en cubos con información de abandono. Espero que esto ayude

Solo un operador de red tendrá acceso a los registros de detalles de llamadas, y es muy probable que las leyes locales de privacidad de datos y seguridad de la información les impidan transmitir los detalles a cualquiera.

Si está haciendo un proyecto formal con una institución reconocida (como una universidad), podría discutir con un operador si se le permitiría acceder a sus datos, pero incluso entonces sería más probable que tuviera que usarlo físicamente sus sistemas informáticos en sus instalaciones.

La externalización del análisis de datos es posible, pero estoy seguro de que se requieren importantes obligaciones contractuales para controlar quién puede usar los datos y cómo se pueden usar.

¿Por qué necesita CDR para la predicción de abandono?

Los datos de abandono están ampliamente disponibles en informes financieros.

Pero:

  • Los datos de CDR son de “nivel bajo”. Normalmente, nunca se compartiría fuera de una organización.
  • Para vincular CDR a churn será necesario “tocar” una serie de bases de datos. Los CDR pasan por el motor de facturación (digamos una vez / mes) y se agregan y califican. Ese archivo se pasa a un sistema de facturación. En algún otro lugar habrá un historial de suscriptores que incluiría inicio / cese que le permitiría derivar abandono.
    Eso es mucho acceso
  • Y acceso a información muy sensible.
    Operativamente eso sería difícil y comercialmente sería una pesadilla.
    Me hubiera sorprendido que un operador permitiera tanto acceso a personas externas.

¿Puedo hacer una sugerencia?

Usted dice “nuestro”, así que supondré que hay más de una persona trabajando en este proyecto. Designe a una persona en su equipo para que escriba un simulador para generar registros detallados de llamadas. El simulador debe tomar algunos parámetros básicos (número de suscriptores, llamadas por día, distribución por día y hora) y generar CDR semi-realistas.

Luego usa esos datos falsos para ejecutar su proyecto. Si puede obtener datos reales de CDR en el futuro, simplemente sume eso.

De hecho, si esta es una clase grande, incluso puede tener varios equipos trabajando en el mismo proyecto, y todos necesitarán acceso a un conjunto de datos. Haga de esto un esfuerzo de colaboración, para que todos trabajen desde el mismo conjunto de datos.