¡Genial, este es (más o menos) mi trabajo! Administro análisis para Boku, una compañía de pagos móviles. Somos un equipo muy pequeño y apoyamos a toda la empresa en cualquier proyecto basado en datos.
Lo que hace que nuestros datos de transacción sean únicos es que no sabemos quién es el cliente, ¡solo su número de teléfono! Y procesamos millones de transacciones, pero en un número relativamente pequeño de comerciantes en comparación con un procesador de pagos más convencional.
Algunos desafíos interesantes que enfrentamos
- ¿Qué clasificadores de aprendizaje automático escalan muy bien a big data? ¿Hay alguna referencia de papel?
- ¿Hay algún programa de CS o análisis en línea sobre programación, ciencia de datos y big data con una universidad prestigiosa? Mi presupuesto es de $ 20,000- $ 30,000.
- ¿Cómo se relacionan los nombres de los archivos de extensión con los datos?
- ¿Cómo ayuda un científico de datos a resolver salas de escape?
- ¿Cuáles son las habilidades / cualidades que busca un pasante de ciencia de datos?
- Vimos este número hace 7 meses. ¿Es la misma persona?
- ¿Cómo encontramos más información sobre nuestros clientes?
- ¿Por qué las personas eligen comprar usando el móvil?
- ¿Cómo podemos predecir el comportamiento de la transacción, como el uso repetido y el gasto de por vida?
- ¿Cómo cambian estas métricas en función de la segmentación del cliente?
- ¿Qué posibilidades hay de que un cliente que compra en un comerciante realice transacciones en otro? ¿Qué pares / categorías de comerciantes son comunes? ¿Cómo podemos usar esa información?
- ¿Dónde abandonan los clientes durante el proceso de pago y qué podemos hacer al respecto?
- ¿Cómo pronosticamos el crecimiento con fines presupuestarios?
- ¿Cómo modela deudas incobrables y devoluciones de cargo en datos limitados del cliente? ¿Qué herramientas podemos usar para reducir las tasas de devolución de cargo? ¿Cuán efectivos serán?
- ¿Cómo identifica y controla los problemas de facturación con los operadores móviles?
- ¿Qué puntos de precio deberíamos permitir que utilicen los comerciantes, dada la demografía del mercado que puede afectar los saldos prepagos, etc.
- ¿Cómo podemos modelar el potencial de entrar en un nuevo mercado basado en indicadores económicos?
Esa es solo la punta del iceberg, y son todas las preguntas que hemos hecho en la última semana más o menos. No se trata de big data o aprendizaje automático, pero definitivamente estamos resolviendo problemas de ciencia de datos.
Las fuentes de datos incluyen nuestros propios datos de transacciones, datos financieros de fuentes públicas, datos de encuestas, datos económicos de lugares como el banco mundial, etc.
Las herramientas incluyen MySQL, Python y Excel. Estamos incursionando en el raspado de registros también.
Los proyectos se mueven rápidamente: hacemos docenas de análisis grandes y pequeños cada semana, y también estamos directamente involucrados en la toma de decisiones comerciales y de productos. También somos responsables del uso de una herramienta de BI general para que la empresa acceda a los datos, y trabajamos estrechamente con el equipo de Finanzas en proyectos relacionados con FP&A, como proyectar flujos de efectivo, condiciones de pago, precios, costos de mensajes, etc.
¡Uf!