¿Qué debo aprender en Data Science para ayudar a mi startup?

Lo más importante son las pruebas AB (pruebas A / B – Wikipedia)

Suponiendo que se trata de anuncios de Internet, toma al azar el 10% de su tráfico y les da un anuncio experimental que espera que mejore alguna métrica . Por ejemplo, muestre un anuncio con un gran botón COMPRAR en rojo intermitente. (Sugerencia: eso probablemente no funcionará …) O puede intentar ejecutar anuncios en dos tipos diferentes de sitios web.

Luego mide esa métrica (un efecto que desea), entre los anuncios antiguos y el anuncio experimental, como:

  • CTR (porcentaje de clics – Wikipedia)
  • compras reales realizadas (conversión)
  • tiempo dedicado al sitio web.
  • registros de correo electrónico
  • etc.

Luego, si el cambio parece ser una mejora significativa, haga que ese cambio se convierta en el anuncio estándar. De lo contrario, intente un nuevo cambio.

Probablemente deba ejecutar durante al menos una semana para tener en cuenta variables como la hora del día, los efectos de fin de semana, etc.

Si ya tiene muchos datos, también puede ejecutar un análisis de regresión: Wikipedia, para determinar qué variables de su base de datos corresponden a la métrica que le interesa. Luego intente mejorar las cosas en función de las variables que tienen los mejores efectos.

Buena suerte.

Al principio, debe determinar el objetivo final de lo que su empresa quiere como resultado. Entonces sabrá qué algoritmos de ciencia de datos necesitará de acuerdo con el problema, el conjunto de datos, los requisitos y el objetivo a alcanzar.

Estos enlaces pueden ser útiles:

Segundo puesto del concurso: ciencia de datos automatizada y aprendizaje automático en publicidad digital

Este enlace tiene un flujo completo de qué hacer para mejorar sus anuncios: cómo usar el aprendizaje automático para mejorar sus campañas de marketing

Este artículo de investigación le explica cómo utilizar el aprendizaje automático para la visualización de anuncios de destino: http://dstillery.com/wp-content/

Buena suerte !

Basado en su pregunta, en realidad está preguntando dos cosas diferentes (al menos, así es como lo tomo).

La automatización no siempre significa aprendizaje automático o ciencia de datos. De hecho, a menudo no lo hace. Entonces, ¿qué tipo de procesos está tratando de automatizar y qué procesos cree que necesitan técnicas de ciencia de datos?

No me malinterpreten, puede usar técnicas de ciencia de datos para aprender dinámicamente y, por lo tanto, automatizar ciertos procesos. Sin embargo, esta es una pregunta muy amplia.

Si su empresa está buscando automatizar los procesos para los anuncios y saber qué anuncios ejecutar y cuándo y qué comprador. Entonces, necesitarás aprendizaje automático. Este es un problema común que enfrenta Amazon. Recientemente publicaron un trabajo de investigación sobre un algoritmo más complejo (que solo un básico, quién eres y qué quieres ver) que están probando.

Lo que diría es que, muy probablemente, está tratando de averiguar a quién le gustan los anuncios. Como dijo Clem, las pruebas A / B son una forma de abordar esto.

Si quieres probar un enfoque más automatizado. Configura varios anuncios y se asegura de tener cookies configuradas para rastrear a cada usuario y en qué anuncios hacen clic. Luego, puede comenzar con algunos datos que tiene e intentar agrupar (usando un algoritmo de agrupamiento, qué grupo de personas responderá a qué anuncio. A partir de ellos, puede agregar un aspecto dinámico donde el programa realmente aprende. Eso sería, hizo eso haga clic en la persona, no, intente con otro, cuál es el porcentaje de clúster x cliqueado en el anuncio 1, anuncio 2, anuncio 3, y simplemente haga que siga reiterando.

De nuevo … no tengo idea de qué proceso estás tratando de automatizar …

Depende de las preguntas que quieras responder. En general, aprenda cómo hacer la limpieza de datos, disputas / manipulación.

Prueba Spark. Tiene API de Python y biblioteca de aprendizaje automático.

More Interesting

¿Cómo funcionan los vectores de párrafo frente a codificadores automáticos variacionales?

¿Qué tan efectivo es usar medidas simples de correlación en la selección de características?

¿Por qué no es una práctica estándar publicar pesos de modelos entrenados junto con el código fuente para trabajos de investigación de aprendizaje profundo?

¿Qué puedo hacer para mejorar el proceso de clasificación con Weka o NLTK?

En la regresión cuadrática, ¿por qué tengo que mantener una variable y su aumento exponencial en el mismo modelo?

Tengo un conjunto de puntos 3D y cada uno tiene una puntuación. ¿Cómo encuentro / busco un grupo denso de puntos de alta puntuación?

¿Cómo puedo comenzar el análisis de datos en un gran conjunto de datos?

¿Cuáles son todas las debilidades que Lee Sedol encontró en el juego de AlphaGo?

¿Qué tipo de programas de back-end ejecuta YouTube, como el aprendizaje automático y otros programas funcionales?

¿Por qué el escalado es importante para la clasificación SVM lineal?

Si alguien sin experiencia en programación quisiera aprender algoritmos y aprendizaje automático, ¿cuáles serían las mejores fases de estudio e investigación? ¿Sería mejor comenzar con el aprendizaje de la codificación? ¿Con qué idioma es mejor comenzar?

¿Cuáles son algunos estudios de caso excelentes en el aprendizaje automático?

¿Se recomienda que un desarrollador Java experimentado aprenda y pase al aprendizaje automático? ¿Qué tan difícil / fácil es?

¿Qué son los asombrosos papeles gráficos de conocimiento?

¿Cómo agrupamos el comportamiento de navegación de usuarios similares y seleccionamos características separables?