¿Qué debo aprender en Data Science para ayudar a mi startup?

Lo más importante son las pruebas AB (pruebas A / B – Wikipedia)

Suponiendo que se trata de anuncios de Internet, toma al azar el 10% de su tráfico y les da un anuncio experimental que espera que mejore alguna métrica . Por ejemplo, muestre un anuncio con un gran botón COMPRAR en rojo intermitente. (Sugerencia: eso probablemente no funcionará …) O puede intentar ejecutar anuncios en dos tipos diferentes de sitios web.

Luego mide esa métrica (un efecto que desea), entre los anuncios antiguos y el anuncio experimental, como:

CTR (porcentaje de clics – Wikipedia)
compras reales realizadas (conversión)
tiempo dedicado al sitio web.
registros de correo electrónico
etc.

Luego, si el cambio parece ser una mejora significativa, haga que ese cambio se convierta en el anuncio estándar. De lo contrario, intente un nuevo cambio.

Probablemente deba ejecutar durante al menos una semana para tener en cuenta variables como la hora del día, los efectos de fin de semana, etc.

Si ya tiene muchos datos, también puede ejecutar un análisis de regresión: Wikipedia, para determinar qué variables de su base de datos corresponden a la métrica que le interesa. Luego intente mejorar las cosas en función de las variables que tienen los mejores efectos.

Buena suerte.

Aprendizaje automáticoBig DataCiencia de datosdatosMinería de

¿Qué función podría usar en R para encontrar los n valores más grandes de un vector?

Todos dicen que el aprendizaje automático ocupará trabajos de un gran no. de personas, ¿es esto cierto? ¿Hay algún lado positivo?

¿Es una buena idea dejar el aprendizaje automático después de 2 años y estudiar desarrollo web, si me di cuenta de que no soy tan inteligente para todas esas matemáticas de ML?

¿Python es más lento que MATLAB para la ciencia de datos y el aprendizaje automático?

¿Por qué aparecen tantos indios en Internet?

Cómo eliminar un virus del sector de arranque

Al principio, debe determinar el objetivo final de lo que su empresa quiere como resultado. Entonces sabrá qué algoritmos de ciencia de datos necesitará de acuerdo con el problema, el conjunto de datos, los requisitos y el objetivo a alcanzar.

Estos enlaces pueden ser útiles:

Segundo puesto del concurso: ciencia de datos automatizada y aprendizaje automático en publicidad digital

Este enlace tiene un flujo completo de qué hacer para mejorar sus anuncios: cómo usar el aprendizaje automático para mejorar sus campañas de marketing

Este artículo de investigación le explica cómo utilizar el aprendizaje automático para la visualización de anuncios de destino: http://dstillery.com/wp-content/ …

Buena suerte !

Ben Rogojan

Basado en su pregunta, en realidad está preguntando dos cosas diferentes (al menos, así es como lo tomo).

La automatización no siempre significa aprendizaje automático o ciencia de datos. De hecho, a menudo no lo hace. Entonces, ¿qué tipo de procesos está tratando de automatizar y qué procesos cree que necesitan técnicas de ciencia de datos?

No me malinterpreten, puede usar técnicas de ciencia de datos para aprender dinámicamente y, por lo tanto, automatizar ciertos procesos. Sin embargo, esta es una pregunta muy amplia.

Si su empresa está buscando automatizar los procesos para los anuncios y saber qué anuncios ejecutar y cuándo y qué comprador. Entonces, necesitarás aprendizaje automático. Este es un problema común que enfrenta Amazon. Recientemente publicaron un trabajo de investigación sobre un algoritmo más complejo (que solo un básico, quién eres y qué quieres ver) que están probando.

Lo que diría es que, muy probablemente, está tratando de averiguar a quién le gustan los anuncios. Como dijo Clem, las pruebas A / B son una forma de abordar esto.

Si quieres probar un enfoque más automatizado. Configura varios anuncios y se asegura de tener cookies configuradas para rastrear a cada usuario y en qué anuncios hacen clic. Luego, puede comenzar con algunos datos que tiene e intentar agrupar (usando un algoritmo de agrupamiento, qué grupo de personas responderá a qué anuncio. A partir de ellos, puede agregar un aspecto dinámico donde el programa realmente aprende. Eso sería, hizo eso haga clic en la persona, no, intente con otro, cuál es el porcentaje de clúster x cliqueado en el anuncio 1, anuncio 2, anuncio 3, y simplemente haga que siga reiterando.

De nuevo … no tengo idea de qué proceso estás tratando de automatizar …

Sonam Gupta

Depende de las preguntas que quieras responder. En general, aprenda cómo hacer la limpieza de datos, disputas / manipulación.

Ben Rogojan

Prueba Spark. Tiene API de Python y biblioteca de aprendizaje automático.

Ben Rogojan

More Interesting

¿Cómo funcionan los vectores de párrafo frente a codificadores automáticos variacionales?

¿Qué tan efectivo es usar medidas simples de correlación en la selección de características?

¿Por qué no es una práctica estándar publicar pesos de modelos entrenados junto con el código fuente para trabajos de investigación de aprendizaje profundo?

¿Qué puedo hacer para mejorar el proceso de clasificación con Weka o NLTK?

En la regresión cuadrática, ¿por qué tengo que mantener una variable y su aumento exponencial en el mismo modelo?