Cómo explicar la ‘ciencia de datos’ usando un ejemplo

Lo clave en la ciencia de datos es “la extracción del conocimiento de los datos “.

1. Suponga que ha mencionado “música, bandas, películas, Sandra Bullock, Pink Floyd, Roger Water” como un interés en mi sitio web.

2)

Ahora mis algoritmos de aprendizaje automático intentarán clasificar los datos en función de su interés. Verificará en la categoría “Música”. Como también ha mencionado “bandas”, irá poco en la categoría de bandas, oh, de nuevo ha mencionado “Pink Floyd” y “Roger water”.

3)

Mi robot tendrá suficiente conocimiento de cuáles son sus intereses.

Ahora aplicará NLP (procesamiento del lenguaje natural), para procesar datos de texto almacenados o páginas en línea, para rastrear datos (documentos) según su interés.

Resultados:

1. Tienes Roger Water y Pink Floyd en tu interés, por lo que el robot te recomendará

  • Más fuerte que las palabras “última canción de éxito de Pink Floyd, arena de Roger.
  • Te puede interesar seguir a “Roger Waters, David Gilmour, Syd Barrett, Richard Wright, Nick Mason”, otros tipos similares a Roger y también en Pink Floyd

2. Tienes Sanda y Películas en interés, entonces

  • Robot dirá Te puede gustar “Gravity” buena película de Sandra
  • Dirá, es posible que desee seguir al actor de “George Clooney”, similar a Sandra trabajó en algunas películas donde Sandra también estuvo allí.

Todo el ciclo es así:

Aquí está mi ejemplo favorito. Lo uso en mi clase de minería de datos:

Cómo Target descubrió que una adolescente estaba embarazada antes que su padre

Primero la historia: un hombre enojado entró en un Target a las afueras de Minneapolis, exigiendo hablar con un gerente:

“¡Mi hija recibió esto por correo!”, Dijo. “¿Todavía está en la secundaria y le envías cupones para ropa de bebé y cunas? ¿Estás tratando de alentarla para que quede embarazada?

El gerente miró el anuncio publicitario, estaba dirigido a la hija del hombre y contenía anuncios de ropa de maternidad, muebles de guardería y otras cosas para bebés. El gerente se disculpó y luego llamó unos días más tarde para disculparse nuevamente.

Sin embargo, por teléfono, el padre estaba algo avergonzado.

“Tuve una conversación con mi hija”, dijo. “Resulta que ha habido algunas actividades en mi casa que no conocía. Ella debe en agosto. Te debo una disculpa.”

AHORA CÓMO ES POSIBLE Y CONEXIÓN CON LA CIENCIA DE DATOS

Paso 1: El científico de datos analizó los datos históricos de compra de todas las mujeres que se habían inscrito en los registros de bebés de Target en el pasado.

Paso 2: Data Scientist notó que las mujeres en el registro de bebés estaban comprando grandes cantidades de loción sin perfume al comienzo de su segundo trimestre.

Otro analista señaló que en algún momento de las primeras 20 semanas, las mujeres embarazadas cargaron suplementos como calcio, magnesio y zinc.

Muchos compradores compran jabón y bolas de algodón, pero cuando alguien de repente comienza a comprar mucho jabón sin olor y bolsas extra grandes de bolas de algodón, además de desinfectantes para manos y paños, indica que podrían estar llegando a su fecha de entrega.

Paso 3: La minería de datos inicial aplicada a estos datos fue capaz de identificar alrededor de 25 productos que, cuando se analizaron juntos, permitieron a Data Scientist asignar a cada comprador una puntuación de “predicción de embarazo”.

Más importante aún, Data Scientist también podría estimar su fecha de vencimiento dentro de una pequeña ventana, por lo que Target podría enviar cupones cronometrados a etapas muy específicas de su embarazo.

Un empleado de Target con el que hablé proporcionó un ejemplo hipotético.

Tomemos como ejemplo a una compradora ficticia de Target llamada Jenny Ward, que tiene 23 años, vive en Atlanta y en marzo compró una loción de manteca de cacao, un bolso lo suficientemente grande como para ser una bolsa de pañales, suplementos de zinc y magnesio y una alfombra azul brillante. Hay, por ejemplo, un 87 por ciento de posibilidades de que esté embarazada y de que su fecha de parto sea a fines de agosto.

Tienes un negocio

Y como todo hombre de negocios, quiere que su negocio crezca.

En el mundo de hoy, con tanta información disponible (y tanto alcance para recopilar información), apoyarse solo en su intuición para desarrollar su negocio, no es la mejor idea.

Para poder aprovechar todos los datos disponibles (y relevantes) para obtener información, necesita ‘un conjunto especial de habilidades’.

Esta combinación de habilidades analíticas (leer conocimientos matemáticos y de programación) y la capacidad de convertir métricas para tener sentido comercial es lo que hace que un científico de datos.