Cómo explicar la ‘ciencia de datos’ usando un ejemplo

Lo clave en la ciencia de datos es “la extracción del conocimiento de los datos “.

1. Suponga que ha mencionado “música, bandas, películas, Sandra Bullock, Pink Floyd, Roger Water” como un interés en mi sitio web.

Cómo pasar mi carrera de consultor MDM al análisis de datos
¿Cuál es el futuro de Big Data e IOT para tomarlo como una carrera futura después de algunos años de experiencia en la industria india de TI?
¿Cuál es la diferencia entre ciencia de datos y estadística?
Cómo crear un cuaderno Jupyter en AWS
¿Qué curso de ciencia de datos es mejor para un principiante, el nanodegree analista de datos de Udacity o el curso de ciencia de datos?

Ahora mis algoritmos de aprendizaje automático intentarán clasificar los datos en función de su interés. Verificará en la categoría “Música”. Como también ha mencionado “bandas”, irá poco en la categoría de bandas, oh, de nuevo ha mencionado “Pink Floyd” y “Roger water”.

3)

Mi robot tendrá suficiente conocimiento de cuáles son sus intereses.

Ahora aplicará NLP (procesamiento del lenguaje natural), para procesar datos de texto almacenados o páginas en línea, para rastrear datos (documentos) según su interés.

Resultados:

1. Tienes Roger Water y Pink Floyd en tu interés, por lo que el robot te recomendará

Más fuerte que las palabras “última canción de éxito de Pink Floyd, arena de Roger.
Te puede interesar seguir a “Roger Waters, David Gilmour, Syd Barrett, Richard Wright, Nick Mason”, otros tipos similares a Roger y también en Pink Floyd

2. Tienes Sanda y Películas en interés, entonces

Robot dirá Te puede gustar “Gravity” buena película de Sandra
Dirá, es posible que desee seguir al actor de “George Clooney”, similar a Sandra trabajó en algunas películas donde Sandra también estuvo allí.

Todo el ciclo es así:

¿Cuáles son las API de aprendizaje automático que puedo usar para analizar la calidad de los datos?

¿Cuáles son las compañías de análisis / ciencia de datos que pagan mucho en Bangalore?

¿Qué es una fuente de datos?

¿Cuáles son las principales aplicaciones (de la vida real) de la minería de datos y la ciencia de datos utilizadas en el mundo práctico de hoy?

¿Qué es WPS en un punto de acceso WiFi?

Cómo convertirse en un científico de datos en la NASA

Aquí está mi ejemplo favorito. Lo uso en mi clase de minería de datos:

Cómo Target descubrió que una adolescente estaba embarazada antes que su padre

Primero la historia: un hombre enojado entró en un Target a las afueras de Minneapolis, exigiendo hablar con un gerente:

“¡Mi hija recibió esto por correo!”, Dijo. “¿Todavía está en la secundaria y le envías cupones para ropa de bebé y cunas? ¿Estás tratando de alentarla para que quede embarazada?

El gerente miró el anuncio publicitario, estaba dirigido a la hija del hombre y contenía anuncios de ropa de maternidad, muebles de guardería y otras cosas para bebés. El gerente se disculpó y luego llamó unos días más tarde para disculparse nuevamente.

Sin embargo, por teléfono, el padre estaba algo avergonzado.

“Tuve una conversación con mi hija”, dijo. “Resulta que ha habido algunas actividades en mi casa que no conocía. Ella debe en agosto. Te debo una disculpa.”

AHORA CÓMO ES POSIBLE Y CONEXIÓN CON LA CIENCIA DE DATOS

Paso 1: El científico de datos analizó los datos históricos de compra de todas las mujeres que se habían inscrito en los registros de bebés de Target en el pasado.

Paso 2: Data Scientist notó que las mujeres en el registro de bebés estaban comprando grandes cantidades de loción sin perfume al comienzo de su segundo trimestre.

Otro analista señaló que en algún momento de las primeras 20 semanas, las mujeres embarazadas cargaron suplementos como calcio, magnesio y zinc.

Muchos compradores compran jabón y bolas de algodón, pero cuando alguien de repente comienza a comprar mucho jabón sin olor y bolsas extra grandes de bolas de algodón, además de desinfectantes para manos y paños, indica que podrían estar llegando a su fecha de entrega.

Paso 3: La minería de datos inicial aplicada a estos datos fue capaz de identificar alrededor de 25 productos que, cuando se analizaron juntos, permitieron a Data Scientist asignar a cada comprador una puntuación de “predicción de embarazo”.

Más importante aún, Data Scientist también podría estimar su fecha de vencimiento dentro de una pequeña ventana, por lo que Target podría enviar cupones cronometrados a etapas muy específicas de su embarazo.

Un empleado de Target con el que hablé proporcionó un ejemplo hipotético.

Tomemos como ejemplo a una compradora ficticia de Target llamada Jenny Ward, que tiene 23 años, vive en Atlanta y en marzo compró una loción de manteca de cacao, un bolso lo suficientemente grande como para ser una bolsa de pañales, suplementos de zinc y magnesio y una alfombra azul brillante. Hay, por ejemplo, un 87 por ciento de posibilidades de que esté embarazada y de que su fecha de parto sea a fines de agosto.

Oner Celepcikay

Tienes un negocio

Y como todo hombre de negocios, quiere que su negocio crezca.

En el mundo de hoy, con tanta información disponible (y tanto alcance para recopilar información), apoyarse solo en su intuición para desarrollar su negocio, no es la mejor idea.

Para poder aprovechar todos los datos disponibles (y relevantes) para obtener información, necesita ‘un conjunto especial de habilidades’.

Esta combinación de habilidades analíticas (leer conocimientos matemáticos y de programación) y la capacidad de convertir métricas para tener sentido comercial es lo que hace que un científico de datos.

Nishant Gupta

More Interesting

¿Cómo obtener datos reales para la investigación de seguridad cibernética?

¿Realmente hace una diferencia entre los programas de EM de uno y dos años en los Estados Unidos, con respecto al campo de la ciencia de datos en términos de conseguir un trabajo también?

¿Qué tan bueno es el programa de análisis e inteligencia de negocios en IIM Bangalore? ¿Se considera el mejor en la India? ¿Cuáles son las buenas universidades de ciencia de datos en la India?

¿Qué se entiende por big data?

¿De qué trata el libro Big Data Baseball?

¿Cómo manejar los datos faltantes (estadísticas)? ¿Qué técnicas de imputación recomienda o sigue?

¿Cómo se analizan los datos codificados?

¿Puede Google Chrome mostrar mi uso de datos?

¿Has oído hablar de alguien que usa datos de transacciones para ayudar a detectar patrones de fraude?

¿Cómo incorporan las empresas consultoras de alta dirección la experiencia en ciencia de datos en sus modelos de entrega actuales?