¿Cómo se usa MySQL en ciencia de datos?

Podemos dividir los sistemas de bases de datos como compatibles con OLTP u OLAP. MySQL cae a la categoría OLTP. Este tipo de bases de datos se utilizan para soportar las necesidades de almacenamiento de datos para los sistemas de producción. No son particularmente útiles para consultas analíticas que se utilizan para profundizar en los datos. Las bases de datos de tipo MPP OLAP como Redshift, Vertica son más útiles en este tipo de tareas.

La forma principal en que MySQL es importante para la ciencia de datos es porque algunos o la mayoría de los datos sin procesar se almacenarían en MySQL, si se utilizan para soportar las necesidades OLTP de la organización. Por lo tanto, estos datos serían necesarios para exportarlos para el aprendizaje automático u otras tareas de análisis. Por lo general, se leerá de la réplica. Pero ahora la mayoría de las organizaciones dependen de registros de aplicaciones en lugar de leer réplicas de MySQL debido a la latencia que se introduce cuando usamos la réplica.

Ciencia de datosdatosinformáticaMinería deMySQL

Related Content

¿Por qué se considera que la ciencia de datos está de moda?

Usando datos y experiencia, estadísticamente, ¿cuál de ellos es más preciso y por qué?

¿Qué porcentaje de una muestra proporciona suficiente análisis de datos?

Si mis datos consisten en Hosts e Invitados, ¿cómo estructuraría la base de datos para que no termine con una gran cantidad de datos duplicados?

En ciencia de datos, ¿qué tema es más útil saber sobre análisis de series temporales o procesos estocásticos?

¿Prefiere usar un adaptador de red inalámbrico interno o externo (usb)?

¿Qué es más rápido: insertar 200,000 filas de datos o actualizar 200,000 filas de datos SQL?

Como explicó Quora User, MySQL es solo una de las herramientas utilizadas para acceder a los datos de la base de datos. Como pasante de ciencia de datos, uso PostgreSQL para consultar, extraer y transformar los datos. Después de lo cual uso R o Python para construir modelos de Machine Learning.

Akhil Kumar

Para que la ciencia de datos tenga lugar, necesita que los datos se almacenen de tal manera que se pueda acceder a ellos y analizarlos. Hay varias maneras de almacenar datos, pero una muy común es colocarlos en una base de datos.

MySQL es un sistema de gestión de bases de datos relacionales de código abierto. En otras palabras, es un gran conjunto de software que se lanza de forma gratuita y permite a cualquiera almacenar y acceder a sus datos de una manera estructurada y relativamente indolora. MySQL es particularmente software en aplicaciones web, pero también se usa en un montón de configuraciones diferentes.

Los científicos de datos deben, como mínimo, tener una buena comprensión de cómo consultar y extraer datos de manera eficiente de las bases de datos (a menudo, incluidas las bases de datos MySQL). También deben tener al menos una comprensión sólida de cómo se diseñan las bases de datos y las diversas compensaciones que se incluyen en las estructuras de las bases de datos.

Akhil Kumar

MySQL es una gran herramienta en sí misma y también si la usa con un lenguaje de programación como, por ejemplo, Java. Lo he estado usando junto con estructuras de datos Java para tener los datos almacenados y guardar RAM.

Por supuesto, su funcionalidad principal es la de consultar los datos después de haber diseñado cuidadosamente la base de datos.

También hay muchas extensiones para realizar consultas espaciales en datos geoespaciales o de ubicación.

Hay un límite en el uso de MySQL si tiene un gran conjunto de datos … digamos 50-100 millones de recods. Se vuelve terriblemente lento cuando realiza una consulta que incluye instrucciones de “agrupar por”. Entonces, para grandes conjuntos de datos, es mejor usar un NoSQL como MongoDB.

Akhil Kumar

More Interesting

¿Tengo la oportunidad de trabajar en San Francisco como científico de datos?

¿La capacitación y la certificación de Big Data ayudarán a impulsar mi carrera como desarrollador de Java?

¿Cómo es el alcance del big data (analítico) en todo el mundo y también en India en los próximos años?

Si eres un profesional de big data / analytics, ¿cuál sería un regalo emocionante que te gustaría recibir?

¿La ciencia de datos y la IA están relacionadas de alguna manera?

¿Cuáles son los mejores cursos de ciencia de datos en iTunes U?

Además de Ciencias de la Computación, ¿cuál es una mejor alternativa de programa de grado para ser un buen científico de datos?

Cómo estimar errores debido al peso de los datos

¿Pueden las herramientas de Big Data ayudar a borrar el ciclo económico?

¿Algunos físicos usan Excel para el análisis de datos?

¿Cuáles son algunas de las empresas de análisis de big data?

Cómo determinar la complejidad de una oración en inglés

¿Cuál es la mayor barrera para la adopción de soluciones de big data en la asistencia sanitaria?

Quiero ser un científico de datos. ¿Qué tipo de trabajo puedo hacer para mi tesis después de aprender Hadoop?

¿Qué significa exactamente la ciencia de datos?

Web Analytics