¿Cuáles son las desventajas comunes de tener un conjunto de datos dispersos al crear un modelo ML?

Las desventajas comunes serían (no exactamente para el aprendizaje, sino quizás desde una perspectiva de disponibilidad de recursos)

Memoria limitada
Poder de procesamiento limitado
La combinación de los cuales hace que sea imposible ejecutar los algoritmos a veces o lo hace realmente lento. Sin embargo, puedes evaluar la situación.

La escasez no siempre es una desventaja, a pesar de que hablamos de “La maldición de la dimensionalidad”. De hecho, esto da más información sobre la estimación del modelo.

Puede usar PCA, LDA, Autoencoders, etc. para reducir la dimensionalidad.

El manejo de datos de alta dimensión es complicado y a veces imposible si el algoritmo elegido requiere que todos los datos estén en la memoria.

Sin embargo, existen métodos de “aprendizaje en línea” como el gradiente estocástico, que no requiere que cargue todo el conjunto de datos en la memoria.

(PD: ¡según tengo entendido! Puede haber muchas otras cosas que afectan el proceso)

Aprendizaje automáticoCiencia de datosConjuntos de datosdatosMinería de

Related Content

¿Cómo utilizan los bancos la minería de datos?

Cómo concentrarme en mis planes (ciencia de datos y programación) para vacaciones de verano

¿Qué idioma debería preferir para la ciencia de datos?

¿Cuáles son las preguntas más frecuentes sobre entrevistas de ciencia de datos?

¿Cuáles son algunas aplicaciones impresionantes de big data y machine learning?

¿De qué manera es Excel VBA útil para los científicos y analistas de datos?

¿Cuál es el principal de una computadora?

La escasez en su mayoría significa que manejas datos realmente de alta dimensión, lo que puede ser un problema en sí mismo.

Algunos algoritmos de aprendizaje automático tendrán problemas con dichos datos (por ejemplo, árboles de decisión).

Arjun Gowda

More Interesting

¿Cómo pueden los bancos (pequeños, medianos y grandes) usar big data para ser más eficientes?

¿Cómo ayuda la normalización de datos en Machine Learning?

Cómo calcular la distribución estadística en un gran conjunto de datos

¿Debo hacer mi maestría en Data Analytics / MBA en Nueva Zelanda, Dubai o Alemania?

Cómo cambiar mi carrera de desarrollador front-end a ciencia de datos / informática científica

Si cada ciencia usa datos, ¿qué es la ciencia de datos?

¿Debo ir para el desarrollo de Android o la ciencia de datos o la programación de Python o el aprendizaje automático?

¿Cuál es el tema de ciencia de datos Preguntas frecuentes?

¿Existe una demanda de escritores técnicos que se especialicen en ciencia de datos?

¿Cuál es una mejor iniciativa para aprender ciencia de datos: Python o R?

Hicimos una prueba A / B. La prueba ganó, así que hicimos el cambio en el sitio para todos los usuarios, pero después de esperar un tiempo, nos dimos cuenta de que la nueva versión del sitio no estaba funcionando mejor que la anterior. ¿Cuál podría ser la razón?

¿Cuál tiene el mejor alcance, Big Data o AWS?

¿Cuál es la mejor tecnología, ciencia de datos o big data?

¿Cuáles son los desafíos de la migración de datos?

¿Cuáles son las tecnologías actuales utilizadas en el análisis de datos?

Web Analytics