En Machine Learning, ¿por qué aplicamos a menudo la suposición de registros independientes e idénticamente distribuidos?

La respuesta simple y simple es un cálculo más rápido y menos desordenado. Los modelos de capacitación tardan más de lo que la gente quisiera incluso con la informática distribuida. Tampoco es que los modelos / representaciones de aprendizaje automático, como las redes neuronales, modelen el cerebro exactamente. Los investigadores acaban de hacer todo lo posible para imitar algunas de las capacidades que tiene el cerebro. El cerebro humano es tan brillante, ni siquiera podemos acercarnos a imitar sus capacidades. También sucede que a través de pruebas empíricas, en muchos casos, los modelos con supuestos simplificadores funcionan tan bien como los modelos con más complejidad.

Además, los supuestos de iid a veces resultan en fórmulas muy bonitas.

TLDR;

Los investigadores trabajan con los recursos limitados (p. Ej., Hardware) y el conocimiento (documentos técnicos escritos hasta el momento), por lo que deben hacer suposiciones para poder obtener un resultado en un tiempo razonable. O a veces necesitan hacer una suposición para obtener algún resultado.

Aprendizaje automáticoinformáticaInteligencia Artificial

¿Alguien puede explicar la arquitectura de Von Neumann?

¿Qué escenarios está utilizando el aprendizaje automático para hoy en sus aplicaciones?

¿La controversia del FBI de Apple expondrá la duplicidad del mundo que creemos que existe?

¿Qué sitios web o empresas están utilizando el aprendizaje automático o la IA que lograron un gran beneficio o impacto?

¿Qué tan bien equipado está India para sostener un ataque cibernético masivo?

¿Funciona el dispositivo de propulsión espacial de la cavidad de microondas EM?

La mayoría de los algoritmos de Machine Learning se basan en principios de probabilidad estadística, que suponen que los registros son independientes e idénticamente distribuidos. Las aplicaciones de dicho algoritmo no serán válidas si los registros de entrenamiento no son independientes e idénticamente distribuidos. Si los registros no son independientes e idénticamente distribuidos, será necesario agregar algunos campos para explicar las interdependencias de los registros de capacitación.

Lalit Patel

More Interesting

¿Cuál es la tecnología actual disponible para leer las señales cerebrales y transferirlas a una computadora para realizar análisis?

¿Cuál es la importancia de los FSM?

¿Qué es el aprendizaje automático y su concepto?

Mis auriculares no reproducen sonido de alta frecuencia, parece estar con un cableado defectuoso. Pero, ¿por qué solo se bloquean los sonidos de alta frecuencia? ¿Es esto físicamente posible?

Cómo trazar puntos GPS en un mapa usando Python

¿Cuáles son las tendencias en el desarrollo de la interfaz computadora humana?

¿Cuál es la máxima imprecisión que uno puede enfrentar al usar un decimal de coma flotante de 32 bits?

En la era de Global Grid Computing, ¿cómo siguen siendo relevantes las supercomputadoras?

¿Qué es un subgrafo predecesor?

¿Cómo han avanzado los avances recientes en aprendizaje automático y visión artificial en el campo de la radiología médica?