¿Qué otros algoritmos de aprendizaje automático, además del aprendizaje profundo, se aplican ampliamente en aplicaciones comerciales?

Soporte de máquinas de vectores. Estos se usan mucho para la clasificación binaria o de varias clases. Es mucho más sofisticado que los algoritmos más simples, a la vez que requiere mucha menos información que el aprendizaje profundo. Las aplicaciones de ejemplo son tareas de clasificación para documentos, imágenes y más.

Regresión lineal / Regresión logística Ambos son muy simples de usar. La regresión lineal es probablemente el algoritmo más simple que los niños aprenden en la escuela. La regresión logística también es muy útil para la clasificación. He llegado a creer que la gran mayoría de las aplicaciones de ciencia de datos están cubiertas por estos dos algoritmos.

Árboles de decisión y bosques aleatorios Desde reglas simples donde, por ejemplo, los usuarios reciben diferentes anuncios basados ​​en género y grupos de grupos de edad hasta reglas altamente complejas aprendidas de los datos. Sus conjuntos (bosques aleatorios) también se utilizan comercialmente.

Otros

Modelado de temas

Aumento de gradiente

Aquí hay una pregunta relacionada con toneladas de respuestas para la clasificación de texto.

¿Cuáles son los algoritmos de clasificación de texto populares en uso comercial y cómo se usan?

Los árboles de decisión en varias formas (incluidos los bosques potenciados, adaptables y degradados, en bolsas y aleatorios) siguen siendo muy populares: son mucho más simples de construir que los algoritmos de aprendizaje profundo (que son difíciles de construir). Los árboles de decisión son lo más parecido al aprendizaje automático “plug and play”: se manejan bien con distribuciones extrañas, y si se trata de una simple tarea supervisada de clasificación o regresión con un número razonable de atributos, son difíciles de superar. También se usan en lugares sorprendentes porque son agradables y rápidos, por ejemplo, Microsoft lo usa para clasificar las partes del cuerpo en el Kinect. Vea este documento realmente interesante. También se utilizan mucho en el comercio de alta frecuencia.

La regresión logística y lineal también se usa ampliamente cuando tiene sentido hacerlo, y son lo suficientemente expresivos.

Los enfoques bayesianos también se usan ampliamente, pero tienden a estar en dominios más específicos. Por ejemplo, los filtros de spam generalmente se crean como una bolsa de palabras + Bayes ingenuos (aunque están comenzando a usar el aprendizaje profundo más).

Por el momento, el aprendizaje profundo no se aplica tanto en aplicaciones comerciales. La mayoría de las empresas que realmente han implementado soluciones de aprendizaje profundo tienden a concentrarse en la industria de alta tecnología. Sin embargo, fuera de la alta tecnología, el aprendizaje profundo está pasando por la etapa de investigación y experimentación, o ni siquiera se está explorando en absoluto. La adopción del aprendizaje profundo probablemente aumentará en el futuro a medida que la potencia informática se vuelva más barata y más empresas se sientan cómodas con sus complejidades. Pero por ahora su uso comercial no está tan extendido como los algoritmos de modelado más tradicionales.

Entonces, ¿qué clase de algoritmos más utilizados en la industria hoy en día? Mi suposición sería modelos lineales generalizados (GLM), por ejemplo, regresión logística, lineal y de Poisson. Estos algoritmos son muy atractivos porque son fáciles de interpretar, se pueden entrenar y ajustar rápidamente, son fáciles de implementar, se generalizan bien y pueden ser sorprendentemente buenos en la predicción en algunos casos. Es por eso que las técnicas GLM han existido durante muchas décadas y aún se mantienen firmes contra los algoritmos más nuevos y más modernos.

More Interesting

¿Es obligatoria la experiencia de aprendizaje automático para conseguir un trabajo con Google? ¿Es realmente un tema importante en las universidades?

¿Qué es un sistema o algoritmo de recomendación que dice 'Dado que consumiste X {a} veces, Y {b} veces y Z {c} veces, ¿cuál de {X, Y, Z} debería recomendarte que consumas a continuación'?

¿Qué tipo de aumento de datos se puede usar para imágenes médicas?

¿Cuáles son las áreas más activas de investigación de aprendizaje automático para la aplicación de datos tabulares? Mis datos están en forma de CSV con unos pocos miles de instancias.

¿Cuáles son las restricciones de ordenamiento de la base herbrand en el aprendizaje metainterpretativo?

¿Qué es el aprendizaje automático en tiempo real?

¿Qué cursos deben tomar los antecedentes de EE para el aprendizaje profundo?

¿Debo comenzar a aprender Python y el aprendizaje automático al mismo tiempo?

¿El aprendizaje automático es un subconjunto de la ciencia de datos?

¿Cuál es el significado físico de usar SVD / NMF en una matriz de correlación espacial?

Tengo un conjunto de puntos 3D y cada uno tiene una puntuación. ¿Cómo encuentro / busco un grupo denso de puntos de alta puntuación?

¿Cómo detectar el sarcasmo en frases u oraciones mientras se extrae texto? ¿Hay alguna metodología utilizada?

¿Cuándo recomendaría los modelos gráficos sobre el aprendizaje profundo?

¿Cuál es la diferencia entre Bayes ingenuo y la entropía máxima?

¿Cuál es la mejor manera de manejar múltiples brazos en algoritmos de bandidos?