¿Está bien usar un modelo de aprendizaje automático no supervisado para la predicción?

Ciertamente es factible, pero no diría que es lo mejor. Puede usar fácilmente el aprendizaje automático no supervisado para realizar la agrupación, y desde allí puede limitar los grupos a 10 (si tiene 10 clases, por ejemplo), y luego, para cada nuevo punto de datos, simplemente encuentra qué grupo coincide más estrechamente.

De hecho, el aprendizaje de un disparo generalmente se realiza de esta manera, porque no hay entrenamiento / modelo parametrizado involucrado. Una actualización de este paradigma son las Redes de correspondencia de Google, que utilizan redes neuronales capacitadas en un conjunto de datos supervisado primero para extraer características y elevar los píxeles sin procesar a un nuevo espacio de datos, de modo que kNN se vuelve más fácil.

Dicho esto, definitivamente esta no es la mejor manera de hacerlo. Si realmente no puede pasar por el esfuerzo de etiquetar a mano, intente preguntarle a sus amigos o use Amazon Mechanical Turk, porque el aprendizaje no supervisado es realmente fastidioso y solo es realmente práctico en un subconjunto limitado de problemas de predicción. Por ejemplo, si desea predecir el texto, ¿cómo lo haría? Hay demasiado contexto involucrado para que un simple algoritmo de agrupación / kNN lo resuelva, y el conjunto de datos probablemente será tan ruidoso que tener, por ejemplo, 10k clústeres para 10k clases de vocabulario sería increíblemente extendido.

Desde mi perspectiva, la respuesta general es que rara vez es útil, ya que utiliza principalmente el aprendizaje no supervisado para agrupar objetos similares. Uno podría pensar que aún podría ser útil para un algoritmo predictivo, pero recuerde que estos grupos no están etiquetados. Por lo tanto, definir el significado de cualquier grupo particular es difícil para fines de predicción, excepto en algunos casos en los que puede reducir sus necesidades predictivas a un estado binario. Me cuesta pensar en otros casos en los que lo elegiría por una ruta diferente.

Básicamente, usted elige su modelo de aprendizaje (E) con respecto a alguna tarea (T) y una medida de desempeño (P) si su desempeño en (T), medido por (P), mejora con la experiencia aplicada (E).

¿Es una clasificación o un problema de regresión? ¿Está etiquetado o no? ¿Estoy buscando una salida de ‘descubrimiento’ de clústeres / agrupaciones o una salida ‘predictiva’? Estas respuestas generalmente decidirán qué modelo de aprendizaje usar.

More Interesting

¿Vale la pena aprender HTML o los creadores de sitios web y la inteligencia artificial lo volverán inútil en el futuro?

¿Cuáles son los pros y los contras de la IA?

¿Cómo programar un robot? ¿Cuál es el lenguaje de programación más preferido para ello?

¿Qué papel tendrá la IA en el enfoque de diseño de IDEO?

¿Los desarrolladores front-end serán reemplazados por IA?

¿Qué tan pronto los robots reemplazarán la mano de obra en trabajos físicos de alta habilidad como la construcción?

¿La IA avanzada conducirá a la compañía de mil millones de dólares?

¿Cuáles son algunos algoritmos de inteligencia artificial necesarios para los desarrolladores de juegos?

¿Cuáles son las trampas / trampas / deudas técnicas a tener en cuenta si alguien está comenzando una codificación de visión por computadora y una aplicación de aprendizaje automático en C ++?

¿Cuáles son algunas definiciones breves y funcionales del concepto de "concepto" en varios campos?

¿Las formas de vida artificial no estarían sujetas a la ley con respecto a crímenes como hurto y asesinato en primer grado?

Dado un problema de predicción, ¿cuáles son los principios que intervienen en el diseño de una red neuronal para ese problema?

¿Qué pasa si la policía fue reemplazada por robots?

¿Cuál es la dificultad de aplicar el método de aprendizaje profundo a los mercados financieros?

¿Qué universidad debo solicitar para el Máster en CS y la especialización en Inteligencia Artificial?