¿Cuáles son las diferencias entre los modelos pre-entrenados y entrenados?

Realmente no hay diferencia técnica.

Pero la documentación y los usuarios están usando “modelos pre-entrenados” para referirse a modelos que se comparten abiertamente para que otros los usen. A diferencia de los que los usuarios se entrenan.

Por ejemplo en el contexto de fastText.

Por lo general, los llamados modelos pre-entrenados se entrenaron en un conjunto de datos estándar relativamente grande.

Tiene sentido compartir tales modelos porque

  1. son generales y, por lo tanto, útiles para un público amplio
  2. el tiempo de entrenamiento no es trivial en la máquina del usuario promedio
  3. la mayor parte del trabajo es en realidad la extracción, el formateo y el preprocesamiento
  4. El uso del mismo conjunto de datos hace que los resultados sean comparables y repetibles.

Si tiene un dominio o problema muy específico, máquinas, habilidades y está optimizando resultados prácticos que no son comparables, entonces entrenar sus propios modelos tiene sentido.

O si está desarrollando su propio enfoque de capacitación.

No hay diferencia, ambos comparten los mismos parámetros. Del mismo modo que los modelos pre-entrenados se entrenan en grandes conjuntos de datos generales donde los modelos entrenados representan un dominio específico.

More Interesting

¿Cuál es una buena manera de entender las dos fórmulas con respecto a este modelo gráfico de probabilidad dado?

¿Puedo usar TensorFlow sin tener experiencia con el aprendizaje automático?

¿Qué es la entropía cruzada en palabras fáciles?

¿Es posible usar 'Mínimo cuadrado (LS)' como la función objetivo cuando se trata con un problema de clasificación?

¿Por qué las redes neuronales recurrentes no pueden ampliarse bien?

¿Cuáles son las ventajas de las técnicas de aprendizaje automático sobre las técnicas de pronóstico tradicionales?

¿Cómo podemos "entrenar" sistemáticamente los algoritmos de agrupación sobre qué combinaciones de atributos / características generan en última instancia los tipos deseados de agrupaciones?

¿La IA tradicional se está volviendo obsoleta a la luz del progreso en el aprendizaje profundo?

¿Necesita aprender CSE (motor de ciencias de la computación) para aprender inteligencia artificial, o hay cursos de ingeniería separados para IA y aprendizaje automático?

¿Cuáles son las características del texto en la minería de datos?

¿Qué libros o recursos de probabilidad y estadística debo consultar antes de sumergirme en Machine Learning, PNL, minería de datos, etc.? Soy un completo principiante.

¿Cuáles son los ejemplos de redes neuronales profundas extremas (más de 150 capas)?

¿Cómo funcionan los árboles de decisión para la regresión?

¿Qué piensa la gente del concurso Quora ML CodeSprint 2013?

¿El análisis complejo es relevante para el aprendizaje automático?