¿Cuáles son las diferencias entre los modelos pre-entrenados y entrenados?

Realmente no hay diferencia técnica.

Pero la documentación y los usuarios están usando “modelos pre-entrenados” para referirse a modelos que se comparten abiertamente para que otros los usen. A diferencia de los que los usuarios se entrenan.

Por ejemplo en el contexto de fastText.

¿Cómo funcionan los vectores de párrafo frente a codificadores automáticos variacionales?
Cómo interpretar una capa totalmente conectada como una capa convolucional para hacer predicciones densas de píxeles
¿Cuál es el significado de los recientes anuncios de aprendizaje automático de código abierto?
¿Qué redes neuronales se han diseñado para leer los labios?
¿El filtrado colaborativo se considera aprendizaje automático?

Por lo general, los llamados modelos pre-entrenados se entrenaron en un conjunto de datos estándar relativamente grande.

Tiene sentido compartir tales modelos porque

son generales y, por lo tanto, útiles para un público amplio
el tiempo de entrenamiento no es trivial en la máquina del usuario promedio
la mayor parte del trabajo es en realidad la extracción, el formateo y el preprocesamiento
El uso del mismo conjunto de datos hace que los resultados sean comparables y repetibles.

Si tiene un dominio o problema muy específico, máquinas, habilidades y está optimizando resultados prácticos que no son comparables, entonces entrenar sus propios modelos tiene sentido.

O si está desarrollando su propio enfoque de capacitación.

Aprendizaje automático

Related Content

¿Qué es el preprocesamiento de audio?

¿Cuál es la mejor manera de administrar indicadores de función o alternar características para equipos de desarrollo más grandes?

¿Cuál es una buena manera de clasificar los documentos de texto contra un modelo de tema arbitrario?

¿Cuál es el mejor curso de aprendizaje automático en Hyderabad?

¿Cómo se determina la significación estadística para las curvas ROC y los valores de AUC?

¿Cómo es trabajar como desarrollador de redes definidas por software (SDN)?

¿La tecnología ayudó a mejorar las relaciones o las desgarró?

No hay diferencia, ambos comparten los mismos parámetros. Del mismo modo que los modelos pre-entrenados se entrenan en grandes conjuntos de datos generales donde los modelos entrenados representan un dominio específico.

Snehal Patel

More Interesting

¿Cuál es una buena manera de entender las dos fórmulas con respecto a este modelo gráfico de probabilidad dado?

¿Puedo usar TensorFlow sin tener experiencia con el aprendizaje automático?

¿Qué es la entropía cruzada en palabras fáciles?

¿Es posible usar 'Mínimo cuadrado (LS)' como la función objetivo cuando se trata con un problema de clasificación?

¿Por qué las redes neuronales recurrentes no pueden ampliarse bien?

¿Cuáles son las ventajas de las técnicas de aprendizaje automático sobre las técnicas de pronóstico tradicionales?

¿Cómo podemos "entrenar" sistemáticamente los algoritmos de agrupación sobre qué combinaciones de atributos / características generan en última instancia los tipos deseados de agrupaciones?

¿La IA tradicional se está volviendo obsoleta a la luz del progreso en el aprendizaje profundo?

¿Necesita aprender CSE (motor de ciencias de la computación) para aprender inteligencia artificial, o hay cursos de ingeniería separados para IA y aprendizaje automático?

¿Cuáles son las características del texto en la minería de datos?