¿Podemos nombrar funciones de funciones en CRF como funciones de kernel como para SMV?

En realidad no, porque la función del núcleo es, en términos generales, algo que codifica la similitud en el espacio de entrada, de modo que la salida de una entrada desconocida se puede predecir a partir de entradas conocidas a través de esta similitud. Básicamente es como asignar los datos de entrada a otro dominio representándolos por su similitud y resolver su problema en ese dominio.

Por otro lado, una función de función en CRF (y modelos lineales / log-lineales / no lineales en general) es algo que cree que representa un cierto aspecto de los datos. Puede usar cualquier cosa que genere algún número para eso, sin mencionar su utilidad.

Para los CRF, puede usar cualquier función de valor real como función de función (a menudo se usan funciones booleanas), pero en SVM (y máquinas de núcleo), un núcleo debe ser positivo (semi) definido, ya que debe actuar como un ” medida de similitud (o producto de puntos generalizado). En este sentido, los núcleos capturan un cierto aspecto de los datos de entrada; sí, puede llamar a los núcleos como funciones de función, pero no al revés. (Si observa la regla de predicción de SVM (y máquinas del núcleo), no es más que una suma lineal de núcleos para cada punto de datos de entrada (conocido), cada uno de los cuales es una “función de función” que se define como una similitud con un punto de datos)

Aprendizaje automáticoProbabilidadReconocimiento de patrones

Related Content

¿Cuáles son los mejores solucionadores de programas cuadráticos?

¿Por qué las técnicas de optimización como el gradiente natural y los métodos de segundo orden (L-BFGS por ejemplo) no se usan mucho en el aprendizaje profundo?

¿Las redes de cápsulas reemplazarán a las redes neuronales?

Comencé a aprender Machine Learning pero estoy luchando con conceptos matemáticos como la regresión lineal. ¿Cuál debería ser mi punto de partida en tal caso?

¿Cuál es la razón para mapear datos de dos idiomas diferentes en un espacio de incrustación de palabras común y no usar dictonarios y asignarle el idioma b a los vectores del idioma a para entrenar un modelo de manera multilingüe?

¿Cómo reformateo mi Windows Vista?

¿Cuál es la ventaja de Bayesian Naive Bayes sobre Naive Bayes simple?

More Interesting

¿Cuáles son algunos usos prácticos o aplicaciones del conjunto de datos de YouTube 8M?

¿Qué hace que un modelo sea interpretable?

¿La retropropagación de red neuronal de convolución utiliza un algoritmo en línea o un algoritmo por lotes?

¿Qué significa estadísticas de coexistencia?

¿Cuál es la relación entre IA, aprendizaje automático y ciencias de la computación? ¿Hay especializaciones en IA o aprendizaje automático, o son especializaciones en informática?

¿Qué llamarías técnicas de aprendizaje no automático?

¿Pueden las redes neuronales convolucionales entrenarse para jugar al ajedrez realmente bien?

¿Cuál es la diferencia entre la clasificación de vectores de soporte y la regresión? ¿Un regresor de vectores de soporte se comporta como una red neuronal por casualidad?

¿Cuál es una buena manera de entender las dos fórmulas con respecto a este modelo gráfico de probabilidad dado?

¿El aprendizaje por refuerzo es escalable?

¿Puede el preprocesamiento de datos en redes neuronales de IA (aprendizaje profundo) ser dinámico y automatizado (en lugar de estático y manual)?

¿Qué profesores / grupos / laboratorios están trabajando en el aprendizaje profundo en el MIT?

¿Quién ha explorado las aplicaciones del modelo Word2vec en datos que no sean lenguajes naturales?

¿Por qué una red neuronal no es propensa al sobreajuste a pesar de tener tantos parámetros?

¿Por qué Apple no equipa sus máquinas con mejores opciones de tarjeta de video?

Web Analytics