¿Por qué es importante el núcleo en los algoritmos de aprendizaje automático, como SVM o k-NN?

Dos razones. La primera es que, según el tipo de núcleo, proyecta sus datos en un espacio de características de dimensiones superiores. ¡A veces en un espacio de dimensiones infinitas! Si sus datos no son linealmente separables en el espacio de características original, existe una buena posibilidad de que lo sean cuando se proyectan en dimensiones más altas.

La segunda razón, quizás más intuitiva, es que imbuye a cada uno de sus puntos de datos con información sobre el resto del conjunto de entrenamiento. El núcleo se puede ver como una medida de similitud, de modo que sus características se conviertan en “¿qué tan similar es la instancia 1 a la instancia 2?”, “¿Qué tan similar es la instancia 1 a la instancia 3?”, Etc. Esto hace que sea fácil para el clasificador diga: “La instancia 1 se parece mucho a estas otras instancias que tienen la etiqueta ‘A’. Quizás la instancia 1 también debería tener la etiqueta ‘A'”.

AlgoritmosAprendizaje automáticoCiencia de datosClasificación (aprendizaje automático)Estadísticas (disciplina académica)Máquinas de vectores de soporte

¿Hay algún lugar en Gurgaon donde pueda enseñar Data Science gratis?

¿Los científicos de datos usan programación orientada a objetos?

¿Cuáles son los componentes de software comunes de un kit de herramientas de almacenamiento de datos?

¿Cómo es trabajar en un equipo de ciencia de datos de detección de fraude?

¿Vale la pena organizar un concurso de dinero de Kaggle?

En mi iPad, tengo configurado iCloud, y tiene todas las características apropiadas en funcionamiento, pero no puedo conectarme a iCloud Drive. Esto es un error o un problema de hardware. Envié información a Apple, pero no obtuve respuesta. Me gusta la continuidad de icloud.com e iCloud Drive, pero no funciona. ¿Qué tengo que hacer?

Solo para mejorar la respuesta anterior, las funciones del núcleo son útiles debido a lo que se conoce como el “truco del núcleo”.

Si tiene una solución a un problema que puede expresar como un producto interno del vector de consulta y el vector de entrenamiento (que se conoce como la forma dual), eso hace la vida mucho más fácil.
¿Por qué? porque una vez que escriba la solución en este formulario, puede calcular el producto interno utilizando el núcleo complicado que desee. El resto de la solución permanece intacta, y su solución está en el espacio original de baja dimensión. Puede salirse con la suya simplemente calculando los núcleos en un espacio de dimensiones realmente altas (incluso en un espacio de dimensiones infinitas, como en el caso del núcleo gaussiano). ¡Con buena pinta!

Shayne Miel

More Interesting

¿Cuál es la mejor manera de dominar la ciencia de datos en R?

¿De qué se trata este bombo de big data?

¿Qué escuela es mejor para el aprendizaje automático?

¿Flipkart tiene un grupo de ciencia de datos cautivo o algo similar? ¿Flipkart emplea 'Data Scientists'?

¿Hay compañías tecnológicas en el Área de la Bahía que patrocinarán a los estudiantes aceptados en los programas de Stanford MS?

¿Cuál es la relación entre sobreajuste y cambio de datos?

¿Hay algún curso de análisis (en el Reino Unido o en línea) que se especialice en interpretar análisis y datos para darme información comercial significativa?

¿Cómo contrata Uber científicos de datos?

¿Cuál es la diferencia entre Data Science y Big Data?

¿Un científico de datos necesita conocer algoritmos y estructuras de datos, así como un ingeniero de software?