La regresión logística o la mayoría de los algoritmos de ML para ese asunto implican multiplicaciones matriciales. Por lo tanto, un enfoque obvio para acelerar estos algoritmos es realizar una multiplicación de matriz paralela. Acelerar las multiplicaciones matriciales es un área bien estudiada y hay implementaciones rápidas de multiplicación matricial, que están muy optimizadas a nivel de instrucción de máquina. Ejemplos de bibliotecas inlcude, https://github.com/fommil/netlib… y http://math-atlas.sourceforge.net/ (ATLAS).
Use JAVA para llamar a estas rutinas altamente optimizadas para hacer los cálculos. En una sola máquina, es muy poco probable que lo haga mejor que esto, utilizando un paradigma de programación paralela de alto nivel. Sin embargo, si hay un clúster informático, lo mejor sería utilizar SparkML o alguna otra biblioteca de cómputo multinodo para acelerar su algoritmo.
- ¿Cuál es la razón para mapear datos de dos idiomas diferentes en un espacio de incrustación de palabras común y no usar dictonarios y asignarle el idioma b a los vectores del idioma a para entrenar un modelo de manera multilingüe?
- ¿Existe una brecha entre las estadísticas y las comunidades de aprendizaje automático? Si es así, ¿por qué?
- ¿Qué debe hacer un estudiante de diploma para aprender software o aprendizaje automático?
- ¿Cómo impacta la alta dimensionalidad en la efectividad del modelo?
- ¿Puedo comenzar a aprender el aprendizaje automático y el aprendizaje profundo sin repasar primero mis conocimientos de matemáticas?