¿Qué conocimiento se requiere para usar bibliotecas de aprendizaje automático pero no implementarlas?

Recientemente tuve que hacer esto mediante el cual tuve que llamar a tres algoritmos de aprendizaje automático en código Java para clasificar las frecuencias de palabras clave en corpus de texto. Sin embargo, no estoy familiarizado con los algoritmos utilizados de manera significativa.

Entonces, algunos consejos para tratar de responder a su pregunta:

  1. Utilice una herramienta de aprendizaje automático preexistente y reconocida. No intentes “reinventar la rueda”.
  2. Tenga una comprensión básica de cómo funciona cada algoritmo, porque es posible que tenga que documentar esto más adelante.
  3. Sepa qué requieren los algoritmos que debe usar en términos de datos y el formato de esos datos, por ejemplo, archivos .arff para el producto Weka en Java.
  4. Comprender los resultados producidos por los algoritmos.
  5. Sepa cómo llamar a los algoritmos desde el código de su programa, por ejemplo, para Weka, mire esta página.

La intuición principal detrás del aprendizaje automático es encontrar patrones en el conjunto de datos. Todas las bibliotecas de máquinas son como un recuadro negro, que necesita entradas apropiadas y proporciona una salida en presencia o ausencia de atributos de etiqueta de clase. Entonces, ¿cuáles son los puntos que debe tener en cuenta?

  1. Los tipos de atributos de los datos (nominal, ordinal, binomial, leído, numérico o categórico)
  2. Presencia de etiqueta de clase o ausencia
  3. ¿Qué métrica es mejor para sus datos? ¿La puede lograr el resultado que proporcionará el modelo de aprendizaje automático?
  4. ¿Cuáles son los diferentes atributos que tiene el clasificador, como un SVM tiene lineal, radial, cuadrático o cúbico?
  5. ¿Hay algún parámetro para el clasificador, como en SVM tenemos un impulso de aprendizaje y una tasa de aprendizaje?

Por último, nos preocupa alguna mejora en el resultado y el resultado es interpretable.

More Interesting

Para un problema de clasificación (dos clases), ¿es mejor usar dos salidas con softmax o una salida con entropía cruzada binaria?

¿Cuál es la función de las máquinas restringidas de Boltzmann para el filtrado colaborativo?

¿Qué es la regresión en el aprendizaje automático?

Cómo hacer una biblioteca en ML como Tensorflow

¿Es posible que, en el futuro, los países sean manejados por una súper computadora que calcule el mejor resultado de una decisión política?

¿Qué significa que una modelo se sobreajuste?

¿Me puede recomendar algunos buenos libros, blogs, artículos y documentos dedicados a conjuntos de modelos y especialmente apilamiento de modelos, también conocidos como conjuntos de modelos híbridos?

¿Por qué los modelos acústicos DNN / HMM son mejores que GMM / HMM?

¿Tiene sentido usar redes neuronales convolucionales en la identificación biométrica humana basada en ECG?

¿Cómo es un proyecto de visión por computadora "típico", de principio a fin?

¿Qué quiere decir con redes neuronales lineales profundas / no lineales?

¿Cuándo sale mal la reducción de dimensionalidad?

¿Cuál es la mejor opción, Machine Learning o codificación?

¿Cómo podemos usar la herramienta Weka para crear un sistema de recomendación?

Suponga que la máquina es multinúcleo, el tiempo de ejecución de un programa en una máquina que ejecuta solo ese proceso es igual al tiempo de ejecución en una máquina en la que hay otros procesos ejecutados junto con él, ¿no es así?