Cómo hacer para recolectar datos de entrenamiento para un algoritmo de aprendizaje automático

En la práctica, los datos de capacitación disponibles y el problema a resolver decidirían el algoritmo de aprendizaje automático en lugar de lo contrario.

Sin embargo, suponiendo que desee probar un algoritmo de aprendizaje automático, responder las siguientes preguntas puede ayudar a comenzar:

  1. ¿El algoritmo es supervisado, no supervisado o semi-supervisado? Por ejemplo, un algoritmo supervisado requeriría datos de entrenamiento etiquetados.
  2. ¿Qué suposiciones hace el algoritmo sobre los datos de entrenamiento? Por ejemplo, un algoritmo puede funcionar solo con variables continuas, o funcionar mejor si las variables involucradas son independientes.
  3. ¿Cuántas variables puede manejar el algoritmo? Por ejemplo, algunos algoritmos pueden no funcionar bien si el número de dimensiones para un punto (una muestra de datos de entrenamiento) involucrado es grande.

Gracias por la pregunta: creo que puede encontrar datos de gran calidad de Stanford Large Network Dataset Collection, agradable de aprender y practicar el aprendizaje automático.

Verifique nuestro producto si tiene interés en el aprendizaje automático o la inteligencia artificial. Servicios de inteligencia empresarial a través de la red