¿Cómo y qué tipo de datos ha recopilado por su cuenta para el proyecto / servicio ML?

Hay muchos conjuntos de datos públicos que puede usar para entrenar sus modelos. Algunos de los más utilizados se pueden encontrar aquí: Depósito de aprendizaje automático UCI: conjuntos de datos

Si necesita algo más personalizado, siempre puede encontrar datos en Internet. Muchas empresas (como la mía) están obteniendo los datos que necesitan de las redes sociales, los motores de búsqueda u otros sitios web. Es una táctica muy común en el aprendizaje automático.

Si desea comenzar a raspar, le sugiero que eche un vistazo aquí: Un marco rápido y potente de raspado y rastreo web
Por supuesto, hay numerosos marcos de raspado para elegir.

Actualizar:
Esto es lo que estoy construyendo actualmente: Intelistyle – The Artificial Intelligence Fashion Stylist
He raspado a muchos minoristas para obtener los datos para esto como h & m, zara, mango, zalando, etc.

Machine Learning

Related Content

¿Cuáles son los algoritmos para el resumen automático? ¿Alguien puede explicar los pasos en el resumen automático?

Cómo preprocesar el conjunto de datos de correo electrónico de Enron

¿Qué otros algoritmos de aprendizaje automático, además del aprendizaje profundo, se aplican ampliamente en aplicaciones comerciales?

¿Qué factores además del conjunto de datos afectan cómo se elige el tamaño de lote para el descenso de gradiente estocástico (SGD) mini-lote?

¿Por qué hay tantos enfoques generativos en la clasificación de escenas, mientras que el enfoque discriminatorio es el principal en el reconocimiento / detección de objetos?

¿Cómo reconoce la red neuronal convolucional los objetos de las imágenes sin la percepción o reconocimiento 3D?

¿Qué es mejor para una implementación de juego de 20 preguntas, redes neuronales o árboles de decisión?

More Interesting

¿Qué significa el término de procesamiento del lenguaje natural 'modelo de lenguaje' en términos simples?

¿Cómo toman decisiones las neuronas del cerebro? ¿Funcionan de la misma manera que las neuronas artificiales en ANN?

¿Cómo se puede usar una distribución como una característica para la clasificación en el aprendizaje automático?

¿Cuál es la diferencia entre Numpy y TensorFlow?

Aprendizaje automático: ¿cuáles son las ventajas de SVM sobre las redes neuronales y k- vecinos más cercanos?

En términos simples, ¿cómo funciona Gibbs Sampling?

¿Cuál es una buena fuente o explicación sobre la tasa de error de fonema (PER) y la tasa de error independiente de la posición, o la tasa de error de letras?

¿Qué es el procesamiento del lenguaje natural en términos simples?

¿Qué hacen los ingenieros de aprendizaje automático diariamente?

¿El sobreajuste en un conjunto de datos implica que el modelo realmente puede aprender y generalizar sobre ese conjunto de datos, pero desafortunadamente demasiado entrenado?

¿Cuál es la mejor manera de implementar mi algoritmo de reducción de dimensiones?

¿Cómo se justifica el uso de la desigualdad de Hoeffding para demostrar que el aprendizaje es factible?

¿Cómo funcionan las redes interbancarias?

¿Qué es una explicación intuitiva de la iteración de valores en el aprendizaje por refuerzo (RL)?

¿Cómo se calculan las curvas de recuperación de precisión?

Web Analytics