¿Cuáles son los conjuntos de datos canónicos de aprendizaje automático utilizados como punto de referencia para demostrar un nuevo método?

Casi todos los conjuntos de datos “canónicos” se almacenan en UCI: UCI Machine Learning Repository: Data Sets

Es un repositorio bien curado y mantenido para varios conjuntos de datos con buena navegación según el tipo de problema.

Los conjuntos de datos de ImageNet son automáticamente “canónicos” porque se usan en una de las competencias más importantes en visión por computadora. Muchos artículos que lo presentan son finalmente aceptados por NIPS (la razón real no es el conjunto de datos en sí, obviamente, sino el hecho de que su investigación es increíble): competencia de reconocimiento visual a gran escala ImageNet (ILSVRC)

Million Song Dataset | Scaling MIR Research: estándar para el reconocimiento de audio

MovieLens – clasificaciones para películas, diferentes escalas

Webscope | Yahoo Labs – Yahoo Datasets, siempre un buen punto de referencia ‘

http://wiki.dbpedia.org/Datasets DBPedia

Wikidata: descarga de la base de datos Wikidata

Sexto Taller EMNLP 2011 sobre traducción automática estadística: desafío de traducción automática, gran corpus, un estándar de oro para SMT y NMT en particular, pero a menudo utilizado para otros fines.

Related Content

¿Hay algunos trabajos relacionados con el aprendizaje por refuerzo?

Cómo mostrar que una convolución transpuesta es equivalente a un paso de respaldo de la capa de convolución, con los mismos pesos que en una propagación hacia adelante

En Python, ¿cómo puedo probar y asegurarme de que mi modelo predice datos correctamente? (principiante preguntando)

¿Cuáles son los casos de uso del uso del procesamiento del lenguaje natural (PNL) en diversas industrias?

¿Vale la pena desarrollar un algoritmo de minería de datos más rápido que otros de código abierto y comerciales existentes? Si vale lo suficiente, ¿qué valor tiene ser el algoritmo más rápido?

¿Qué hace a China tecnológicamente tan superior?

¿Cuál es la capacidad del aprendizaje automático? Quiero decir, ¿cuánto puede ‘aprender’ una máquina?

More Interesting

¿Puedes explicar el descenso coordinado en términos simples?

¿Qué es el aprendizaje de características?

Cómo encontrar la correlación más fuerte entre los vectores de colores a continuación en MATLAB o Python

¿Cuánto aprendizaje automático aprendería al completar el curso Andrew Ng (el de Coursera), en una escala de 100?

¿Cómo cambiará la TPU de Google el mercado de CPU + GPU? ¿Cómo responderán los fabricantes de chips a este cambio?

¿Cuáles son algunos textos recientes sobre métodos de kernel?

¿Cuántos selfies debe leer un Machine Learning antes de poder discernir el origen étnico?

¿Qué sigue después del aprendizaje profundo?

¿Cuál es la diferencia entre el aprendizaje de refuerzo basado en modelos y sin modelos?

En las arquitecturas VGG-16 y VGG-19, ¿por qué hay más capas convolucionales 3 × 3 apiladas consecutivamente en las capas altas que en las capas inferiores?

¿Cuáles son las mejores prácticas cuando se utiliza el análisis predictivo para la industria? ¿Hay algunos marcos o pautas?

¿Cuál es la ventaja de una red neuronal entrenable de extremo a extremo?

¿Por qué no hay bloqueadores de anuncios impulsados por el aprendizaje automático?

¿Qué es el generador Deep Dream?

¿Cuál sería un enfoque razonable para optimizar los ingresos publicitarios del sitio web utilizando datos de GA y aprendizaje automático?

Web Analytics