¿Ha publicado Factual.com algún trabajo de investigación (o algún asunto técnico importante) sobre las técnicas de aprendizaje automático que utilizan para rastrear y extraer de la web?

No. Hay varias razones para esto que no son exclusivas de Factual, pero las siguientes pueden ayudar a responder la pregunta de manera más amplia:

Velocidad: los enfoques tecnológicos cambian rápidamente, por lo que un comentario detallado es demasiado pronto o es incorrecto
Equipo: las mismas personas que construyen el producto son las que escribirían tal resumen; la hoja de ruta siempre tiene prioridad
Renuencia: algunas compañías no ofrecerán ventanas a sus negocios para mantener el secreto organizacional (no de hecho, aunque estamos bien)

Algunos argumentan que esto es un lujo en el mundo de las startups, y solo después de que una plataforma de negocios o tecnología se desploma, se puede consentir el entusiasmo por la publicación. Como resultado, nosotros, y otros, hacemos lo mejor que podemos compartiendo de manera más puntual, aunque superficial, a través de presentaciones de conferencia, quora (cf. ¿Cuál es la forma más eficiente de eliminar nombres duplicados en una base de datos de PDI?), y publicaciones de blog.

Aprendizaje automático

Related Content

¿Necesita saber la teoría de la medida para hacer investigación de aprendizaje automático?

Cómo discriminar una señal del ruido en la última investigación y desarrollo de AI / ML

Cómo utilizar una GPU en mis algoritmos de aprendizaje automático de R

Aprendizaje automático: ¿Puede alguien que es horrible en los concursos de kaggle seguir siendo bueno como científico de datos?

¿Qué tan significativo es el artículo de FractalNet?

¿Pueden la comunicación y las tecnologías informáticas promover la democracia? ¿Si es así, cómo?

¿Alguien ha intentado utilizar motores de recomendación y alguna forma de filtrado colaborativo para destacar agujeros en el mercado y producir conceptos para un mayor desarrollo en los productos?

Dudo que usen algo especial. Es decir, Google Places extrae casi tantos lugares con el mismo detalle. Básicamente, confían en una combinación de registro comercial directo y rastreo de otros sitios. En el caso de Factual, es probable que dependan principalmente de este último, además de los datos que obtienen de sus socios.

Sin embargo, la página del fundador enumera a Timothy Chklovski, científico principal, y menciona su registro de publicación. Tiene algunas cosas buenas, pero se trata de un tema ligeramente diferente. No trataría de adivinar cuál es su trabajo actualmente.

Si en realidad están usando “aprendizaje automático sofisticado”, entonces no veo exactamente dónde aparece, a menos que se muestre en la forma en que, por ejemplo, analizan el tipo de cocina (que es plausible, pero no involucra el 90% de su contenido).

Por supuesto, en realidad pueden estar tratando de verificar la mayor cantidad posible de sus datos en las fuentes originales, o pueden tener algún otro control de calidad en su cartera que sea bastante intenso. Parecen tener un sitio web y antecedentes un corte por encima del sitio típico de listado de negocios, además de buenas API.

Tyler Bell

More Interesting

Árboles de decisión: ¿Cómo podar un CARRITO?

¿Cuál es la diferencia entre IA, aprendizaje automático y aprendizaje profundo?

¿Cómo se aplica el aprendizaje profundo en el reconocimiento de imágenes?

¿Cuáles son algunos problemas de Kaggle que ayudarán a un principiante a avanzar?

¿Qué son las características y clases en ingeniería de características?

¿Qué es un uso subestimado del aprendizaje automático?

¿Es posible que, en el futuro, los países sean manejados por una súper computadora que calcule el mejor resultado de una decisión política?

¿Cuál es la diferencia entre clasificación y reconocimiento de patrones?

Tengo un conjunto de datos con 14 características. Quiero aplicar SVM en él usando R. ¿Cómo puedo?

Cómo crear mi propia biblioteca de tokenizadores en PNL

¿Cuáles son algunas buenas ideas de proyectos para aplicaciones web de negocios que utilizan análisis de sentimientos?

¿Se está saturando el aprendizaje automático como campo de investigación?

¿Por qué es difícil construir IA de autoaprendizaje?

¿Puedo hacer una competencia de kaggle con un archivo csv de entrenamiento de 0.5 Gb en mi computadora de 8 Gb y tener éxito?

Soy maestra de preescolar pero estoy muy interesado en las máquinas y quiero comenzar un aprendizaje adecuado. ¿Donde debería empezar?

Web Analytics