¿Qué empresas están haciendo aprendizaje automático real en lugar de ciencia de datos hacky?

Me sorprende que Google, IBM y Microsoft no hayan pasado a la mente, ya que todos son conocidos por los avances en el aprendizaje automático:

Geoff Hinton está detrás del reconocimiento de voz en Google: http://chronicle.com/article/The…

Jeff Dean de Google es conocido por procesar videos de gatos: http://www.nytimes.com/2012/06/2…

IBM es conocido por Watson y su interfaz NLP: http://www.ibm.com/developerwork…

Geoff Zweig en Microsoft también tiene un esfuerzo de reconocimiento de voz sustancial y ampliamente conocido que está en curso: http://research.microsoft.com/en…

Apuesto a que todas las empresas web que invierten cientos de millones o miles de millones anualmente en la construcción de sus propios centros de datos estarían haciendo aprendizaje automático, por lo que se podría adivinar que Amazon estaría en la mezcla, y de hecho, Amazon está contratando personas de aprendizaje automático: http: //www.amazon.jobs/jobs-cate…

Necesitará acceso a una gran cantidad de datos para hacer aprendizaje automático, por lo que el cultivo de datos sería una condición previa necesaria, en la línea de lo que hacen Facebook, Yahoo, LinkedIn, Twitter, eBay y Baidu.

LinkedIn tiene vacantes para personas de aprendizaje automático: https://www.linkedin.com/job/mac…

Facebook tiene un grupo de investigación de IA que hace aprendizaje automático: https://research.facebook.com/bl…

Jimmy Lin y Alex Kolcz de Twitter han publicado artículos sobre aprendizaje automático: https://engineering.twitter.com/…

Yahoo Labs tiene un grupo de aprendizaje automático http://labs.yahoo.com/areas/?are…

Ebay tiene un equipo de aprendizaje automático y ciencia de datos: https://labs.ebay.com/research-a…

Baidu tiene su propio instituto de aprendizaje profundo http://idl.baidu.com/en/

Tiene que haber conferencias a las que vayan estos equipos de aprendizaje automático. CVPR es uno de estos: http://www.pamitc.org/cvpr14/

CVPR me señala a Google Scholar Metrics, que extrae publicaciones como IEEE Transactions on Pattern Analysis e Machine Intelligence que se citan ampliamente: http://scholar.google.com/citati…

Si mira la página CVPR, verá patrocinadores como Nvidia. ¿Por qué nvidia? porque las GPU se están utilizando en el análisis de gráficos a través de HPC, que también está asociado con el aprendizaje automático … También podría mirar a los patrocinadores de CVPR, y al buscar el nombre de la compañía + aprendizaje automático, podría ver lo que están haciendo. . Intel y Xerox también figuran, entre muchos otros.

Podrías crear una lista de los investigadores más citados con un poco del tipo correcto de búsqueda, y luego seguirlos en las redes sociales y aprender lo que están siguiendo. Estoy seguro de que todos los miembros de la comunidad central se conocen o se conocen.

Análisis de datosAprendizaje automáticoCiencia de datosdatosMinería de

¿Por qué necesitamos una matriz de confusión en la minería de datos?

Al entrenar un modelo de ML, ¿debo descartar los datos que tienen características faltantes o debo usar un valor medio para esos valores faltantes?

¿Cuál es la diferencia entre Data Warehousing y Big Data Analytics?

¿Cuál es el mejor sitio web tutorial para aprender el lenguaje Big Data, Hadoop & R?

¿Por qué no vemos computadoras como la pantalla de inicio en Windows Mobile?

¿Quiénes son las mujeres en ciencia de datos?

Un saludo desde las trincheras, pensé que esto debía decirse, aunque puede que no responda directamente a la pregunta.

Fuera de las compañías de Internet y tecnología donde entra en juego un sesgo de prominencia y el peso de la probabilidad es que están haciendo aprendizaje automático real, hay cientos de empresas más pequeñas o menos conocidas que aprovechan el aprendizaje automático de muchas maneras, a menudo de forma considerable. escala empresarial, y dirigido directamente al corazón de los procesos y decisiones que generan más valor (léase: hacer / ahorrar dinero).

El punto es que si algo realmente está dando una ventaja competitiva, y el aprendizaje automático ciertamente puede hacer eso, lo mejor para la compañía es no dejar que nadie lo sepa.

La mayoría del trabajo de aprendizaje automático de vanguardia que se implementa realmente (no se habla) hoy no llegará a ninguna publicación de blog, artículo de HBS o mashable en el corto plazo, o si lo hace, ciertamente no será porque la compañía necesita un ego aumentar.

Se mantendrá en secreto el mayor tiempo posible, con solo sus efectos en el mercado. Una especie de “carrera armamentista invisible” ya ha estado en marcha durante algunos años, y lo que leemos en línea es similar a la lectura pública de noticias nuevas de nuevas ofensivas, técnicas y armas en el campo.

Por otro lado, tampoco es cierto que necesite muchos datos externos para realizar el aprendizaje automático.

Alan Morrison

En otro cierre de las trincheras, busque empresas que utilicen análisis predictivos para fines operativos. Por lo general, son los mejores, que no se pueden contar sobre análisis de negocios generales. He visto muchas aplicaciones de análisis predictivo para fines comerciales generales, pero incluso si se hacen bien, nunca se usan de manera efectiva. Un ejemplo muy típico es la propensión a la rotación. Entonces, tienes un gran modelo para la propensión a la rotación, ¿qué vas a hacer? ¿Vas a apuntar a los agitadores de mayor propensión con algo? El problema aquí es que su modelo predice el abandono de la propensión, no la propensión a salvarse, por lo que, por definición, acaba de resolver lo incorrecto (y, por cierto, atacar a los que abandonan el trabajo es una mala estrategia a largo plazo, y solo necesita saber matemática básica para confirmarlo). Esta es la típica “confusión de objetivos y perfección de los medios”, como lo expresó un individuo muy brillante.

Mi segundo comentario es que veo muchas más soluciones “hacky” en métodos avanzados que en el simple conteo de frecuencias (es decir, cualquier cosa puede implementarse usando SQL, Tableau o incluso una tabla dinámica). La mayoría de las personas no entienden bien los modelos, y simplemente arrojan los datos, curiosos por saber qué escupirá la caja negra. Eso es hacky, en mi opinión. Analizar los datos utilizando métodos simples, incluidos los gráficos, no es “hacky”. Es una forma muy prudente de comprender lo que está sucediendo en el negocio.

Alan Morrison

More Interesting

¿Cuáles son los patrones de diseño para proyectos de minería de datos / aprendizaje automático?

¿Cuáles son los programas similares a Data Science for Social Good y The Fellowship | Código para América?

¿Cuál es el mejor curso en línea gratuito para ciencia de datos / aprendizaje automático como principiante?

¿En qué casos no podemos aplicar el análisis de datos (ordinarios) y tenemos que usar el análisis de datos topológicos? ¿Podrías dar un ejemplo concreto? ¡Gracias!

Si un doctorado en física con experiencia mínima en programación, pero con buenos antecedentes en matemáticas, quiere encontrar un trabajo en ciencia de datos en el mercado estadounidense, ¿qué más debe aprender?

¿Qué servidor utiliza Google para guardar grandes datos?

¿Cuál es la pregunta sin respuesta más importante sobre Quora relacionada con big data y data science?

Cómo convertirse en un científico de datos en 4-5 meses si no tengo experiencia previa con ningún lenguaje de programación

¿Puedo convertirme en desarrollador full stack y científico de datos en 1,5 años?

¿Cómo manejan las empresas el análisis cooperativo de datos que preserva la privacidad? ¿Hay algunos casos reales?