¿Cuáles son los mejores equipos de ciencia de datos fuera de los Estados Unidos?

Como el primer Científico de Datos en LivePerson y el que reclutó a la mayoría del equipo, puedo decir que estoy muy orgulloso del nivel de talento y nuestra capacidad para ejecutar aquí.

Dado que LivePerson no es tan conocido como las compañías mencionadas en la pregunta, solo explicaré que LivePerson está en el negocio de participación en línea, lo que significa que tratamos de ayudar a los visitantes de varios sitios web como Apple, AT&T y Home Depot a convertir en sitio que utiliza varios compromisos, pero somos más conocidos por nuestra solución de chat. Puede leer más en este artículo de GigaOm (http://gigaom.com/cloud/can-i-he…)

Nuestro equipo está formado por graduados del programa Talpiyot (programa Talpiot), el programa más prestigioso de las Fuerzas de Defensa de Israel, unidad 8200 (http://en.wikipedia.org/wiki/Uni…), el equivalente israelí del estadounidense Agencia de Seguridad Nacional y Harvard Statistics Ph. D, quien también era CTO de una compañía de Ad-Tech en el Área de la Bahía. Afortunadamente, hasta ahora hemos logrado reclutar personas que tienen la famosa triple corona de la ciencia de datos, pero se vuelve difícil.

La estructura del equipo está construida de manera similar a cómo funciona en LinkedIn, donde el equipo no es parte de la organización de I + D sino que está bajo la organización del Producto. Nuestro día a día consiste exactamente en los tres aspectos antes mencionados de nuestro trabajo, trabajando con varias personas de productos que comprenden lo que se puede mejorar en sus proyectos, esto ya ha llevado a dos de los productos de mayor rendimiento de LivePerson (http://www.liveperson.com / produc … y http://www.liveperson.com/produc…), algoritmos de creación de prototipos (principalmente en Python (lenguaje de programación) y Apache Hadoop) como nuestro algoritmo patentado de regresión logística ponderada y binning que estamos pensando en código abierto (esto uno realmente escrito en Java (lenguaje de programación)), haciendo análisis de negocios y escribiendo código de producción que hacemos principalmente en Scala (lenguaje de programación) con todos los sospechosos habituales que se encuentran en los sistemas de producción.

Lo que nos separa de muchos otros equipos de ciencia de datos es que nuestros problemas son muy reales. Estamos tratando de optimizar el tráfico en vivo que llega al sitio web y recursos como agentes humanos y ofertas limitadas para que cada compromiso que hagamos afecte de inmediato a todo el sitio web. Por lo general, este no es el caso con, por ejemplo, los sistemas de recomendación, donde la recomendación entre usuarios es independiente, por lo que la precomputación se puede usar fácilmente.

Si está buscando aumentar sus habilidades de Data Science o mejor aún, ayúdenos a crecer, escríbanos.

El Yahoo! El equipo de Labs de Haifa, Israel, es probablemente el equipo más experimentado y talentoso de doctores e ingenieros en Israel que trabajan en problemas relacionados con la ciencia de datos. Están trabajando tanto en proyectos prácticos a escala de Internet como en problemas puramente teróticos.
La cantidad de artículos que publican es enorme.

No soy objetivo ya que trabajé allí por un tiempo y pude aprender mucho de esta increíble gente …

Creo que el equipo de Simon Rogers en The Guardian está haciendo algunos proyectos realmente interesantes en torno a la ciencia de datos. Hacen un excelente trabajo al limpiar los datos del gobierno y presentarlos de una manera realmente comprensible. http://www.guardian.co.uk/news/d

Puede ver su presentación en Strata London sobre el trabajo que hizo su equipo sobre los ataques con IED en Afganistán y cómo pueden rastrear dónde sucedía año tras año.

El equipo de profesores y estudiantes de aprendizaje automático de la Universidad Nacional de Taiwán se encuentra entre los mejores del mundo.

La facultad allí incluye a los autores de Liblinear y Libsvm (que es lo que está bajo el capó de scikit) y uno de los coautores de “Learning from Data”. Los equipos NTU han ganado la Copa KDD 5 de los últimos 6 años.

(Divulgación completa: primero estudié aprendizaje automático en NTU).

More Interesting

¿Qué buscas en los científicos de datos?

¿Qué significa "casi todas las herramientas de software estadístico disponibles para los científicos alientan el modelado paramétrico y, por lo tanto, el diseño de experimentos basados ​​en suposiciones sobre la distribución de datos que están equivocados"?

¿Cuál es la diferencia entre ETL y Data Warehouse / Data Warehousing?

¿Cuál es la diferencia entre un ingeniero y un científico, y cuál es más divertido?

¿Necesitamos normalizar todas las variables antes de pasar a construir modelos?

¿Que competencia de kaggle debería elegir?

¿Cómo cambiará el mercado laboral de la ciencia de datos en los próximos diez años?

¿Cómo debe medirse el rendimiento de un equipo de ciencia de datos como una unidad? Por ejemplo, si lideraba el equipo de ciencia de datos de LinkedIn, ¿cómo debería evaluar mi desempeño el CEO?

Cómo hacer un trabajo orientado a la investigación en big data

¿Cómo debo planificar cuando aspiro a ser un científico de datos?

Cómo elegir un algoritmo de minería de datos al minar un conjunto de datos real

¿Cuáles son algunas buenas hojas de trucos de ciencia de datos?

¿Cuál es la mejor manera de aprender los scripts de shell para la ciencia de datos?

¿Cómo se crean los archivos .a en Linux?

¿Cómo se sienten los estudiantes de doctorado en aprendizaje automático después del reciente aumento del aprendizaje profundo? ¿Creen que gran parte de su arduo trabajo se desperdiciará?