Así es como lo haría, podría haber otros enfoques también. Ponga estas tres cosas:
1. Algunos practicantes que están trabajando en cosas geniales y han escrito buenos documentos o construido asombrosos sistemas de Data Science Esta es la parte más difícil e importante, ya que es difícil contratar a personas experimentadas con carreras estables para un nuevo laboratorio. Esto requeriría una buena visión y mejores beneficios que el promedio. Asegúrese de tener una buena combinación de intereses aquí, o el laboratorio de Ciencia de datos convergería rápidamente a un laboratorio de “Aprendizaje automático” o de “Sistemas distribuidos”.
Contrata con cuidado, aléjate de los “posers”, demasiadas personas conocen muchos términos y no han usado / implementado ninguno de estos. Estas personas son inútiles más allá de las salas de reuniones.
2. Ponga algo de dinero para que los chicos de (1) se queden y creen una cultura. Esto implica crear / soportar software de código abierto / documentos de publicación y acumular un conjunto de desarrolladores que entiendan / usen la tecnología que el laboratorio construye.
Algunos puntos que me gustaría personalmente en un laboratorio de ciencia de datos:
a. Buen dinero.
si. Tiempo para trabajar en las cosas. Good Data Science a menudo toma múltiples iteraciones de desarrollo antes de que sean funcionales. La mayoría de las empresas tratan la ciencia de datos como proyectos de software normales y, por lo tanto, siempre se limitarían a métodos basados en bibliotecas de código abierto comunes “seguros”. Si el tiempo es limitado, un laboratorio de innovación es una mala idea, contrate un equipo.
do. Menos burocracia: menos gerentes de proyecto que no conocen la ciencia de datos (escenario muy común) y más poder de decisión para las personas.
3. Ahora reclute más personas que aprendan de la cultura / personas con experiencia. Ofrezca mejores incentivos para resolver problemas que son de alta prioridad para el gobierno / empresa / lo que sea que el laboratorio esté trabajando.
Ahora tiene un laboratorio de ciencia de datos funcional. Todo lo mejor.
- ¿Cuáles son las principales áreas de la investigación bioinformática actual?
- ¿Qué tecnologías que no son de IBM se están utilizando para mejorar el ecosistema de IBM Watson?
- ¿Cuáles son algunos buenos proyectos en los que un principiante de aprendizaje automático puede trabajar?
- ¿Qué saben los profesionales del aprendizaje automático y los científicos de datos de la industria sobre el análisis, la probabilidad basada en la teoría de la medida y el álgebra lineal numérica?
- ¿Apache Spark es un buen marco para implementar Reinforcement Learning?