Cualquiera que haga computación científica.
La informática científica ha sido históricamente la fuente de problemas de big data (y en su mayor parte, soluciones). El año pasado, visité algunas startups de Silicon Valley con problemas de big data que sentí que podrían haber sido resueltas fácilmente por un físico computacional; Una de esas aplicaciones era para un procesador de imágenes a gran escala que necesitaba una implementación sólida del modelo Ising. Estoy relativamente convencido de que las startups parecen haberse olvidado de que las personas pueden haber resuelto algunos (pero de ninguna manera todos) de los problemas computacionales de big data, así que pensé que debería dar un saludo a algunos de los “viejos” escuela “solucionadores de problemas de big data.
Por ejemplo, considere las siguientes empresas (que tienen mucha gente técnica que está resolviendo problemas decididamente no relacionados con el consumidor) y sus problemas de big data:
- ¿Cómo se usa una capa oculta soft-max en una red neuronal profunda?
- Regularización: ¿Por qué se llaman así los SVM L1 y L2 cuando ambos miden la distancia a un hiperplano a lo largo de la proyección ortogonal?
- Cómo aprender los conceptos básicos del aprendizaje automático dentro de una semana para una entrevista de trabajo
- ¿Cómo funciona el entrenamiento multi-gpu?
- ¿Es inevitable la multicolinealidad en los datos experimentales? Si no, ¿en qué condiciones podemos esperar multicolinealidad?
- IBM (empresa) – Supera los estereotipos (desafortunadamente comunes) de ‘Big Blue’ como solo el inventor de la PC. Solo considere los esfuerzos científicos de IBM como Blue Gene (computadora de propósito general creada inicialmente para resolver el gigantesco problema de datos que plantea la biología computacional) y la computación cuántica. Todos estos presentan enormes problemas de computación científica que pueden generar petabytes de datos. ¿Necesito decir mas?
- Renaissance Technologies (fondo de cobertura) – James Simons, matemático y fundador de Renaissance, crea mucho valor para sus inversores. Hasta donde puedo decir, las técnicas estadísticas (especialmente la minería de textos) son especialidades de casi todos los empleados técnicos (léase: casi todos) en RenTech. Sin embargo, si crees en Quora User, quizás la experiencia de Simons con Gauge Theories te haya ayudado. Para ser honesto, debería nombrar prácticamente todos los fondos cuantitativos , pero dado que Renaissance es conocido por su visión (relativamente) abstracta de cualquier mercado ‘mercantilizable’ como máquina generadora de señales, sirven como un gran ejemplo de estadísticas para la victoria.
- Amgen (empresa) y Genentech : al menos cuando trabajaba en Pharma, Amgen y Genentech eran reconocidos por sus grupos de química computacional y biología computacional. El futuro del diseño racional de medicamentos requerirá encontrar formas combinatorias para reducir el espacio de estado (estimado) de [matemáticas] \ aproximadamente 10 ^ {160} [/ matemáticas] posibles moléculas pequeñas y medicamentos biológicos.
- PARC (empresa) – Ethernet nació aquí. Ahora trabajan para resolver problemas como la dependencia energética utilizando simulaciones masivas que generan terabytes de datos.
- Liga Mayor de Béisbol – Sabermetrics para las masas de fantasía.
La razón principal por la que menciono Scientific Computing es porque actualmente estoy trabajando en problemas de datos gigantes en DE Shaw Research . Estamos tratando de hacer que la biología computacional esté un poco más fundada en la física, así como ayudar a que las computadoras sean útiles en nuestra búsqueda de medicamentos diseñados racionalmente. Si está interesado en algunos de nuestros problemas de datos, le sugiero que consulte algunas de las publicaciones de nuestro grupo, para tener una idea de los grandes problemas de datos en física / química de los computadores.
Ver: http://www.deshawresearch.com/pu…