¿Cómo afectarán herramientas como BigML y Google Prediction API al aprendizaje automático? ¿Reducirá la demanda de científicos de datos?

DIVULGACIÓN COMPLETA: trabajo para BigML

BigML nunca ha tenido la intención de dejar sin trabajo a los expertos de ML, sino democratizar el aprendizaje automático. En todo caso, tenemos muchos expertos en ML que utilizan felizmente BigML para la creación de prototipos y agilizan la implementación de modelos predictivos aprovechando nuestra API RESTful. Entonces, ¿qué significa “Democratizing ML”?

Bueno, es un hecho bien conocido que muchas organizaciones todavía luchan por comprender mejor lo que pueden hacer con Machine Learning y / o rediseñar sus procesos de minería de datos del viejo mundo además de las nuevas tecnologías de onda (por ejemplo, MLaaS, Big Data, etc.). A menos que sea LinkedIn, AirBnB o Uber, es probable que su organización tenga dificultades para reclutar, retener el talento de Data Science y lograr un ROI positivo más rápido con sus esfuerzos de análisis avanzado.

BigML ha notado este déficit ya en 2011 y comenzó a trabajar para hacer que ML sea más accesible al simplificar las cosas a un nivel en el que todavía es efectivo desde una perspectiva de mejores prácticas de ML, pero lo más importante a un nivel que hace posible que los expertos que no son de ML (principalmente desarrolladores) a
* aprovecha una interfaz de usuario intuitiva
* un API de ML bien diseñado y potente (Desarrolladores | BigML.com)
* una infraestructura de fondo altamente adaptable y escalable
* a un costo de entrada muy razonable (es decir, planes a partir de $ 30 / mes)
Eso es lo que llamamos Machine Learning as a Service (MLaaS).

Comenzamos esta visión implementando primero árboles de decisión, porque son muy bien entendidos, interpretables y altamente escalables. Sin embargo, la oferta actual de BigML va MUCHO MÁS ALLÁ (Novedades | BigML.com) árboles de decisión. A saber, incluye:
* Conjuntos de bosque de decisión aleatoria
* Conjuntos de ensacado (también conocido como Bootstrap Aggregating)
* K-significa Clustering
* G-significa Agrupación
* Detección de anomalías (basado en bosque de aislamiento)
* Evaluaciones del modelo (con precisión, recuperación, matriz de confusión, medidas F y Phi)
* Discovery de la Asociación (Gracias a la adquisición de Magnum Opus a principios de este año: http://blog.bigml.com/2015/07/02…)

Nuestra comunidad de usuarios realmente aprecia nuestra posición API-first que los ayuda a resolver PROGRAMÁTICAMENTE casos de uso predictivo de la vida real, porque les da la oportunidad de implementar rápidamente modelos ML en su entorno de producción, una tarea de enormes proporciones para los modelos ML integrados en herramientas como R Para los que tienen una inclinación técnica, tenemos un Slideshare bastante detallado de lo que significa API-first en el contexto de ML:
http://www.slideshare.net/bigml/…

Finalmente, como estamos presenciando la evolución de las herramientas de ML desde las basadas en estaciones de trabajo hasta las nacidas en la nube, más y más grandes jugadores están invirtiendo en servicios MLaaS validando aún más la visión pionera de BigML, por ejemplo, más recientemente Microsoft, Amazon. Sin duda, las técnicas de Machine Learning seguirán siendo útiles en el futuro previsible como ayudas internas para la toma de decisiones. Sin embargo, el futuro pertenece a servicios de aprendizaje automático fáciles de usar, fáciles de integrar, más rápidos de implementar, adaptables y escalables a la perfección que realizarán su verdadero potencial en manos de desarrolladores creativos y talentosos que desarrollarán aplicaciones y productos inteligentes innovadores que aprovecharán el aprendizaje automático. como una PARTE INTEGRAL de la experiencia del usuario final. BigML seguirá innovando para satisfacer mejor esta necesidad desatendida del mercado.

More Interesting

Los algoritmos de ML escritos en Java funcionan bien para un conjunto de datos más pequeño. Para un conjunto de datos grande, ¿cómo podemos escalar estos algoritmos? ¿Necesitamos buscar algoritmos distribuidos / mapas distribuidos en memoria / NOSQL / archivos para leer y escribir grandes conjuntos de datos o hay alguna buena API?

¿Cuál es un algoritmo de detección de imagen apropiado para detectar corrosión / óxido?

¿Qué opina del Proyecto Microsoft Kensci que utiliza el aprendizaje automático en la gestión predictiva de riesgos de salud?

¿Hay algún ejemplo en la inferencia bayesiana de que, incluso con infinitos puntos de datos, el efecto de lo anterior no puede ser "eliminado"?

¿Cuáles son algunos proyectos de aprendizaje automático de nivel principiante que se pueden hacer después de una clase de Coursera de Andrew Ng?

¿Qué significa realmente la matriz de covarianza de la estimación de máxima verosimilitud de la distribución normal multivariante?

¿Cuán sensible es el análisis de componentes independientes (ICA) a la simultaneidad de la señal de entrada?

¿Es el sesgo entre las mejores universidades frente a otras universidades en los Estados Unidos tan malo como el sesgo de IIT frente al resto de la India?

¿Cuál es la divergencia KL entre un Gaussiano y un Student-t?

¿Qué es una explicación simplificada y una prueba del lema de Johnson-Lindenstrauss?

En el aprendizaje automático, ¿cómo estima el descenso de gradiente la pendiente de la función de pérdida en un punto dado?

Cómo construir un proyecto de aprendizaje profundo en dos meses

Procesamiento del lenguaje natural: ¿Cuáles son algunas ideas de problemas / proyectos sobre la clasificación jerárquica de textos?

¿Cómo es trabajar en problemas de aprendizaje automático en un entorno empresarial?

¿Qué campo es el mejor, big data o machine learning?