¿Las herramientas como BigML o Google Prediction API dejarán a los expertos en aprendizaje automático fuera del trabajo?

DIVULGACIÓN COMPLETA: trabajo para BigML

BigML nunca ha tenido la intención de dejar sin trabajo a los expertos de ML, sino democratizar el aprendizaje automático. En todo caso, tenemos muchos expertos en ML que utilizan felizmente BigML para la creación de prototipos y agilizan la implementación de modelos predictivos aprovechando nuestra API RESTful. Entonces, ¿qué significa “Democratizing ML”?

Bueno, es un hecho bien conocido que muchas organizaciones todavía están luchando por comprender mejor lo que pueden hacer con Machine Learning. Sin embargo, otros que ya están convencidos de su promesa buscan rediseñar sus procesos de minería de datos del viejo mundo además de las nuevas tecnologías de onda (por ejemplo, MLaaS, Big Data, etc.). A menos que sea LinkedIn, AirBnB o Uber, es probable que su organización tenga dificultades para reclutar y retener el talento de Data Science y lograr un ROI positivo más rápido de sus esfuerzos de análisis avanzado.

BigML ha notado este déficit ya en 2011 y comenzó a trabajar para hacer que ML sea más accesible al simplificar las cosas a un nivel en el que todavía es efectivo desde una perspectiva de mejores prácticas de ML, pero lo más importante a un nivel que hace posible que no sea ML expertos (principalmente desarrolladores) para aprovechar:
* una interfaz de usuario intuitiva
* Una API de ML bien diseñada y potente (https://bigml.com/developers)
* una infraestructura de fondo altamente adaptable y escalable
* modelos de caja blanca, interpretables y EXPORTABLES
* a un costo de entrada muy razonable (es decir, planes a partir de $ 30 / mes)
Eso es lo que llamamos Machine Learning as a Service (MLaaS).

@Kirk Hadley tiene razón en que comenzamos esta visión implementando primero árboles de decisión, porque son muy bien entendidos, interpretables y altamente escalables. Sin embargo, la oferta actual de BigML a partir de septiembre de 2015 va mucho más allá de los árboles de decisión. A saber, incluye:
* Conjuntos de bosque de decisión aleatoria
* Conjuntos de ensacado (también conocido como Bootstrap Aggregating)
* K-significa Clustering
* G-significa Clustering (Adivinando la ‘K’ en K-significa Clustering)
* Detección de anomalías (basado en bosque de aislamiento)
* Evaluaciones del modelo (con precisión, recuperación, matriz de confusión, medidas F y Phi)
* Discovery de la Asociación (Gracias a la adquisición de Magnum Opus a principios de este año: http://blog.bigml.com/2015/07/02…)

Nuestra comunidad de usuarios realmente aprecia nuestra posición API-first que los ayuda a resolver PROGRAMÁTICAMENTE casos de uso predictivo de la vida real, porque les da la oportunidad de implementar rápidamente modelos ML en su entorno de producción, una tarea de enormes proporciones para los modelos ML integrados en herramientas como R Para los que tienen una inclinación técnica, tenemos un Slideshare bastante detallado de lo que significa API-first en el contexto de ML:
http://www.slideshare.net/bigml/…

Finalmente, como estamos presenciando la evolución de las herramientas de ML desde las basadas en estaciones de trabajo hasta las que nacen en la nube, cada vez más grandes jugadores (por ejemplo, Microsoft, Amazon) están invirtiendo en servicios MLaaS validando aún más la visión pionera de BigML. Sin duda, las técnicas de Machine Learning seguirán siendo útiles en el futuro previsible como ayudas internas para la toma de decisiones. Sin embargo, el futuro pertenece a servicios de aprendizaje automático fáciles de usar, fáciles de integrar, más rápidos de implementar, adaptables y escalables a la perfección que realizarán su verdadero potencial en manos de desarrolladores creativos y talentosos que desarrollarán aplicaciones y productos inteligentes innovadores que aprovecharán el aprendizaje automático. como una PARTE INTEGRAL de la experiencia del usuario final. BigML seguirá innovando para satisfacer mejor esta necesidad desatendida del mercado.

Yo diría que es un no definitivo. BigML es solo árboles de decisión, que son ampliamente conocidos por su fragilidad y una falta general de robustez. La API de predicciones de Google parece probar diferentes modelos uno contra el otro (probablemente basado en una búsqueda heurística, no pensando que están buscando en la cuadrícula en todo el universo de candidatos a algoritmos), lo que lo convierte en un producto más atractivo, pero no obstante que no funcionaría significativamente Supera a un modelo base simple que normalmente se desarrolla como punto de referencia en las etapas iniciales del proceso de modelado. No esperaría que el producto de Google funcione bien en situaciones donde la ingeniería de características es particularmente necesaria ni en problemas muy complejos.
En resumen, BigML tiene un excelente marketing y una infraestructura escalable construida alrededor de matemáticas bastante simples; Google ha construido ambos en torno a una colección más amplia de matemática simple.

Siempre habrá dos tipos de personas:
1. esclavo de herramientas / tecnologías
2. constructor / maestro de herramientas / tecnologías

Respuesta corta: no. Un supuesto “experto” probablemente esté haciendo más que ejecutar DT y regresiones logísticas. BigML no comercializa para expertos, sino para otro tipo de usuario final.

More Interesting

En la calificación crediticia, ¿cuáles son las ventajas y desventajas del aprendizaje automático en relación con las técnicas de regresión tradicionales?

¿Es posible que un ingeniero de procesamiento de señales se involucre en el campo del aprendizaje automático?

¿Qué significa realmente 'Deep' en Deep Learning?

¿Qué debo tomar Machine Learning o realidad aumentada?

¿Cómo podemos hacer que las redes profundas funcionen de manera eficiente en dispositivos de baja potencia (por ejemplo, teléfonos)?

¿Cuántas imágenes necesito para entrenar una red neuronal convolucional?

¿Qué es el Tanimoto Score y cuándo se usa?

Proporcione tres aplicaciones informáticas para las cuales el Aprendizaje automático parece apropiado y tres para las cuales parecen inapropiadas. ¿Incluya una justificación de sentencia para cada una?

¿Cómo podemos suprimir el ruido de fondo en un teléfono durante una llamada telefónica?

¿Qué se entiende exactamente por pesos compartidos en una red neuronal convolucional?

¿El aprendizaje automático o los algoritmos de aprendizaje se pueden aplicar a problemas de optimización?

¿Es la máquina de comercio científico una estafa?

¿Cuáles son los pros y los contras de los diversos algoritmos de clasificación de Tree Ensemble?

¿Cómo debo combinar la retroalimentación implícita y explícita en el filtrado colaborativo?

¿Cómo se explica el aprendizaje automático y la inteligencia artificial a un niño de 5 años?