Cómo convertir un algoritmo de entrenamiento de redes neuronales realmente poderoso en un producto comercial

Felicidades si lo que dices es cierto. Puede ser un cambio de juego. Sin embargo, ¡ay! Es el tipo de datos que hace que su algoritmo se ajuste bien o mal y no al revés.
Pregúntese

¿Cuál es la base de su reclamo? ¿Qué conjuntos de datos o aplicaciones ha probado para verificar sus resultados? o ¿Estás haciendo Overfitting?
¿Encontró una aplicación sólida para demostrar su modelo?
¿Esa aplicación tiene algún valor o importancia?
¿Alguien no lo ha hecho antes? ¿Hiciste una encuesta bibliográfica o una búsqueda de patentes?
¿Tiene un prototipo viable para demostrar su modelo?

Lo siento, pero una frase como ” Varios han sugerido probar el código contra MNIST. Investigarlo. Ya sé que los resultados serían buenos pero no excelentes “, parece demasiado optimista. Debes ser un genio que con solo mirar los datos de MNIST sabías que tu clasificador funcionaría muy bien. ¡Desearía tener esos superpoderes! Felicidades por derrotar la investigación de Deep Learning solo por el poder del pensamiento. Desafortunadamente, la ciencia no funciona de esa manera, necesita evidencia consistente y repetible.
(No te estoy desanimando, ¿estas son las preguntas que alguien hará, o pueden ser incluso más duras? De hecho, soy un gran defensor de las ideas para construir productos comerciales que usan Machine Learning, pero no se puede hacer una opción para todos solución)
De todos modos, ¿por qué no lo pruebas en MNIST para empezar? Sus datos fáciles, probar otros conjuntos de datos difíciles, participar en competiciones de Kaggle como sugirió el usuario de Quora. Lea sobre No hay teorema de almuerzo gratis. Y luego mira dónde estás parado.

Aprendizaje automáticoAprendizaje profundoInteligencia ArtificialRedes neuronales artificiales

¿Cuáles son las mejores prácticas para elegir el tamaño de estado oculto en RNN?

Máquinas de factorización: ¿cómo hacen los FM para hacer predicciones y aprender?

Intuitivamente, ¿cómo funcionan los multiplicadores de Lagrange en SVM?

¿Por qué asumiríamos que los datos son iid cuando no lo son?

¿Qué es una lista de proyectos de IA que podría hacer para mejorar cada vez más en aprender cómo funciona la inteligencia artificial?

¿Existe un mapeo limpio de los ordenamientos de N objetos en la recta numérica?

En primer lugar, me gustaría felicitarte por tu logro. El dinero no lo es todo, pero la determinación, la pasión y la consistencia también pueden llevarte lejos. Como la mayoría de las personas han declarado, es necesario demostrar un sistema de este tipo con datos de la vida real en la “naturaleza” y me refiero a los datos de la vida real de videos naturales o imágenes de personas reales, no tomadas con cuidado por algunos grupos de investigación.

Sin embargo, por la forma en que se formula la pregunta, parece demasiado bueno para ser verdad. Esto se debe principalmente a que el reclamo llega de repente y parece que ha sido endulzado o que “todo lo que rechina no es oro”. Seré honesto aquí, por lo general, tal reclamo debe venir con algún respaldo, una demostración del sistema en acción en YouTube, etc. Sé que tal vez no haya tiempo para hacer una evaluación comparativa académica, ya que le apasiona convertir esto en un comercial producto.

Pero no lo dudo por completo porque no quiero ser el tipo que dudaba de una gran persona. Le creo porque este descubrimiento de investigación no se limita a grupos de investigación privilegiados en laboratorios subterráneos súper secretos con fondos multimillonarios. Siempre hay una desventaja para cualquier cosa. Porque la investigación realizada por grupos de investigación, aunque fructífera, la mayoría de las veces podría no ser donde se hacen descubrimientos críticos.

Los grupos de investigación pueden ser rápidos para probar cosas, pero es muy poco probable que sigan apasionadamente un camino “poco prometedor” atenuado debido a la presión de las personas o empresas que los financian. El camino “poco prometedor” en realidad puede resultar más fructífero a largo plazo.
Las instrucciones de investigación son de naturaleza puramente heurística para maximizar los recursos de investigación, por lo tanto, ningún grupo de investigación o compañía, sin importar cuán ricos o grandes puedan lograr pasar por todos los caminos de investigación posibles. En el aprendizaje automático, el espacio de la solución es enorme, por lo que hay suficiente espacio para el descubrimiento accidental de un algoritmo de aprendizaje desconocido, incluso por un solo investigador apasionado. Debido a que este espacio de solución es tan grande que ningún dispositivo o sistema computacional puede permutar a través de él en su totalidad.
La investigación tiende a estar de moda en la naturaleza, ahora el aprendizaje profundo es la charla del día y mañana podría ser otra cosa. La mayoría de los grupos de investigación grandes o financiados tienden a buscar direcciones de investigación modernas, pero la historia muestra que donde está todo el mundo, no es necesariamente el lugar correcto. Un investigador apasionado como usted probablemente hizo lo contrario, mientras que otros optaron por los algoritmos de moda y ahora ha encontrado una paz perdida. No te perdiste en el ruido.

Convertir su descubrimiento en un producto comercial de la vida real podría no ser fácil. Hasta ahora solo ha realizado el 50% del trabajo, el otro 50% será igualmente desafiante. Patente más tarde, dependiendo de su país, hay un período de gracia de aproximadamente un año desde el momento en que comienza a usar su tecnología patentable en un producto comercial hasta que se vuelve no patentable. También puede optar por un secreto comercial, ya que una patente tendrá que revelar el funcionamiento interno del algoritmo para que algunas grandes compañías puedan aprovechar y no tenga suficiente tiempo y fondos para demandar legalmente a esas compañías.

La otra cosa es que puedes crear una aplicación para eso, como una que realice fotos de Google en Play Store :). Su sistema debería poder ejecutarse en dispositivos móviles porque ha declarado que es rápido entrenar y ejecutar, por lo tanto, cree una aplicación especialmente en la categoría de fotografía, ya que el aprendizaje automático se demuestra mejor mediante el reconocimiento de imágenes / objetos. Puede que no sea una aplicación para casos de uso normal, sino una aplicación de demostración para que otros investigadores realicen pruebas.

O puede regalarlo todo gratis, ponerlo en libertad, como usted dijo, planea abrir el algoritmo de código abierto. Esto puede no ser fácil ni el camino correcto porque como inventor realmente necesita beneficiarse de su trabajo, pero es un desafío, incluso el algoritmo de búsqueda de Google tuvo tiempos difíciles cuando se creó por primera vez. Tocarás muchas puertas y solo unas pocas se abrirán, es la vida, además de que nada es fácil.

Personalmente, he desarrollado un sistema de reconocimiento de objetos a nivel de instancia de última generación desde cero y he lanzado una aplicación de Android para unir imágenes en panoramas mediante la coincidencia y alineación de imágenes utilizando el sistema que llamo BIMOR – (Objeto motivado biológicamente Sistema de reconocimiento). Todo lo construido desde cero, incluso el algoritmo de descomposición de valor singular (svd) para el álgebra lineal tuvo que ser codificado desde cero, también implementé el algoritmo Leverberg marquadt para el ajuste de paquetes. No se utilizaron bibliotecas externas. Escribí BIMOR API y Bimostitch únicamente y no está disponible públicamente por ahora.

BIMOR es un algoritmo de visión por computadora altamente eficiente capaz de hacer detección de objetos a nivel de instancia en tiempo real a más de 60 fps o más en máquinas modernas, también se ejecuta rápidamente en dispositivos móviles. Pero tengo un desafío, ¿cómo comercializarlo de manera efectiva? He seguido la dirección de creación de la aplicación por ahora.

Actualmente estoy extendiendo el sistema para tratar problemas de clasificación de objetos a nivel de categoría mediante el uso de nuevos algoritmos de aprendizaje. Lo demostraré más adelante.

Espero que esto ayude 🙂

Carlos Reyes

Me encuentro en una situación similar, así que he pensado profundamente en su pregunta durante meses o años. En mi caso, se trata de algunos algoritmos fractales que estoy desarrollando que se pueden aplicar al aprendizaje profundo o a la IA o muchas otras áreas.

1) Lo primero que diría es que necesitas compararlo con otros métodos. Como afirma que su punto más fuerte es que es fácil de usar y que no puede vencer a un kit afinado en un problema dado, entonces supongo que busca un uso masivo de la idea en lugar de enfocarse en vencer algunos problemas difíciles o no resueltos .

Entonces, la única forma en que puedo probarlo sin revelar la idea es crear una API disponible desde la web y crear un front-end (basado en la web, aplicación móvil, etc.) que use estas API para resolver algún tipo de problema interesante para las personas . El problema de la bruja que podría ser es una pregunta muy difícil que deberías imaginar por ti mismo, pero sin ella, nadie creerá tus reclamos (grandes reclamos, grandes demostraciones, no estoy seguro de que se traduzca de esa manera, pero entiendes la idea) .

Por ejemplo, tenía una versión inicial del algoritmo fractal adaptada para optimizar funciones (encontrar el mínimo global), por lo que ejecuté un punto de referencia contra los dos algoritmos más utilizados, así que supe dónde estaba realmente ( http: //www.hcsoft. net / sergio / kar …).

SOLO después de esto, puedo decir que mi algoritmo es similar en precisión a los demás (cuando no pierden totalmente el mínimo) pero mucho más robusto (no se pierde en los mínimos locales tan fácilmente como lo hacen los demás). Verifique las columnas etiquetadas como “Std”, ya que le dicen cuán uniformemente el algoritmo encontró el mimimum correcto en las muchas veces que se probó.

2) Sobre el lanzamiento público, estoy 100% de acuerdo con usted. Planeo lanzarlo, pero no demasiado rápido. Mi idea al respecto es: hacer público todo lo que pueda sin revelar la “parte secreta”, si es posible, y como regla general, siempre mantenga la parte más reciente / más fresca para usted … hasta que encuentre una mejor. De esta manera, después de sondear puede “hacerlo”, las compañías sabrán que es usted y solo usted el que puede hacer una versión “de vanguardia” adaptada a cualquier problema que quieran aplicar. Otros también podrán hacerlo, pero no como tú. En resumen, haga público el método, pero asegúrese de que, al menos inicialmente, sea el dueño del mismo.

Mi caso no es tu caso, espero que mis algoritmos superen, algún día, cualquiera de los otros métodos disponibles, para poder jugar otras cartas, pero de todos modos, ser el experto número 1 en algo nuevo que es poderoso es una mina de oro , y no necesitas preocuparte por las patentes (que detesto).

Por cierto, si quieres echar un vistazo a la parte “no secreta” de mis ideas, decidí abrir un blog (Entropic and Fractal Intelligence) y comentar el desarrollo como en un diario o bitacore, así que mis logros están ahí y mis malas ideas que tampoco funcionaron tan bien. También tengo códigos de ejemplo, etc., pero siempre mantengo el último 25% del estado real de las ideas para mí.

Ah! Sobre los papeles también estoy de acuerdo con usted. ¡Comencé a escribir uno sobre una versión de la IA usando fuerzas y sentimientos entrópicos como utilidad, antes de ingresar al “mundo fractal”! Pero fue demasiado aburrido para mí definirlo formalmente (soy matemático y también trabajo como programador en una empresa), así que planeo publicarlo “informalmente” como una pequeña publicación en mi blog personal.

Carlos Reyes

A2A
En primer lugar, felicidades por hacer algo interesante y algo genial.
No estoy seguro de qué dominio ha comprobado porque parece que debe haberlo probado en un pequeño conjunto de datos y no en alguna forma de datos comerciales que las principales empresas habrían alentado a patentar.
Hay muchas competiciones organizadas por Kaggle que creo que sería algo que te pagarían si ganas. Así que pruébalo. Dependiendo de la ubicación, hay personas con las que puede hablar para obtener más ayuda. Finalmente, con suerte, si todo funciona, publíquelo en cualquier licencia académica para el beneficio de la comunidad.

Carlos Reyes

Su reclamo es dudoso en el mejor de los casos y simplemente deshonesto en el peor. Si tiene algunos resultados, llévelos a un profesor y publíquelos en una revista respetable. De lo contrario, todo lo que está haciendo aquí es buscar atención probablemente debido al efecto Dunning-Kruger. Esto sucede con bastante frecuencia a personas sin suficientes antecedentes y educación en ciencias.

Como mínimo, debería haber podido compartir una descripción de alto nivel (créanme, ya se ha intentado todo bajo el sol) e inmediatamente podría decirle si está soplando humo o si tiene algo que se puede publicar.

Carlos Reyes

More Interesting

¿Cuál fue su peor interacción con una máquina?

¿Puedo usar el aprendizaje automático para analizar correos electrónicos?

¿Cómo puedo hacer que mi computadora esté disponible para Google, Quora, Facebook, para poder contribuir a sus tareas de aprendizaje automático durante el tiempo de inactividad?

¿Cómo se puede usar el aprendizaje profundo para la detección de eventos anormales en los videos?

¿Qué es el aprendizaje automático y la IA?

¿Existe alguna directriz para diseñar redes neuronales en términos de número de capas ocultas, número de unidades ocultas, tamaño de filtro (CNN) y paso de tiempo (RNN)?

¿Cuáles son los beneficios de usar unidades lineales rectificadas frente a la función de activación sigmoidea típica?

¿Conoces algún software que implemente cálculos de los últimos k vectores singulares de matriz dispersa de entrada? Solía irlba, pero que yo sepa, solo calcula los primeros k vectores singulares

Después de seleccionar entidades con una regresión regularizada, ¿es mejor estimar el resultado con la misma regresión regularizada o con una regresión no regularizada?

¿Ha habido alguna investigación sobre cómo las pérdidas de capacitación en la convergencia de los algoritmos de aprendizaje profundo varían con el tamaño de los datos que ingresan?