¿Debo usar TensorFlow o Caffe2 para comenzar a aprender el aprendizaje automático y el aprendizaje profundo?

Personalmente, diría TensorFlow.

TensorFlow tiene un nivel mucho más bajo, por lo tanto, mientras que en Caffe las capas individuales están implementadas para usted, en TensorFlow tendrá que implementar las características más matizadas de la red. Esto significa que tiene más flexibilidad en TensorFlow, y puede hacer varias cosas de manera inmediata en TF que no podría hacer en Caffe.

Como usted dice en su pregunta que realmente quiere aprender Machine Learning y Deep Learning, es importante que no se vuelva flojo. Una parte importante de Machine Learning y Deep Learning es tener una comprensión firme y profunda de los conceptos que ha aprendido. No tendrá este nivel de comprensión si utiliza un marco DL de nivel relativamente alto para sostener su mano por usted. De hecho, incluso puedo recomendar (¡mi opinión!) Comenzar con un marco de nivel aún más bajo, como Theano. Cuando use Theano, tendrá que llegar a los componentes realmente esenciales de su red. Es realmente abrumador poder implementar su propia pérdida, y poder hacer todo tipo de arquitecturas extravagantes, y saber exactamente cómo funciona porque lo construyó desde cero (un poco).

En mi opinión, si su objetivo es aprender desde el principio, es usar una matriz numpy de vainilla e implementar todo usted mismo (la fase de propagación hacia adelante y hacia atrás).

Luego se sorprendió cuando descubrió que tensorflow se encarga de la fase de actualización con diferenciación automática. También prepárese para rascarse mucho la cabeza cuando intente depurar su código tf debido a algún error de dimensión de matriz.

Mientras tanto, Caffe, aunque solía ser la primera opción para la visión por computadora, ahora es demasiado nicho como la primera biblioteca para aprender, en mi opinión. Aunque escuché algunas buenas características sobre Caffe2, como la implementación en dispositivos móviles, etc.

Si realmente está tratando de aprender ML, no solo cómo funcionan algunas bibliotecas, yo diría que tampoco. Vuelva a lo básico e implemente algunas cosas desde cero, luego pase a probar estas bibliotecas.

More Interesting

¿Puede LSTM u otro tipo de red neuronal recurrente aprender a extraer y representar un estado de Markov?

¿Cuál es la diferencia entre regresión, clasificación y agrupamiento en el aprendizaje automático?

En la regresión cuadrática, ¿por qué tengo que mantener una variable y su aumento exponencial en el mismo modelo?

Cómo expresar un modelo de árbol de decisión en modelos gráficos

¿Por qué utilizamos núcleos en algunos modelos de aprendizaje automático?

Como persona con una maestría en química y un doctorado en ingeniería eléctrica y nanotecnología, a los 26 años sin experiencia en ciencias de la computación, ¿es demasiado tarde o demasiado difícil enseñarme a mí mismo el aprendizaje automático?

¿Qué es la selección de variables en bloques cuando se hace un análisis de regresión?

¿Cuántas imágenes se requieren para las redes adversas generativas (GAN)?

Como ingeniero de ML en Quora, ¿alguna vez ha implementado un artículo de investigación en aprendizaje automático para resolver un problema técnico o de producto?

¿En qué se diferencia una empresa financiera cuantitativa de un fondo de cobertura típico?

¿Cómo se logra la detección de afirmaciones en el procesamiento del lenguaje natural?

¿Por qué es importante la ciencia de datos?

¿Cuáles son las formas de ingresar a Stanford para obtener una maestría en informática o una maestría en aprendizaje automático e inteligencia artificial?

¿Cuáles son las ventajas y desventajas de cada método de regresión no lineal existente?

¿Cuándo la pérdida cuadrada no es buena para la función de pérdida para la regresión?