¿Utiliza bibliotecas o código usted mismo cuando usa un algoritmo de aprendizaje automático? ¿Qué hace un científico de datos con esto en su trabajo?

Utiliza bibliotecas para todo lo que puede e inventa las cosas que no están disponibles en las bibliotecas. Hay personas que maldecirán con la codificación manual, pero las ventajas que le brinda generalmente son pálidas en comparación con el código de mayor calidad que proporcionará una buena biblioteca, así como todos los otros ojos que nunca podrán ver su código, pero que han ayudado a las bibliotecas a fortalecerse. Particularmente si estás haciendo trabajo comercial; siempre debe esforzarse por poner su energía en su ventaja competitiva. Si el código existe en una biblioteca, es casi seguro que no sea su área de ventaja competitiva.
Todo lo que he dicho hasta ahora se aplica a cualquier código de computadora, pero con el aprendizaje automático hay una razón aún más convincente para usar bibliotecas: en el caso de ML, su ventaja competitiva puede no ser el código, sino el corpus que usa y el características que has elegido. Concéntrese en dónde puede agregar el mayor valor: en ML se trata de construir su entorno de capacitación y conjuntos de datos.

AlgoritmosAprendizaje automáticoCiencia de datosInteligencia ArtificialProgramación informática

¿Cuál es la diferencia entre un científico de datos y un ingeniero de aprendizaje automático en LinkedIn?

¿Cómo pueden los científicos de datos y diseñadores de productos trabajar juntos de manera más efectiva? ¿Cómo deberían los desarrolladores ayudar a los diseñadores a comprender las posibilidades y limitaciones del análisis de datos y el aprendizaje automático?

Acabo de regresar de Strata 2017 y todas las demás botas mostraban una plataforma de ciencia de datos (es decir, Domino). ¿Cuál es tu plataforma favorita y por qué?

¿Cuál es la mejor manera de medir la acción para impactar en el análisis de datos?

¿Cuáles son algunas ideas muy buenas de minería de datos o algoritmos de búsqueda basados en gráficos para un proyecto menor?

¿Hay algún gran foro o sitio web en aprendizaje automático o ciencia de datos?

Implementar un algoritmo por su cuenta es la manera perfecta de aprender realmente sobre el algoritmo. Sin embargo, es mejor dejarlo como ejercicio académico. Si un algoritmo está disponible dentro de una biblioteca existente como scikit-learn o GPy, es probable que el código dentro de estos módulos haya sido rigurosamente probado para detectar errores y funcione de manera muy eficiente. Entonces, en la práctica, ve con la biblioteca. Tenga en cuenta que esto le permite centrar su atención en detalles más importantes, como la selección de funciones.

Rolando Cruz

Hola,
Puede diseñar y codificar el algoritmo usted mismo, tratando de entender cómo funciona realmente. Esto puede llevar tiempo, quise decir mucho tiempo. Hay muchos científicos que saben qué hacer con los algoritmos más que saber cómo funciona realmente. Entonces, mi consejo sería aprender haciendo, explorar la biblioteca, modificarla, algún día lo descubrirás sobre la marcha.

Toshi Takeuchi

Puedes pensarlo en dos fases.

1. Fase de aprendizaje

Elija un algoritmo que planea usar y codifíquelo usted mismo. Esto le ayuda a comprender cómo funciona y qué posibles limitaciones puede tener.

Repita esto para cada nuevo algoritmo que desee usar.

2. Fase de uso práctico

Según lo que sabe, elija una biblioteca adecuada que implemente bien el algoritmo y úselo. Debe tener un código de mayor calidad ya que muchas personas lo han usado, y no tiene que reinventar la rueda. Ocasionalmente, la biblioteca existente puede no satisfacer sus necesidades, y puede escribir la suya en ese momento.

Rolando Cruz

Desde el tiempo que pasé aprendiendo / jugando con Machine Learning, generalmente uso bibliotecas, pero cuando algo no está disponible, termino teniendo que codificarlo yo mismo.

Rolando Cruz

More Interesting

¿Cómo puede una persona con conocimientos básicos de ciencia de datos no CS en 2 años?

¿Cuál es el lenguaje de programación más poderoso en el campo de Analytics / Data Science: Python, R o SAS?

¿Se puede utilizar la ciencia de datos para SEO?

Tengo más de 4 años de experiencia en el desarrollo de .net, pero ahora quiero cambiar a Big Data. ¿Dónde puedo aprender big data y obtener trabajo?

¿Son diferentes los métodos de minería de datos y el algoritmo de minería de datos?

¿Cuál es la diferencia entre un trabajo de ciencia de datos que requiere el uso de software SAS y uno basado en un lenguaje científico (Python, R, Matlab, etc.)?

¿Qué tan relevante es el análisis de Big Data para la economía global actual?

¿Quiénes son los mejores expertos en aprendizaje automático (ML)?

Incluso utilizando un conjunto de validación, ¿no estamos tratando de maximizar los resultados en el conjunto de prueba? ¿Y al final sobreajustando?

¿Te importa quién conoce tu historial de clics?