¿Qué proyectos de aprendizaje automático se ven bien en un currículum?

Uno de los campos de currículum más importantes para cada científico de datos es “Proyectos”. Mi colega hizo la lista de proyectos de ciencia de datos simples pero ilustrativos para crear un CV de científico de datos sin experiencia laboral.

Dejaré la descripción de uno de estos proyectos solo para tener la idea de si vale la pena seguir el enlace.

Spam o jamón
El spam vive donde sea posible dejar mensajes. Uno de los problemas clásicos de la ciencia de datos es la detección de spam. Puede entrenar un modelo para detectar correos electrónicos no deseados, mensajes de spam y comentarios de usuarios de spam para ocultarlos en el navegador.

Un motor de aprendizaje automático define el spam en función de la probabilidad de encontrar palabras como “venta” y “compra” en los mensajes de spam. Como resultado, puede obtener un prototipo funcional de AdBlock en aproximadamente una semana.

Problema de ML: clasificación de texto
Algoritmos: ingenuos bayes, clasificadores lineales, clasificadores de árboles, clasificadores de lo que quieras
Tecnologías: sklearn, nltk, scrapy
Datos: conjunto de datos de spam de SMS, conjunto de datos de spam de correo electrónico, conjunto de datos de spam de comentarios de YouTube
Implementación: extensión del navegador
Referencias: AdBlock, Adguard
Guías: Cómo construir un clasificador simple de aprendizaje automático de detección de spam, Primeros pasos: construcción de una extensión de Chrome

Otros problemas de ML son:

No hotdog
Recomendaciones de películas de Netflix
Lentes originales de Snapchat
Transmisión de Twitter
Apuestas de tenis
Predicción del precio de las acciones

Aquí está el enlace en la publicación original del blog: Data Scientist Resume Projects – Stats and Bots

Espero que sea útil!

AlgoritmosAprendizaje automáticoIngeniería de softwareInteligencia ArtificialProgramación informática

Related Content

¿Cómo funciona el algoritmo de despacho de Uber?

¿Por qué la recursión me causa tantos problemas?

Cómo encontrar la cantidad mínima de pasos necesarios para eliminar todos los peones del tablero de ajedrez

¿Podemos modificar la técnica de descomposición de la raíz cuadrada a la descomposición de la raíz cúbica? Si no, ¿por qué?

¿Cuáles son algunas de las estructuras de datos / algoritmos de clasificación más interesantes?

¿Por qué 1366 x 768 se convirtió en una resolución de pantalla de computadora portátil tan común?

¿Qué algoritmos existen para la reconstrucción de un conjunto de vectores de un diccionario de cardinalidad más pequeña?

El mejor proyecto depende de los tipos de trabajos que está buscando. Mi primer consejo sería enumerar proyectos que sean relevantes para los puestos que está solicitando.

Por ejemplo, si desea un trabajo en finanzas, debe jugar con los conjuntos de datos financieros de Quandl.com.

Dicho esto, puedo contarles los rasgos comunes de los proyectos que más me impresionaron cuando contraté científicos de datos.

En general, hay algunos rasgos que busco:

Creación de valor de extremo a extremo. El aprendizaje automático tiene muchas partes móviles, y puede ser fácil perder el bosque por los árboles. Me parece impresionante cuando los candidatos pueden demostrar que han utilizado el aprendizaje automático para resolver problemas comerciales reales. Eso significa identificar una necesidad, recopilar datos y aplicar los resultados para resolver la necesidad.
Riguroso ajuste de algoritmos. Muchas personas han probado algoritmos individuales en algunos conjuntos de datos, pero no muchos han hecho una comparación de 5 algoritmos diferentes en 5 conjuntos de datos diferentes para ver cuáles funcionan mejor en diversas condiciones. En un trabajo de aprendizaje automático, pasará una cantidad significativa de tiempo ajustando y mejorando modelos.
Conjuntos de datos creativos. Siempre me encanta ver personas que eliminan sus propios datos de sitios web, combinan datos de diferentes API o agrupan conjuntos de datos aparentemente no relacionados.
Algoritmos apropiados para la tarea. El aprendizaje automático ofrece muchas herramientas, y elegir entre ellas es una habilidad importante. Prepárate para defender tus elecciones.
¡Divertido e interesante! Una vez hice un proyecto de aprendizaje automático sobre datos de baloncesto, y me invitaron a una entrevista solo porque el gerente de contratación era un gran fanático del baloncesto y quería discutirlo. Además, si está interesado en el tema, naturalmente hará un mejor trabajo.

Aquí hay 6 ideas específicas que puede completar en menos de una semana cada una ( soy editor en este sitio ): Ideas divertidas de proyectos de aprendizaje automático para principiantes

Soumyaansh Roy

En un nodo personal, el tipo de actitud de “verse bien en el currículum” no es apropiado.

Un simple proyecto de reconocimiento de escritura a mano lo ayudará a comenzar con muchas cosas. Desde el procesamiento de imágenes hasta redes neuronales artificiales.

Liz A

More Interesting

Cómo ordenar la lista de números dada en orden de registro (n)

¿Qué es un algoritmo recursivo (pseudocódigo) que calcula la suma de los primeros enteros positivos impares?

¿Cuál es el significado del peor tiempo de ejecución de un algoritmo?

¿Para qué tipo de gráfico sería óptimo y correcto un algoritmo codicioso para colorear gráficos?

¿Qué es el nodo en la estructura de datos?

Matrices de sufijos: Dadas dos cadenas s1 y s2. ¿Cuál es el mejor algoritmo para encontrar el número de subcadenas comunes entre s1 y s2 de longitud 1, 2,… hasta min (| s1 |, | s2 |)?

En un algoritmo de búsqueda binaria existe la línea, si la clave == A [mid] return (mid + 1). ¿Por qué (mediados + 1)?

¿Cuál es tu algoritmo favorito y dónde lo has usado prácticamente en la vida real?

¿Qué software / algoritmo se usa para hacer partidos de la liga de fútbol o cualquier evento deportivo enorme?

¿Hay algún algoritmo de ordenación que funcione en el orden de n?

¿Qué algoritmo puedo usar para medir la correlación entre dos palabras?

¿Cuál es la aplicación de la vida real de las estructuras de datos de árbol?

¿Cómo analizaría la complejidad temporal de fibbonacci?

¿Qué es una explicación intuitiva de la minimización de arrepentimiento contrafactual?

No entiendo las torres recursivas del problema de Hanoi. ¿Qué es?

Web Analytics