Gracias por pedirme que responda esto. En primer lugar, me gustaría apreciar su decisión de hacer su tesis en el campo del aprendizaje automático. Según mi propia experiencia, esta es la mejor manera en que puedes aprender el aprendizaje automático. Comencé con mi viaje de aprendizaje automático con mi tesis de maestría. Si se realiza correctamente, este viaje podría enseñarle muchas advertencias ocultas en la práctica del aprendizaje automático.
Como otros han señalado correctamente, la buena información es crucial para tener éxito en el aprendizaje automático. Basura dentro basura fuera. Y para no olvidar, la mayoría de las veces en la práctica de la minería de datos real, se dedica a la preparación de datos, el preprocesamiento y la generación de funciones. Cuando estás en una configuración académica, tiendes a olvidar eso. Si desea una experiencia rica con el aprendizaje automático, mi recomendación es elegir un problema en el que pueda recopilar y preprocesar los datos. Esta habilidad es imprescindible si quieres convertirte en un minero de datos.
Los datos genéticos obtenidos mediante secuenciación son de naturaleza muy dimensional. Si recién está comenzando con el aprendizaje automático, es posible que evitar este problema sea una buena idea. Pero estás seguro de que quieres contribuir a la raza humana, continúa. Pero planifique lo que quiere hacer, en el lapso de tiempo que desea hacer en su tesis. Encuentre personas que ya estén investigando en esta área y vea si puede ayudar / colaborar con ellas. Lea sus documentos para ver lo que ya se está investigando sobre el neuroblastoma. Aquí hay algunos enlaces útiles para comenzar
- Cómo escribir un algoritmo para regresión logística paralela en Java
- ¿Cómo se puede reducir el tamaño del modelo TFIDF sin reducir significativamente la precisión?
- ¿Cuál es el mejor título de maestría para obtener hoy en inteligencia artificial, aprendizaje automático, etc.?
- ¿Es inevitable la multicolinealidad en los datos experimentales? Si no, ¿en qué condiciones podemos esperar multicolinealidad?
- ¿Podría el aprendizaje automático erradicar el cáncer?
TU Dortmund – Informática VIII
Selección de características en datos de alta dimensión …
La inversión automatizada también es un área amplia, para la tesis debe descubrir algo más específico. por ejemplo, predecir automáticamente la dirección del movimiento de las existencias en la próxima semana (arriba / abajo), solo dirección. Luego puede convertirlo en un problema de series de tiempo y concentrarse en resolverlo.
Para resumir,
* el procesamiento previo de datos es más importante de lo que piensas
* Identifique un problema específico y defina claramente las métricas de rendimiento para lograr la calidad de su (s) modelo (s)
Te deseo buena suerte con el viaje.