¿Cuáles son algunos trabajos de investigación que puedo publicar en el campo del procesamiento / generación de lenguaje natural, aprendizaje automático y minería de datos?

Es bueno que hayas tomado estas conferencias, pero eso no te da capacidad de investigación. Las conferencias son un buen comienzo en el campo, sin embargo, la investigación es un proceso totalmente diferente. Asistir a estas conferencias significa que aprendió los conceptos básicos y una parte un poco avanzada de los cursos. Ahora comienza lo real.

1) Te recomendaría que estudies más a fondo temas similares de libros y otras cosas para refrescar todo lo que aprendiste. Y también revise a fondo los libros, ya que se cree que las conferencias en video, por muy efectivas que sean, nunca pueden reemplazar a los libros, definitivamente no si desea continuar con la investigación en el campo. Por lo tanto, tómese su tiempo y estudie ML y NLP, etc.

2) Verifique qué investigación se está llevando a cabo en el campo de su interés. Si le gusta algo, intente averiguar quién ha hecho algo similar a lo que va a hacer. Intente descubrir proyectos, tesis relacionadas con el tema y luego, para comenzar su proceso de investigación, es bueno hacer un proyecto. Ahora es cuando necesitas un mentor. Acércate a un profesor que trabaje en un tema similar y habla con él sobre lo que quieres hacer, cómo puede guiarte. Si acepta guiarte en tu proyecto, está bien.

3) Ahora que el prof. acordó guiarte, después de asumir que tienes un buen conocimiento de los temas involucrados, él te pedirá que encuentres y estudies algunos trabajos de investigación sobre esos temas. Él puede sugerir algunos también. Prueba Google Scholar. Comience leyendo algunas encuestas en el campo, luego sabrá lo que está sucediendo en el campo. Luego pasarás a trabajos de investigación generales. Lea los documentos y obtendrá una idea básica de lo que es un trabajo de investigación (si no lo ha leído antes), el estilo y el formato, así como el contenido del trabajo. Sabrá cómo se propone algo, y luego se prueba o cómo se afirma que un nuevo proceso / procedimiento es mejor y luego lo demuestran los estudios empíricos y todas esas cosas complicadas. Inicialmente resultará difícil, pero si realmente te gusta la investigación, te encantará. Este proceso continuará durante unos meses 😉.

4) Después de tener un conocimiento avanzado de la investigación en el campo, deberá proponer algo nuevo. Esta es la parte difícil. Has leído decenas (o tal vez cientos) de artículos a lo largo de los meses. ¿Qué novedades crees que puedes hacer? ¿Puedes proponer un método mejor para resolver un problema particular que las cosas existentes? En caso afirmativo, proponga su método y luego pruébelo y escríbalo.

5) Su guía / prof. revisará sus cosas y le dirá si es material publicable. Si él está de acuerdo, eso es bueno. De lo contrario, él le dirá qué cambios hacer y etc.

6) Ahora viene LaTeX y esas cosas. Supongamos que logra probar su reclamo, su guía lo aceptó y ha escrito un esqueleto básico de un documento. Ahora, si desea publicarlo, deberá formatearlo por completo como un documento de investigación con todo lo que generalmente contiene un documento de investigación. Puede que tenga que aprender LaTeX. Pero eso no es un problema.

7) Ahora que ha escrito un buen trabajo de investigación, es hora de enviarlo para su publicación. Encuentre conferencias o revistas (internacionales o nacionales) y envíe su revista. Si se acepta, tienes tu primera publicación. De lo contrario, encuentre otras conferencias / revistas.

Tener una publicación generalmente no es tan fácil, pero es gratificante. Tienes un largo camino por recorrer.

Todo lo mejor:)

Últimamente he estado trabajando en el procesamiento del lenguaje natural. He visto varios trabajos de investigación sobre una mejor representación de las características de los documentos de texto para su posterior agrupación o clasificación. El término matriz del documento es una representación vectorial de un corpus que generalmente se usa para la agrupación o clasificación. Dado que DTM se basa en el enfoque de la bolsa de palabras, pierde parte del contenido semántico del documento ya que se ignora por completo el orden de las palabras. Luego vinieron LDA y LSI. Recientemente, los investigadores de Google llegaron con una nueva representación vectorial llamada word2vec. Del mismo modo, puede investigar y encontrar una mejor representación característica de un corpus y podría publicarse.

More Interesting

¿Cuál es una buena definición de big data?

¿Qué es más exigente, desarrollo de aplicaciones, aprendizaje automático, aprendizaje profundo, inteligencia artificial o IOT?

¿Tiene sentido emplear Bayes ingenuos multinomiales con n-gramos? Pregunto porque supone que cada posición está ocupada por un término, por lo que los n-gramos no parecen encajar naturalmente en el modelo.

¿Se ha realizado algún trabajo para hacer que la regresión lineal sea amigable para el laico?

Además de las redes neuronales profundas, ¿existen antecedentes para cálculos largos con una inferencia máxima a posteriori eficiente?

¿Qué técnicas se usan generalmente para la reducción de la dimensionalidad en el campo de análisis de Big Data?

¿El aprendizaje por refuerzo es meta-aprendizaje?

¿Por qué NP = P es tan difícil de resolver?

¿Cómo podemos hacer un análisis de opinión para una revisión de película cuando no tenemos un conjunto de datos de capacitación?

¿Cómo podemos suprimir el ruido de fondo en un teléfono durante una llamada telefónica?

¿Cuál es la diferencia entre diferentes tamaños de kernel convolucional como 3 × 3 y 5 × 5? ¿Existe alguna teoría al respecto?

¿Son los modelos de n-gramas, la codificación de uno en caliente y word2vec diferentes tipos de representaciones de palabras y vectores de palabras?

¿Vale la pena desarrollar un algoritmo de minería de datos más rápido que otros de código abierto y comerciales existentes? Si vale lo suficiente, ¿qué valor tiene ser el algoritmo más rápido?

¿Cómo están revolucionando las redes neuronales convolucionales la visión por computadora?

¿Cuál es la diferencia entre la recuperación de información normal y los sistemas de recomendación?