¿Qué es más beneficioso para la comprensión general de la informática, el procesamiento del lenguaje natural o la teoría de la computación?

El procesamiento del lenguaje natural (PNL) es una aplicación muy específica de la informática. Uno podría considerar que para acercarse a la PNL, se requiere una comprensión fundamental de los lenguajes humanos , gestos, cultura, etc. La teoría de la computación, por otro lado, es la base de las ciencias de la computación. Entonces, la respuesta corta a su pregunta es que la búsqueda de la teoría de la computación le dará una comprensión de CS.

Algunas reflexiones sobre PNL: definitivamente es importante para las interacciones hombre-máquina / protocolos. Sin embargo, incluso con eso, diferentes lenguajes humanos y culturas, etc. exhiben diferentes señales, gestos (desde la elección de palabras, construcciones de oraciones, inflexión, entonación, expresión de emociones, señales no verbales, lenguaje corporal, etc.) desviarse un poco de los límites actuales de la tecnología, pero esa sería la trayectoria general de la PNL: recuerde que los protocolos humano-máquina (en computadoras eléctricas) comenzaron con la observación de tubos de vacío y la manipulación de interruptores, luego cinta perforada, tarjetas perforadas, teclado y texto monitores, donde los humanos eran esclavos de los protocolos de la máquina. Eso mejoró ligeramente con salida de audio, pantallas de video, joysticks, lápices luminosos, ratones, GUI, etc. PNL y lenguaje corporal a seguir.

El procesamiento del lenguaje es claramente más práctico y es posible que ganes más dinero. No ganarás tanto dinero haciendo teoría. La teoría es importante y, de hecho, diría que la mayoría de las teorías CS son las partes fáciles y perezosas, las partes seriales (la teoría está atascada en la Máquina / Cinta Turing). La teoría de la computación paralela se ha estancado principalmente en PRAM y variaciones. Mi amigo Dave ha escrito un libro sobre programación que cree que es la respuesta (en el cableado de software). A medida que avanzan los temas de la clase, debe estar expuesto a ambos pero ser escéptico (hay demasiados optimistas por ahí).

El problema con el procesamiento del lenguaje (una rama de AI / MI) es que se ha prometido demasiado y aún tiene limitaciones en lo que ofrece (no es tan general como la gente piensa). El problema es que los desarrolladores son los que seleccionan los casos de prueba, y solo muestran los casos de prueba que los hacen verse bien. Esto se debe en parte a que se hizo hincapié en las aplicaciones de inteligencia militar. Tengo una pregunta sin respuesta del hardware de idiomas hace décadas (puedo rastrear la historia de esto desde el principio), y he tenido un par de ex jefes que fueron críticos sobre muchas de estas cosas de la década de 1960.

Ambas áreas son vergonzosas en comparación con otras ciencias. Romper ese ciclo / problema.

Diría que la teoría de la computación ya que todos los modelos que aprendemos o derivamos en TOC son necesarios para la realización de nuevos modelos. Comprender el procesamiento del lenguaje natural tiene sinergia con las gramáticas léxicas y el lenguaje regular. Ahora, incluso la comprensión sensible al contexto es necesaria para varios otros idiomas además del inglés. Por lo tanto, la comprensión de TOC es preliminar para PNL y otros campos en los que estamos en la creación y prueba de modelos.

Dependiendo del contenido exacto de las clases, generalmente recomendaría tomar primero el curso de teoría de la computación. En la mayoría de las versiones de esta clase, cubriría conceptos como las gramáticas libres de contexto que probablemente se usarían en la clase de PNL (nuevamente, esto depende del enfoque exacto del curso).

TCS es más básico, ya que se usa en muchas otras áreas de CS, tanto en términos de conceptos y herramientas específicos, como en general, como una forma de formalizar los problemas que surgen en otras áreas de CS. Gran parte del lenguaje común de CS es de la teoría.

Por otro lado, si bien la PNL está más centrada en ciertos problemas prácticos, las herramientas desarrolladas para la PNL son las mismas que las utilizadas para otros tipos de análisis de datos, por lo que una buena clase de PNL también proporcionará una introducción a las técnicas generales de aprendizaje automático. Es una buena clase para tomar, pero aún así recomendaría tomar TCS primero.

La teoría de la computación es una de las dos o tres grandes ideas en informática, y probablemente uno de los desarrollos intelectuales más importantes del siglo XX. PNL es una aplicación de varias partes de CS, pero podría decirse que es un campo separado, y definitivamente es un poco tangencial. En términos de centralidad, no hay competencia.

Si la informática es un árbol, la teoría de la computación es su raíz y el procesamiento del lenguaje natural es su fruto.

Si estás en el mundo académico o en la creación de sistemas operativos, puedes considerar la teoría de la computación. Si se encuentra en un mercado laboral común, puede considerar el procesamiento del lenguaje natural.