He trabajado en el área de PNL por un tiempo, y como la mayoría de las personas que trabajan en PNL, nunca me concentré en qué estructuras de datos elegir, en lugar de qué técnicas aplicar.
Comprendamos cómo las estructuras de datos serán útiles en proyectos basados en PNL. Además de almacenar y recuperar texto (cadenas), las estructuras de datos no desempeñarían otro papel en la determinación del rendimiento del resultado. Lo que necesitamos es un almacenamiento eficiente y una recuperación más rápida del texto, en proyectos de este tipo. Entonces, teniendo en cuenta lo anterior, mi elección sería “árboles”, “montones” y “tabla hash”.
Auto-promoción descarada: Recientemente lanzamos una herramienta de análisis de sentimientos llamada www.stride.ai/texsie en la que aprovechamos algunas de las estructuras de datos mencionadas anteriormente.
- ¿Qué lenguaje es mejor para hacer big data y machine learning (en términos de rendimiento) Java o Python?
- Cómo usar la prueba T de Student para la selección de funciones
- ¿Qué es un uso subestimado del aprendizaje automático?
- ¿Cuál es la intuición detrás de la propagación hacia atrás?
- ¿En qué se diferencia el estado oculto (h) de la memoria (c) en una celda LSTM?