¿Dónde debo comenzar si quiero escribir un algoritmo de etiquetado y clasificación de oraciones?

¿Puede decir un poco sobre el propósito y el contexto, así como sus antecedentes, el marco temporal para hacer esto y los recursos? Probablemente pueda encontrar en Google, por ejemplo, algunos artículos que describen lo que la gente ha hecho con el etiquetado simple basado en el análisis estadístico de una muestra en particular. Por ejemplo, supongamos que simplemente desea etiquetar los tweets que mencionan AI como positivo o negativo. Reúne un conjunto de ejemplos de tamaño razonable y luego hace que tres (digamos) personas los etiqueten o los califiquen en una escala de 3, 5 o 7 puntos en cuanto a cuán positivos son. (Es posible que deba iterar un poco antes para obtener un buen consenso en los evaluadores). Ahora intenta encontrar palabras que sean estadísticamente predictivas de puntajes altamente positivos o altamente negativos. Este podría ser un trabajo de una persona para una semana si tiene los antecedentes adecuados en estadísticas y es fluido en un lenguaje como R que tiene muchas funciones incorporadas. En el otro extremo, podría estar intentando hacer un analizador bastante extenso para un asistente personal de propósito general. (Incluso uno limitado a un dominio específico como la venta de ropa deportiva podría requerir mucho trabajo). Diría que esto se parece más a un pequeño equipo de personas durante un año o más, aunque depende de cuán “inteligente” deba ser el asistente. En cualquier caso, los primeros pasos importantes son determinar exactamente cuáles son sus objetivos, asegurarse de que el uso sea ético, recopilar una muestra representativa grande del tipo de declaraciones que va a analizar.

Related Content

¿Cuáles son algunas posibles aplicaciones de aprendizaje profundo que son bastante novedosas?

¿Por qué la devolución [matemáticas] G_t = R_ {t + 1} + \ gamma R_ {t + 1} + \ cdots [/ matemáticas] tiene la recompensa del siguiente paso?

¿Qué otros algoritmos de aprendizaje automático, además del aprendizaje profundo, se aplican ampliamente en aplicaciones comerciales?

¿Cuántas imágenes de entrenamiento deberían usarse para una buena tarea de reconocimiento de género en OpenCV? ¿Hay algún conjunto de datos disponible para esta tarea?

¿Cómo se usa el aprendizaje automático en DevOps?

¿Por qué es mejor usar la función Softmax que la función sigmoidea?

Cómo construir una IA que pueda comunicarse naturalmente

More Interesting

¿Qué tipos de carreras hay para los ingenieros informáticos que se concentran en la inteligencia artificial y la máquina?

¿Hay casos en que las ideas del aprendizaje profundo hayan sido útiles para problemas de datos pequeños?

¿Cómo se pueden usar las redes neuronales en el análisis de sentimientos árabes?

¿Qué es el Tanimoto Score y cuándo se usa?

¿AWS es bueno para ejecutar proyectos de aprendizaje profundo? ¿Qué tan rápido y costoso sería entrenar una red convolucional en aproximadamente 1 millón de imágenes?

¿Qué es la agrupación de datos?

¿Cuál es la forma más sencilla de entender el equilibrio de sesgo-varianza en el aprendizaje automático?

¿Cómo se siente la comunidad de aprendizaje automático sobre Kaggle?

¿Cómo ganan dinero las startups de aprendizaje profundo o aprendizaje automático?

¿Es c # una buena opción para el aprendizaje automático de producción?

¿Cuál es la diferencia de enfoque para resolver un desafío de Kaggle y trabajar en un problema de investigación de LA bien definido?

Visión por computadora: ¿Existe un servicio que, dada una imagen, le dice lo que representa?

¿Cuáles son las ventajas de las máquinas de vectores de soporte (SVM) en comparación con la regresión lineal o la regresión logística?

¿Cuáles son las aplicaciones HOT de Machine Learning para las ciencias biológicas?

¿Qué es un proceso gaussiano?

Web Analytics