¿Qué biblioteca utiliza Quora para realizar el aprendizaje automático y el procesamiento del lenguaje natural?

Utiliza una combinación de aprendizaje automático y procesamiento del lenguaje natural para garantizar contenido de alta calidad en el sitio.

  • Algoritmo de clasificación (aprendizaje automático) para agrupar preguntas en categorías.
  • Algoritmo de análisis para la corrección gramatical.
  • Análisis de clúster y algoritmo de cálculo de similitud SMD para encontrar preguntas duplicadas.
  • Algoritmo similar a AGV que proporciona la relevancia de las preguntas devueltas como resultados de búsqueda instantánea y la relevancia de los temas sugeridos para las preguntas que se hacen. Encuentra un tipo de homogeneidad en un conjunto de datos y los divide en un número finito de grupos. También utiliza un algoritmo similar para las clasificaciones.
  • Modelado de temas utilizando la asignación de Dirichlet latente, cuando hace una pregunta, automáticamente le asigna algunos temas.
  • También usa Thrift.
  • Aparte de eso, cose se basa principalmente en Python (lenguaje de programación), Tornado (marco web), PyPy.

Aparte de eso, estoy seguro de que sus proyectos de Machine Learning incluyen la palabra “Deep”

D Adam D’Angelo en Twitter

    More Interesting

    ¿Por qué las CPU modernas no ofrecen recolección de basura asistida por hardware y asignación de memoria?

    Tengo 4 años de experiencia en TI. Estoy planeando cambiar a BIG Data y Hadoop. ¿Cuáles son los pros y los contras que debo tener en cuenta?

    ¿Puedo obtener la percepción de profundidad de 2 imágenes tomadas por la misma cámara en diferentes puntos de vista?

    ¿Qué tipo de trabajo hacen los buenos codificadores algorítmicos en las empresas de TI?

    ¿Qué debo tomar, CSE (informática) en IGDTUW o ICE (instrumentación y control) en NSIT?

    ¿Cuál es la diferencia entre una llamada al sistema y un núcleo?

    ¿Qué es el cálculo de Lambda en términos simples?

    ¿Qué RAM debo instalar en mi PC 2005? Ahora corre lento; ¿Es este el resultado de instalar Windows 7? ¿Cómo puedo acelerarlo?

    Si tenemos un conjunto muy grande de objetos comparables, ¿qué implementación de la tabla de símbolos es empíricamente más rápida: una tabla hash o un árbol de búsqueda binario balanceado? ¿Por qué?

    ¿Puedo hacer una maestría en CS solo con experiencia en econometría?

    ¿Es Londres una buena ciudad para una startup tecnológica?

    Cómo mantener un buen rendimiento para una computadora

    ¿Para qué sirve la parte 'resumen' del currículum?

    ¿Cuáles son los temas y blogs específicos de Quora que debe seguir un dominio geek en informática / ingeniería de software?

    ¿Qué porcentaje de miembros de la facultad en su departamento de CS se ocupan del aprendizaje automático?