De acuerdo con Coleen
tu conjunto de datos es pequeño
es probable que sus 10k documentos hayan usado 1–2 páginas para información de tipo de preámbulo y otras secciones que no aborden directamente su necesidad principal
- ¿Cómo ha sido su experiencia en Quora con Computer Vision y la comunidad relacionada?
- ¿Cuáles son los temas candentes para la investigación en Machine Learning?
- ¿Cómo trata Apache Spark con los datos de registro que se ejecutan en TeraBytes con memoria limitada (por ejemplo, 8 GB)?
- ¿Es cierto que incluso si podemos modelar a partir de la distribución del modelo [matemática] p (x) [/ matemática], el muestreo de importancia óptima no es [matemática] p (x) [/ matemática]?
- ¿Cuál es un ejemplo de un sistema, proceso o actividad que no puede ser modelado por un proceso de decisión de Markov?
Si el 10 K se refiere a la misma jurisdicción y un segmento industrial muy estrecho, tal vez tenga suerte.
Incluso si asume que la porción de PNL no es un problema (lo es), los matices de la redacción legal serán un desafío además de eso.
Las placas de calderas fueron creadas por abogados por una buena razón. Especialmente para contratos corporativos donde los matices después de que un MSA contextualice otro contrato existente, necesitará muchas más muestras por industria por jurisdicción
Una contradicción en la ley de Texas podría considerarse benigna o inaplicable en Delaware, pero luego debería haber disposiciones de modularidad / separabilidad en muchos ejemplos legales.