¿Hay una explicación fácil sobre cuándo usar fit y cuándo un fit_transform de sk-learn en Python?

documentación de sklearn:

Estoy tomando un ejemplo de sklearn.feature_extraction.text .CountVectorizer

donde tenemos dos de esas funciones:

¿Qué campo debo elegir: análisis de negocios, análisis de datos, inteligencia de negocios y minería de datos?
¿Hay algún programa de capacitación en ciencia de datos para empleados de H1B que trabajan en otro dominio?
¿Cuál es la próxima gran cosa después de Big Data?
¿Cuál es la diferencia entre Business Intelligence y Data Science?
¿Será el estilo de datos un buen sitio para aprender Big Data y Hadoop?

fit (raw_documents [, y]) Aprenda un diccionario de vocabulario de todos los tokens en los documentos sin formato.
fit_transform (raw_documents [, y]) Aprenda el diccionario de vocabulario y devuelva la matriz de documentos de términos

Primero, tome entradas sin procesar y formule el espacio vectorial dependiendo de la tarea (aquí la tarea es CountVectorization) y devuelve el modelo.

Por otro lado, el segundo completa el primer paso como subtarea y luego devuelve el vector normalizado que se basa en el espacio vectorial recién construido.

En scikit-learn estimator api ,

fit() : utilizado para generar parámetros de modelo de aprendizaje a partir de datos de entrenamiento

transform() : parámetros generados a partir del método fit() , aplicados sobre el modelo para generar un conjunto de datos transformado.

fit_transform() : combinación de api fit() y transform() en el mismo conjunto de datos

Disfruta 🙂

Aprendizaje automáticoAprendizaje de PythonAprendizaje para programarCiencia de datosLenguajes de programaciónProgramación informáticaPythonscikit-learn

Related Content

¿Qué es la limpieza de datos como en Machine Learning y cómo se hace?

Con experiencia en informática, ¿vale la pena aprender R y ciencia de datos?

Cómo extraer grandes conjuntos de datos de registros médicos

¿Qué empresas serían consideradas estrellas en ascenso con Big Data?

¿Qué opciones de carrera hay para graduados no informáticos en Data Science?

Cómo elegir un modelo ML cuando el objetivo es tanto una predicción razonable como una inferencia

¿Qué tipo de datos predice con precisión el aprendizaje automático?

More Interesting

¿En qué área de las matemáticas debo mejorar para entrar en una carrera de ciencias de datos, cálculo o matemáticas discretas?

¿Cuáles son los principios de recopilación y análisis de datos?

¿Cuál es la mejor institución para aprender un curso de análisis de negocios / ciencia de datos en Hyderabad?

¿Cómo es ser un científico de datos en McKinsey?

¿Cuáles son las perspectivas de empleo si completo el Master de Ciencia de Datos de Código Abierto en http://datasciencemasters.org?

¿Cómo se puede utilizar la ciencia de datos en economía?

¿Qué campo prefiere si reinicia su carrera ahora, Machine Learning, Data Science, Quant?

¿Qué tan importante es la prueba A / B para un científico de datos que trabaja en una empresa de tecnología?

¿Qué pasó con el proyecto 'Estadístico automático', respaldado por Google, etc.?

¿Cuál es el salario base de un científico de datos en Airbnb?

¿Cómo logra Coffee Meets Bagel tener éxito sin ningún científico de datos?

¿Qué necesito saber para convertirme en científico de datos?

¿Cuál es la mejor tecnología para procesar big data además de Hadoop y Spark?

¿Los Sistemas de aprendizaje natural, como Watson Analytics de IBM, alguna vez reemplazarán la necesidad de aprender código para un científico de datos?

¿Cuál es el mejor curso fuera de línea para big data y data science en Navi Mumbai?

Web Analytics