En Machine Learning también tenemos que lidiar con más números de variables categóricas. Por lo general, codifican datos categóricos para que todos nuestros datos categóricos se conviertan a forma numérica. En el caso de variables independientes también seguimos la misma estrategia.
Aquí he compartido un código que se usa para codificar datos categóricos en python.
Conjunto de datos: –
- ¿Cuáles son algunos buenos libros para principiantes y avanzados sobre redes neuronales e inteligencia artificial?
- ¿En qué se diferencia LSTM de RNN? En una explicación laica.
- ¿Por qué se requieren conocimientos de aprendizaje automático para un periodista de datos? ¿Por qué la exploración y visualización de datos por sí sola no es suficiente para el periodismo de datos?
- ¿Cuáles son las mejores medidas de rendimiento para un modelo de detección de anomalías?
- ¿Los centros de datos cambiarán a procesadores personalizados para aplicaciones de aprendizaje automático?
Gasto en I + D, Administración, Estado, Beneficio
165349.2, 136897.8, 471784.1, Nueva York, 192261.83
162597.7, 151377.59, 443898.53, California, 191792.06
Código fuente:-
# Importando las bibliotecas
importar numpy como np
importar matplotlib.pyplot como plt
importar pandas como pd
# Importando el conjunto de datos
conjunto de datos = pd.read_csv (’50_Startups.csv’)
X = dataset.iloc [:,: -1] .values
y = dataset.iloc [:, 4] .values
# Codificación de datos categóricos
desde sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder = LabelEncoder ()
X [:, 3] = labelencoder.fit_transform (X [:, 3])
onehotencoder = OneHotEncoder (categorical_features = [3])
X = onehotencoder.fit_transform (X) .toarray ()