from sklearn.preprocessing import LabelEncoder
Con esta linea de import en nuestro código, se abren posibilidades nuevas en opciones a como modelar o manipular nuestro dataset.
Anteriormente comentamos en el post de dummies la posibilidad de generar con la función get_dummies() y transformar cada dato no numérico en una representación binaria ( expandiendo nuestro dataset a la cantidad de datos distintos que existan en una columna).
Hoy veremos la solución mediante sklearn y su modulo de preprocessing, dado que esto esta mucho mas enfocado en el Machine Learning al momento de entrenar algún modelo.
from sklearn.preprocessing import LabelEncoder df['Direction'] = LabelEncoder().fit_transform(df['Direction'])
La magia de esto, es que nos permite hacer un fit_transform generando de manera interna y automática la transformación y recodificación de un numero indeterminado de variables dentro de una columna y entregarla de manera numérica por lo tanto manejable en algún modelo de Machine Learning
Por lo tanto podemos comenzar a graficar o en caso de algún modelo de clasificación podemos predecir algún dato.
El ejemplo completo lo pueden ver desde nuestro github.
Si tienes dudas o consultas no dudes en preguntarnos!!! SALUDOS!