Home 101 Data en object a Numerico con preprocessing sklearn LabelEncoder

Data en object a Numerico con preprocessing sklearn LabelEncoder

Por Felipe Veloso

from sklearn.preprocessing import LabelEncoder

Con esta linea de import en nuestro código, se abren posibilidades nuevas en opciones a como modelar o manipular nuestro dataset.

Anteriormente comentamos en el post de dummies la posibilidad de generar con la función get_dummies() y transformar cada dato no numérico en una representación binaria ( expandiendo nuestro dataset a la cantidad de datos distintos que existan en una columna).

Hoy veremos la solución mediante sklearn y su modulo de preprocessing, dado que esto esta mucho mas enfocado en el Machine Learning al momento de entrenar algún modelo.

from sklearn.preprocessing import LabelEncoder

df['Direction'] = LabelEncoder().fit_transform(df['Direction'])

La magia de esto, es que nos permite hacer un fit_transform generando de manera interna y automática la transformación y recodificación de un numero indeterminado de variables dentro de una columna y entregarla de manera numérica por lo tanto manejable en algún modelo de Machine Learning

Por lo tanto podemos comenzar a graficar o en caso de algún modelo de clasificación podemos predecir algún dato.

El ejemplo completo lo pueden ver desde nuestro github.

 

Si tienes dudas o consultas no dudes en preguntarnos!!! SALUDOS!

You may also like

Deja un Comentario

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More