Home Data Scientist Regresión Lineal Simple, Nuestro Primer Algoritmo de predicción.

Regresión Lineal Simple, Nuestro Primer Algoritmo de predicción.

Por Felipe Veloso

Regresión Lineal Simple

Bienvenidos una vez mas a Feeding The Machine, como el nombre del blog lo indica apunta mucho a alimentar la maquina con …. bueno lo que nos compete… DATA, analizaremos en breve el modelo mas simple que podemos analizar la regresión lineal simple.

Se presentara el primer algoritmo de predicción, llamado Regresión Lineal, cabe recalcar que por si mismo la regresión lineal no es un algoritmo computacional, si no una herramienta estadística para la predicción en un dato dado, esta nos sirve para aproximar la relación de dependencia entre una variable dependiente Y, las variables independientes Xi y un error aleatorio ε o un delta si gustas.

Citando a wikipedia la formula a representar seria.

En el ámbito del Machine Learning, puede ser utilizado como tu primer algoritmo para la predicción en un modelo.

En nuestro código de ejemplo que puedes visitar aquí te presentamos vía Anaconda Browser un código que presenta un simple Dataset que detallaré.

Advertising.csv DataSet

El data set a utilizar corresponde al advertising.csv y para darle contexto (requerimiento importante en una data entregada) analizamos la relación entre el aumento de ventas de en base a lo invertido en la publicidad.

Este dataset fue obtenido especialmente para el análisis de la regresión lineal, por lo tanto no es necesario demostrar que la data viene distribuida de esta forma.

Es posible que en el futuro profundice en python/R para hacer tutoriales de programación para el análisis, por ahora este post apunta a otro tema, tenemos en vista una pequeña muestra de la data, esta ya esta ordenada y limpia por lo tanto esos pasos son omitidos.

Con esta muestra sabemos tanto que nuestro archivo cargo correctamente y vemos algo de los datos que poseemos. luego de esto vienen todos nuestros estadísticos.

En la data que mostramos podemos percatarnos del uso de los estadísticos principales utilizando la librería statsmodel donde utilizamos algunas de sus funciones principales.

La forma mas completa de poder ver es utilizando la función summary() esta aplica para un modelo lineal creado vía statsmodel, se puede apreciar la creación de este desde la compilación [9] en nuestro ejemplo de github.

Aquí tenemos la vista de los principales estadísticos y sus valores, esto nos permite evaluar realmente si el modelo se ajusta a la realidad presentada en datos o si el modelo propuesto no permite explicar la información dada.

Ahora sin profundizar en los estadísticos presentados del summary al ver la gráfica de dispersión del modelo. al analizar el error desde el punto de vista del estadístico R-adj tenemos un 40% de incertidumbre y al analizar el Errores llegamos a visualizar 23% en margen de error.

Lo importante de esto, es iniciar el uso de los modelos básicos que tenemos como herramientas para el análisis y mas aun el uso de las principales librerías para el Data Science o estudios de modelos.

Saludos!

You may also like

Deja un Comentario

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More