Modelo de regresión lineal simple
El modelo de regresión lineal
La estructura del modelo de regresión lineal es la siguiente:
En esta expresión estamos admitiendo que todos los factores o causas que influyen en la variable respuesta pueden dividirse en dos grupos: el primero contiene a una variable explicativa y el segundo incluye un conjunto amplio de factores no controlados que englobamos bajo el nombre de perturbación o error aleatorio, ε, que provoca que la dependencia entre las variables dependiente e independiente no sea perfecta, sino que esté sujeta a incertidumbre. Por ejemplo, en el consumo de gasolina de un vehículo influyen la velocidad y una serie de factores como el efecto conductor, el tipo de carretera, las condiciones ambientales, etc., que quedarían englobados en el error. Lo que en primer lugar sería deseable en un modelo de regresión es que estos errores aleatorios sean en media cero para cualquier valor de es decir, , y por lo tanto: En dicha expresión se observa que:- La media de , para un valor fijo , varía linealmente con .
- Para un valor x se predice un valor endado por por lo que el modelo de predicción puede expresarse también como .
- El parámetro es la ordenada al origen del modelo (punto de corte con el eje Y) y la pendiente, que puede interpretarse como el incremento de la variable dependiente por cada incremento en una unidad de la variable independiente. Estos parámetros son desconocidos y habrá que estimarlos de cara a realizar predicciones.
- La varianza de ε es constante para cualquier valor de , es decir,
- La distribución de ε es normal, de media 0 y desviación σ.
- Los errores asociados a los valores de Y son independientes unos de otros.