PLANTEAMIENTO
Se expone como obtener la recta por regresión lineal por covarianza entre dos
variables cuantitativas.
RECTA
DE REGRESIÓN LINEAL POR COVARIANZA
En
múltiples ocasiones se requiere analizar la relación entre dos variables
cuantitativas. Los dos objetivos fundamentales de este análisis son:
1.
Determinar si dichas variables están asociadas
y en qué sentido se da dicha asociación (es decir, si los valores de una de las
variables tienden a aumentar -o disminuir- al aumentar los valores de la otra).
2.
Estudiar si los valores de una variable pueden
ser utilizados para predecir el valor de la otra.
La
forma correcta de abordar el primer problema es recurriendo a coeficientes de
correlación. Sin embargo, el estudio de la correlación es insuficiente para
obtener una respuesta a la segunda pregunta, ya que se limita a indicar la
fuerza de la asociación mediante un único número, tratando las variables de
modo simétrico, mientras que lo que se busca es modelar dicha relación y usar
una de las variables para explicar la otra. Para tal propósito se recurrirá a
la técnica de regresión.
La
regresión lineal permite definir la
recta que mejor se ajusta a una nube de puntos. Gráficamente:
La
recta está definida por la siguiente expresión:
donde
es la variable dependiente y
es la variable independiente. Sus coeficientes
representan:
determina la pendiente de la recta, es decir, su grado de inclinación. Se
calcula como la covarianza de las dos variables, dividida por la varianza de la
variable
es el valor que toma
cuando la variable independiente
vale cero. Es el punto donde la recta cruza el
eje vertical, llamado ordenada al origen de la recta. Se calcula como la media
de la variable
menos la media de la variable
multiplicada por el parámetro
que se ha calculado:
Ejemplo.
Obtener
y graficar la recta de regresión con los datos de estatura y peso de diez jugadores del equipo Leopardos de fútbol americano
de la prepa 8:
Estatura (m) |
1.72 |
1.79 |
1.78 |
1.75 |
1.80 |
1.79 |
1.81 |
1.70 |
1.68 |
1.73 |
Peso (kg) |
74 |
81 |
76 |
77 |
87 |
86 |
92 |
67 |
76 |
74 |
Solución.
Considerando
que la estatura es la variable y que el peso es la variable
se tiene:
La estatura media es:
El peso medio es:
Por lo tanto la covarianza es:
Calculando la desviación estándar de las estaturas:
Con base en los valores obtenidos de la covarianza y de la
desviación estándar, se calcula
Considerando que y que
Por lo que la recta de regresión lineal es:
Su gráfica es:
CONCLUSIÓN
La recta de regresión
es la que mejor se ajusta a la nube de puntos. La recta de regresión se utiliza
para estimar los valores de a partir de la
La pendiente de la recta es el cociente entre
la covarianza y la varianza de la variable
PROPUESTA
DE TRABAJO
1.
Observar detenidamente la tabla de datos
2.
Notar que esos datos están en forma de puntos.
3.
Mover cualquiera de los puntos y ver cómo se
modifica la recta.
4.
Visualizar la ecuación de regresión lineal.
5.
Ver que la recta se ajusta lo más posible a la
nube de puntos.
6.
Notar como el valor de la pendiente cambia ya
que depende de covarianza y la varianza de la variable
7.
Pulsar el icono que se sitúa arriba a la derecha para
regresar a la construcción inicial.
8.
Con los datos presentados, comprobar en el cuaderno la
ecuación de la recta siguiendo la metodología expuesta.
9.
Pulsar el icono que se sitúa arriba a la derecha para
regresar a la construcción inicial.