PLANTEAMIENTO

 

Se expone como obtener la recta por regresión lineal por covarianza entre dos variables cuantitativas.

 

 

RECTA DE REGRESIÓN LINEAL POR COVARIANZA

 

En múltiples ocasiones se requiere analizar la relación entre dos variables cuantitativas. Los dos objetivos fundamentales de este análisis son:

 

1.     Determinar si dichas variables están asociadas y en qué sentido se da dicha asociación (es decir, si los valores de una de las variables tienden a aumentar -o disminuir- al aumentar los valores de la otra).

2.     Estudiar si los valores de una variable pueden ser utilizados para predecir el valor de la otra.

 

La forma correcta de abordar el primer problema es recurriendo a coeficientes de correlación. Sin embargo, el estudio de la correlación es insuficiente para obtener una respuesta a la segunda pregunta, ya que se limita a indicar la fuerza de la asociación mediante un único número, tratando las variables de modo simétrico, mientras que lo que se busca es modelar dicha relación y usar una de las variables para explicar la otra. Para tal propósito se recurrirá a la técnica de regresión.

 

La regresión lineal permite definir la recta que mejor se ajusta a una nube de puntos. Gráficamente:

 

 

La recta está definida por la siguiente expresión:

 

 

donde  es la variable dependiente y  es la variable independiente. Sus coeficientes representan:

 

 determina la pendiente de la recta, es decir, su grado de inclinación. Se calcula como la covarianza de las dos variables, dividida por la varianza de la variable

 

 

 es el valor que toma  cuando la variable independiente  vale cero. Es el punto donde la recta cruza el eje vertical, llamado ordenada al origen de la recta. Se calcula como la media de la variable  menos la media de la variable  multiplicada por el parámetro  que se ha calculado:

 

 

Ejemplo.

Obtener y graficar la recta de regresión con los datos de estatura y peso de diez jugadores del equipo Leopardos de fútbol americano de la prepa 8:

 

Estatura (m)

1.72

1.79

1.78

1.75

1.80

1.79

1.81

1.70

1.68

1.73

Peso (kg)

74

81

76

77

87

86

92

67

76

74

 

Solución.

Considerando que la estatura es la variable  y que el peso es la variable  se tiene:

 

La estatura media es:

 

 

El peso medio es:

 

 

Por lo tanto la covarianza es:

 

 

 

Calculando la desviación estándar de las estaturas:

 

 

 

Con base en los valores obtenidos de la covarianza y de la desviación estándar, se calcula

 

 

Considerando que  y que

 

 

Por lo que la recta de regresión lineal es:

 

Su gráfica es:

 

 

 

CONCLUSIÓN

 

La recta de regresión es la que mejor se ajusta a la nube de puntos. La recta de regresión se utiliza para estimar los valores de  a partir de la  La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable

 

 

PROPUESTA DE TRABAJO

 

1.     Observar detenidamente la tabla de datos

2.     Notar que esos datos están en forma de puntos.

3.     Mover cualquiera de los puntos y ver cómo se modifica la recta.

4.     Visualizar la ecuación de regresión lineal.

5.     Ver que la recta se ajusta lo más posible a la nube de puntos.

6.     Notar como el valor de la pendiente cambia ya que depende de covarianza y la varianza de la variable

7.     Pulsar el icono que se sitúa arriba a la derecha para regresar a la construcción inicial.

8.     Con los datos presentados, comprobar en el cuaderno la ecuación de la recta siguiendo la metodología expuesta.

9.     Pulsar el icono que se sitúa arriba a la derecha para regresar a la construcción inicial.