Si se dispone de dos series de datos emparejadas, con frecuencia se desea
conocer si ambas variables están relacionadas o si son independientes. Por
ejemplo, ¿en qué medida, un aumento de los gastos en publicidad hace aumentar las ventas de un determinado producto? ó ¿será que existe alguna relación entre la talla y el peso de una persona?
A continuación, representaremos la relación entre dos variables mediante una
gráfica llamada diagrama de dispersión, luego, estableceremos un modelo
matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión y finalmente estudiaremos el grado de relación existente entre las variables en lo que llamaremos análisis de correlación.
La relación existente entre dos variables puede ser lineal, cuadrática, exponencial, logarítmica, etc.
DIAGRAMA DE DISPERSIÓN
En un plano cartesiano se representan tantos puntos como pares de observaciones se tengan, correspondiendo cada punto a un par de observaciones; a esta representación gráfica se le denomina indistintamente diagrama de dispersion.
RECTA DE REGRESIÓN
Se llama así a la recta que atraviesa la nube de puntos y que mejor se ajusta a ellos. El modelo matemático que describe una relación lineal cuando se estima el valor de Y en función de x esta dada así, Y = bx + c ó Y = 1x + 0, o Y = Bx + A. (Esta última notación es la empleada en las calculadoras CASIO)Donde:
Y es la variable que se va a estimar en función de otra variable (x) que se supone conocida. Se le denomina también como variable dependiente, explicada o predictando.
x es la variable cuyo valor supuestamente se conoce, se le denomina variable
independiente, predictor o explicativa.
b = 1 es la pendiente o sea la que determina el ángulo de inclinación de la recta.
Denominada coeficiente angular, cuantificando la cantidad que aumenta o decrece Y por cada unidad que aumente o disminuya la variable independiente x.
Si b es positivo indica que la recta es ascendente. Si b es negativo la recta será descendente y si b es igual a cero será una paralela al eje horizontal.
c = 0, corresponde al coeficiente de posición. Es el valor donde la recta
intercepta al eje Y. Puede ser mayor, menor o igual a 0.
Se debe encontrar la línea que represente al conjunto de puntos, para lograr esto se deben determinar los coeficientes de regresión muestrales (Coeficiente angular y de posición) que son estimadores de los parámetros o coeficientes de regresión poblacional. Los valores de b y c corresponden a aquellos que hacen que los Yi sean lo más cercanos posibles a los valores observados yi, para determinarlos lo más indicado es aplicar el método de los mínimos cuadrados.
CRITERIO DE LOS MÍNIMOS CUADRADOS:
En el método de los mínimos cuadrados se emplean los datos de la muestra para determinar los valores de b y c que minimizan la suma de los cuadrados de las desviaciones entre los valores observados de la variable dependiente yi, y los valores estimados de la variable dependiente, Yi. Este criterio se puede expresar así:
Mín ( yi – Yi)2
Siendo
yi = valor observado de la variable dependiente para la i-ésima observación.
Yi = valor estimado de la variable dependiente para la i-ésima observación.
No hay comentarios:
Publicar un comentario