martes, 29 de mayo de 2012

REGRESIÓN


Si se dispone de dos series de datos emparejadas, con frecuencia se desea 
conocer si ambas variables están relacionadas o si son independientes.  Por 
ejemplo, ¿en qué medida, un aumento de los gastos en publicidad hace aumentar las ventas de un determinado producto? ó ¿será que existe alguna relación entre la talla y el peso de una persona?
A continuación, representaremos la relación entre dos variables mediante una 
gráfica llamada  diagrama de dispersión,  luego, estableceremos  un modelo 
matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión y finalmente estudiaremos el grado de relación existente entre las variables en lo que llamaremos análisis de correlación.
La relación existente entre dos variables puede ser  lineal, cuadrática, exponencial, logarítmica, etc. 


DIAGRAMA DE DISPERSIÓN


En un plano cartesiano se representan tantos puntos como pares de observaciones se tengan, correspondiendo cada punto a un par de observaciones; a esta representación gráfica se le denomina indistintamente diagrama de dispersion.




RECTA DE REGRESIÓN

Se llama así a la recta que atraviesa la nube de puntos y que mejor se ajusta a ellos. El modelo matemático que describe una relación lineal cuando se estima el valor de Y en función de x esta dada así,  Y  = bx + c  ó  Y = 1x  +  0,  o  Y = Bx  +  A. (Esta última notación es la empleada en las calculadoras CASIO)Donde:
Y es la variable que se va a estimar en función de otra variable (x) que se supone conocida. Se le denomina también como variable dependiente, explicada o predictando.  
x es la variable cuyo valor supuestamente se conoce, se le denomina variable 
independiente, predictor o explicativa.


b = 1  es la pendiente o sea la que determina el ángulo de inclinación de la recta. 
Denominada coeficiente angular, cuantificando la cantidad que aumenta o decrece Y por cada unidad que aumente o disminuya la variable independiente x.

Si b es positivo indica que la recta es ascendente. Si b es negativo la recta será descendente y si b  es igual a cero será una paralela  al eje horizontal.
c =  0, corresponde al  coeficiente de posición. Es el valor donde la recta 
intercepta al eje Y. Puede ser  mayor, menor o igual a 0.
Se debe encontrar la línea que represente al conjunto de puntos, para lograr esto se deben determinar  los coeficientes de regresión muestrales (Coeficiente angular y de posición) que son estimadores de los parámetros o coeficientes de regresión poblacional.  Los valores de b y  c corresponden a aquellos que hacen que los Yi sean lo más cercanos posibles a los valores observados  yi, para determinarlos lo más indicado es aplicar  el método de los mínimos cuadrados.

CRITERIO DE LOS MÍNIMOS CUADRADOS:

En el método de los mínimos cuadrados  se emplean los datos de la muestra para determinar los valores de b y c  que minimizan  la suma  de los cuadrados de las desviaciones  entre los valores observados de la variable dependiente  yi, y los valores estimados de la variable dependiente,  Yi. Este criterio se puede expresar así:
Mín ( yi  – Yi)2

Siendo
yi  =  valor observado de la variable dependiente para la i-ésima observación.
Yi =  valor estimado de la variable dependiente para la i-ésima observación.









No hay comentarios:

Publicar un comentario