Diapositiva 1
Document Sample


Pelayo Delgado Tello
Uno de los supuestos del modelo de regresión lineal, es que no debe haber
un alto grado de correlación entre las variables
predeterminadas(independientes), pues esto, trae serias consecuencias que
podemos resumir así:
I.- Los estimadores por mínimos cuadrados ordinarios siguen siendo
lineales, insesgados y óptimos pero las estimaciones tienen varianzas y
covarianzas grandes.
II.- Las razones t de uno o mas coeficientes tienden a ser estadísticamente
no significativas, con lo que se pierde de perspectiva el análisis.
III.- Aun cuando la razón t de uno o mas coeficientes, es estadísticamente
no significativa, el coeficiente de determinación tiende a ser elevado, con lo
que se demuestra que no se puede separar el efecto individual de cada
variable predeterminada hacia la variable endógena (y).
Entonces, es necesario que luego de estimar un modelo, tengamos que
determinar la existencia o no de un alto grado de correlación entre las
variables predeterminadas.
Los métodos de detección de multicolinealidad que
vamos a estudiar son:
Método de Relación t y R2
Método de la matriz de correlación
Método de la prueba F
Método de los valores propios e índice
de condición
Mediante este método podemos determinar la
existencia de multicolinealidad observando
las razones t y si estas no son
estadísticamente significativas y contamos
con un coeficiente de determinación elevado
(superior a 0.80), podemos estar ante un
síntoma claro de multicolinealidad.
Como el problema de multicolinealidad es un problema con las variables
predeterminadas, establecemos una matriz de correlación entre
aquellas, es decir:
Como es de notar, si la correlación entre las variables predeterminadas
fuera 1, extrema correlación, el determinante de R será igual a cero,
caso contrario, si la correlación fuera 0, el determinante será igual a 1,
por lo que podemos esbozar una regla en los siguientes términos:
Si el determinante de la matriz R es cercano a cero, el grado
de multicolinealidad es considerable; si es cercano a uno, la
correlación entre las variables no será de consideración.
CALCULA EL DETREMINANTE DE LA MATRIZ
DE CORRELACION
GROUP CX x1 x2
MATRIX CO = CX
MATRIX CORR =@COR(CO)
MATRIX DT =@DET(CORR)
En un modelo de K-1 variables predeterminadas, es
conveniente determinar cual de las mencionadas variables X
esta correlacionada con las restantes para lo cual hay
necesidad de hacer regresiones auxiliares de cada X con las
restantes y obtener el R2 correspondiente. Luego siguiendo la
relación entre F y R2 se establece el siguiente probador:
Que sigue una distribución F con k-2 G.L. para el numerador
y n-k+1 G.L para el denominador y
n: tamaño de la muestra
:coeficiente de determinación en la regresión de alguna Xk
con las restantes incluidas en el modelo.
Si Fc excede al F tabulado a cierto nivel de
significación, se dice entonces que la Xk en
particular es colineal con las demás
El tema de los valores propios es uno puramente
matemático, que tiene que ver con el álgebra
matricial y que son calculados por los paquetes
econométricos y matemáticos del caso. En todo
caso, partiendo de los valores propios de la matrix
X’X, que es la que contiene las variables
predeterminadas, se establece lo que se conoce
como número de condición (K):
Si K esta entre 100 y 1000, existe
multicolinealidad que va desde moderada a
fuerte, mientras que si excede a 1000, existe
multicolinealidad severa. De otro lado, si el
índice de condición (IC) está entre 10 y 30,
existe multicolinealidad entre moderada y
fuerte y si excede 30, existe multicolinealidad
severa.
Para aplicar todo lo expuesto anteriormente, vamos a
estimar un modelo que contiene una variable endógena y
dos predeterminadas. La especificación es la siguiente:
Donde:
IMP: Importaciones
PBI: Producto Bruto Interno
INV: Inversión
La especificación anterior implica que las importaciones
estarían en relación directa con el indicador de la actividad
económica PBI y con la inversión lo que quiere decir que
sus coeficientes B2 y B3 deben ser positivos.
La estimación para el periodo 1970 2002 es:
Años P PBI INV
1970 1000 890.7500 163.1300
1971 1700 960.0600 190.3300
1972 1800 1009.610 210.8900
1973 2000 1073.500 247.7000
1974 2115 1103.330 223.1000
1975 2300 1185.380 260.5000
1976 1800 1239.030 321.7000
1977 2400 1299.500 351.8000
1978 2700 1303.490 313.7000
1979 2100 1310.180 247.2000
1980 2300 1491.180 265.9000
1981 2800 1623.650 336.0000
1982 2900 1744.720 383.0000
1983 2100 1825.560 364.1000
1984 3100 1952.820 358.9000
1985 3200 2084.240 428.6000
1986 2800 2260.000 480.8000
1987 2500 2350.270 442.5000
1988 3600 2325.320 376.2000
1989 3800 2385.300 389.4000
1990 2500 2571.500 436.0000
1991 3600 2686.980 492.0000
1992 3800 2773.230 510.6000
1993 3200 2919.500 698.3000
1994 2700 3073.440 884.4000
1995 4000 3316.910 916.2000
1996 4100 3363.400 788.5000
1997 4200 3361.570 723.4000
1998 4300 3361.180 659.0000
1999 4150 3562.400 723.6000
2000 4120 3728.570 882.0000
2001 4200 3899.040 1024.100
2002 4800 3903.340 1001.900
Dependent Variable: IMP
Method: Least Squares
Date: 02/28/10 Time: 18:31
Sample: 1970 2002
Included observations: 33
Variable Coefficient Std. Error t-Statistic Prob.
C 931.7856 191.2664 4.871663 0.0000
PBI 1.205663 0.226452 5.324150 0.0000
INV -1.317726 0.866111 -1.521428 0.1386
R-squared 0.823462 Mean dependent var 2990.455
Adjusted R-squared 0.811693 S.D. dependent var 948.1416
S.E. of regression 411.4402 Akaike info criterion 14.96371
Sum squared resid 5078491. Schwarz criterion 15.09976
Log likelihood -243.9013 F-statistic 69.96751
Durbin-Watson stat 2.002785 Prob(F-statistic) 0.000000
Como podemos observar, nuestros coeficientes
tienen los signos esperados y hay significación
estadística. Excepto con IINV puesto que el P-
valor es superior o igual a 0.10, por lo que
está variable no es estadísticamente
significativa. Del mismo modo en lo que
respecta a la relevancia global, el coeficiente de
determinación es considerablemente alto del
mismo modo F calculado , con lo que hasta aquí
podríamos decir que es un modelo que esta
explicando muy bien el fenómeno económico que
estamos tratando. Veamos el problema de la
multicolinealidad.
Podríamos decir ahora que este método es
referencial y aplicado a nuestro caso,
significa que no existe multicolinealidad
puesto que las razones t implican
significación estadística, siendo nuestra única
sospecha el elevado coeficiente de
determinación
En lo que respecta a este método, vamos a hacer uso del
Eviews, para encontrar directamente matrix de correlación
entre dos variables, aplicamos la siguiente orden:
cor pbi inv y obtenemos:
PBI INV
PBI 1.0000 0.9435
INV 0.9435 1.0000
Con lo que queda claro que la correlación entre PBI e INV
es considerable.
El resultado anterior no es una matrix y en consecuencia
no podemos encontrar su determinante. La forma como
podemos encontrar los mismos valores partiendo de una
matrix es con el siguiente procedimiento
Convertir en grupo las predeterminadas con la orden:
GROUP GR PBI INV donde GR es el nombre del grupo de variables
compuesto por PBI e INV, pudo haber sido
cualquier
nombre:Aplicarla siguiente orden:
Matrix matcor=@cor(GR) que nos da el siguiente resultado:
C1 C2
R1 1.0000 0.9435
R2 0.9435 1.0000
Hay que destacar que cuando damos la orden (Matrix matcor=@cor(GR)
con la palabra matrix estamos indicando que el resultado será una
matrix, pudo haber sido un vector o un escalar lógicamente que para
nuestro caso es una matrix. matcor es el nombre de la matrix, pudo
haber sido otro, lo que estamos haciendo es nombrar acorde con lo que
pretendemos calcular, matcor,
significaría matrix de correlación. Luego del signo = esta la orden
propiamente dicha precedida del signo de arroba.
Eviews puede ahora manipular la matrix matcor y luego para
encontrar el determinante hacemos lo siguiente:
Scalar C2=@determinant(matcor)
Como siempre c2 es el nombre del scalar, pudo haber sido otro. El
resultado es:
Scalar C2=0.109885115319
Es decir el determinante de la matrix de correlación es el número
indicado mas arriba. En cuanto a la interpretación, podemos decir
que el valor no esta cercano a cero, pero tampoco a uno, luego por
este método hay menos que perfecta correlación.
Para aplicar este método, tenemos que hacer la
regresión de PBI contra INV (X2 con las restantes,
X3)
Esto es:
Dependent Variable: PBI
Method: Least Squares
Date: 11/20/01 Time: 07:59
Sample: 1950 1982
Included observations: 33
Variable
Coefficient Std. Error t-Statistic Prob.
C 480.5837 124.7485 3.852421 0.0005
INV 3.608454 0.227712 15.84659 0.0000
Coefficient Std. Error t-Statistic Prob.
C 480.5837 124.7485 3.852421 0.0005
INV 3.608454 0.227712 15.84659 0.0000
R-squared 0.890116
Adjusted R-squared 0.886571
S.E. of regression 326.3249
Sum squared resid 3301125.
F-statistic 251.1145
Prob(F-statistic) 0.0000
Este método es aplicable a situaciones donde
habría mas de dos variables predeterminadas
pues si nos damos cuenta en el numerador del
probador hay que corregir por K-2 G.L con lo
que quedaría una división por cero, haciendo
inaplicable el mencionado método. Sin embargo,
habría que tener en cuenta que el coeficiente de
determinación para la regresión de PBI con INV es
0.890116 y si queremos encontrar la correlación,
habría que sacar raíz cuadrada al mencionado
coeficiente, con lo que el resultado es:0.943459
tal como fue calculado mas arriba.
Veamos con el Eviews como conseguimos la
matrix X’X.
Consideramos este método como el mas
indicado para determinar la multicolinealidad ya
que tiene que ver con la matriz de momentos
X’X, que como demostramos en su momento si
hay interacción completa no se puede encontrar
la inversa y consecuentemente tampoco los
coeficientes de regresión.
En primer lugar debemos agrupar las
predeterminadas pero considerando una columna
de 1’s para recoger el termino independiente:
GROUP GRP 1 PBI INV cuyo resultado es
group grp 1 pbi inv
sym xtx=@inner(grp)
vector VPRO=@eigenvalues(xtx)
Aplicar la siguiente orden:
Sym XX=@inner(GRP) obteniendo:
C1 C2 C3
R1 33.00000 73938.95 16095.45
R2 73938.95 195707488 43473608
R3 16095.45 43473608 9904075.
Una nota adicional ponemos sym para indicar
que el resultado será una matriz simétrica y
además porque la orden para encontrar los
valores propios funciona solo para matrices
simétricas.
Que es la matriz X’X, en nuestro caso matriz de
las predeterminadas PBI INV.
De esta matriz es de la que habría que encontrar
los valores propios. Veamos:
Vector VPRO=@eigenvalues(X´X)
R1 4.627378
R2 235407.7
R3 205376183.8
El resultado es un vector columna que contiene
los valores propios (VRPO. Pero observemos
que si aplicamos la formula de K e IC los
resultados serian:
K = 44382841.38
IC = 6662.044835,
Como K y IC exceden a 1000 y 30 respectivamente entonces existe
una multicolinealidad severa entre PBI y INV
Get documents about "