Diapositiva 1

Shared by: r11Kv3
Categories
Tags
-
Stats
views:
6
posted:
11/18/2011
language:
Spanish
pages:
25
Document Sample
scope of work template
							Pelayo Delgado Tello
    Uno de los supuestos del modelo de regresión lineal, es que no debe haber
    un alto grado de correlación entre las variables
    predeterminadas(independientes), pues esto, trae serias consecuencias que
    podemos resumir así:

   I.- Los estimadores por mínimos cuadrados ordinarios siguen siendo
    lineales, insesgados y óptimos pero las estimaciones tienen varianzas y
    covarianzas grandes.
   II.- Las razones t de uno o mas coeficientes tienden a ser estadísticamente
    no significativas, con lo que se pierde de perspectiva el análisis.
   III.- Aun cuando la razón t de uno o mas coeficientes, es estadísticamente
    no significativa, el coeficiente de determinación tiende a ser elevado, con lo
    que se demuestra que no se puede separar el efecto individual de cada
    variable predeterminada hacia la variable endógena (y).
   Entonces, es necesario que luego de estimar un modelo, tengamos que
    determinar la existencia o no de un alto grado de correlación entre las
    variables predeterminadas.
   Los métodos de detección de multicolinealidad que
    vamos a estudiar son:

     Método de Relación      t y R2



                                       Método de la matriz de correlación



         Método de la prueba F



                                      Método de los valores propios e índice
                                                  de condición
   Mediante este método podemos determinar la
    existencia de multicolinealidad observando
    las razones t y si estas no son
    estadísticamente significativas y contamos
    con un coeficiente de determinación elevado
    (superior a 0.80), podemos estar ante un
    síntoma claro de multicolinealidad.
   Como el problema de multicolinealidad es un problema con las variables
    predeterminadas, establecemos una matriz de correlación entre
    aquellas, es decir:




Como es de notar, si la correlación entre las variables predeterminadas
 fuera 1, extrema correlación, el determinante de R será igual a cero,
 caso contrario, si la correlación fuera 0, el determinante será igual a 1,
 por lo que podemos esbozar una regla en los siguientes términos:

    Si el determinante de la matriz R es cercano a cero, el grado
    de multicolinealidad es considerable; si es cercano a uno, la
    correlación entre las variables no será de consideración.
   CALCULA EL DETREMINANTE DE LA MATRIZ
    DE CORRELACION

   GROUP CX x1 x2
   MATRIX CO = CX
   MATRIX CORR =@COR(CO)
   MATRIX DT =@DET(CORR)

   En un modelo de K-1 variables predeterminadas, es
    conveniente determinar cual de las mencionadas variables X
    esta correlacionada con las restantes para lo cual hay
    necesidad de hacer regresiones auxiliares de cada X con las
    restantes y obtener el R2 correspondiente. Luego siguiendo la
    relación entre F y R2 se establece el siguiente probador:




   Que sigue una distribución F con k-2 G.L. para el numerador
    y n-k+1 G.L para el denominador y
    n: tamaño de la muestra
   :coeficiente de determinación en la regresión de alguna Xk
    con las restantes incluidas en el modelo.
Si Fc excede al F tabulado a cierto nivel de
significación, se dice entonces que la Xk en
particular es colineal con las demás
El tema de los valores propios es uno puramente
matemático, que tiene que ver con el álgebra
matricial y que son calculados por los paquetes
econométricos y matemáticos del caso. En todo
caso, partiendo de los valores propios de la matrix
X’X, que es la que contiene las variables
predeterminadas, se establece lo que se conoce
como número de condición (K):
Si K esta entre 100 y 1000, existe
multicolinealidad que va desde moderada a
fuerte, mientras que si excede a 1000, existe
multicolinealidad severa. De otro lado, si el
índice de condición (IC) está entre 10 y 30,
existe multicolinealidad entre moderada y
fuerte y si excede 30, existe multicolinealidad
severa.
   Para aplicar todo lo expuesto anteriormente, vamos a
    estimar un modelo que contiene una variable endógena y
    dos predeterminadas. La especificación es la siguiente:



   Donde:
    IMP: Importaciones
    PBI: Producto Bruto Interno
    INV: Inversión

    La especificación anterior implica que las importaciones
    estarían en relación directa con el indicador de la actividad
    económica PBI y con la inversión lo que quiere decir que
    sus coeficientes B2 y B3 deben ser positivos.
    La estimación para el periodo 1970 2002 es:
Años   P      PBI        INV
1970   1000   890.7500   163.1300
1971   1700   960.0600   190.3300
1972   1800   1009.610   210.8900
1973   2000   1073.500   247.7000
1974   2115   1103.330   223.1000
1975   2300   1185.380   260.5000
1976   1800   1239.030   321.7000
1977   2400   1299.500   351.8000
1978   2700   1303.490   313.7000
1979   2100   1310.180   247.2000
1980   2300   1491.180   265.9000
1981   2800   1623.650   336.0000
1982   2900   1744.720   383.0000
1983   2100   1825.560   364.1000
1984   3100   1952.820   358.9000
1985   3200   2084.240   428.6000
1986   2800   2260.000   480.8000
1987   2500   2350.270   442.5000
1988   3600   2325.320   376.2000
1989   3800   2385.300   389.4000
1990   2500   2571.500   436.0000
1991   3600   2686.980   492.0000
1992   3800   2773.230   510.6000
1993   3200   2919.500   698.3000
1994   2700   3073.440   884.4000
1995   4000   3316.910   916.2000
1996   4100   3363.400   788.5000
1997   4200   3361.570   723.4000
1998   4300   3361.180   659.0000
1999   4150   3562.400   723.6000
2000   4120   3728.570   882.0000
2001   4200   3899.040   1024.100
2002   4800   3903.340   1001.900
   Dependent Variable: IMP
   Method: Least Squares
   Date: 02/28/10 Time: 18:31
   Sample: 1970 2002
   Included observations: 33


   Variable             Coefficient   Std. Error   t-Statistic   Prob.


    C                931.7856          191.2664     4.871663      0.0000
   PBI              1.205663          0.226452     5.324150      0.0000
   INV             -1.317726          0.866111     -1.521428     0.1386


   R-squared              0.823462      Mean dependent var                2990.455
   Adjusted R-squared     0.811693      S.D. dependent var                948.1416
   S.E. of regression   411.4402        Akaike info criterion             14.96371
   Sum squared resid    5078491.        Schwarz criterion                 15.09976
   Log likelihood       -243.9013       F-statistic                       69.96751
   Durbin-Watson stat   2.002785        Prob(F-statistic)                 0.000000

   Como podemos observar, nuestros coeficientes
    tienen los signos esperados y hay significación
    estadística. Excepto con IINV puesto que el P-
    valor es superior o igual a 0.10, por lo que
    está     variable   no es       estadísticamente
    significativa. Del mismo modo en lo que
    respecta a la relevancia global, el coeficiente de
    determinación es considerablemente alto del
    mismo modo F calculado , con lo que hasta aquí
    podríamos decir que es un modelo que esta
    explicando muy bien el fenómeno económico que
    estamos tratando. Veamos el problema de la
    multicolinealidad.
                      
Podríamos decir ahora que este método es
referencial y aplicado       a   nuestro caso,
significa que no existe multicolinealidad
puesto     que    las    razones   t    implican
significación estadística, siendo nuestra única
sospecha     el     elevado    coeficiente    de
determinación

    En lo que respecta a este método, vamos a hacer uso del
    Eviews, para encontrar directamente matrix de correlación
    entre dos variables, aplicamos la siguiente orden:
    cor pbi inv y obtenemos:

            PBI       INV
    PBI    1.0000    0.9435
   INV      0.9435 1.0000
   Con lo que queda claro que la correlación entre PBI e INV
    es considerable.
    El resultado anterior no es una matrix y en consecuencia
    no podemos encontrar su determinante. La forma como
    podemos encontrar los mismos valores partiendo de una
    matrix es con el siguiente procedimiento
   Convertir en grupo las predeterminadas con la orden:
   GROUP GR PBI INV          donde GR es el nombre del grupo de variables
                             compuesto por PBI e INV, pudo haber sido
    cualquier
                              nombre:Aplicarla siguiente orden:
   Matrix matcor=@cor(GR) que nos da el siguiente resultado:

            C1         C2
   R1      1.0000    0.9435
   R2      0.9435    1.0000

   Hay que destacar que cuando damos la orden (Matrix matcor=@cor(GR)
    con la palabra matrix estamos indicando que el resultado será una
    matrix, pudo haber sido un vector o un escalar lógicamente que para
    nuestro caso es una matrix. matcor es el nombre de la matrix, pudo
    haber sido otro, lo que estamos haciendo es nombrar acorde con lo que
    pretendemos calcular, matcor,
   significaría matrix de correlación. Luego del signo = esta la orden
    propiamente dicha precedida del signo de arroba.
    Eviews puede ahora manipular la matrix matcor y luego para
    encontrar el determinante hacemos lo siguiente:

   Scalar C2=@determinant(matcor)

    Como siempre c2 es el nombre del scalar, pudo haber sido otro. El
    resultado es:

    Scalar C2=0.109885115319

    Es decir el determinante de la matrix de correlación es el número
    indicado mas arriba. En cuanto a la interpretación, podemos decir
    que el valor no esta cercano a cero, pero tampoco a uno, luego por
    este método hay menos que perfecta correlación.


  Para aplicar este método, tenemos que hacer la
  regresión de PBI contra INV (X2 con las restantes,
  X3)
  Esto es:
 Dependent Variable: PBI

 Method: Least Squares

 Date: 11/20/01 Time: 07:59

 Sample: 1950 1982

 Included observations: 33

 Variable

 Coefficient     Std. Error  t-Statistic    Prob.
C 480.5837         124.7485    3.852421 0.0005
INV 3.608454       0.227712 15.84659 0.0000
 Coefficient     Std. Error  t-Statistic Prob.
C 480.5837         124.7485    3.852421 0.0005
INV 3.608454        0.227712 15.84659 0.0000
 R-squared         0.890116
 Adjusted R-squared 0.886571
 S.E. of regression 326.3249

 Sum squared resid 3301125.
 F-statistic          251.1145
 Prob(F-statistic)      0.0000
   Este método es aplicable a situaciones donde
    habría mas de dos variables predeterminadas
    pues si nos damos cuenta en el numerador del
    probador hay que corregir por K-2 G.L con lo
    que quedaría una división por cero, haciendo
    inaplicable el mencionado método. Sin embargo,
    habría que tener en cuenta que el coeficiente de
    determinación para la regresión de PBI con INV es
    0.890116 y si queremos encontrar la correlación,
    habría que sacar raíz cuadrada al mencionado
    coeficiente, con lo que el resultado es:0.943459
    tal como fue calculado mas arriba.
   Veamos con el Eviews como conseguimos la
    matrix X’X.
   Consideramos este método como el mas
    indicado para determinar la multicolinealidad ya
    que tiene que ver con la matriz de momentos
    X’X, que como demostramos en su momento si
    hay interacción completa no se puede encontrar
    la inversa y consecuentemente tampoco los
    coeficientes de regresión.
                          
    En   primer   lugar   debemos     agrupar  las
    predeterminadas pero considerando una columna
    de 1’s para recoger el termino independiente:
    GROUP GRP 1 PBI INV cuyo resultado es
   group grp 1 pbi inv
   sym xtx=@inner(grp)
   vector VPRO=@eigenvalues(xtx)
   Aplicar la siguiente orden:
    Sym XX=@inner(GRP) obteniendo:

           C1        C2           C3
   R1   33.00000 73938.95      16095.45
   R2   73938.95 195707488     43473608
   R3   16095.45 43473608      9904075.
   Una nota adicional ponemos sym para indicar
    que el resultado será una matriz simétrica y
    además porque la orden para encontrar los
    valores propios funciona solo para matrices
    simétricas.

    Que es la matriz X’X, en nuestro caso matriz de
    las predeterminadas PBI INV.
    De esta matriz es de la que habría que encontrar
    los valores propios. Veamos:
    Vector VPRO=@eigenvalues(X´X)

   R1    4.627378
   R2     235407.7
   R3      205376183.8
   El resultado es un vector columna que contiene
    los valores propios (VRPO. Pero observemos
    que si aplicamos la formula de K e IC los
    resultados serian:
    K = 44382841.38
    IC = 6662.044835,
    Como K y IC exceden a 1000 y 30 respectivamente entonces existe
    una multicolinealidad severa entre PBI y INV

						
Related docs
Other docs by r11Kv3
Istituzioni di diritto privato
Views: 17  |  Downloads: 0
Article TITLE
Views: 213  |  Downloads: 0
Class Schedule:
Views: 12  |  Downloads: 0
Ark1 - Excel 19
Views: 262  |  Downloads: 0
Choctaw Gap
Views: 0  |  Downloads: 0
The Constitution
Views: 9  |  Downloads: 0
ADA Lite / Disability Awareness and Diversity
Views: 2  |  Downloads: 0
Result of Asstt Teacher
Views: 582  |  Downloads: 0
OSRAM-VISTAR
Views: 359  |  Downloads: 0