Modelos Avanzados de Preferencias: by 82c6qUJC

VIEWS: 15 PAGES: 38

									Modelos Avanzados de Preferencias:
Aplicaciones en Estimación de Demanda y
           Marketing Moderno


        Clase 8: Diseño de Diseños

                 Luis Ignacio Rizzi
          Profesor de Economía de Transporte
         Pontificia Universidad Católica de Chile
Encuestas de Preferencias Declaradas

   Metodología de recolección de información aplicada a
    diversas áreas como investigación de mercado,
    transporte, ciencias sociales, salud, etc.
      Permite valorar bienes no transables en los
       mercados
      Permite considerar alternativas o factores no
       existentes en la realidad
      Permite obtener múltiples respuestas por individuo,
       disminuyendo el costo de obtención de los datos
Encuestas de Preferencias Declaradas

   En un experimento de PD, el encuestado típicamente
    evalúa un cierto número de alternativas, descritas por
    un conjunto de atributos, y escoge la que satisface
    sus preferencias en mejor forma
   Esto se repite tantas veces como escenarios de
    elección incluya el experimento
   El número de alternativas, atributos, escenarios de
    elección a evaluar, niveles de variación y rango de
    variación, se conocen como las dimensiones de
    diseño (DD) de un experimento de PD
   La dimensionalidad del diseño es generalmente
    especificada a priori por el modelador
   La influencia del diseño y su complejidad sobre el
    comportamiento no ha sido investigada en forma
    sistemática
Encuestas de Preferencias Declaradas

   Bradley y Daly (1994) modelan la complejidad de un
    experimento de PD usando el enfoque de
    escalamiento
   Swait y Adamowicz (2001) incorporan la complejidad
    a través de una parametrización del factor de escala
    en función de un índice de entropía
   DeShazo y Fermo (2002) hacen una parametrización
    del factor de escala en función de ciertas medidas de
    cantidad de información y estructuras de correlación
   Hensher (2003) estudia el fenómeno de complejidad a
    través de la especificación de modelos logit mixto con
    interacciones entre las dimensiones de diseño y los
    atributos
Encuestas de Preferencias Declaradas

   La especificación de modelos tradicionales no ha
    incorporado la complejidad en parte por conveniencia
    (simplicidad) y en parte porque el enfoque simplista
    pareciera arrojar resultados correctos
   La influencia de la complejidad del ejercicio sólo
    puede ser evaluada a través de un diseño que permita
    variaciones en las dimensiones de diseño.
Encuestas de Preferencias Declaradas

Objetivo de la investigación:
   Desarrollar e implementar un experimento de PD que
    permita variaciones sistemáticas en las dimensiones
    de diseño
   Desarrollar una metodología que logre incorporar la
    influencia de la complejidad y carga cognitiva, en la
    especificación de modelos a formular
   Determinar el impacto de esta estrategia sobre los
    resultados obtenidos tanto en términos de ajuste
    como de disposiciones al pago (VST)
Encuestas de Preferencias Declaradas

   Diseño experimental secuencial en dos fases
      Contexto de la encuesta: elección de ruta para un

       viaje interurbano reportado por el encuestado
       Fase 1: Se consideró las dimensiones de diseño
        como variables del experimento, generando así
        diversos sub-diseños
       Fase 2: Para cada sub-diseño se generó distintas
        rutas alternativas, mediante un diseño experimental
        basado en los atributos asociados al viaje
        reportado
Encuestas de Preferencias Declaradas

   Atributos primera fase

    Escenarios de   Número de Número de Niveles para Rango de Variación
      Elección      Alternativas Atributos los Atributos para los Niveles

         6              2           3           2       Menor que la Base
         9              3           4           3             Base
         12             4           5           4       Mayor que la Base
         15                         6
Encuestas de Preferencias Declaradas

   Sub-diseños primera fase
                                                   Rango para los
Escenarios Número de Número de Niveles de
                                                    niveles de los
de Elección Alternativas Atributos los Atributos
                                                      Atributos
     15          3             4         3               Base
     12          3             4         4         Mayor que la base
     15          2             5         2         Mayor que la base
     9           2             5         4               Base
     6           2             3         3         Mayor que la base
     15          2             3         4         Menor que la base
     6           3             6         2         Menor que la base
     9           4             3         4         Mayor que la base
     15          4             6         4               Base
     6           4             6         3         Mayor que la base
     6           3             5         4         Menor que la base
     9           4             4         2         Menor que la base
     12          3             6         2               Base
     12          2             3         3         Menor que la base
     9           2             4         2               Base
     12          4             5         3         Menor que la base
Encuestas de Preferencias Declaradas


                                 Fase 1
                                 n sub-diseños




         Fase 2
      m alternativas
Encuestas de Preferencias Declaradas

   Atributos a considerar en la segunda fase
      Tiempo de viaje sin congestión
      Tiempo de viaje con congestión moderada
      Tiempo de viaje con congestión alta
      Incertidumbre en el tiempo de viaje
      Costos de operación del vehículo
      Tarifa de viaje (peaje)


   La variación en el número de atributos presentes se
    logra mediante la agregación de éstos (no por
    inclusión/exclusión)
Encuestas de Preferencias Declaradas
Encuestas de Preferencias Declaradas
Encuestas de Preferencias Declaradas
Encuestas de Preferencias Declaradas

   Diversos estudios han investigado el efecto de ciertas
    dimensiones de diseño en forma independiente
      Número de alternativas por escenario de elección:
       un aumento en el número de alternativas
       compromete la consistencia de la elección, sujeto a
       un valor umbral (Wildert, 1998; DeShazo y Fermo,
       2002)
      Número de atributos por alternativa: un aumento
       produce siempre un incremento en la varianza
       asociada al proceso de elección (Wang y Li, 2002;
       Arentze et al, 2003; Hensher, 2003)
Encuestas de Preferencias Declaradas

     Número de niveles y rangos de variación:
      basándose en Dellaert et al. (1999), Ohler et al.
      (2000) y Wang y Li (2002), se espera que la
      complejidad aumente a medida que se incrementa
      la cantidad de niveles de variación y sus
      respectivos rangos
     Cantidad de escenarios de elección a evaluar: se
      postula un efecto compuesto; un aumento inicial en
      el número de escenarios de elección puede
      disminuir la varianza (debido a un efecto
      aprendizaje), pero luego esta debiera empezar a
      aumentar debido a la mayor carga cognitiva (efecto
      fatiga)
Encuestas de Preferencias Declaradas


Modelos Logit Mixto (Hensher, 2003)
 El impacto de las dimensiones de diseño sobre los
  resultados se puede estimar mediante la
  incorporación de interacciones entre las dos fases
  de modelación
    Vi  c ·Ci  t ·ti  t / atr ·ti ·N atr  ...
   Como el modelo sigue siendo lineal en los
    parámetros, puede ser estimado mediante paquetes
    estadísticos comerciales como ALOGIT o LIMDEP
   Este tipo de modelación es compleja y no tiene un
    adecuado sustento teórico
Encuestas de Preferencias Declaradas


   Modelos Logit Heterocedásticos
     Recordemos que en una especificación MNL
      y la varianza asociada al proceso de elección

                        ·Vi
                   e                      
        P(i )                    
                  e
                          ·V j
                                          6 ·
                  j




       Existe una relación directa entre el parámetro
        de escala ()
Encuestas de Preferencias Declaradas


   A medida que el proceso se vuelve más complejo,
    la varianza aumenta. Como se tiene que si   ,
      0, finalmente se podría llegar a que:
                     0
               e               1
    P(i )    n
                             
              e         0     n
              j 1


   Esto es, la componente determinística va
    perdiendo peso y la elección se puede volver
    aleatoria (y equiprobable)
Encuestas de Preferencias Declaradas


   Postular una parametrización adecuada para el
    factor de escala  en función de las dimensiones
    de diseño

      f (# alts, # atrib, # niv...)
   DeShazo y Fermo (2002) sugieren una forma
    funcional exponencial; esta asegura la no-
    negatividad de  y además tiene adecuadas
    propiedades de convergencia
Encuestas de Preferencias Declaradas


   Así,  no es más un término constante:

            k · DDk
     e   k



    varía entre sub-diseños por ser función de las
    dimensiones de diseño (DD)
   varía entre respuestas de un mismo individuo,
    pues incorpora el número de escenarios de
    elección
   puede variar entre las n-ésimas respuestas de
    individuos pertenecientes a un mismo sub-diseño,
    si se incorporan variables socioeconómicas (SE)
Encuestas de Preferencias Declaradas


   El modelo heterocedástico resulta ser no lineal en
    los parámetros
   No existen paquetes estadísticos comerciales que
    permitan estimar el modelo
   Se debió programar en GAUSS la función de log-
    verosimilitud asociada al modelo
Encuestas de Preferencias Declaradas


   Modelo MNL v/s Modelo Heterocedástico (MH)
                           MNL GAUSS                  MH
     Atributos
                       Parámetro Valor t     Parámetro Valor t
Actual                   0.0066      0.17      0.0104      0.15
TVSC                    -0.0122     -22.56    -0.0491      -3.79
TVCM                    -0.0154      -9.63    -0.0581      -3.32
TVCA                    -0.0425     -19.81    -0.1415      -3.47
TVCC                    -0.0340     -14.70    -0.0869      -3.96
TVTOT                   -0.0199     -24.20    -0.0329      -3.92
INCERT                  -0.0051     -10.32    -0.0167      -3.73
COP                    -1.00E-05     -2.96   -1.00E-04     -2.00
TARIFA                 -1.00E-04     -4.85   -6.00E-04     -2.91
CTOT                   -2.00E-04    -22.85   -5.00E-04     -3.90
Log Verosimilitud            -8131.15              -7858.51
 Basado en 8020 observaciones                                 LR = 545.28
                                                             299%,8g.l.= 20.1
Encuestas de Preferencias Declaradas


   Parámetros Asociados al Factor de Escala
   Sólo fue posible estimar efectos cuadráticos para
    el número de escenarios de elección, debido a
    problemas de convergencia
       Atributos de       MNL GAUSS                MH
       Complejidad    Parámetro Valor t   Parámetro     Valor t
    escenarios           -----    -----      0.050        2.01
    alternativas         -----    -----      0.224        7.00
    atributos            -----    -----     -0.456      -12.09
    niveles              -----    -----     -0.065       -1.67
    rango menor          -----    -----      0.770       10.33
    rango mayor          -----    -----     -0.383       -5.31
    escenarios 2         -----    -----     -0.003       -1.58
    ingreso              -----    -----      0.021        2.08
Encuestas de Preferencias Declaradas


   Un aumento en el número de alternativas
    disponibles aumenta la probabilidad de encontrar
    una opción que represente mejor las preferencias
    individuales
   Un aumento en el número de atributos aumenta la
    complejidad del proceso
   Lo mismo ocurre con un aumento en los niveles de
    variación de los atributos:
       El rango de variación que minimiza la varianza
        (complejidad) es el rango restringido: + - 20%
Encuestas de Preferencias Declaradas


   Existe un “efecto aprendizaje”, que luego de 10
    escenarios de elección evaluados se ve
    contrapesado por la carga cognitiva asociada al
    experimento
   Si el ingreso se considera como un buen proxy para
    la educación, las personas más educadas
    presentarían una mayor habilidad cognitiva
   Aquellos sub-diseños que presentan los menores
    valores de  son los que muestran una mayor
    proporción de atributos agregados e ignorados
        Los individuos efectivamente simplifican el proceso de
         elección cuando éste resulta muy complejo
Encuestas de Preferencias Declaradas


   VST es la tasa marginal de sustitución entre tiempo y
    costo de viaje para un nivel de utilidad U constante

          U i / ti
    VST 
          U i / Ci        U  cte


   Para funciones de utilidad lineales en los parámetros,
    el VST corresponde simplemente a la razón entre los
    parámetros del tiempo y costo de viaje

          t
    VST 
          C      U  cte
Encuestas de Preferencias Declaradas


   Comparación de los VST de Ambos Modelos
VST [$/min]       MNL     I de Confianza       MH     I de Confianza
VSTSC             122,2      [86,6 - 203,8]   81,8      [56,4 - 158,9]
VSTCM             154,0     [103,4 - 262,8]   96,8      [59,9 - 186,2]
VSTCA             425,0     [299,3 - 714,2]   235,8    [154,6 - 447,0]
VSTCC             340,0     [235,5 - 576,2]   144,8     [99,5 - 290,1]
VSTTOT             99,5      [89,8 - 110,3]   65,8       [58,0 - 74,8]


   El MNL sobrestima sistemáticamente los valores
    puntuales de los distintos tipos de VST en todos los
    casos (Saelensminde, 2001; Hensher, 2003)
   Los porcentajes de sobrestimación van desde un 50%
    a un 135%

*   Los intervalos de confianza se estimaron utilizando la expresión
    propuesta por Armstrong et al. (2001)
Conclusiones

   El enfoque heterocedástico permite incorporar con éxito la
    complejidad asociada al experimento de PD en la
    especificación de los modelos a estimar
   El ajuste del mejor modelo heterocedástico es muy
    superior al MNL promedio correspondiente y levemente
    inferior a la especificación de 16 MNL’s diferentes, uno
    para cada sub-diseño, tarea que implica la estimación de
    más de 70 parámetros adicionales
   Un enfoque simplista de estimación (MNL) puede derivar
    en una grave sobre-estimación de los beneficios asociados
    a la implementación de proyectos viales
   El no considerar dicho fenómeno en la especificación de
    los modelos, puede producir importantes sesgos tanto en
    los resultados como en la valoración de la disposición al
    pago
Identificando la Complejidad

        Mediante el Método de Escalamiento
            Herramienta que se utiliza en la modelación mixta con datos de
             distinta naturaleza (e.g. PD y PR)
            Consiste en agrupar la información según algún criterio para
             luego estimar un factor de escala para cada nido ficticio
            Diferencias entre dichos factores de escala revelan diferencias
             para las varianzas asociadas
Identificando la Complejidad



     Se anidan los sub-diseños según alguna dimensión de diseño y se examinan los
      factores de escala
     Sólo se puede identificar el efecto de cada dimensión de diseño en forma
      independiente (no simultáneamente)




                1=1                 2                             3
Identificando la Complejidad



    Hallazgos
         Un aumento en el número de atributos considerados aumenta la varianza en
          forma sistemática
         El número de alternativas disponibles presenta un efecto compuesto,
          pareciendo ser cuatro el número de alternativas que minimiza la varianza
         El número de niveles de variación también presenta un efecto compuesto,
          siendo tres el número de niveles que maximiza el valor del factor de escala
Identificando la Complejidad



        El rango óptimo de variación parece estar restringido, a variaciones de
         + - 20%
        El número de escenarios de elección a evaluar también presenta un
         efecto compuesto, siendo 12 el número de escenarios que minimiza la
         varianza asociada

    Desventaja del Enfoque
        Los efectos se identifican en forma independiente, mientras que el
         objetivo sería lograr una evaluación conjunta
El Problema de No-Identificabilidad

       En el modelo heterocedástico




           El factor de escala no es un término constante, ya que depende
            de la complejidad del experimento
           Sin embargo, el problema de no-identificabilidad persiste, por lo
            que se debe asumir que el término constante de la
            parametrización vale cero
           De esta forma, si todos los  = 0, entonces  = 1


                               k · DDk
                    e         k
Modelos con Variables SE

               La inclusión de interacciones entre atributos del viaje y
                variables SE permite tratar hasta cierto punto el problema de
                variaciones en los gustos




               Esta es una metodología no convencional para incluir variables
                SE (Rizzi y Ortúzar, 2003)




                                                                                 
 Viq   TV    l s lq TViq     INC    l s lq  INC iq     C   l s lq C iq
              l                           l                            l         
Modelos con Variables SE


              Atributos      MNL con SE    HL con SE
         Actual (1;0)         0,0397 (*)   -0,0208 (*)
         TVTOT                 -0.0372       -0.0516
         INCERT               0,0013 (*)   -0,0029 (*)
         CTOT                  -0.0003       -0.0004
         Interacciones
         TVxINGBAJO            0.0166       0.0258
         TVxINGMEDIO           0.0125       0.0239
         TVxJOVEN              -0.0018      -0.0077
         TVxADJOV              0.0066       0.0040
         INCERTxSEXO           -0.0128      -0.0096
         INCERTxADJOV          -0.0075      -0.0109
         CTOTxADJOV            -0.0001      -0.0002
         Complejidad
         NESCEN                  -----      0.0387
         NESECN^2                -----      -0.0029
         NALTER                  -----      0.1085
         NNIVEL                  -----      -0.1450
         RANGO AMPLIO            -----      -0.5197        LR = 54.32
         Log Verosimilitud    -1570.51      -1543.35     299%,5g.l.= 15.09
Modelos con Variables SE




       El ajuste del modelo heterocedástico sigue siendo superior al MNL,
        pero la diferencia no es tan drástica

       Ciertas interacciones tienen sustento teórico, mientras otras no

       Los efectos de las dimensiones de diseño sobre el factor de escala
        son similares al caso anterior
Modelos con Variables SE



   En cuanto a los VST, para el modelo MNL
          VST [$/min]    Joven       Adulto-joven   Adulto
        ingreso bajo      74.7          35.0         68.7
        ingreso medio     88.3          45.3         82.3
        ingreso alto     130.0          76.5        124.0

   Para el modelo Heterocedástico

          VST [$/min]     Joven      Adulto-joven   Adulto
        ingreso bajo       83.8         36.3         64.5
        ingreso medio      88.5         39.5         69.3
        ingreso alto      148.3         79.3        129.0
   Las diferencias en términos de VST tienden a desaparecer

								
To top