Modelos de Decisi�n (I)

Document Sample
Modelos de Decisi�n (I) Powered By Docstoc
					Análisis de Procesos
   de Decisiones

  Dr. Viterbo H. Berberena G.
  Tema I
Modelos de
 Decisión
         4 Sesiones
      (12 horas clases)
1.1 Conceptos Básicos.
  • Decisiones, estados de la
    naturaleza y probabilidades.
  • Resultados o pagos.
  • Árboles de decisión.
1.2 Modelos Clásicos.
  • Modelo del pesimista (maxmin).
  • Modelo del optimista (maxmax).
  • Modelo de minimización de las
    pérdidas de oportunidad.
  • Modelo del pago promedio.
  • Modelo del valor monetario
    esperado.
  • Valor de la información perfecta.
1.3 Análisis Bayesiano.
  • Valor de la información imperfecta.
1.4 Modelos de Minería de Datos.
  • Modelo de lealtad.
  • Modelo de rentabilidad.
  • Modelo de análisis de respuesta.
  • Modelo de asociación.
    Introducción al Análisis
          Bayesiano
En los casos en que debe repetirse varias
veces una decisión bajo condiciones similares
y existe experiencia anterior que puede
utilizarse para tomar estas decisiones, la
situación se conoce como Toma de
Decisiones Utilizando Datos Previos. En el
caso de la pizzería Ashley, el problema de
determinar cuántas pizzas hornear es un
ejemplo de este tipo de decisiones.
En las ocasiones en las que las condiciones
pueden diferir (por ejemplo, después de un
juego de fútbol o durante una tormenta de
nieve) no sería apropiado utilizar el enfoque
anterior, basado sólo en la experiencia previa
con la demanda diaria.

       Demanda de Pizzas en los
          últimos 100 días
Número de pizzas que
                       150   160   170   180
se solicitan
Número de días         20    40    25    15
Cuando existe datos previos disponibles
como soporte para toma de decisiones, es
posible utilizar dos tipos de análisis:
      • El Análisis Clásico.
      • El Análisis Bayesiano.
El análisis clásico está formado por la
pruebas de hipótesis que a su vez es una
parte de lo que se conoce como inferencia
estadística (Estimación de parámetros
poblacionales y pruebas de hipótesis).
En este caso se muestrea la población que
está bajo investigación con el objetivo de
buscar una evidencia estadística que nos
permita rechazar o no cierta hipótesis
formulada de antemano.
Este es el tipo de análisis que por lo
general se enseña en los cursos
introductorios de estadística, bajo el
nombre de Pruebas de Hipótesis.
 Las pruebas de hipótesis pueden ser:
         • Paramétricas.
         • No Paramétricas.

Paramétricas: El modelo especifica ciertas
          condiciones que se supone que
          se cumplen y que ordinariamente
          no se prueban (supuestos de la
          prueba). Requiere de una escala
          de medición cuantitativa.
No Paramétricas: El modelo no especifica
         condiciones de los parámetros de
         la población donde se toma la
         muestra. No requiere de una
         escala de medición cuantitativa.

Por ejemplo, en el caso de la pizzería Ashely
puede determinar la demanda esperada por
medio del siguiente cálculo:

  DE  .2150  .4160  .25170  .15180  163.5
Con base en la demanda esperada, Ashley
podría esperar que la demanda excediera, en
promedio, las 160 pizzas por noche. Para
probar esa expectativa se puede utilizar el
análisis clásico.
Para ilustrar como funciona el análisis clásico
(prueba de hipótesis), a continuación se
probara, sí la demanda de pizzas es, por lo
general (en promedio), diferente de 160
pizzas.
 Para éste caso específico, la Prueba t
 (prueba paramétrica de comparación de la
 media con un valor) es la más adecuada.
 Procedimiento de la Prueba de
          Hipótesis:
1. Formulación de la hipótesis nula y las
   alternativas.
                 H 0 :   160
                 H 1 :   160
                      160
                      160
2. Elección de Modelo Estadístico.
  • Naturaleza de la población - La variable
    aleatoria X se distribuye normalmente con
    media  y varianza 2.
  • Método de muestreo – Aleatorio.
  • Requisito de medida – Escala de
    Intervalos.
  Las pruebas más poderosas son apoyadas
  en suposiciones fuertes y amplias. Por
  ejemplo la prueba t y F.
3. Nivel de significación () y tamaño de
   muestra (n).

     = 0.05 significativo.
     = 0.01 muy significativo.
  Errores:

  P (rechazar Ho siendo verdadera) = 
  P (no rechazar Ho siendo falsa) = 
De forma ideal  y  se especifican y queda
determinada n.
En la práctica se escogen  y n y queda
definido .

4. Distribución muestral.
Es una distribución teórica, conforma a Ho, de
algún estadígrafo, para hacer aseveraciones de
probabilidad acerca de la ocurrencia de ciertos
valores numéricos del mismo.
Se supone que la distribución muestral de:

              x  0
           t        ~ t n  1
                 s
                  n

Es una distribución t-student con n-1 grados de
libertad.
5. Región de rechazo.
Es una zona de la distribución muestral que se
compone de un subconjunto de valores, de
manera que la probabilidad de ocurrencia de
estos es igual o menor que .

    H 1 :   160   (Una cola , izquierda )
          160 ( Dos colas )
          160 (Una cola , derecha )
5. Decisión.
Esta consiste en rechazar o no la hipótesis
nula en base a la evidencia estadística. Si se
rechaza H0, entonces se acepta H1.
      H 0 :   160 ( Se echaza si Pt    )
      H 1 :   160   ( Se acepta)
                                                                
      H 0 :   160 ( Se echaza si Pt         ó Pt   1        )
                                             2                   2
      H 1 :   160   ( Se acepta)


      H 0 :   160 ( Se echaza si Pt    )
      H 1 :   160   ( Se acepta)
                  f(x)




                                                    f(x)

Valor crítico del estadígrafo                    X



                  f(x)                                                          

                                                                                       X
                                                            Valor crítico del estadígrafo


                                            
    2                                        2

          Valores críticos del estadígrafo       X
Resultados de la Prueba t en SPSS
                       One-Sample Statistics

                                                                   Std. Error
                  N               Mean          Std. Deviation       Mean
    DEMAND            100         163.50                 9.68             .97



                                 One-Sample Test

                                       Tes t Value = 160
                                                                   95% Confidence
                                                                    Interval of the
                                                      Mean            Difference
          t           df          Sig. (2-tailed)   Difference    Lower        Upper
 DEMAND   3.616             99              .000           3.50      1.58           5.42
   Criterios para elegir una
     prueba estadística:
a) La potencia de la prueba.

b) La aplicabilidad del modelo estadístico
    en que se basan los datos de la
    investigación.

c) La potencia eficiencia.

d) El nivel de medida logrado en la
    investigación.
         Análisis Bayesiano
En este análisis se combinan los datos previos
(o probabilidades subjetivas) con datos
muestrales o de prueba, utilizando la fórmula
desarrollada por el ministro inglés Thomas
Bayes.

Procedimiento para el análisis bayesiano:

     •   Se elabora una matriz de decisión
         que contiene las consecuencias
         monetarias de las diversas acciones
         (tabla de utilidades).
•   Se realiza un análisis previo utilizando los
    datos disponibles (VME).
•   Se realiza un segundo análisis,
    preposterior, en el cual se determina si
    resulta útil llevar a cabo pruebas o
    muestras adicionales (VII).
•   Si el análisis anterior muestra que es
    económicamente útil experimentar para
    obtener mayor información, esta se utilizará
    para modificar las probabilidades previas y
    determinar las probabilidades posteriores.
El análisis Bayesiano presenta ventajas
con respecto al análisis clásico, ya que en
este sólo se realizan pruebas adicionales
si un análisis preposterior de los datos
muestra que estas serían
económicamente valiosas.

En el análisis clásico siempre se procede
a realizar una prueba o recolectar una
muestra.
   Valor de la Información
          Perfecta
¿Cuánto estaría dispuesto a pagar el TD
para obtener información adicional sobre
cuáles serán las circunstancias reales?

Si sabemos con exactitud cuál estado de
la naturaleza ocurrirá, es fácil determinar
la alternativa que debe elegirse, es decir
la que produce mayor pago para ese
estado de la naturaleza.
En el problema de la pizzería Ashley, para un
número determinado de demanda de pizzas,
el elegiríamos hornear con anticipación el
número de pizzas que maximizara las
utilidades netas. Por ejemplo, para la
situación en la que supiéramos con certeza
que habría una demanda de 160 pizzas, las
utilidades máximas ocurrirían si se hornearan
160 pizzas, y esa utilidad sería $320. Si
calculáramos esto para cada uno de los
estados de la naturaleza se generaría la tabla
siguiente.
     TABLA DE PAGOS MÁXIMOS

  Número de
pizzas que se
               Decisión con
   solicitan                  Pago
               pago máximo
(estados de la
  naturaleza)
     150           150        $300
     160           160        $320
     170           170        $340
     180           180        $360
Puesto que cada estado de la
naturaleza ocurre solo durante una
fracción del tiempo, es posible calcular
el valor VME para el caso de la
información perfecta utilizando los
pagos máximos y las probabilidades
para cada estado de la naturaleza.
Para calcular el valor de la información
perfecta (VIP), se calcula la diferencia
entre el valor monetario esperado para la
información perfecta y el valor monetario
esperado máximo sin información
perfecta.
En el caso de la pizzería, el TD estaría
dispuesto a pagar hasta $11 diarios para
conocer con anticipación exactamente
cuántas pizzas se requerirán cada día.
Si la información no es perfecta, o el
costo de la información adicional es
mayor de $11, sería mejor prescindir de
esta.
  Valor de la Información
        Imperfecta
En la sección anterior se presentó la
información perfecta. Sin embargo, por
lo general la información proviene de
algún procedimiento de prueba, por lo
que esta no siempre pronostica en forma
correcta el estado de la naturaleza que
ocurrirá.
Por ejemplo, un meteorólogo podría, con
base en alguna prueba, pronosticar lluvia
y, aún así, este estado de la naturaleza
podría ocurrir sólo en 70% de las veces
que se hace esta predicción.
Debido a esta imperfección en el poder
predictivo, el cálculo de la información de
prueba (imperfecta) es algo más complejo
que para la información perfecta.
Para comprender el procedimiento que se
utiliza para el cálculo de información
imperfecta se procede de la forma siguiente:

Se define           como la probabilidad de
que ocurra en realidad el evento N, dado que
el resultado de la prueba fue R.

            Se lee como la probabilidad de N,
            dado R.
 Porque las pruebas siempre son
 imperfectas:



Ejemplo: Si un meteorólogo está correcto
           en el 70% de las veces.




donde, N - llueve, y R - se pronostica lluvia.
Por lo general se desconocen los valores
de         , puesto que estos valores sólo
se conocen después de haber utilizado la
prueba las suficientes veces para recopilar
datos que permitan calcular probabilidades.
Por lo general se conoce lo opuesto
-la probabilidad de que ocurra un pronóstico
acertado una vez que llueve. Esto último se
puede calcular utilizando datos históricos.
Para determinar             , se utiliza el
Teorema de Bayes:




Por lo general, los valores del numerador
pueden obtenerse a partir de datos de
prueba y el denominador se determina a
partir de los dos anteriores.
Se calcula a partir de datos
previos la probabilidad de que la
prueba sea exacta (probabilidad
condicional).


Es la probabilidad de ocurra un
resultado particular, también
puede ser una probabilidad
basada en la experiencia (a
priori).
La probabilidad        se calcula
utilizando el resultado de la teoría
probabilística:




Donde incluye todos los eventos que
no sean , es decir, es la negación de
    .
    El Teorema de Bayes será:




Este resultado se conoce como
probabilidades a posteriori y se pueden
utilizar para llevar a cabo el análisis
preposterior con el objetivo de determinar si
se tiene que llevar a cabo una prueba o
muestreo.
  APLICACIÓN AL CASO DE LA
          PIZZERÍA
El TD necesita conocer la cantidad
diaria de pizzas a hornear con
anticipación, que proporcione las
mayores utilidades.
Hay un servicio de pronóstico con un
costo de $5/día.
  ¿Se debe contratar este servicio de
            pronóstico?
Si los pronósticos tuvieran una exactitud de
un 100%, su valor sería $11.
Como los pronósticos no tienen la exactitud
del 100%, entonces valen menos.
A partir de datos de ventas diarias
anteriores se calcula la siguiente tabla de
probabilidades de prueba.
Las entradas de la tabla siguientes son
                                 N
probabilidades condicionales P R .
 Tabla de Probabilidades de Prueba

  Número de
                  Número de pizzas que
     pizzas
                 realmente se solicitaron
pronosticadas
                (estados de la naturaleza)
 (alternativas)
                150    160    170    180
    150         1/2    1/4     0      0
    160         1/3    1/2    1/6    1/6
    170         1/6    1/4    2/3    1/3
    180          0      0     1/6    1/2
  Suma por
                 1      1      1      1
  Columna
Las entradas de la tabla anterior son las
probabilidades de que se haya pronosticado
cada número de pizzas, dado el número que en
realidad se solicitó (demanda real):




Por ejemplo, en los días en que se solicitaron
160 pizzas (demanda real), el pronostico fue de
150 pizzas ¼ de las veces, de 160 ½ de las
veces, de 170, también ¼ de las veces, y por
último de 180, 0 veces.
Con el objeto de convertir las probabilidades
         en           se calcula       para
cada número de pizzas pronosticado,
utilizando la siguiente ecuación:




Ejemplo: En la tabla anterior, para R = 150
         (pronóstico de la demanda)
               N = 150 (demanda real).
                  = 160, 170, 180.
Para calcular       y        se utilizan los
valores del muestreo de solicitudes de pizzas
de 100 días (probabilidades a priori):
El cálculo de   será:
En la expresión anterior las cantidades entre
paréntesis son la primera fila de la tabla de
probabilidades de prueba y los valores entre
corchetes son las probabilidades calculadas
con los datos previos (probabilidades a
priori). El resto se calcula de forma similar:
Puede observarse que si se suman las
probabilidades de pronosticar cada
número de pizzas se obtiene la unidad.

Esto es de esperarse, puesto que debe
pronosticarse algún número de pizzas,
150, 160, 170 o 180.
Utilizando cada uno de los elementos de
cada una de las sumas anteriores para el
cálculo de       se obtiene una nueva
tabla donde cada entrada es:
 Tabla Modificada de Probabilidades
             Conjuntas

  Número de      Número de pizzas que
     pizzas     realmente se solicitaron
                                           Suma
pronosticadas (estados de la naturaleza)
 (alternativas)
                150 160 170 180
      150       1/10 1/10     0       0    2/10
      160       1/15 1/5 1/24 1/40         1/3
      170       1/30 1/10 1/6 1/20         7/20
      180         0    0    1/24 3/40      7/60
Si se realiza el cálculo para cada uno de
los valores de la tabla anterior se obtiene
una nueva tabla.
Tabla de probabilidades a posteriori


  Número de         Número de pizzas que
                                               Suma
     pizzas        realmente se solicitaron
                                                por
pronosticadas     (estados de la naturaleza)
                                                fila
 (alternativas)
                  150    160    170     180
     150           1/2   1/2      0       0     1
     160           1/5   3/5    1/8     3/40    1
     170          2/21   2/7   10/21    1/7     1
     180            0     0     5/14    9/14    1
  Las entradas de la tabla anterior son las
  probabilidades:




Cada fila de la tabla anterior es ahora una
distribución completa de probabilidad a
posteriori y puede utilizarse para pronosticar
los niveles de demanda a través de un
análisis preposterior.
Ahora estamos en condiciones de
calcular el valor monetario esperado de la
contratación de un sistema de pronóstico
a través de un análisis preposterior.

Para esto utilizamos las filas de la tabla
de probabilidades a posteriori
combinandola con la tabla de utilidades
de la pizzería.
Tabla de VME con un pronóstico de 150

 Número de
                Número de pizzas que se
pizzas que se
                       solicitan          VME
hornean con
 anticipación
                150   160    170    180
     150        300   300    300    300   300
     160        290   320    320    320   305
     170        280   310    340    340   295
     180        270   300    330    360   285
 Probabilidad   1/2   1/2     0      0
Tabla de VME con un pronóstico de 160
 Número de
pizzas que se   Número de pizzas que se
                                          VME
hornean con            solicitan
 anticipación
                150   160    170   180
    150         300   300    300   300    300
    160         290   320    320   320    314
    170         280   310    340   340    310
    180         270   300    330   360    302
Probabilidad    1/5   3/5    1/8   3/40
Tabla de VME con un pronóstico de 170

 Número de
                Número de pizzas que se
pizzas que se
                       solicitan           VME
hornean con
 anticipación
                150    160    170    180
    150         300    300    300    300   300
    160         290    320    320    320   317
    170         280    310    340    340   326
    180         270    300    330    360   320
Probabilidad    2/21   2/7   10/21   1/7
Tabla de VME con un pronóstico de 180


 Número de
                Número de pizzas que se
pizzas que se
                       solicitan          VME
hornean con
 anticipación
                150   160   170    180
    150         300   300   300    300    300
    160         290   320   320    320    320
    170         280   310   340    340    340
    180         270   300   330    360    349
Probabilidad     0     0    5/14   9/14
Utilizando la alternativa preferible para cada uno
de los resultados posibles de la prueba y la
probabilidad de que ocurra cada uno de estos
resultados ( a partir de la tabla de probabilidades
a posteriori), es posible calcular el VME
utilizando la prueba (tabla de utilidades de
prueba).
El VME que resulta de utilizar un sistema
de pronóstico es $320 y el VME sin usar
ningún sistema era de $316. Por tanto el
valor neto de utilizar un sistema de
pronóstico es de $4/día (Valor de la
Información Imperfecta).
 ¿Se debe contratar un servicio de
pronóstico? Explique su respuesta.
El VME que resulta de utilizar un servicio
de pronóstico aporta un valor neto de
$4/día (Valor de la Información
Imperfecta).
Puesto que este valor es inferior al costo
de contratar un sistema de pronóstico
($5/día) al TD de la pizzería le
convendría más no utilizar el sistema de
pronóstico externo.
Resumen del Procedimiento del
     Análisis de Bayes
Paso 1. Elaborar una tabla de
        probabilidades de prueba, es
        decir, P(el resultado de la prueba
        será R/ el resultado real fue N) y
        un conjunto de probabilidades
        previas P(N), para cada estado de
        la naturaleza.
Paso 2. Para cada renglón de la tabla de
        probabilidades de prueba,
        multiplicar cada elemento por la
        probabilidad previa
        correspondiente de estado de la
        naturaleza, P(N). Cada producto
        es elemento de una tabla
        modificada de probabilidades,
        P(R/N)*P(N). La suma de estas
        probabilidades para cada renglón
        es ahora P(R).
Paso 3. Dividir cada elemento de la matriz
        de probabilidades modificada
        entre la suma de su renglón, es
        decir, P(R/N)*P(N)/P(R), para
        obtener los elementos de la tabla
        de pronósticos, P(N/R).
Paso 4. Utilizando la matriz de pago
        calcular por separado el VME
        máximo para cada resultado de
        prueba, utilizando las
        probabilidades del renglón de la
        matriz de predicción que
        corresponde a ese resultado de
        prueba.
Paso 5. Utilizando los VME máximos para
       cada resultado de prueba, calcular
       el VME (de la prueba)
       multiplicando el VME máximo para
       cada resultado de prueba por la
       probabilidad de que ocurra este
       resultado, P(R), y sumando todos
       estos resultados.
Paso 6. Calcular el valor de la prueba
        determinando la diferencia entre el
        VME de la prueba calculado en el
        paso 5, y el VME máximo posible
        sin la prueba (Valor de la
        información imperfecta).
Tarea Extraclase por Equipos
Un equipo de Liga Pequeña de Béisbol ha
estado empleando una máquina automática de
pitcheo. Si la máquina se instala bien (es decir,
si está ajustada correctamente), lanzará “strikes”
85% de las veces. Si no está bien instalada,
lanzará “strikes” sólo 35% de las veces. La
experiencia nos indica que las instalaciones se
efectuan correctamente 75% de las veces. Una
vez que se instala la máquina para la práctica de
bateo en un día, lanza 3 “strikes” en los primeros
tres lanzamientos. ¿Cuál será la probabilidad
posterior de que la instalación esté bien hecha?

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:6
posted:1/4/2012
language:Spanish
pages:70