Incrementa Tu Iq Financiero - PowerPoint

Document Sample
Incrementa Tu Iq Financiero - PowerPoint Powered By Docstoc
					Programa de certificación
   de Black Belts ASQ

 VI. Seis Sigma - Análisis

     P. Reyes / Noviembre de 2007




                                    1
                      Fase de Análisis
   Propósitos:
       Establecer hipótesis sobre las posibles Causas Raíz
       Refinar, rechazar, o confirmar la Causa Raíz
       Seleccionar las Causas Raíz más importantes:
            Las pocas Xs vitales


   Salidas:
       Causas raíz validadas
       Factores de variabilidad identificados



                                                              2
  QFD
                FASE DE ANÁLISIS
                                               Diagrama de
                                                relaciones
      Diagrama
     Causa Efecto                   Diagrama de
                                      Ishikawa
                                                Diagrama
                                                de Árbol
               Definición
             Y=X1 + X2+. .Xn

             CTQs = Ys     Medición Y,
            Operatividad   X1, X2, Xn
                                                       X's
                                                     Causas
                  Análisis del Modo y Efecto de    potenciales
                           Falla (AMEF)


                                          Llenar columnas del FMEA
                            Pruebas       Hasta sol. Propuesta y
                               de
                            hipótesis
                                          comprobar causas con
Diagrama                                  Pruebas de Hipótesis
 de Flujo
   del                                             X's vitales
 proceso             No        ¿Causa    Si       Causas raíz
                                Raíz?              validadas


                                                              3
                VI. Análisis
A. Medición y modelaje de relación entre
  variables

B: Pruebas de hipótesis

C. Análisis del modo y efecto de falla (AMEF)

D. Métodos adicionales de análisis

                                                4
A. Medición y modelaje de
 relación entre variables




                            5
  A. Medición y modelaje de relación
            entre variables
1. Coeficiente de correlación

2. Regresión

3. Herramientas Multivariadas

4. Estudios Multivari

5. Análisis de datos por atributos

                                     6
VI.A.1 Coeficiente de correlación




                                7
                        Definiciones
Correlación
Establece si existe una relación entre las variables y
responde a la pregunta, ”¿Qué tan evidente es esta
relación?"

Regresión
Describe con más detalle la relación entre las variables.

Construye modelos de predicción a partir de información
experimental u otra fuente disponible.

      Regresión lineal simple
      Regresión lineal múltiple
      Regresión no lineal cuadrática o cúbica

                                                            8
                                                         Correlación
     Propósito: Estudiar la posible relación
     entre dos variables.
     Accidentes laborales




                                                                                                 •           •   •
                                                                                                         •       •   Correlación
                                                                                     •                       •
                                                    •                            •                   •
                            •                                            •       •       •                           positiva,
                                                         •           •
                                                •                •
                                                                                 •
                                                                                             •
                                                                                                                     posible
                                        •           •        •
                                    •       •                                •
                                                         •
                                •                                        •

                                                        Numero de órdenes urgentes

El 1er. paso es realizar una gráfica de la información.

                                                                                                                                   9
    Coeficiente de correlación (r )
   Mide la fuerza de la relación lineal entre las variables
    X y Y en una muestra.

   El coeficiente de correlación muestral de Pearson rx,y
    con valores entre -1 y +1 es:




                                                        10
Correlación de la información (R ) de las X y las Y
    Correlación Positiva                                                                 Correlación Negativa
    25
         Evidente                                                                            25
                                                                                               Evidente
    20                                                                                       20

    15                                                                                       15

    10
Y




                                                                                         Y
                                                                                             10
    5
                                                                                             5
    0
         0       5   10       15   20    25
                                                        Sin Correlación                      0
                                                                                                  0       5       10        15   20   25
                          X                        25
                                        R=1        20
                                                                                                                        X
                                                                                                                                      R=-1
                                                   15

                 Correlación                   Y   10
                                                                                                          Correlación
                                                   5

    25
                  Positiva                         0                                                       Negativa
                                                        0   5   10       15   20   25         25
    20

    15
                                                                     X
                                                                                   R=0        20

                                                                                              15
Y




    10




                                                                                         Y
                                                                                              10
     5
                                                                                                  5
     0
             0   5   10       15   20   25                                                        0
                                                                                                      0       5    10       15   20   25
                          X
                                        R=>1                                                                            X
                                                                                                                                 R=>-1


                                                                                                                                             11
        Coeficiente de correlación
   El coeficiente de correlación r asume el mismo signo
    de la pendiente de la recta 1 siendo cero cuando
    1 =0

   Un valor positivo de r implica que la pendiente de la
    línea es ascendente hacia la derecha
   Un valor negativo de r implica que la pendiente de la
    línea es descendente hacia la derecha
   Si r=0 no hay correlación lineal, aunque puede haber
    correlación curvilínea

                                                     12
Coeficiente de correlación
      Reglas empíricas

Coeficiente de           Relación
  correlación        Fuerte, positiva
 0.8 < r < 1.0        Débil, positiva
 0.3 < r < 0.8          No existe
 -0.3 < r < 0.3       Débil, negativa
-0.8 < r < -0.3      Fuerte, negativa
-1.0 < r < -0.8

                                        13
                    Correlaciones (Pearson)
                    Tabla de Correlación mínima

n        95%               99%       n         95%            99%
     de confianza     de confianza        de confianza   de confianza
3       1.00              1.00       15        0.51           0.64
4       0.95              0.99       16        0.50           0.61
5       0.88              0.96       17        0.48           0.61
6       0.81              0.92       18        0.47           0.59
7       0.75              0.87       19        0.46           0.58
8       0.71              0.83       20        0.44           0.56
9        0.67             0.80       22        0.42           0.54
10       0.63             0.76       24        0.40           0.52
11       0.60             0.73       26        0.39           0.50
12       0.58             0.71       28        0.37           0.48
13       0.53             0.68       30        0.36           0.46
14       0.53             0.66

       Para un 95% de confianza, con una muestra de 10,
             el coeficiente (r) debe ser al menos .63
                                                               14
             Correlación
• La correlación puede usarse para información de
atributos, variables normales y variables no normales.


• La correlación puede usarse con un “predictor” o
más para una respuesta dada.


• La correlación es una prueba fácil y rápida para
eliminar factores que no influyen en la predicción, para
una respuesta dada.

                                                           15
         Coeficiente de Correlación
Para determinar que tanto se acercan los datos
predichos por el modelo a los datos observados
aplicando el coeficiente de correlación de Pearson (ver
tabla anterior para identificar la significancia)
              S(yeyo)
     r=
          S(yeye) S(yoyo)

                      (Syei)2
S(yeye) =   Syei2 -                 r = Coeficiente de correlación
                        n
                                    yo = Respuesta observada
                       (Syoi)2
S(yoyo) = Syoi   2-                  ye = Respuesta esperada
                         n
                     (Syei)(Syoi)
S(yeyo) = Syei yoi -                                           16
                          n
       Coeficiente de Correlación ajustado
   Otra forma para no consultar la tabla de coeficiente de
   correlación de Pearson es la r ajustada

                                                      (n-1)
                             R2(Adj) = 1 – (1 – r2) (n-p)

Donde :                                         Criterios en función a la R2(Adj)
R2(Adj) = Coeficiente de correlación ajustado
                                                > 90% = Correlación Fuerte
r = Coeficiente de correlación de Pearson       80% - 90% = Buena correlación
n = Número de datos
                                                60% - 80% = Correlación media
                                                40% - 60% = Correlación débil
p = Núm. términos en el modelo
     (Incluyendo la constante)
                                                < 40% = No existe correlación
                                                                             17
    Coeficiente de Determinación (R2)
   El coeficiente de determinación es la proporción de la
    variación total explicada por la regresión, R2 se
    encuentra en el rango de valores de 0 a 1.




                                                     18
         Correlación vs causación
   Tener cuidado de no tener variables colineales, por
    ejemplo peso de un coche y peso de las personas
    que transporta, o que no la relación no tenga
    sentido, como si lavo mi coche, llueve.




                                                     19
VI.A.2 Regresión




                   20
              Análisis de Regresión
El análisis de regresión es un método
estandarizado para localizar la correlación entre dos
grupos de datos, y, quizá más importante, crear un
modelo de predicción.

Puede ser usado para analizar las relaciones entre:
• Una sola “X” predictora y una sola “Y”

• Múltiples predictores “X” y una sola “Y”

• Varios predictores “X” entre sí
                                                        21
    Supuestos de la regresión lineal
Los principales supuestos que se hacen en el análisis de regresión
   lineal son los siguientes:
  La relación entre las variables Y y X es lineal, o al menos bien
   aproximada por una línea recta.
                                     y   0  1 X  

   El término de error  tiene media cero.

   El término de error  tiene varianza constante 2.

   Los errores no están correlacionados.

   Los errores están normalmente distribuidos.
                                                               22
        Modelo de regresión lineal
   Se aume que para cualquier valor de X el valor observado de Y
    varia en forma aleatoria y tiene una distribución de probabilidad
    normal




 El modelo general es:
Y = Valor medio de Yi para Xi + error aleatorio

        y   0  1 X  
                                                                23
Regresión Lineal Simple
La línea de regresión se calcula por el método de mínimos cuadrados.
Un residuo es la diferencia entre un punto de referencia en particular (xi,
yi) y el modelo de predicción ( y = a + bx ). El modelo se define de tal
manera que la suma de los cuadrados de los residuales es un mínimo. La
suma residual de los cuadrados es llamada con frecuencia la suma de los
cuadrados de los errores (SSE) acerca de la línea de regresión

                                                                                yi                      y = b0 + b1x
     ei                                                                 •
                                                                                    •
                                                                                            •
                                                                                                •   •
                                                                                                    •
                                                                                                        a y b son
                                                                                                •
                                        •                           •                   •
                •                                           •       •       •                           Estimados de
                                    •
                                            •
                                                    •
                                                        •
                                                                    •                                   0 y 1
                                                                                •
                            •           •       •
                        •       •                               •
                                            •
                    •                                       •

                                                                                xi
            SSE =                       Sei2                =       S(yi - yi2
                  Gráfica de la Línea de Ajuste
                           Recta de regresión
                          Y=-.600.858+5738.89X
                                R2 = .895
            600
Retención




            500                                      Regresión
                                                     95% Intervalo
                                                     de confianza
                                                     95% Intervalo
            400                                      de predicción

                   0.18        0.19           0.20
                          Altura del muelle
Interpretación de los Resultados

La ecuación de regresión (Y = -600.858 + 5738.89X) describe la
relación entre la variable predictora X y la respuesta de
predicción Y.
R2 (coef. de determinación) es el porcentaje de variación
explicado por la ecuación de regresión respecto a la variación total
en el modelo

El intervalo de confianza es una banda con un 95% de
confianza de encontrar la Y media estimada para cada valor de
X [Líneas rojas]


El intervalo de predicción es el grado de certidumbre de la
difusión de la Y estimada para puntos individuales X. En general,
95% de los puntos individuales (provenientes de la población sobre
la que se basa la línea de regresión), se encontrarán dentro de la
banda [Líneas azules]

                                                                       26
  Interpretación de los Resultados

• Los valores “p” de la constante (intersección en Y) y las variables
de predicción, se leen igual que en la prueba de hipótesis.
      Ho: El factor no es significativo en la predicción de la respuesta.
      Ha: El factor es significativo en la predicción de la respuesta.


• s es el “error estándar de la predicción” = desviación estándar del
  error con respecto a la línea de regresión.

• R2 (ajustada) es el porcentaje de variación explicado por la
regresión, ajustado por el número de términos en el modelo y por
  el número de puntos de información.


• El valor “p” para la regresión se usa para ver si el modelo completo
de regresión es significativo.
     Ho: El modelo no es significativo en la predicción de la respuesta.
     Ha: El modelo es significativo en la predicción de la respuesta.
                Errores residuales
   Los errores se denominan frecuentemente residuales.
    Podemos observar en la gráfica de regresión los errores
    indicados por segmentos verticales.




                                                              28
                   Errores residuales
                          ^
Los residuos ei  Yi  Y i , i  1,2,3..., n pueden ser graficados para:

   Checar normalidad.
   Checar el efecto del tiempo si su orden es conocido en los
    datos.
   Checar la constancia de la varianza y la posible necesidad de
    transformar los datos en Y.
   Checar la curvatura de más alto orden que ajusta en las X’s.

A veces es preferible trabajar con residuos estandarizados o
   estudentizados:                             e
                                         ri             i
                                                                              ,
           ei                                         1 (X  X )       
    di         ,.... 1  1,2,....., n
                                                                     2
                                                MSE 1    i
                                                                        
                                                                         
           MS E                                      n      S XX       
                                                                                  29
                                                 Errores residuales
          Análisis de los errores o residuales
  ¿Qué tan normales                                                                        ¿Residuales individuales -
  son los residuales?                                                                      tendencias; o separados?
                                       Diagnóstico del Modelo de Residuales
                              Gráfica Normal de Residuales                                 Tabla de Residuales
                             20                                                   50                                       .0S =43 6
                                                                                                                          3 L .2
                                                                                  40
                             10                                                   30
                                                                                  20
               Residual




                                                                      Residual
                             0                                                    10
                                                                                   0                                       =0 0
                                                                                                                          X .0 0

                       -10                                                       -10
                                                                                 -20
                       -20                                                       -30
                                                                                 -40                                        .0 L=-43 6
                                                                                                                          -3 S      .2
                                                                                 -50
                                  -2      -1       0        1     2                    0            5         10
                                         Marcador Normal                                    Número de Observación

Histograma -                      Histograma de Residuales                             Residuales vs. Ajustes

 ¿curva de                    3                                                  20

                                                                                 10
                Frecuencia




 campana?                     2
                                                                      Residual




                                                                                  0
                              1                                                  -10

   Ignórese                                                                      -20
                                                                                                                                          ¿Aleatorio
                              0

para grupos
                                   -25 -20 -15 -10 -5   0   5 10 15                          450        50
                                                                                                    Ajuste
                                                                                                          0         550                  alrededor de
                                                                                                                                           cero, sin
pequeños de
                                    Buscar las inconsistencias
                                    Buscar las inconsistencias                                                                           tendencias?
 información
                                             mayores
                                             mayores
     (<30)
                                                                                                                                                        30
                    Ejemplo
Considere el problema de predecir las ventas mensuales en
función del costo de publicidad. Calcular el coeficiente de
correlación, el de determinación y la recta.

MES    Publicidad     Ventas

1      1.2            101
2      0.8            92
3      1.0            110
4      1.3            120
5      0.7            90
6      0.8            82
7      1.0            93
8      0.6            75
9      0.9            91
10     1.1            105                                     31
                Cálculo manual
Calcular columnas para Suma X, Suma Y, Xi2, XiYi y Yi2
       Xi            Yi
MES Publicidad       Ventas      Xi2    XiYi     Yi2
1      1.2           101           1.44   121.2   10201
2      0.8           92            0.64   73.6    8464
3      1.0           110           1.00   110.0   12100
4      1.3           120           1.69   156     14400
5      0.7           90            0.49   63.0    8100
6      0.8           82            0.64   65.6    6724
7      1.0           93            1.00   93.0    8649
8      0.6           75            0.36   45.0    5625
9      0.9           91            0.81   81.9    8281
10     1.1           105           1.21   115.5   11025

SUMA 9.4             959           9.28   924.8   93,569
                                                           32
   Método de mínimos cuadrados
Donde:
Yest = Valor predicho de para un valor particular de x.
b0 = Estimador puntual de .(ordenada al origen)
b1=      Estimador puntual de (pendiente)
Para el cálculo de b0 y b1 se utilizamos las siguientes fórmulas:
                                       SS xy
              ( x       2
                                b1 
SS x    x 
           2                           SS x
                n

             ( y        2      b0  y  b1 x
SS y   y 2

               n

                 ( x ( y 
SS xy   xy 
                      n                                        33
     Análisis de varianza en la regresión
Tabla de Análisis de Varianza                                                                    .

Fuente            df                    SS             MS = SS/df                           Fc
Regresión         1               SSR  b1 S XY             MS REG                        MSreg/s2

Residual        n-2        SSE  SSYY  b1 S XY S2
__________________________________________________________.
Total corregido n-1        SYY

   La desviación estándar S corresponde a la raíz cuadrada del valor de MSE
      o cuadrado medio residual.
                                                                                                            n          n
       SS E   SYY  b1 S XY                              n
                                                             
                                                                    2
                                                                                                            X Y
   S                                                Yi 
    2                                                                                      n                      i          i

       n2       n2                 SYY    Yi 2   i 1 
                                               n
                                                                           S XY   X iYi                 i 1       i 1

                                                           n                              i 1                    n
                                             i 1

   Los residuos son:
                                                                    __          ^    __                ^

                       Yi  Y i  Yi  Y  (Y i  Y )  (Y         Y ) 2   (Y i  Y ) 2   (Yi  Y i ) 2
                 ^          ^         __     ^    __

    ei  Yi  Y i
                                                              i




                                                                                                                  34
                    1
     t ( n  2,1   ). S
b1                 2
                      __

            ( X i  X )2




                              Análisis de varianza en la regresión
                        Las conclusiones son como sigue:

                   El estadístico F se calcula como F = MSEREG / S2 y se compara con la F de
                   tablas con (1, n-2) grados de libertad y área en 100(1-)%, para determinar si
                   el parámetro 1 es significativo que es el caso de Fcalc. > Ftablas.


                        Intervalos de confianza para Beta 0 y Beta 1
                                                                       1/ 2
                                             __ 2                                               
                                                                                                                   1/ 2
                                                                                                                       
                                          1 X
                            se(b0 )  MSE  
                                                      
                                                      
                                                            X i2  S                          1        X i2  S
                                                                            b0  t (n  2,1   )
                                                       n ( X i  X ) 2 
                                                                    __
                                           n S XX
                                                                        
                                                                                              2                __
                                                                                                                       
                                          
                                                                                                    
                                                                                                     n ( X i  X ) 2 
                                                                                                                       

                                                                                                        1
                                               MSE    S                              t ( n  2,1          ). S
                            se(b1 )                                         b1                       2
                                               S XX   S XX                                                __

                                                                                          ( X      i    X )2
                                                                                                                           35
                    1
     t ( n  2,1   ). S
b1                 2
                      __

            ( X i  X )2




                                Análisis de varianza en la regresión
                        El intervalo de confianza para la desviación estándar es:

                            ( n  2) MSE                        ( n  2) MSE
                                                    2 
                                  / 2 ,n  2
                                  2
                                                                   12 / 2,n 2
                        Intervalos de confianza para la Y estimada promedio
                                                        __
                                                            2 
                            ^
                                                1 (X0  X ) 
                        Y0  t a / 2,n 2   MSE             
                                               n    S XX     
                                                             
                        Intervalo de predicción para un valor particular de Y estimado
                                                             __
                                                                                                               __
                                                                                                                      
                                                    1 ( X 0  X )2 
                                                1                                                   1 ( X 0  X )2 
                                                                                                   1  
                         ˆ
                        Y0  t / 2,n 2    MSE                              ˆ
                                                                      Y0  Y0  t / 2,n 2   MSE
                                                   n     S XX                                       n     S XX     
                                                                                                                   


                                                                                                                          36
                    1
     t ( n  2,1   ). S
b1                 2
                      __

            ( X i  X )2




                            Análisis de varianza en la regresión
                        Prueba de Hipótesis para Beta 1:
                        Ho: 1 = 0 contra H1:1  0

                                    b1
                            t0 
                                   MSE
                                         S XX

                        Si t0  t / 2,n2 el coeficiente Beta 1 es significativo




                                                                                    37
                    1
     t ( n  2,1   ). S
b1                 2
                      __

            ( X i  X )2




                            Análisis de varianza en la regresión
                        Coeficiente de correlación r:

                                      S XY
                             r
                                     S XX S YY

                        Coeficiente de determinación: r2
                        R2 mide la proporción de la variación total respecto a la media que
                           es explicada por la regresión. Se expresa en porcentaje.

                                                                           ^   __

                        R2 
                                 ( SS.de.la.regresión. por.b0 )
                                                                  
                                                                       (Y  Y ) 2
                                                                                       1
                                                                                             SSE
                                                                               __
                             ( SSTotal.corregido. para.la.media )
                                                                       (Yi  Y ) 2
                                                                                             SYY

                                                                                                   38
                    1
     t ( n  2,1   ). S
b1                 2
                      __

            ( X i  X )2




                             Análisis de varianza en la regresión
                        Prueba de hipótesis para el Coeficiente de correlación r:
                        H0:  = 0 contra H1:   0
                                   r n2
                            t0 
                                    1 r2

                        Si t0  t / 2,n2 se rechaza la hipótesis Ho, indicando que existe una
                           correlación significativa




                                                                                           39
          Riesgos de la regresión
   Los modelos de regresión son válidos como ecuaciones de
    interpolación sobre el rango de las variables utilizadas en el
    modelo. No pueden ser válidas para extrapolación fuera de
    este rango.

   Mientras que todos los puntos tienen igual peso en la
    determinación de la recta, su pendiente está más influenciada
    por los valores extremos de X.
    1.
               Y
                   *A


                        * *
                   *          *         *   Sin A y B
                         *    *   * *


                                            *B

                                                 X              40
          Riesgos de la regresión
   Los outliers u observaciones aberrantes pueden distorsionar
    seriamente el ajuste de mínimos cuadrados.

           Y
                     *A                             *
                                             * *   *
                                            **
                                *   *   *
                             ** *
                             **
                     * * *
                     **
               * *


                                                   X




   Si se encuentra que dos variables están relacionadas
    fuertemente, no implica que la relación sea casual, se debe
    investigar la relación causa – efecto entre ellas. Por ejemplo el
    número de enfermos mentales vs. número de licencias
    recibidas.
                                                                41
                Cálculo manual (cont..)
Cálculo de la recta de regresión lineal:

Sxx = 9.28 - (9.4)^2/10 = 0.444

Sxy = 924.8 - (9.4)(959) / 10 = 23.34

Ymedia = 959 / 10 = 95.9      Xmedia = 9.4 / 10 = 0.94

b1 = Sxy / Sxx = 23.34 / 0.444 = 52.57

b0 = Ymedia - b1*Xmedia = 95.9 - (52.5676)(0.94) = 46.49

Yest. = 46.49 + 52.57* X
                                                           42
              Ejemplo (cont..)
Cálculo de S2 estimador de 

S2 = SSE / (n - 2) = Syy - (Sxy)^2/Sxx

Syy = 93,569 - (959)^2 / 10 = 1600.9

SSE = Syy - b1*Sxy = 1600.9 - (52.567)(23.34) = 373.97

S2 = SSE / (n - 2) = 373.97 / 8 = 46.75

S = 6.84

El intervalo de confianza donde caerán el 95% de los puntos
es el rango de 1.96S = 13.41 o sea a  13.41 de la línea.


                                                         43
              Ejemplo (cont..)
Inferencias respecto a la pendiente de la línea b1:

Se usa el estadístico t = b1 / (S / Sxx)

El término del denominador es el error estándar de la
pendiente.

Para probar la hipótesis nula Ho: 1 = 0

En este caso tc = 52.57 / (6.84 / 0.444) = 5.12

El valor crítico tcrit. para alfa/2 = 0.025 con (n-2) = 8 grados
de libertad es 2.306.

Como tc > tcrítico se rechaza la hipótesis de que b1 = 0
existiendo la regresión.
                                                              44
         Ejemplo (cont..)

Estableciendo un 95% de confianza para la pendiente de
la recta b1.

Usando la fórmula b1  t0.025 (S / Sxx) se tiene:

52.57  2.306 * 6.84 /  0.444 = 52.57  23.67.

Por tanto una unidad de incremento en publicidad, hará que
el volumen de ventas se encuentre entre $28.9 a $76.2.




                                                         45
            Ejemplo (cont..)

Cálculo del coeficiente de Correlación:
            ________
r = Sxy / (SxxSyy)
             ____________
r = 23.34 / 0.444*1600.9 = 0.88

Como r es positivo, la pendiente de la recta apunta hacia
arriba y a la derecha.

El coeficiente de determinación r^2 = 1 - SSE/Syy

r^2 = ( Syy - SSE ) / Syy = 0.774

                                                            46
              Análisis de Regresión
1. Teclear los datos para Xi y Yi

2. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o ANALISIS
DE DATOS, CORRELATION o CORRELACIÓN

3. Dar INPUT RANGE (rango de datos), OUTPUT RANGE (para los
resultados) y obtener los resultados

                 Column 1           Column 2
Column 1         1                   0.875442
Column 2         0.875442           1

      El coeficiente de correlación r = 0.875442
                                                              47
              Cálculo con Excel)
4. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o
ANALISIS DE DATOS, REGRESION o REGRESIÓN

3. Dar INPUT RANGE Y (rango de datos Yi), INPUT RANGE X
(rango de datos Xi), CONFIDENCE INTERVAL 95%, OUTPUT
RANGE (para los resultados), RESIDUAL PLOTS o GRAFICAS DE
RESIDUALES y obtener una tabla de resultados como los que se
muestran en las páginas siguientes.

NOTAS:

a) La gráfica de probabilidad normal debe mostrar puntos
fácilmente aproximables por una línea recta, indicando normalidad.

B) La gráfica de residuos estandarizados se deben distribuir en
forma aleatoria alrededor de la línea media igual a cero.       48
          Resultados de Excel
SUMMARY OUTPUT
Regression Statistics
Multiple R        0.875442            R Square    0.766398
Adjusted R Square0.737198          Standard Error 6.83715
Observations      10

ANOVA
                 df      SS       MS     F      Significance F
Regression       1   1226.927 1226.927 26.24633 0.000904
Residual         8    373.973 46.74662
Total            9   1600.9
                                                  Confidence 95%
      Coefficients Standard Error t Stat P-value Lower        Upper

Intercept 46.48649    9.884566   4.702936   0.001536 23.69262 69.28035

X Variable1 52.56757 10.26086 5.123117 0.000904       28.90597 76.22916

La ecuación de la recta es Yest = 46.48649 + 52.56757 X
Como los valores p para los coeficientes son menores a 0.05,
ambos son significativos
              Gráfica normal de Excel

                Normal Probability Plot

    140
    120
    100
    80
Y




    60
    40
    20
     0
          0       20      40      60       80   100
                       Sample Percentile

                                                      50
Gráfica de Residuos vs. X de Excel


                    X Variable 1 Residual Plot

            20
Residuals




            10
             0
            -10 0           0.5                  1   1.5
                                  X Variable 1

                                                           51
            Ejercicio
Calcular la recta de predicción con sus bandas de confianza,
la correlación y la determinación para la respuesta de un Taxi,
los datos se muestran a continuación:

Distancia      Tiempo
0.8            200
 2.2           400
1.0            160
0.6            120
1.0            360
1.4            280
2.2            560
0.6            320
                                                             52
                      Relaciones no Lineales
            ¿Qué pasa si existe una relación causal, no lineal?
                                         ¿Cómo describiría
El siguiente es un conjunto de datos
experimentales codificados, sobre
                                           esta relación?
resistencia a la compresión de una
aleación especial:

                  Resistencia a
Concentración    la Compresión
     x                 y
   10.0          25.2 27.3 28.7
   15.0          29.8 31.1 27.8
   20.0          31.2 32.6 29.7
   25.0          31.7 30.1 32.3
   30.0          29.4 30.8 32.8

(ref. Walpole & Myers, 1985)

                                                              53
      Resultados del Análisis de Regresión - Modelo Cuadrático




Y = 19.0333 + 1.00857X - 2.04E-02X**2
R2 = 0.614
Análisis de Variancia
FUENTE            DF     SS      MS      F       p
Regresión         2      38.9371 19.4686 9.54490 3.31E-03
Error             12     24.4762 2.0397
Total             14     63.4133
FUENTE DF         Seq SS F        p
Lineal     1      28.0333 10.3005 6.84E-03
Cuadrática 1      10.9038 5.34584 3.93E-02
                                                            54
               Regresión cuadrática
Obs      X        Y      Fit   SE Fit   Residual   St Resid
  1    5.0   1.5820   1.3366   0.0519     0.2454       1.07
  2    6.0   1.8220   1.5778   0.0473     0.2442       1.06
  3    3.4   1.0570   0.9508   0.0703     0.1062       0.47
  4    2.7   0.5000   0.7820   0.0806    -0.2820      -1.27
  5   10.0   2.2360   2.5424   0.0875    -0.3064      -1.40
  6    9.7   2.3860   2.4700   0.0828    -0.0840      -0.38
  7    9.6   2.2940   2.4338   0.0804    -0.1398      -0.63
  8    3.1   0.5580   0.8664   0.0753    -0.3084      -1.38
  9    8.2   2.1660   2.0962   0.0609     0.0698       0.31
 10    6.2   1.8660   1.6260   0.0472     0.2400       1.04
 11    2.9   0.6530   0.8302   0.0776    -0.1772      -0.79
 12    6.4   1.9300   1.6622   0.0474     0.2678       1.16
 13    4.6   1.5620   1.2402   0.0555     0.3218       1.40
 14    5.8   1.7370   1.5295   0.0476     0.2075       0.90
 15    7.4   2.0880   1.9154   0.0530     0.1726       0.75
 16    3.6   1.1370   0.9990   0.0675     0.1380       0.61
 17    7.9   2.1790   2.0239   0.0574     0.1551       0.68
 18    8.8   2.1120   2.2530   0.0694    -0.1410      -0.62
 19    7.0   1.8000   1.8189   0.0500    -0.0189      -0.08
 20    5.5   1.5010   1.4451   0.0490     0.0559       0.24
 21    9.1   2.3030   2.3253   0.0737    -0.0223      -0.10
 22   10.2   2.3100   2.5906   0.0907    -0.2806      -1.29
 23    4.1   1.1940   1.1196   0.0611     0.0744       0.33
 24    4.0   1.1440   1.0834   0.0629     0.0606       0.27
 25    2.5   0.1230   0.7217   0.0845    -0.5987      -2.72R   55
                 Regresión cuadrática




      Analysis of Variance
      Source            DF          SS       MS        F       P
      Regression         1      8.9296   8.9296   160.26   0.000
      Residual Error 23         1.2816   0.0557
Total            24     10.2112
                                                                   56
Regresión cuadrática
                Los residuos
                No son normales
                Se deben transformar
                Las variables




                              57
Otros Patrones No Lineales
 A veces es posible transformar una o ambas variables, para mostrar
 mejor la relación entre ambas. La meta es identificar la relación
 matemática entre las variables, para que con la variable transformada
 se obtenga una línea más recta. Algunas transformaciones comunes
 incluyen:

            x’ = 1/x
                                                x’ = Raíz cuadrada de (x)




   Funciones trigonométricas: x’ = Seno
                                   de x              x’ = log x
         Trasformación de funciones
Funciones           linealizables             y        su      forma          lineal
correspondiente.
Figura 3.13      Función           Transformación               Forma lineal

a,b           Y   0 X 1         Y '  log Y , X '  log X     Y '  log  0  1 X '

c,d           Y   0 e 1 X       Y '  log Y                   Y '  ln  0  1 X

e,f           Y   0  1 log X   X '  log X                   Y '   0  1 X '
                         X                1        1
g,h           Y                   Y '     , X '               Y '   0  1 X '
                     0 X  1            Y        X


     Ejemplo: sea Y   0 e 1 X  se transforma como ln Y  ln  0  1 X  ln 

                                                                               Y '   0 ' 1 X   '

                                                                                            59
      Transformación de variables del
      ejemplo de regresión cuadrática
   Transformando la variable X’ = 1/X se tiene, utilizando Minitab
    The regression equation is
    Y = 2.98 - 6.93 1/X

    Predictor           Coef      SE Coef           T       P
    Constant         2.97886      0.04490       66.34   0.000
    1/X              -6.9345       0.2064      -33.59   0.000

    S = 0.09417       R-Sq = 98.0%      R-Sq(adj) = 97.9%


    Obs        1/X            Y          Fit       SE Fit   Residual   St Resid
      1      0.200       1.5820       1.5920       0.0188    -0.0100      -0.11
      2      0.167       1.8220       1.8231       0.0199    -0.0011      -0.01
      3      0.294       1.0570       0.9393       0.0274     0.1177       1.31
      4      0.370       0.5000       0.4105       0.0404     0.0895       1.05
      5      0.100       2.2360       2.2854       0.0276    -0.0494      -0.55
      6      0.103       2.3860       2.2640       0.0271     0.1220       1.35

                                                                                  60
     Transformación de variables del
     ejemplo de regresión cuadrática
   Transformando la variable X’ = 1/X se tiene, utilizando Minitab




                                                               61
     Transformación de variables del
     ejemplo de regresión cuadrática
   Los residuos ahora ya se muestran normales




                                                 62
   Transformación para homoestacidad
             de la varianza
       Algunas transformaciones para estabilizar la varianza
Relación de 2 a E(Y)                                 Transformación
 2    constante..........      .......... '  Y
                           ..........      Y
 2    E (Y )......... .......... .......... ....Y '  Y         Datos de Poisson

 2    E (Y )1  E (Y ).......... ...... Y '  sin 1 Y        Proporciones binomiales

 2    E (Y )2 .......... .......... .......... Y '  ln(Y )

 2    E (Y )3 .......... .......... ....... Y '  Y 1 / 2




                                                                                          63
      Transformación para homoestacidad
                de la varianza
          Ejemplo: Se hizo un estudio entre la demanda (Y) y la energía
           eléctrica utilizada (X) durante un cierto periodo de tiempo
Obs          X        Y       Fit     SE Fit   Residual   St Resid
  1        679    0.790     1.649      0.351     -0.859      -0.61
  2        292    0.440     0.308      0.490      0.132       0.10
  3       1012    0.560     2.802      0.293     -2.242      -1.57
  4        493    0.790     1.004      0.412     -0.214      -0.15
  5        582    2.700     1.312      0.381      1.388       0.98
  6       1156    3.640     3.301      0.297      0.339       0.24
  7        997    4.730     2.750      0.294      1.980       1.38
  8       2189    9.500     6.880      0.651      2.620       2.00R
  9       1097    5.340     3.097      0.293      2.243       1.57
 10       2078    6.850     6.495      0.600      0.355       0.27
 11       1818    5.840     5.595      0.488      0.245       0.18
 12       1700    5.210     5.186      0.441      0.024       0.02
 13        747    3.250     1.884      0.333      1.366       0.96
 14       2030    4.430     6.329      0.579     -1.899      -1.42
 15       1643    3.160     4.988      0.420     -1.828      -1.31
 16        414    0.500     0.730      0.441     -0.230      -0.17
 17        354    0.170     0.523      0.465     -0.353      -0.25
 18       1276    1.880     3.717      0.313     -1.837      -1.29
 19        745    0.770     1.877      0.333     -1.107      -0.78
 20        435    1.390     0.803      0.433      0.587       0.42
 21        540    0.560     1.167      0.395     -0.607      -0.43
 22        874    1.560     2.324      0.307     -0.764      -0.53
 23       1543    5.280     4.642      0.384      0.638       0.45
 24
 25
          1029
           710
                  0.640
                  4.000
                            2.861
                            1.756
                                       0.293
                                       0.343
                                                 -2.221
                                                  2.244
                                                             -1.55
                                                              1.58    64
   Transformación para homoestacidad
             de la varianza
     Ejemplo: Se hizo un estudio entre la demanda (Y) y la energía
      eléctrica utilizada (X) durante un cierto periodo de tiempo
The regression equation is
Y = - 0.704 + 0.00346 X
Predictor         Coef     SE Coef           T        P
Constant       -0.7038      0.6170       -1.14    0.266
X           0.0034645 0.0005139           6.74    0.000
S = 1.462        R-Sq = 66.4%      R-Sq(adj) = 64.9%
Analysis of Variance
Source             DF          SS           MS         F       P
Regression          1      97.094       97.094     45.45   0.000
Residual Error     23      49.136        2.136
Total              24     146.231


                                                                   65
Transformación para homoestacidad
          de la varianza
   Se observa que la varianza se incrementa conforme aumenta X




                                                           66
Transformación para homoestacidad
          de la varianza
   Se observa que la varianza se incrementa conforme aumenta X




                                                           67
 Transformación para homoestacidad
           de la varianza
     Transformando a X por su raíz cuadrada se tiene:
Obs          X    SQR-Y      Fit   SE Fit   Residual   St Resid
  1        679   0.8888   1.1694   0.1092    -0.2805      -0.64
  2        292   0.6633   0.7717   0.1524    -0.1084      -0.25
  3       1012   0.7483   1.5115   0.0912    -0.7632      -1.71
  4        493   0.8888   0.9783   0.1280    -0.0894      -0.21
  5        582   1.6432   1.0697   0.1184     0.5735       1.31
  6       1156   1.9079   1.6595   0.0922     0.2484       0.56
  7        997   2.1749   1.4961   0.0914     0.6788       1.52
  8       2189   3.0822   2.7208   0.2024     0.3614       0.89
  9       1097   2.3108   1.5989   0.0911     0.7120       1.60
 10       2078   2.6173   2.6068   0.1867     0.0105       0.03
 11       1818   2.4166   2.3397   0.1518     0.0770       0.18
 12       1700   2.2825   2.2184   0.1371     0.0641       0.15
 13        747   1.8028   1.2392   0.1035     0.5635       1.27
 14       2030   2.1048   2.5575   0.1800    -0.4527      -1.09
 15       1643   1.7776   2.1598   0.1304    -0.3822      -0.88
 16        414   0.7071   0.8971   0.1372    -0.1900      -0.44
 17        354   0.4123   0.8354   0.1445    -0.4231      -0.98
 18       1276   1.3711   1.7828   0.0974    -0.4116      -0.93
 19        745   0.8775   1.2372   0.1037    -0.3597      -0.81
 20        435   1.1790   0.9187   0.1347     0.2603       0.60
 21        540   0.7483   1.0265   0.1228    -0.2782      -0.64
 22        874   1.2490   1.3697   0.0955    -0.1207      -0.27
 23       1543   2.2978   2.0571   0.1195     0.2407       0.55

                                                                  68
 24       1029   0.8000   1.5290   0.0910    -0.7290      -1.64
 25        710   2.0000   1.2012   0.1065     0.7988       1.81
Transformación para homoestacidad
          de la varianza
     Transformando a X por su raíz cuadrada se tiene:
    Regression Analysis: SQR-Y versus X

    The regression equation is
    SQR-Y = 0.472 + 0.00103 X
    Predictor        Coef     SE Coef           T        P
    Constant       0.4717      0.1918        2.46    0.022
    X           0.0010275   0.0001598        6.43    0.000
    S = 0.4544      R-Sq = 64.3%      R-Sq(adj) = 62.7%




                                                             69
Transformación para homoestacidad
          de la varianza
   Transformando a X por su raíz cuadrada se tiene:




                                                       70
Regresión lineal múltiple




                            71
               Regresión múltiple
   Cuando se usa más de una variable independiente para predecir
    los valores de una variable dependiente, el proceso se llama
    análisis de regresión múltiple, incluye el uso de ecuaciones
    lineales.

    Yu   0  1 X u1   2 X u 2  .......   k X uk   u

Se asume que los errores u tienen las características siguientes:
  Tienen media cero y varianza común 2.
  Son estadísticamente independientes.
 Están distribuidos en forma normal.



                                                               72
                       Regresión múltiple
Estimación de los parámetros del modelo
   Se trata de minimizar los errores cuadráticos en:
                              N
     R(  0 , 1 ,...,  k )   (Yu   0   1 X u1   2 X u 2  .....   uk ) 2
                             u 1



El modelo de regresión múltiple en forma matricial es:
 Y = X  +  = [1 : D]  + 
Y es un vector N x 1.
X es una matriz de orden N x (k + 1), donde la 1ª. columna es 1’s.
 es un vector de orden (k + 1) x 1.
 es un vector de orden N x 1.
D es la matriz de Xij con i = 1, 2, ..., N; j = 1, 2, ......, k
                                                                                       73
                             Regresión múltiple
Estimación de los parámetros del modelo:

b = (X’X)-1 X’Y
El vector de valores ajustados Y  Xb se puede expresar como:
                                ˆ

Y  Xb  X ( X ' X ) 1 X ' Y  Hy
 ˆ

La varianza del modelo se estima como:
                       n
SSE   (Yi  Y ) 2   ei2  e' e
               ˆ
                      i 1



 SSE  (Y  Xb)' (Y  Xb)  Y ' Y  b' X ' Y  Y ' Xb  b' X ' Xb  Y ' Y  2b' X ' Y  b' X ' Xb
                                                                   SSE
 SSE  Y 'Y  b' X 'Y                            s 2  MSE 
                                                                   Np                     74
            Tamaño de muestra
   Tomar 5 observaciones para cada una de las
    variables independientes, si esta razón es menor de5
    a 1, se tiene el riesgo de “sobreajustar” el modelo

   Un mejor nivel deseable es tomar 15 a 20
    observaciones por cada variable independiente




                                                    75
    Ejemplo de regresión múltiple
   Un embotellador está analizando las rutas de servicio de
    máquinas dispensadoras, está interesado en predecir la
    cantidad de tiempo requerida por el chofer para surtir las
    máquinas en el local (Y).

   La actividad de servicio incluye llenar la máquina con refrescos y
    un mantenimiento menor.

   Se tienen como variables el número de envases con que llena la
    máquina (X1) y la distancia que tiene que caminar (X2).




                                                                 76
X2-Dist    X1-CAS         Y-TENT              Fit   SE   Fit   Residual    St   Resid
Obs
16.68          7.0       16.680           21.708    1.040       -5.028          -1.63
       1
11.50          3.0       11.500           10.354    0.867       1.146           0.36
       2
12.03          3.0       12.030           12.080    1.024       -0.050          -0.02
       3



                   Ejemplo de regresión múltiple
14.88          4.0       14.880           9.956     0.952       4.924           1.58
       4
13.75          6.0       13.750           14.194    0.893       -0.444          -0.14
       5
18.11          7.0       18.110           18.400    0.675       -0.290          -0.09
       6
08.00          2.0        8.000           7.155     0.932       0.845           0.27
       7
17.83          7.0       17.830           16.673    0.823       1.157           0.37
       8
79.24         30.0       79.240           71.820    2.301       7.420            3.21RX
       9
21.50          5.0       21.500           19.124    1.444       2.376           0.81
10
40.33         16.0       40.330           38.093    0.957       2.237           0.72
11
21.00         10.0       21.000           21.593    1.099       -0.593          -0.19
12
13.50          4.0       13.500           12.473    0.806       1.027           0.33
13
19.75          6.0       19.750           18.682    0.912       1.068           0.34
14
24.00          9.0       24.000           23.329    0.661       0.671           0.21
15
29.00         10.0       29.000           29.663    1.328       -0.663          -0.22
16
15.35          6.0       15.350           14.914    0.795       0.436           0.14
17
19.00          7.0       19.000           15.551    1.011       3.449           1.11
18
09.50          3.0        9.500           7.707     1.012       1.793           0.58
19
35.10         17.0       35.100           40.888    1.039       -5.788          -1.87
20
17.90         10.0       17.900           20.514    1.325       -2.614          -0.88
21
52.32         26.0       52.320           56.007    2.040       -3.687          -1.45   22
18.75          9.0       18.750           23.358    0.662       -4.608          -1.44   23
19.83          8.0       19.830           24.403    1.132       -4.573          -1.50   24
10.75          4.0       10.750           10.963    0.841       -0.213          -0.07   25


R   denotes   an   observation   with a large standardized residual
X   denotes   an   observation   whose X value gives it large influence.

Durbin-Watson      statistic   =   1.17
                                                                                 77
                      Ejemplo de regresión múltiple
                           Solución matricial
Matrix M5 = X'
[   1     1     1          1     1       1     1     1     1     1      1    1
1
    7     3     3          4     6       7     2     7    30     5     16    10
4
  560   220   340         80   150     330   110   210   1460   605   688   215
255

      1     1     1        1     1       1     1     1     1      1     1     1
      6     9    10        6     7       3    17    10    26      9     8     4
    462   448   776      200   132      36   770   140   810    450   635   150 ]

Matrix M6 = X'Y

     [   25        219       10232
        219       3055      133899
      10232     133899     6725688 ]

Matrix M7 = X'Y

[      560
      7375
    337072 ]
                                                                                    78
                 Ejemplo de regresión múltiple
                      Solución matricial
Matrix M8 = INV(X'X)

 0.113215 -0.004449 -0.000084
-0.004449 0.002744 -0.000048
-0.000084 -0.000048 0.000001

Matrix M9 = INV(X'X) X'Y

  2.34123
  1.61591
  0.01438


The regression equation is
Y-TENT = 2.34 + 1.62 X1-CAS + 0.0144 X2-DIST
Predictor       Coef        SE Coef        T        P
Constant       2.341          1.097     2.13    0.044
X1-CAS        1.6159         0.1707     9.46    0.000
X2-DIST     0.014385       0.003613     3.98    0.001

S = 3.259      R-Sq = 96.0%       R-Sq(adj) = 95.6%

                                                        79
                  Ejemplo de regresión múltiple
                       Solución matricial
Cálculo de la estimación de la varianza:
Data Display

Matrix M10 = Y'

[ 16.68 11.50 12.03 14.88 13.75 18.11  8.00 17.83 79.24 21.50
40.33
21.00 13.50 19.75 24.00 29.00 15.35 19.00  9.50 35.10 17.90 52.32
18.75 19.83 10.75 ]

Matrix M11 = Y'Y = 18310.6

Matrix M12 = b' = [ 2.34123        1.61591   0.01438 ]

Matrix M13 = b'X'Y = 18076.9

Matrix M14 = SSe = Y'Y - b'X'Y = 233.732


       SS E   233 .732
S2                    10 .624
       Np     25  3
                                                            80
             Ejemplo de regresión múltiple
                  Solución matricial
        Intervalo de confianza para Beta 1

          b1  t.025, 22 se(b1 )  1  b1  t.025, 22 se(b1 )


1.61591 (2.074) (10.6239)(0.00274378)  1  1.6191 (2.074)(0.17073)

     Por tanto el intervalo de confianza para el 95% es:
        1.26181  1  1.97001




                                                                  81
           Ejemplo de regresión múltiple
                Solución matricial
    El embotellador desea construir un intervalo de confianza sobre
     el tiempo medio de entrega para un local requiriendo:

     X1 = 8 envases y cuya distancia es X2 = 275 pies.

             1                                     2.34123
       X 0  8             Y0  X ' 0 b  1,8,2751.61591  19.22minutos
                              ˆ
                                                          
             275
                                                   0.01438
                                                            

La varianza de la Y0 estimada es (tomando M8=inv(X’X) :
                                                               1 
    Var(Y0 )  S 2 X ' 0 ( X ' X ) 1 X 0  10.62391,8,275M 88   10.6239(0.05346)  0.56794
         ˆ
                                                                
                                                               275
                                                                

                                                                                               82
       Ejemplo de regresión múltiple
            Solución matricial
   El intervalo de confianza sobre el tiempo medio de entrega para
    un local requiriendo es para 95% de nivel de confianza:

     19.22  2.074 0.56794  Y0  19.22  2.074 0.56794

   Que se reduce a: 17.66  Y0  20.78




                                                              83
                   Ejemplo de regresión múltiple
                        Solución matricial
           El análisis de varianza es:
Analysis of Variance
                            (559 .6) 2
SST = 18,310.629 -                       = 5784.5426
                               25
                            (559 .6) 2
SSR = 18,076.930 -                       = 5,550.8166
                               25
SSE = SST – SSR = 233.7260

                                  Con el paquete Minitab se obtuvo lo siguiente:
     MSR   2775.4083
F0                  261.24
     MSE    10.6239               Source           DF       SS       MS        F       P
                                  Regression        2   5550.8   2775.4   261.24   0.000
F0.05, 2 , 22  3.44
                                  Residual Error   22    233.7    10.6
                                  Total            24   5784.5
Como la F calculada es mayor que la F de tablas, se
concluye que existe el modelo con alguno de sus
coeficientes diferente de cero
                                                                                           84
       Ejemplo de regresión múltiple
            Solución matricial
   El comportamiento de los residuos es como sigue:




                                                       85
                  Multicolinealidad
   La multicolinealidad implica una dependencia cercana entre
    regresores (columnas de la matriz X ), de tal forma que si hay
    una dependencia lineal exacta hará que la matriz X’X sea
    singular.

   La presencia de dependencias cercanamente lineales impactan
    dramáticamente en la habilidad para estimar los coeficientes de
    regresión.

   La varianza de los coeficientes de la regresión son inflados
    debido a la multicolinealidad. Es evidente por los valores
    diferentes de cero que no están en la diagonal principal de X’X.
    Que son correlaciones simples entre los regresores.


                                                                86
                      Multicolinealidad
   Una prueba fácil de probar si hay multicolinealidad entre dos
    variables es que su coeficiente de correlación sea mayor a 0.7

   Los elementos de la diagonal principal de la matriz X’X se
    denominan Factores de inflación de varianza (VIFs) y se usan
    como un diagnóstico importante de multicolinealidad. Para el
    componente j – ésimo se tiene:
                1
    VIF j 
              1 R2
                  j


   Si es mayor a 10 implica que se tienen serios problemas de
    multicolinealidad.

                                                                 87
           Análisis de los residuos
   Los residuos graficados vs la Y estimada, pueden mostrar
    diferentes patrones indicando adecuación o no adecuación del
    modelo:

   Gráfica de residuos aleatorios cuya suma es cero (null plot)
    indica modelo adecuado

   Gráfica de residuos mostrando una no linealidad curvilínea
    indica necesidad de transformar las variables

   Si los residuos se van abriendo indica que la varianza muestra
    heteroestacidad y se requiere transformar las variables. Se
    puede probar con la prueba de Levene de homogeneidad de
    varianzas                                                   88
         Escalamiento de residuos
   En algunos casos es difícil hacer comparaciones directas entre
    los coeficientes de la regresión debido a que la magnitud de bj
    refleja las unidades de medición del regresor Xj. Por ejemplo:


    ˆ
    Y  5  X 1  1000 X 2

   Para facilitarla visualización de residuos ante grandes
    diferencias en los coeficientes, se sugiere estandarizar o
    estudentizar los residuos




                                                                 89
         Escalamiento de residuos
   Residuos estandarizados
       Se obtienen dividiendo cada residuo entre la desviación
        estándar de los residuos
                                            ei
                                     di        ,
                                            MSE
       Después de la estandarización, los residuos tienen una
        media de 0 y desviación estándar de 1

       Con más de 50 datos siguen a la distribución t, de
        manera que si exceden a 1.96 (límite para alfa 0.05)
        indica significancia estadística y son “outliers”
                                                          90
         Escalamiento de residuos
   Residuos estudentizados
       Son similares a los residuos donde se elimina una
        observación y se predice su valor, pero además se elimina la
        i-ésima observación en el cálculo de la desviación estándar
        usada para estandarizar la í-ésima observación

       Puede identificar observaciones que tienen una gran
        influencia pero que no son detectadas por los residuos
        estandarizados

       H = X (X’X)-1X’ es la matriz sombrero o “hat matriz”.
                       ei
            ri                    ,
                    MSE (1  hii )                               91
         Escalamiento de residuos
   El estadístico PRESS (Prediction Error Sum of Squares) es una
    medida similar a la R2 en la regresión. Difiere en que se estiman
    n-1 modelos de regresión.

   En cada modelo se omite una observación en la estimación del
    modelo de regresión y entonces se predice el valor de la
    observación omitida con el modelo estimado. El residuo iésimo
    será:
                          ˆ
           e( i )  Yi  Y( i )

   El residuo PRESS es la suma al cuadrado de los residuos
    individuales e indica una medida de la capacidad de predicción
     PRESS   e(2i )   Yi  Y( i ) 
              N
                                                            PRESS
                                 ˆ 2     RPr edicción  1 
                                          2
             i 1                                            SYY  92
    Gráficas parciales de regresión
   Para mostrar el impacto de casos individuales es más efectiva la
    gráfica de regresión parcial. Un caso “outlier” impacta en la
    pendiente de la ecuación de regresión (y su coeficiente).

   Una comparación visual de la gráfica de regresión parcial con y
    sin la observación muestra la influencia de la observación

   El coeficiente de correlación parcial es la correlación de la
    variable independiente Xi la variable dependiente Y cuando se
    han eliminado de ambos Xi y Y

   La correlación semiparcial refleja la correlación entre las
    variables independiente y dependiente removiendo el efecto Xi
                                                               93
                  Matriz sombrero
   Los puntos de influencia son observaciones substancialmente
    diferentes de las observaciones remanentes en una o más
    variables independientes

   Contiene valores (sombrero en su diagonal) para cada
    observación que representa influencia. Representa los efectos
    combinados de todos las variables independientes para cada
    caso




                                                              94
                  Matriz sombrero
   Los valores en la diagonal de la matriz sombrero miden dos
    aspectos:
      Para cada observación miden la distancia de la observación

       al centro de la media de todas las observaciones de las
       variables independientes

       Valores altos en la diagonal indica que la observación tiene
        mucho peso para la predicción del valor de la variable
        dependiente, minimizando su residuo
       El rango de valores es de 0 a 1, con media p/n, p es el
        número de predictores y n es el tamaño de muestra. Valores
        límite se encuentran en 2p/n y 3p/n

                                                               95
         Distancia de Mahalanobis
   D2 es una medida comparable a los valores sombrero (hat
    values) que considera sólo la distancia de una observación del
    valor medio de las variables independientes.

   Es otra forma de identificar “outliers”

   La significancia estadística de la distancia de Malahanobis se
    puede hacer a partir de tablas del texto:
      Barnett, V., Outliers in Statistical Data, 2nd. Edition, Nueva

        York, Wiley, 2984




                                                                 96
           Influencia en coeficientes
                  individuales
   El impacto de eliminar una observación simple en cada
    uno de los coeficientes de la regresión múltiple se muestra
    con la DFBETA y su versión estandarizada SDFBETA.

   Se sugiere aplicar como límites ±1.0 o ±2 para tamaños
    de muestra pequeños y ±√n para muestras medias y
    grandes

   La distancia de Cook (Di) captura el impacto de una
    observación:
      La dimensión del cambio en los valores pronosticados
       cuando se omite la observación y la distancia de las
       otras observaciones, el límite es 1 o 4/(n-k-1)
                                                          97
           Influencia en coeficientes
                  individuales
   La medida COVRATIO estima el efecto de la observación
    en la eficiencia del proceso, en sus errores estándar de los
    coeficientes de la regresión. Considera a todos los
    coeficientes colectivamente.

   El límite puede ser establecido en 1 ±3p/n, los valores
    mayores al límite hacen el proceso más eficiente y los
    menores más ineficiente

   La medida SDFFIT es el grado en que cambian los
    valores ajustados o pronosticados cuando el caso se
    elimina. El valor límite es 2*raíz((k+1)/(n-k-1))
Ejemplo de regresión múltiple
 Solución con Excel y Minitab




                                99
      Ejemplo de Regresión Múltiple
                Cat. (US News)   GMAT   Salario Inicial ($)   % Aceptación
Stanford              1          711      82000                   7.4
Harvard               2          670      80000                   12.8
Penn (Wharton)        3          662      79000                   14.7
MIT (Sloan)           4          650      78000                   15.1
Chicago               5          680      65000                   25.0
Northwestern          6          660      70000                   16.0
Columbia              7          660      83000                   14.8
Dartmouth             8          670      70000                   12.6
Duke                  9          646      67500                   20.5
Berkeley              10         653      70000                   13.3
Virginia              11         660      66000                   18.9
Michigan              12         645      65000                   28.0
NYU                   13         646      70583                   20.9
Carnegie Mellon       14         640      67200                   30.8
Yale                  15         675      65000                   23.5
U.N.C.                16         630      60000                   19.8
UCLA                  17         651      65000                   17.5
Texas-Austin          18         630      60000                   27.3
Indiana               19         630      61500                   44.7
Cornell               20         637      64000                   25.4
Rochester             21         630      58500                   36.0
Ohio State            22         611      61000                   23.2
Emory                 23         626      60000                   33.0
Purdue                24         603      63700                   20.7
Maryland              25         640      53000                   18.9
                                                                             100
Interpretación de Resultados de Excel- Regresión Multiple
SUMMARY OUTPUT
Regression Statistics
Multiple R        0.8749313 R Square         0.76550478
Adjusted R Square 0.732005463 Standard Error 4050.855918 Observations             25

ANOVA
                        df       SS            MS                F          Significance F
Regression              3        1.12E+09 374977790.1         22.851355           8.17E-07
Residual                21       3.45E+08 16409433.67
Total                   24       1.47E+09

            Coefficients Standard     t Stat        P-value   Lower 95% U pper 95%
                            Error
Intercept     122481.40 41473.13 2.953271081 0.007589                36233.29     208729.5

X Variable1 -926.873         198.8104 -4.662094325 0.0001336         -1340.32     -513.424

X Variable2 -59.9488         60.44875 -0.991730876 0.3326192          -185.659    65.76118

X Variable3 -191.7291        125.6138 -1.526337637 0.1418472          -452.957    69.49917
Resultados de Excel- Regresión sólo con sólo X1
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.855974
R Square                0.732691
Adjusted R Square 0.721069
Standard Error    4132.688
Observations      25

ANOVA
                        df       SS                  MS         F           Significance F

Regression              1        1.08E+09            1.08E+09 63.04264          4.88E-08
Residual                23       3.93E+08            17079107
Total                   24       1.47E+09

          Coefficients Standard Error       t Stat   P-value   Lower 95%   Upper 95%
Intercept 79230.32           1703.951       46.49801 2.98E-24 75705.43405 82755.20595
X Variable1 -910.077          114.6201      -7.93994 4.88E-08 -1147.186411 -672.9674353


   Con sólo X1, el Modelo se simplifica enormemente
  poca importancia práctica se pierde en R2 (ajustada)
  Vuelva a del Modelo
Reducción correr la regresión usando la categoría
  US News, como el único agente de predicción (“predictor”)

 La ecuación de regresión es:
 y = 79230 - 910 x

 “Predictor”    Coef     Desv. Estándar     T        p
 Constante      79230      1704             46.50    0.000
 x             -910.1      114.6            -7.94    0.000

 S = 4133      R2 = 73.3%    R2 (ajustada) = 72.1%

 Análisis de Variancia

 Fuente            DF       SS              MS               F       p
 Regresión         1        1076712008      1076712008       63.04   0.000
 Error             23       392819470       17079107
 Total             24       1469531477

   El Modelo se simplifica enormemente..…poca
   importancia práctica se pierde en R2 (ajustada)
                Corrida en Minitab
   Se introducen los datos en varias columnas C1 a C5
    incluyendo la respuesta Y (heatflux) y las variables
    predictoras X’s (North, South, East)
       HeatFlux Insolation      East       South   North
           271.8    783.35 33.53       40.55   16.66
           264.0    748.45 36.50       36.19   16.46
           238.8    684.45 34.66       37.31   17.66
           230.7    827.80   33.13     32.52   17.50
           251.6    860.45 35.75       33.71   16.40
           257.9    875.15 34.46       34.14   16.28


                                                           104
              Corrida en Minitab
   Utilzar el archivo de ejemplo Exh_regr.mtw
   Opción: Stat > Regression > Regression
   Para regresión lineal indicar la columna de respuesta
    Y (Score2) y X (Score1)

   En Regresión lienal en opciones se puede poner un
    valor Xo para predecir la respuesta e intervalos. Las
    gráficas se obtienen Stat > Regression > Regression
    > Fitted line Plots

   Para regresión múltiple Y (heatflux) y las columnas
    de los predictores (north, south, east)
                                                    105
       Resultados de la regresión lineal
                           The regression equation is
                          Score2 = 1.12 + 0.218 Score1
         Predictor              Coef         SE Coef                  T             P
         Constant           1.1177            0.1093           10.23         0.000
         Score1            0.21767           0.01740           12.51         0.000
             S = 0.1274          R-Sq = 95.7%            R-Sq(adj) = 95.1%
                                Analysis of Variance
    Source                 DF                SS              MS              F             P
    Regression              1        2.5419             2.5419        156.56        0.000
               Residual Error            7         0.1136         0.0162
                        Total                     8          2.6556
                   Predicted Values for New Observations
    New Obs       Fit       SE Fit                95.0% CI                       95.0% PI
1         2.6414          0.0474     (   2.5292,       2.7536)    (       2.3197,       2.9631)
                                 New Obs          Score1
                                 1                    7.00                                        106
Resultados de la regresión lineal
                                 Regression Plot
                               Score2 = 1.11771 + 0.217670 Score1

                        S = 0.127419       R-Sq = 95.7 %   R-Sq(adj) = 95.1 %

          3.5
 Score2




          2.5




                                                                                    Regression
          1.5                                                                        95% CI
                                                                                     95% PI


                2   3     4            5          6          7         8        9

                                       Score1




                                                                                                 107
Resultados de la regresión Múltiple
                     The regression equation is
     HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
    Predictor              Coef        SE Coef                  T          P
    Constant           389.17               66.09            5.89      0.000
    North            -24.132                1.869       -12.92         0.000
    South              5.3185           0.9629               5.52      0.000
    East                  2.125             1.214            1.75      0.092
         S = 8.598          R-Sq = 87.4%             R-Sq(adj) = 85.9%
                          Analysis of Variance
Source               DF                SS              MS              F       P
Regression            3       12833.9               4278.0       57.87     0.000
           Residual Error         25          1848.1                73.9
                 Total                      28        14681.9
                     Source            DF           Seq SS
                     North              1        10578.7
                     South              1           2028.9
                     East               1            226.3
                                                                                   108
           Resumen de la Regresión
• La regresión sólo puede utilizarse con información de variables
continuas.


• Los residuos deben distribuirse normalmente con media cero.


• Importancia práctica: (R2). Importancia estadística: (valores p)

• La regresión puede usarse con un “predictor” X o más,
  para una respuesta dada

• Reduzca el modelo de regresión cuando sea posible,
  sin perder mucha importancia práctica

                                                                 109
VI.A.4 Herramientas
   multivariadas




                      110
     Herramientas multivariadas
1. Introducción

2. Análisis de componentes principales

3. Análisis factorial

4. Análisis discriminante

5. MANOVA

                                         111
                     Introducción
   En el análisis multivariado se incluyen dos o más
    variables dependientes Y1, Y2, etc. Consideradas
    simultáneamente para las variables independientes
    X1, X2, …., Xn

   Normalmente se resuelven con herramientas
    computacionales tales como Minitab y SPSS.

   Entre las herramientas principales se encuentran:
       Componentes principales, análisis factorial, análisis
        discriminante, análisis de conglomerados, análisis
        canónico, MANOVA
                                                           112
    Análisis de componentes principales
   El análisis (PCA) y el análisis factorial (FA) se usan
    para encontrar patrones de correlación entre muchas
    variables posibles y subconjuntos de datos

   Busca reducirlas a un menor número de
    componentes o factores que representen la mayor
    parte de la varianza.

   Normalmente se requieren al menos cinco
    observaciones por variable

                                                    113
    Análisis de componentes principales
   Pasos de análisis en Minitab
        Se usa una matriz de correlación para determinar la
         relación entre componentes
        Las matrices definen cantidades como eigenvalores y
         eigenvectores
        Se suman los eigenvalores y se calculan las
         proporciones de cada componente
        Se identifican los PC1, PC2, … que explican la mayor
         parte de la varianza
        Se puede hacer un diagrama de Pareto como apoyo


                                                         114
       Ejemplo: Alimentos en Europa
       X1      X2   X3           X4    X5     X6       X7        X8 X9
País   RMEAT    WMEAT    EGGS   MILK   FISH   CERL    STARCH    NUTS   FR-VEG
  1     10.1      1.4     0.5    8.9    0.2    42.3       0.6      5.5     1.7
  2      8.9      14      4.3   19.9    2.1     28        3.6      1.3     4.3
  3     13.5      9.3     4.1   17.5    4.5    26.6       5.7      2.1       4
  4      7.8       6      1.6    8.3    1.2    56.7       1.1      3.7     4.2
  5      9.7     11.4     2.8   12.5     2     34.3         5      1.1       4
  6     10.6     10.8     3.7    25     9.9    21.9       4.8      0.7     2.4
  7      8.4     11.6     3.7   11.1    5.4    24.6       6.5      0.8     3.6
  8      9.5      4.9     2.7   33.7    5.8    26.3       5.1        1     1.4
  9      18       9.9     3.3   19.5    5.7    28.1       4.8      2.4     6.5
 10     10.2       3      2.8   17.6    5.9    41.7       2.2      7.8     6.5
 11      5.3     12.4     2.9    9.7    0.3    40.1         4      5.4     4.2
 12     13.9      10      4.7   25.8    2.2     24        6.2      1.6     2.9
 13       9       5.1     2.9   13.7    3.4    36.8       2.1      4.3     6.7
 14      9.5     13.6     3.6   23.4    2.5    22.4       4.2      1.8     3.7
 15      9.4      4.7     2.7   23.3    9.7     23        4.6      1.6     2.7
 16      6.9     10.2     2.7   19.3     3     36.1       5.9        2     6.6
 17      6.2      3.7     1.1    4.9   14.2     27        5.9      4.7     7.9
 18      6.2      6.3     1.5   11.1     1     49.6       3.1      5.3     2.8
 19      7.1      3.4     3.1    8.6     7     29.2       5.7      5.9     7.2
 20      9.9      7.8     3.5   24.7    7.5    19.5       3.7      1.4       2
 21     13.1     10.1     3.1   23.8    2.3    25.6       2.8      2.4     4.9
 22     17.4      5.7     4.7   20.6    4.3    24.3       4.7      3.4     3.3
 23      9.3      4.6     2.1   16.6     3     43.6       6.4      3.4     2.9
 24     11.4     12.5     4.1   18.8    3.4    18.6       5.2      1.5     3.8
 25      4.4       5      1.2    9.5    0.6    55.9         3      5.7     3.2


                                                                                 115
                 Corrida en Minitab
2   Stat > Multivariate > Principal components
3   En Variables, X1, X2, X3, X4, X6, X7, X8, X9

4  En Number of factors to extract, 3. Seleccionar
  Correlation Matrix
5 Click Graphs y seleccionar Scree Plot, Score plot for first
  2 components Loading plot for first 2 components

8   Click Storage e indicar las columnas donde se guarden los
   coeficientes y los valores Z (scores) Coef1 Coef 2 y Z1 Z2
9. Click OK en cada uno de los cuadros de diálogo



                                                                116
                               Ejemplo: Alimentos en Europa
                         Scree Plot of RMEAT, ..., FR-VEG

             4



             3
                                                                                                                    Loading Plot of RMEAT, ..., FR-VEG
Eigenvalue




                                                                                                                   WMEAT                                                 CERL
                                                                                                            MILK
             2                                                                             0.2

                                                                                           0.1                     RMEAT
                                                                                                         EGGS

                                                                                           0.0




                                                                        Second Component
             1
                                                                                           -0.1                                                                        NUTS

                                                                                           -0.2
             0
                                                                                           -0.3                    STARCH
                 1   2    3       4      5       6          7   8   9
                                  Component Number                                         -0.4

                                                                                           -0.5                                                   FR-VEG

                                                                                           -0.6                                    FISH


             Dos componentes exceden                                                       -0.7
                                                                                                  -0.5     -0.4     -0.3    -0.2     -0.1    0.0   0.1     0.2   0.3   0.4

             El eigenvalor de ref. de 1                                                                                              First Component




                                                                                                                                                                 117
                     Ejemplo: Alimentos en Europa
Se tiene la gráfica siguiente de países:
Europa occidental                              Europa oriental                      Balcanes

                                          Scatterplot of Z2 vs Z1
      2                                                                                                       1
                                                                                                          4
                                      2                                                          18               25
                                14
      1         12
                                  8
                                           21
                                                  5
                                                                          11
                         24     20
                               22                               23
      0              6           3
                                   7                                          13
                                                      16
                                  9       15
                                                                                            10
      -1
 Z2




      -2
                                                                         19

      -3

      -4                                                                           17


      -5
           -3             -2              -1           0             1                  2             3                4
                                                           Z1



                                               Península ibérica




                                                                                                                           118
                Análisis factorial
   Es una técnica de reducción de variables para
    identificar factores que expliquen la variación,
    aunque se reiere un juicio subjetivo.

   Las variables de salida están relacionadas
    linealmente con las variables de entrada.

   Las variables deben ser medibles y simétricas. Debe
    haber cuatro o más factores de entrada para cada
    variable independiente

                                                       119
                  Análisis factorial
   Se especifican un cierto número de factores comunes

   El análisis factorial se hace en dos etapas:
       Extracción de factores, para identificar los factores
        principales para un estudio posterior
       Rotación de factores, para hacerlos más significativos




                                                         120
             Corrida con Minitab
2    Stat > Multivariate > Factor Analysis.
3    En Variables, X1, X2, X3, X4, X6, X7, X8, X9
4    En Number of factors to extract, 4.
En  Method of Extraction, seleccionar Principal components
6    En Type of Rotation, seleccionar Varimax.
7    Click Graphs y seleccionar Loading plot for first 2 factors
    y Scree Plot.
Click Results y seleccionar Sort loadings.
Seleccionar Storage e indicar columnas para ponderaciones,
    coeficientes, Z’s, eigenvalores, etc.
Click OK en cada uno de los cuadros de d


                                                          121
                                                                                   Loading Plot of RMEAT, ..., FR-VEG
                                                                                   CERL
                                                            0.50

                                                                    NUTS




         Ejemplo
                                                            0.25

                                                                                                  FR-VEG              STARCH




                                            Second Factor
                                                            0.00                           FISH
                                                                                                                                           WMEAT


                                                            -0.25


                                                            -0.50
                                                                                                            MILK
                                                                                                                             EGGS

                                                            -0.75
                                                                                                    RMEAT

                                                            -1.00
                                                                           -0.50          -0.25    0.00        0.25   0.50          0.75     1.00
                                                                                                      First Factor


Rotated Factor Loadings and Communalities
Varimax Rotation

  Variable   Factor1 Factor2 Factor3 Factor4 Communality
X1 RMEAT        0.051  -0.931   0.014   0.037       0.871
X2 WMEAT        0.943  -0.127  -0.100   0.050       0.918
X3 EGGS         0.628  -0.664   0.163   0.020       0.862
X4 MILK         0.197  -0.610   0.219   0.579       0.795
X5 FISH        -0.226  -0.088   0.921  -0.104       0.919
X6 CERL        -0.395   0.549  -0.624  -0.145       0.867
X7 STARCH       0.515  -0.004   0.683  -0.026       0.732
X8 NUTS        -0.638   0.263  -0.326  -0.515       0.849
X9 FR-VEG      -0.010   0.003   0.178  -0.937       0.910

  Variance   2.2054   2.0749   1.9273   1.5165                               7.7240
  % Var       0.245    0.231    0.214    0.168                                0.858                                             122
                                                       Ejemplo:

                                Scatterplot of Z2 vs Z1
     2
                                     Yugoslavia

                             Portugal
                                           Rumania                                     Hungría

     1                                  Bulgaria Rusia                                 Polonia
                                                                                         Checa Alemania orien
                                            España
          Albania
                                Noruega
     0                              Finlandia
                                                                  Dinamarca                 Holanda Autria
Z2




                                        Italia    Suecia                                Alemania Occ

                                                                        Bélgica
                    Grecia
     -1                                                       Suiza               Irlanda



                                                           Francia

     -2                                  Reino Unido


              -2                -1                            0                         1                       2
                                                         Z1




                                                                                                                    123
            Análisis discriminante
   Si se tiene una muestra con grupos conocidos, el
    análisis discriminante clasifica las observaciones o
    atributos en dos o más grupos

   Puede utilizarse como herramienta predictiva o
    descriptiva

   Las variables deben ser multivariadamente normales,
    con la misma varianza y covarianza poblacional entre
    variables dependientes, y las muestras exhiben
    independencia

                                                      124
         Ejemplo de actividades en países
No   Grupo          Ciudad   Agr Min Man     Ps    Con    Ser Fin     Sps    Tc
 1     1     Bélgica          3.3 0.9 27.6   0.9    8.2   19.1 6.2    26.6   7.2
 2     1     Dinamarca        9.2 0.1 21.8   0.6    8.3   14.6 6.5    32.2   7.1
 3     1     Francia         10.8 0.8 27.5   0.9    8.9   16.8 6.0    22.6   5.7
 4     1     Alemania Occ.    6.7 1.3 35.8   0.9    7.3   14.4 5.0    22.3   6.1
 5     1     Irlanda         23.2 1.0 20.7   1.3    7.5   16.8 2.8    20.8   6.1
 6     1     Italia          15.9 0.6 27.6   0.5   10.0   18.1 1.6    20.1   5.7
 7     1     Luxenburgo       7.7 3.1 30.8   0.8    9.2   18.5 4.6    19.2   6.2
 8     1     Holanda          6.3 0.1 22.5   1.0    9.9   18.0 6.8    28.5   6.8
 9     1     Inglaterra       2.7 1.4 30.2   1.4    6.9   16.9 5.7    28.3   6.4
10     1     Austria         12.7 1.1 30.2   1.4    9.0   16.8 4.9    16.8   7.0
11     1     Finlandia       13.0 0.4 25.9   1.3    7.4   14.7 5.5    24.3   7.6
12     2     Grecia          41.4 0.6 17.6   0.6    8.1   11.5 2.4    11.0   6.7
13     1     Noruega          9.0 0.5 22.4   0.8    8.6   16.9 4.7    27.6   9.4
14     2     Portugal        27.8 0.3 24.5   0.6    8.4   13.3 2.7    16.7   5.7
15     2     España          22.9 0.8 28.5   0.7   11.5    9.7  8.5   11.8   5.5
16     1     Suecia           6.1 0.4 25.9   0.8    7.2   14.4 6.0    32.4   6.8
17     1     Suiza            7.7 0.2 37.8   0.8    9.5   17.5 5.3    15.4   5.7
18     2     Turquía         66.8 0.7  7.9   0.1    2.8    5.2  1.1   11.9   3.2
19     3     Bulgaria        23.6 1.9 32.3   0.6    7.9    8.0  0.7   18.2   6.7
20     3     Checa           16.5 2.9 35.5   1.2    8.7    9.2  0.9   17.9   7.0
21     3     Alemania Ori.    4.2 2.9 41.2   1.3    7.6   11.2 1.2    22.1   8.4
22     3     Hungría         21.7 3.1 29.6   1.9    8.2    9.4  0.9   17.2   8.0
23     3     Polonia         31.1 2.5 25.7   0.9    8.4    7.5  0.9   16.1   6.9
24     3     Rumania         34.7 2.1 30.1   0.6    8.7    5.9  1.3   11.7   5.0
25     3     Rusia           23.7 1.4 25.8   0.6    9.2    6.1  0.5   23.6   9.3
26     3     Yugoslavia      48.7 1.5 16.8   1.1    4.9    6.4 11.3    5.3   4.0




                                                                             125
           Corrida con Minitab
2   Stat > Multivariate > Discriminant Analysis.

3   En Groups, poner SalmonOrigin.

4   En Predictors, poner Freshwater Marine. Click OK.




                                                126
                              Corrida con Minitab
                  Canonical Discri minant Functions
             3


             2


             1          3
                                                 1
             0


             -1                                              GRUPO

                                     2                         Group C en troids
             -2
Function 2




                                                               3
             -3
                                                               2

             -4                                                1
                  -6     -4     -2       0   2       4   6


                  Function 1




                                                                         127
Análisis de conglomerados




                            128
       Análisis de conglomerados
   Se usa para determinar agrupaciones o
    clasificaciones de un conjunto de datos

   Las personas se pueden agrupar por IQ, padres,
    hábitos de estudio, etc.

   Se trata de dar sentido a grandes cantidades de
    datos de cuestionarios, ecnuestas, etc.



                                                      129
                         Ejemplo
   Suponer que un estudio de     Variables V1       V2
    mercado trata de determinar
    segmentos de mercado en          A           3        2
    base a los patrones de           B           4        5
    lealtad de marcas (V1) y
    tiendas (V2), medidas del 0      C           4        7
    al 10 en 7 personas (A-G).
                                     D           2        7

                                     E           6        6

                                     F           7        7

                                     G           6        4


                                                          130
                            Corrida en Minitab
   Stat > Multivariate Análisis > Cluster Observations
   Distance Measured Euclidean Seleccionar Show
    Dendogram OK
                         Dendrogram with Single Linkage and Euclidean Distance


                  3.16




                  2.11
       Distance




                  1.05




                  0.00
                            1       2        3        4         5      6         7
                                                 Observations
                                                                                     131
    Análisis de correlación canónico
   Prueba la hipótesis de que los efectos pueden tener
    causas múltiples y de que las causas pueden tener
    efectos múltiples (Hotelling 1935)

   Es como una regresión múltiple para determinar la
    correlación entre dos conjuntos de combinaciones
    lieneales, cada conjunto puede tener varias variables
    relacionadas.
   La relación de un conjunto de variables dependientes
    a un conjunto de variables independientes forma
    combinaciones lineales

                                                   132
    Análisis de correlación canónico
   Se usan los más altos valores de correlación para los
    conjuntos. Los pares de combinaciones lineales se
    denominan variates canónicas con correlaciones
    canónicas (Rc con valor mayor a 0.3)

   Por ejemplo se quiere determinar si hay una
    correlación entre las características de un ingeniero
    industrial y las habilidades requeridas en la
    descripción de puesto del mismo ingeniero.



                                                     133
                  MANOVA
       (Análisis de varianza múltiple)
   Es un modelo para analizar la relación entre una o
    más variables independientes y dos o más variables
    dependientes

   Prueba si hay diferencias significativas en las medias
    de grupos de una combinanción de respuestas Y.

   Los datos deben ser normales, con covarianza
    homogenea y observaciones independientes


                                                     134
           MANOVA
(Análisis de varianza múltiple)




                                  135
Diferencias de ANOVA y MANOVA




                           136
                 Ejemplo:
       Extrusión de película plástica
   Se realiza un estudio para determinar las condiciones
    óptimas para extruir película plástica.

   Se miden tres respuestas – Tear, gloss y opacity –
    cinco veces en cada combinación de dos factores –
    tasa de extrusión y cantidad de aditivo – cada grupo
    se pone en niveles bajos y altos.

   Se utiliza el MANOVA balanceado para probar la
    igualdad de las medias.

                                                     137
          Ejemplo:
Extrusión de película plástica
  Tear   Gloss   Opacity   Extrusión   Additive
   6.5     9.5     4.4         1          1
   6.2     9.9     6.4         1          1
   5.8     9.6      3          1          1
   6.5     9.6     4.1         1          1
   6.5     9.2     0.8         1          1
   6.9     9.1     5.7         1          2
   7.2     10       2          1          2
   6.9     9.9     3.9         1          2
   6.1     9.5     1.9         1          2
   6.3     9.4     5.7         1          2
   6.7     9.1     2.8         2          1
   6.6     9.3     4.1         2          1
   7.2     8.3     3.8         2          1
   7.1     8.4     1.6         2          1
   6.8     8.5     3.4         2          1
   7.1     9.2     8.4         2          2
    7      8.8     5.2         2          2
   7.2     9.7     6.9         2          2
   7.5    10.1     2.7         2          2
   7.6     9.2     1.9         2          2
                                                  138
                 Ejemplo:
       Extrusión de película plástica
1    Abrir el archivo EXH_MVAR.MTW.
2    Seleccionar Stat > ANOVA > Balanced
    MANOVA.
3    En Responses, poner Tear Gloss Opacity.
4    En Model, poner Extrusion | Additive.
5    Click Results. En Display of Results, seleccionar
    Matrices (hypothesis, error, partial
    correlations) y Eigen analysis.
6    Click OK en cada cuadro de diálogo.


                                                 139
                                             Ejemplo
Criterion            Statistic           F   Num     Denom      P
Wilks'                    0.38186    7.554       3     14    0.003
SSCP Matrix for Extrusion
             Tear    Gloss     Opacity
Tear        1.740    -1.505     0.8555
Gloss       -1.505   1.301     -0.7395
Opacity     0.855    -0.739     0.4205
SSCP Matrix for Error
             Tear     Gloss     Opacity
Tear        1.764    0.0200         -3.070
Gloss       0.020    2.6280         -0.552
Opacity     -3.070   -0.5520        64.924
Partial Correlations for the Error SSCP Matrix
Eigenvector           1          2           3
Tear            0.6541      0.4315     0.0604
Gloss           -0.3385     0.5163     0.0012
Opacity         0.0359      0.0302     -0.1209

                                                                     140
                Ejemplo:
      Extrusión de película plástica
Las matrices SSCP evalúan la contribución a la
  variabilidad de manera similar a la suma de
  cuadrados en la ANOVA univariada.

Las correlaciones parciales entre Tear y Gloss son
  pequeñas. Como la estructura de las correlaciones es
  débil, se pueden realizar análisis univariados de
  ANOVA para cada una de las respuestas.




                                                 141
VI.A.4 Estudios Multivari




                            142
                  Estudios Multivari
   La carta multivari permite analizar la variación dentro
    de la pieza, de pieza a pieza o de tiempo en tiempo

   Permite investigar la estabilidad de un proceso
    consiste de líneas verticales u otro esquema en
    función del tiempo. La longitud de la línea o del
    esquema representa el rango de valores encontrados
    en cada conjunto de muestras




                                                     143
                 Estudios Multivari
   La variación dentro de las muestras (cinco puntos en
    cada línea). La variación de muestra a muestra como
    posición vertical de las líneas.


     E
     S
     P
     E
     S
     O
     R


                         Número de subgrupo        144
                 Estudios Multivari
   Ejemplo de parte metálica
                          Centro más grueso




                                              145
                   Estudios Multivari
   Procedimiento de muestreo:
       Seleccionar el proceso y la característica a
        investigar

       Seleccionar tamaño de muestra y frecuencia de
        muestreo

       Registrar en una hoja la hora y valores para
        conjunto de partes


                                                       146
                 Estudios Multivari
   Procedimiento de muestreo:
       Realizar la carta Multivari
       Unir los valores observados con una línea

       Analizar la carta para variación dentro de la parte,
        de parte a parte y sobre el tiempo

       Puede ser necesario realizar estudios adicionales
        alrededor del área de máxima variación aparente
       Después de la acción de mejora comprobar con
        otro estudio Multivari
                                                      147
                     Cartas Multivari
   Su propósito fundamental es reducir el gran número de
    causas posibles de variación, a un conjunto pequeño de
    causas que realmente influyen en la variabilidad.

   Sirven para identificar el patrón principal de variación de
    entre tres patrones principales:


       Temporal: Variación de hora a hora; turno a
        turno; día a día; semana a semana; etc.

       Cíclico: Variación entre unidades de un mismo
        proceso; variación entre grupos de unidades;
        variación de lote a lote.                     148
                     Cartas Multivari
   Posicional:
        Variaciones dentro de una misma unidad (ejemplo:
         porosidad en un molde de metal) o a través de una sola
         unidad con múltiples partes (circuito impreso).


        Variaciones por la localización dentro de un proceso que
         produce múltiples unidades al mismo tiempo. Por
         ejemplo las diferentes cavidades de un molde


        Variaciones de máquina a máquina; operador a
         operador; ó planta a planta

                                                               149
                      Cartas Multivari
   Ejemplo: Se toman 3 a 5 unidades consecutivas, repitiendo el
    proceso tres o más veces a cierto intervalo de tiempo, hasta que al
    menos el 80% de la variación en el proceso se ha capturado.




    A




         1 2 3 4 5             27 28 29 30 31        55 56 57 58 59
          VARIACIÓN POSICIONAL DENTRO DE LA UNIDAD
                                                                  150
                         Cartas Multivari
   Ejemplo: (cont...)




    B




         1 2 3 4 5           27 28 29 30 31   55 56 57 58 59
          VARIACIÓN CÍCLICA DE UNIDAD A UNIDAD




                                                        151
                         Cartas Multivari
   Ejemplo: (cont...)




    C




         1 2 3 4 5         27 28 29 30 31   55 56 57 58 59

          VARIACIÓN TEMPORAL DE TIEMPO A TIEMPO



                                                       152
                   Cartas Multivari
   Ejemplo: Un proceso produce flecha cilíndricas, con
    un diámetro especificado de 0.0250”  0.001”.


   Sin embargo un estudio de capacidad muestra un Cp
    = 0.8 y una dispersión natural de 0.0025” (6  )
    contra la permitida de 0.0002”.


   Se tiene pensado comprar un torno nuevo de
    US$70,000 para tolerancia de  0.0008”, i.e. Cpk =
    1.25. Se sugirió un estudio Multi Vari previo.
                                                         153
                     Cartas Multivari
   Se tomaron cuatro lecturas en cada flecha, dos a
    cada lado. Estas muestran una disminución gradual
    desde el lado izquierdo al lado derecho de las
    flechas, además de excentricidad en cada lado de la
    flecha.


   La variación cíclica, de una flecha a la siguiente, se
    muestra mediante las líneas que concentran las
    cuatro lecturas de cada flecha.


   También se muestra la variación temporal.
                                                             154
                  Cartas Multivari
           8 AM     9 AM                 10 AM   11 AM   12 AM
.0.2510”




0.2500”




0.2490”

                           Izquierda

                  Máximo
                                       Derecha


                  Mínimo

                                                             155
                       Cartas Multivari
   Un análisis rápido revela que la mayor variación es temporal
    con un cambio mayor entre las 10 AM y las 11 AM.

   A las 10 AM se para el equipo para el almuerzo y se arranca a
    las 11 AM, con lecturas similares a las de las 8 AM. Conforme
    pasa el tiempo las lecturas tienden a decrecer más y más, hasta
    que se invierten a las 10 A.M. en forma drástica.


   Se investigó y se encontró que la temperatura tenía influencia
    en la variación.

   La variación en temperatura era causada por que la cantidad de
    refrigerante no era la adecuada, lo cual se notaba más cuando
    se paraba el equipo y se volvía a arrancar. Se adicionó,
    reduciendo la variación en 50% aproximadamente..
                                                                   156
                       Cartas Multivari
   También se encontró que el acabado cónico era causado por
    que la herramienta de corte estaba mal alineada. Se ajustó,
    contribuyendo a otra reducción del 10% de la variabilidad.


   La excentricidad de las flechas se corrigió al cambiar un
    rodamiento excéntrico por desgaste en el torno. Se instaló un
    nuevo rodamiento eliminándose otro 30% de la variabilidad.


   La tabla siguiente muestra un resumen de los resultados.




                                                                    157
                           Cartas Multivari
Tipo de           % var.   Causas de       Acción           % de variación
Variación         Total    Variación       Correctiva       Reducida
Temporal          50       Bajo nivel de   Adicionar        Casi 50
Tiempo a tiempo            Refrigerante    refrigerante
Dentro de         10       Ajuste no       Ajuste de la     Casi 10
la flecha                  no paralelo     herramienta de
                                           corte
Dentro de         30       Rodamiento      Nuevo            Casi 30
la flecha                  gastado         rodamiento


Flecha a          5        -???            -                -
flecha
                                                                      158
                        Cartas Multivari
   Resultados:
       La variación total en la siguiente corrida de producción se
        redujo de 0.0025” a 0.0004”


       El nuevo Cp fue de 0.002 / 0.0004 = 5.0


       Como beneficios se redujo a cero el desperdicio y no hubo
        necesidad de adquirir una nueva máquina.


       Se observa que antes de cambiar equipo o máquinas, es
        conveniente realizar un estudio de variabilidad para
        identificar las fuentes de variación y tratar de eliminarlas.
                                                                        159
                         Cartas Multivari
  Ejemplo: Búsqueda de fuentes de variación con el diagrama sistemático.


                                     Diámetro de Flecha
                                       (0.150" +/- .002)

                         Variación
                                                    Variación de
                            de
                                                   sist. medición
                         proceso

Pieza a                      Dentro de     Máquina a      Turno a    Tiempo a
           Lote a lote
 pieza                        la pieza      máquina        turno      tiempo

                                                             Operador a
                                                             operador
           Programa           Máquina      Accesorios



                                                                          160
         Cartas Multivari
Ejemplo (cont..):
• Al realizar la prueba de homogeneidad de varianza F, se
encontró que había una diferencia significante entre los
operadores.


Se Rechaza Ho: Oper1 = Oper2 = Oper3
• Para probar si existe diferencia significativa entre
medias de operadores se hacen las siguientes
comparaciones

Ho: Oper1 = Oper2        Ho: Oper1 = Oper3
Ho: Oper2 = Oper3        Ha: Oper1 Oper2 Oper3 161
               Corrida en Minitab
   Se introducen los datos en varias columnas C1 a C3
    incluyendo la respuesta (strenght) y los factores
    (time y Metal)
        SinterTime         MetalType        Strength
                     0.5     15        23
                     0.5     15        20
                     0.5     15        21
                     0.5     18        22
                     0.5     18        19
                     0.5     18        20
                     0.5     21        19
                     0.5     21        18              162
              Corrida en Minitab
   Utilizar el achivo de ejemplo Sinter.mtw

   Opción: Stat > Quality Tools > Multivari charts

   Indicar la columna de respuesta y las columnas de
    los factores

   En opciones se puede poner un título y conectar las
    líneas

                                                      163
                                     Resultados
              Multi-Vari Chart for Strength by SinterTime - MetalType

                                                                  SinterTime
                                                                     0.5
           23.5
                                                                     1.0

                                                                     2.0
           22.5


           21.5
Strength




           20.5



           19.5


           18.5



           17.5


                      15               18               21

                                   MetalType



                                                                               164
VI.A.5 Análisis de datos
     por atributos




                           165
    Análisis de datos por atributos
   Si los CTQ’s son variables continuas, se usa la
    regresión, dependiendo de la naturaleza de la
    característica crítica para el cliente (CTS’s) como éste
    la expresa:

        CTS                          HERRAMIENTA
    Nominal (Verde, Rojo, azul) Regresión Logística Nominal
    Atributo (Pasa/No pasa)     Regresión Logística Binaria
    Ordinal (1, 2, 3, 4, 5)     Regresión Logística Ordinal



                                                      166
    Análisis de datos por atributos
   El análisis de datos por atributos se organiza en
    valores, categorías o grupos dicotómicos

   Las decisiones incluyen: si / no, pasa / no pasa,
    bueno / malo, pobre/justo/bueno/superior/excelente,
    etc.

   Entre los modelos no lineales de regresión usados se
    tienen: regresión logística, regresión logit y regresión
    probit

                                                        167
    Análisis de datos por atributos
   Regresión logística
       Relaciona variables independientes categóricas a una
        variable dependiente (Y). Minitab incluye los modelos
        binario, ordinal y nominal


   Regresión logit
       Es subconjunto del modelo log-lineal. Tiene solo una
        variable dependiente, usa determinaciones de
        probabilidad o tasa de probabilidad



                                                         168
    Análisis de datos por atributos
   Regresión probit
       Es similar a la prueba de vida acelerada, la unidad se
        somete a esfuerzo con la respuesta pasa/falla, bueno o
        malo. Es una respuesta binaria en un tiempo de falla
        futuro




                                                        169
    Regresión logística o binaria
• En caso de información cualitativa es necesario
  traducir las preferencias del cliente expresadas como
  atributos a un intervalo de valores aceptables de
  variables (Especificaciones).




                                                 170
      Regresión logística o binaria
   Es similar a la regresión múltiple excepto que la
    respuesta es binaria (si/no, bueno/malo, etc.) Sus
    coeficientes se determinan por el método de máxima
    verosimilitud

   Su función tiene forma de “S”, con valores máximos
    de Cero y Uno.

                    Yi = 0, 1




                                                  171
       Regresión logística o binaria
   La probabilidad de que el resultado esté en cierta
    categoría es:




   El método de cálculo del coeficiente b es diferente
    que en la regresión lineal

   Los coeficientes se determinan con la relación sig.:
     P(evento)
                  e B 0  B1 X 1  B2 X 2  ....  Bn X n
    P(no evento)
                                                             172
               Regresión logística
   Condiciones:
       Hay solo dos resultados posibles
       Hay solo un resultado por evento
       Los resultados son independientes estadísticamente
       Todos los predictores relevantes están en el modelo
       Es mutuamente exclusivo y colectivamente exhaustivo
       Los tamaños de muestra son mayores que para la
        regresión múltiple

   Los efectos positivos se obtienen con b1>1 y los
    negativos con b1 e 0 a 1

                                                      173
Regresión logística
Relación con ajuste pobre




Relación con buen ajuste




                            174
Regresión logística - Procedimiento
   Definir el atributo a “traducir” (“y”)
   Definir la variable apropiada para el atributo (“x”)
   Definir el modelo matemático a probar
   Determinar los defectos que está dispuesto a
    aceptar
   Recolecte información de “x” vs “y”. Asigne 1 si falla
    y 0 si es aceptable.
   Analice la información mediante Regresión Logística
    Binaria


                                                    175
Regresión logística- Procedimiento




                                 176
     Regresión logística - Procedimiento

Coeficientes del modelo



  P-Value de Deviance


        Observe el P-Value de “Deviance” en la Sesión, debe
         de ser grande (P >0.10)
        Obtenga los coeficientes del modelo (De la Sesión)

                                                      177
    Regresión logística - Procedimiento
    •   Construya el modelo de regresión                  para      la
        probabilidad de falla estará dado por :


P(Falla) =
            e +b x +....
             b  0   1 1
                                Donde :
           1+e
               b +b x +....
                    0     1 1
                                b0, b1, ... = Coeficientes del modelo


    •   Identifique el(los) valor(es) de “x” que le generarán
        como máximo la cantidad de defectos que usted
        está dispuesto a aceptar [4]


                                                              178
    Ejemplo de riesgo de paro cardiaco
    Logistic Regression Table
                                                Odds    95% CI
    Predictor      Coef    SE Coef     Z     P Ratio Lower Upper
    Constant -1.98717      1.67930 -1.18 0.237
    Fuma
     Si        -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90
    Peso      0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05

   Para Fuma, el coeficiente negativo de -1.193 y la tasa de
    posibilidades de 0.30, indica que quien fuma, tiende a tener una
    tasa de pulso más alta que los sujetos que no fuman. Si los
    sujetos tienen el mismo peso, las posibilidades de que los
    fumadores tengan un pulso bajo sea sólo del 30% de las
    posibilidades de que los no fumadores tengan un pulso bajo.
                                                                   179
             Regresión logística ordinal
•   Cuando la respuesta ó CTS es de tipo ordinal (Varias
    categorías de respuesta como “totalmente de
    acuerdo”, “de acuerdo”, “en desacuerdo” y
    “totalmente en desacuerdo”) y el Factor ó CTQ es de
    naturaleza continua, entonces, para definir
    Especificaciones, la herramienta a utilizar es la
    Regresión Logística Ordinal.




                                                  180
       Regresión logística ordinal -
             Procedimiento
   Defina la variable de respuesta a “traducir” (“y” ó
    CTS)
   Defina el CTQ (“x”) ó variable a relacionar con el
    CTS
   Defina el modelo matemático a probar
   Determine los defectos que está dispuesto a aceptar
    en la categoría de interés
   Recolecte información de “x” vs “y”
   Analice la información mediante Regresión Logística
    Ordinal

                                                  181
                Regresión logística ordinal -
                      Procedimiento
           Stat > Regression > Ordinal Logistic Regression
               Seleccione la respuesta (“y”)
               Seleccione los términos que estima tiene el modelo
                [3]

Constantes y
Coeficientes
del modelo




                                                               182
       Regresión logística ordinal -
             Procedimiento
   Observe el P-Value de “Deviance” en la Sesión, debe
    de ser grande (P >0.10)

   Obtenga las constantes y coeficientes del modelo
    (De la Sesión)

   Construya los modelos de regresión para la
    probabilidad acumulada por categoría



                                                  183
                   Regresión logística ordinal -
                         Procedimiento

                                               Donde :
P acumulada    =
                  eK +b x + b x ....
                         i   1 1       2 2
                                               Ki = Constante de la categoría i
 hasta categoría     K +b x + b x ....         b1, b2, ... = Coeficientes del modelo
 i               1+e         i   1 1     2 2



Constantes y
Coeficientes
del modelo




  •   Identifique el(los) valor(es) de “x” que le generarán como máximo la
       cantidad de defectos que usted está dispuesto a aceptar en la
       categoría de interés [4]
                                                                              184
               Regresión logística ordinal -
                     Procedimiento
      Una vez que se tienen establecidos los CTQs con los
       que se medirá el desempeño del producto, es
       necesario indicar las Especificaciones de los mismos
               Parámetros




                                                                              Expectativas
                de Diseño


                            Matriz de




                                                                  Importan.
                                        CTQs
Producto
                            Diseño




                                                                              (CTS’s)
               (DPs)




                                                                  Tipo
(General)                                      Especificaciones                              Clientes
                                                LIE LSE   Otra
                                                                                             Usuarios
                                                                                             Finales

 Producto
(Específico)




                                                                                                   185
                  Análisis Logit
   Usa razones para determinar que tanta posibilidad
    tiene una observación de pernecer a un grupo que a
    otro.
   Una posibilidad de 0.8 de estar en el grupo A se
    puede expresar como una tasa de posibilidades de
    4:1 ( que es p/(1-p)), cuyo logaritmo es el logit.


   La probabilidad para un valor L está dado por la
    ecuación


                                                       186
          Análisis Logit - ejemplo
50 estudiantes tomaron un examen, donde solo 27 pasaron.
   ¿Cuáles son las posibilidades de pasar?
Posibilidades = P/(1-P) = 0.54/0.46 = 1.17 o 1.71:1

Un estudiante que estudia 80 horas tiene un 54.5% de pasar,
  ¿cuáles son las posibilidades?
  Posibilidades = 0.545/(1-0.545) = 1.198 o 1.198:1

Logit = ln(p/(1-p)) = ln(1.189) = 0.1809 y despejando al
Exp(b1) = exp(0.1082) = 1.11 que es la tasa de pasar a otro nivel



                                                           187
                  Análisis Probit
   Es similar a las pruebas de vida acelerada y análisis
    de sobrevivencia. Un artículo sujeto a esfuerzo puede
    fallar o sobrevivir. El modelo probit tiene un valor
    esperado de 0 y una varianza de 1.

   Requiere tamaños de muestra muy grandes para
    diferenciarse del modelo logit



   Los coeficientes b del modelo logit difieren del probit
    en 1.814 con: bl = -1.1814 bp
                                                      188
VI.B Pruebas de hipótesis




                            189
         VI.B Pruebas de hipótesis
1.   Conceptos fundamentales
2.   Estimación puntual y por intervalo
3.   Pruebas para medias, varianzas y proporciones
4.   Pruebas comparativas para varianzas, medias y prop.

5.   Bondad de ajustes
6.   Análisis de varianza (ANOVA)
7.   Tablas de contingencia
8.   Pruebas no paramétricas

                                                  190
VI.B.1 Conceptos
 fundamentales




                   191
      Análisis Estadístico
En CADA prueba estadística, se comparan algunos valores
observados a algunos esperados u otro valor observado
comparando estimaciones de parámetros (media, desviación
estándar, varianza)

Estas estimaciones de los VERDADEROS parámetros son obtenidos
usando una muestra de datos y calculando los ESTADÏSTICOS...

La capacidad para detectar un diferencia entre lo que es
observado y lo que es esperado depende del desarrollo de la
muestra de datos

Incrementando el tamaño de la muestra mejora la estimación y tu
confianza en las conclusiones estadísticas.
                                                              192
         Conceptos fundamentales
   Hipótesis nula Ho
      Es la hipótesis o afirmación a ser probada

      Puede ser por ejemplo , , , = 5

      Sólo puede ser rechazada o no rechazada




   Hipótesis alterna Ha
      Es la hipótesis que se acepta como verdadera cuando se

       rechaza Ho, es su complemento
      Puede ser por ejemplo  = 5 para prueba de dos colas

       < 5 para prueba de cola izquierda

       > 5 para prueba de cola derecha

      Esta hipótesis se acepta cuando se rechaza Ho

                                                          193
         Conceptos fundamentales
   Ejemplos:
       Se está investigando si una semilla modificada
        proporciona una mayor rendimiento por hectárea, la
        hipótesis nula de dos colas asumirá que los
        rendimientos no cambian Ho: Ya = Yb

       Se trata de probar si el promedio del proceso A es
        mayor que el promedio del proceso B. La hipótesis
        nula de cola derecha establecerá que el proceso A es
        <= Proceso B. O sea Ho: A <= B.


                                                        194
         Conceptos fundamentales
   Estadístico de prueba
       Para probar la hipótesis nula se calcula un estadístico
        de prueba con la información de la muestra el cual se
        compara a un valor crítico apropiado. De esta forma se
        toma una decisión sobre rechazar o no rechazar la Ho

   Error tipo I (alfa = nivel de significancia, normal=.05)
       Se comete al rechazar la Ho cuando en realidad es
        verdadera. También se denomina riesgo del productor

   Error tipo II (beta )
       Se comete cuando no se rechaza la hipótesis nula
        siendo en realidad falsa. Es el riesgo del consumidor
                                                         195
            Conceptos fundamentales
   Tipos de errores
      Se asume que un valor pequeño para  es deseable, sin

       embargo esto incrementa el riesgo .
      Para un mismo tamaño de muestra n ambos varían

       inversamente
      Incrementando el tamaño de muestra se pueden reducir ambos

       riesgos.
Decisión realizada      Ho en realidad es        Ho en realidad es
                        Verdadera                falsa
No hay evidencia para   p = 1-                  p=
rechazar Ho             Decisión correcta        Error tipo II
Rechazar Ho             p=                      p=1-
                        Error tipo I             Decisión correcta
                                                             196
         Conceptos fundamentales
   Pruebas de dos colas
       Si la Ho: , , , = cte. que un valor poblacional,
        entonces el riesgo alfa se reparte en ambos extremos
        de la distribución. Por ejemplo si Ho = 10 se tiene:




         P(Z<= - Zexcel ) = alfa/2   P(Z>= + Zexcel ) = alfa/2




                                                                 197
         Conceptos fundamentales
   Pruebas de una cola
       Si la Ho: , , ,  >= Cte. que un valor poblacional,
        entonces el riesgo alfa se coloca en la cola izquierda de
        la distribución. Por ejemplo si Ho: >= 10 y Ha: < 10
        se tiene una prueba de cola izquierda:




        P(Z <= - Zexcel ) = alfa




                                                          198
         Conceptos fundamentales
   Pruebas de una cola
       Si la Ho: , , , <= Cte. que un valor poblacional,
        entonces el riesgo alfa se coloca en la cola derecha de
        la distribución. Por ejemplo si Ho: <= 10 y Ha:  >
        10 se tiene una prueba de cola derecha:




                                     P(Z>= + Zexcel ) = alfa


                                                               199
         Conceptos fundamentales
   Tamaño de muestra requerido
       Normalmente se determina el error alfa y beta deseado
        y después se calcula el tamaño de muestra necesario
        para obtener el intervalo de confianza.


   El tamaño de muestra (n) necesario para la prueba
    de hipótesis depende de:
       El riesgo deseado tipo I alfa y tipo II Beta
       El valor mínimo a ser detectado entre las medias de la
        población (Mu – Mu0)
       La variación en la característica que se mide (S o
        sigma)
                                                         200
         Conceptos fundamentales
    El Tamaño de muestra requerido en función del error
     máximo E o Delta P intervalo proporcional esperado
     se determina como sigue:

       Z 2 / 2 2
    n
          E2
       Z 2 / 2 ( p )(1  p )
    n
               (p ) 2               Z 2 / 2  2
                                n 
                                    (X   )2
                                    Z 2 / 2 (  )( 1   )
                                n 
                                         ( p   )2         201
         Conceptos fundamentales
   Ejemplo:
       ¿Cuál es el tamaño de muestra mínimo que al 95% de
        nivel de confianza (Z=1.96) confirma la significancia de
        una corrida en la media mayor a 4 toneladas/hora (E),
        si la desviación estándar (sigma) es de 20 toneladas?

    n = (1.96^2)(20^2)/(4)^2 = 96

    Obtener 96 valores de rendimiento por hora y determinar
      el promedio, si se desvía por más de 4 toneladas, ya
      ha ocurrido un cambio significativo al 95% de nivel de
      confianza
                                                         202
Efecto del tamaño de muestra




                          203
Efecto del tamaño de muestra




                          204
Efecto del tamaño de muestra




                          205
Efecto del tamaño de muestra




                          206
           Potencia de la prueba
   La potencia de una prueba estadística es su habilidad
    para detectar una diferencia crítica


       Potencia  1  
   Si Beta = 0.1 la potencia es del 90%

   Delta se puede normalizar dividiéndolo entre la
    desviación estándar  y se expresa en un cierto
                         
    número de  (1 , 1.5  )
                                                   207
            Potencia de la prueba
   La potencia de la prueba es la probabilidad de de
    rechazar correctamente la hipótesis nula siendo que
    en realidad es falsa.
   El análisis de potencia puede ayudar a contestar
    preguntas como:

       ¿Cuántas muestras se deben tomar para el análisis?
       ¿Es suficiente el tamaño de muestra?
       ¿Qué tan grande es la diferencia que la prueba puede
        detectar?
       ¿Son realmente valiosos los resultados de la prueba?

                                                       208
             Potencia de la prueba
   Para estimar la potencia, Minitab requiere de dos de
    los siguientes parámetros:

       Tamaños de muestra
       Diferencias - un corrimiento significativo de la media
        que se desea detectar
       Valores de potencia - La probabilidad deseada de
        rechazar Ho cuando es falsa




                                                          209
Considerando la potencia de prueba




                               210
VI.2 Significancia estadística
         vs práctica




                                 211
Estimación de riesgos




                        212
                 Pruebas de Minitab
   Permite hacer las siguientes pruebas:
       Prueba   z de una muestra
       Prueba   t de una muestra
       Prueba   t de dos muestras
       Prueba   de 1 proporción
       Prueba   de 2 proporciones

       ANOVA
       Diseños factoriales de dos niveles
       Diseños de Packett Burman

                                             213
Calculo manual




                 214
Calculo manual




                 215
VI.3 Tamaño de muestra




                         216
Calculo manual de tamaño de
          muestra




                              217
Calculo manual de tamaño de
muestra – Pruebas de una cola




                            218
Calculo manual de tamaño de
muestra – Pruebas de una cola




                            219
    Ejemplo con prueba de una media t
   Ejemplo: Se tiene una población normal con media de 365 y
    límites de especificación de 360 y 370. Si la media se desplaza
    2.5 gramos por arriba de la media, el número de defectos sería
    inaceptable, la desviación estándar histórica es de 2.403:
                           CORRIDA DE 2.5 GRS. EN PROMEDIO
                                                   Ha: Corrida
              0.18                    Ho:          367.5                         Variable
                                      Meta                       LIE 370
                                                                                 O riginal
              0.16         LIE 360                                               C orrida
                                      365
              0.14

              0.12

              0.10
     Y-Data




              0.08

              0.06

              0.04

              0.02

              0.00

                     355        360          365            370            375
                                             C1


                                                                                             220
Ejemplo con prueba de una media t
Stat > Power and Sample Size > 1 - Sample t
Completar el diálogo como sigue:




                                              221
              Ejemplo con prueba de una media t
Los resultados se muestran a continuación:
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 2.403

           Sample                            Se tiene un 53.76% de Potencia para detectar
Difference   Size    Power                   una diferencia de 2.5 si se usan 6 muestras
       2.5      6 0.537662                   O sea que hay una probabilidad del 46.24%
                                             que no se rechaze Ho y se concluya que no
                                             hay diferencia significativa.
¿cuántas muestras se requieren para tener un 80% de probabilidad de detectar
el corrimiento, y para 85%, 90% y 95%?

                                                                                            222
         Ejemplo con prueba de una media t
Stat > Power and Sample Size > 1 - Sample t




                                             Se cambia este parámetro




Los resultados se muestran a continuación:

               Sample     Target
Difference       Size      Power    Actual Power
       2.5         10       0.80        0.832695
       2.5         11       0.85        0.873928
       2.5         12       0.90        0.905836
       2.5         15       0.95        0.962487

Si la potencia es demasiado alta por decir 99% se pueden detectar diferencias
que realmente no son significativas.                                    223
         Ejemplo con prueba de 2 medias t
Ejemplo: La potencia de una prueba depende de la diferencia que se quiera detectar
respecto a la desviación estándar, para una sigma poner 1 en diferencia y desviación
estándar, con valores deseados de Potencia de 0.8 y 0.9.
Stat > Power and Sample Size > 2 - Sample t
Power and Sample Size           2-Sample t Test

Testing mean 1 = mean 2 (versus not =)
Calculating power for mean 1 = mean 2 + difference
Alpha = 0.05 Assumed standard deviation = 1
            Sample Target
Difference    Size   Power Actual Power
         1      17     0.8      0.807037
         1      23     0.9      0.912498
Se requieren tamaños de muestra de entre 17 y 23
                                                                         224
          Ejemplo con prueba de 1 proporción
Para estimar la potencia, Minitab requiere de dos de los siguientes parámetros:
* Tamaños de muestra
* La proporción - una proporción que se desea detectar con alta probabilidad
* Valores de potencia - La probabilidad deseada de rechazar Ho cuando es falsa
Suponiendo que se desea detectar una proporción de 0.04 con el 0.8 y 0.9 de niveles
de Potencia:




                                             Proporción que se desea detectar con alta
                                             probabilidad (0.80, 0.90)


                                             Es la proporción de la Hipótesis nula


                                                                                         225
      Ejemplo con prueba de 1 proporción
Test for One Proportion
Testing proportion = 0.02 (versus > 0.02)
Alpha = 0.05
Alternative Sample Target
 Proportion         Size     Power Actual Power
         0.04        391         0.8           0.800388
         0.04        580         0.9           0.900226
Si se desea saber la Potencia si se utiliza un tamaño de muestra de 500 se tiene:
Stat > Power and Sample Size > 2 - Sample t
Sample sizes = 500 Alternative values of p = 0.04
Options: Greater Than
Significance Level = 0.05

Test for One Proportion
Testing proportion = 0.02 (versus > 0.02)
Alpha = 0.05
Alternative Sample
 Proportion         Size       Power
          0.04       500        0.865861
Por tanto con un tamaño de muestra de 500, la potencia de la prueba para detectar
un corrimiento de 2% a 4% es del 86.6%
                                                                                226
                        Ejercicios
Calcular los tamaños de muestra necesarios para los siguientes
escenarios (usar pruebas de dos colas):
a. 1-muestra Z à a=0.05, b=0.1 y 0.2, d = 1.5s
b. 1-muestra t à a=0.05, b=0.1 y 0.2, d = 1.5s
c. 1-muestra t à a=0.01, b=0.05, d = 0.5s y 1.0s
d. 2-muestras t à a=0.05, b=0.1, d = 1.5s y 2.0s
2. Calcular la potencia de la prueba para los siguientes escenarios
(usar pruebas de dos colas):
a. 1-muestra Z à a=0.05, d = 0.5s, n = 25, 35
b. 1-muestra t à a=0.05, d = 1.0s, n = 10, 20
c. 1-muestra t à a=0.01, d = 1.0s, n = 10, 25
d. 2-muestras t à a=0.05, d = 0.5s, n = 10, 25, 50, 75, 100
                                                             227
                        Ejercicios
Calcular el tamaño de muestra requerido para los siguientes
escenarios (usar pruebas de dos colas):
a. 1-proporción à a=0.05, b=0.1 & 0.2, P0 = 0.5, PA = 0.6
b. 1-proporción à a=0.01, b=0.1 & 0.2, P0 = 0.8, PA = 0.9
c. 2-proporción à a=0.05, b=0.1, P0 = 0.5, PA = 0.6, 0.8
d. 2-proporciones à a=0.01, b=0.1, P0 = 0.8, PA = 0.85, 0.95
2. Calcular la potencia de la prueba para los siguientes escenarios
(usar pruebas de dos colas):
a. 1-proporción à a=0.05, P0 = 0.5, PA = 0.6, n = 250, 350
b. 1-proporción à a=0.01, P0 = 0.9, PA = 0.95, n = 400, 500
c. 2-proporciones à a=0.05, P0 = 0.5, PA = 0.6, n = 250, 350
d. 2-proporciones à a=0.01, P0 = 0.9, PA = 0.95, n = =400, 500
                                                             228
229
230
VI.B.4 Estimación puntual
      y por intervalo




                            231
           Estimación puntual y por
                   intervalo
   Las medias o desviaciones estándar calculadas de una muestra
    se denominan ESTADÍSTICOS, podrían ser consideradas como
    un punto estimado de la media y desviación estándar real de
    población o de los PARAMETROS.

   ¿Qué pasa si no deseamos una estimación puntual como media
    basada en una muestra, qué otra cosa podríamos obtener como
    margen, algún tipo de error?



                 “Un Intervalo de Confianza”


                                                               232
                            Intervalo de confianza

                                                        Error de estimación




P(Z<= - Zexcel ) = alfa/2                             P(Z>= + Zexcel ) = alfa/2

                      Intervalo de confianza donde
                      se encuentra el parámetro con
                      un NC =1-
                                                                         233
            Estimación puntual y por
                    intervalo
   ¿Cómo obtenemos un intervalo de confianza?

    Estimación puntual + error de estimación

   ¿De dónde viene el error de estimación?

Desv. estándar X multiplicador de nivel de confianza deseado Z/2

Por Ejemplo: Si la media de la muestra es 100 y la desviación
   estándar es 10, el intervalo de confianza al 95% donde se
   encuentra la media para una distribución normal es:

    100 + (10) X 1.96 => (80.4, 119.6)           1.96 = Z0.025

                                                                 234
            Estimación puntual y por
                    intervalo
95% de Nivel de Confianza significa que sólo tenemos un 5% de
  oportunidad de obtener un punto fuera de ese intervalo.

Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la tabla Z veremos
   que para un área de 0.025, corresponde a una Z de 1.960.
       C. I.               Multiplicador Z/2
       99                       2.576
        95                     1.960
        90                     1.645
        85                     1.439
        80                     1.282
Para tamaños de muestra >30, o  conocida usar la distribución Normal
Para muestras de menor tamaño, o  desconocida usar la distribución t
                                                                235
   Estimación puntual y por
           intervalo
                                       
 para .n 30  X  Z 
                                  2        n
                                      
 para .n 30  X  t                         ; con n-1 gl.
                              2        n
( n  1) s 2                  ( n  1) s 2
                    2
                          
  2
                                  2       
        , n 1                        1       , n 1
    2                                      2

                      p (1  p )
  p  Z
                 2
                          n
                                                           236
Para n grande el IC es pequeño




                           237
Para n grande el IC es pequeño




                           238
                        Ejemplo
   Dadas las siguientes resistencias a la tensión: 28.7,
    27.9, 29.2 y 26.5 psi

Estimar la media puntual
    X media = 28.08 con S = 1.02


Estimar el intervalo de confianza para un nivel de
  confianza del 95% (t = 3.182 con n-1=3 grados de
  libertad)
    Xmedia±3.182*S/√n = 28.08±3.182*1.02/2=(26.46, 29.70)

                                                       239
        Ejemplos para la media con
           Distribución normal Z

Z 1. El peso promedio de una muestra de 50 bultos de productos
  Xmedia = 652.58 Kgs., con S = 217.43 Kgs. Determinar el intervalo
  de confianza al NC del 95% y al 99% donde se encuentra la media
  del proceso (poblacional). Alfa = 1 - NC

 2. Un intervalo de confianza del 90% para estimar la ganancia
 promedio del peso de ratones de laboratorio oscila entre 0.93 y
 1.73 onzas. ¿Cuál es el valor de Z?.

 3. 100 latas de 16 onzas de salsa de tomate tienen una media de
 Xmedia = 15.2 onzas con una S = 0.96 onzas. ¿A un nivel de
 confianza del 95%, las latas parecen estar llenas con 16 onzas?.

 4. Una muestra de 16 soluciones tienen un peso promedio de 16.6
 onzas con S = 3.63. Se rechaza la solución si el peso promedio de
 todo el lote no excede las 18 onzas. ¿Cuál es la decisión a un 90%
 de nivel de confianza?.

                                                              240
   Ejemplos para la media y varianza
          con Distribución t

 t 5. 20 cajas de producto pesaron 102 grs. Con S = 8.5 grs. ¿Cuál
   es el intervalo donde se encuentra la media y varianza del lote
   para un 90% de nivel de confianza?. Grados libertad=20 -1 =19


6. Una muestra de 25 productos tienen un peso promedio de 23.87
   grs. Con una S = 9.56. ¿Cuál es la estimación del intervalo de
   confianza para la media y varianza a un nivel de confianza del
   95 y del 98% del peso de productos del lote completo?.

7. Los pesos de 25 paquetes enviados a través de UPS tuvieron
   una media de 3.7 libras y una desviación estándar de 1.2 libras.
   Hallar el intervalo de confianza del 95% para estimar el peso
   promedio y la varianza de todos los paquetes. Los pesos de los
   paquetes se distribuyen normalmente.


                                                              241
     Ejemplos para proporciones con
             Distribución Z

 Z 8. De 814 encuestados 562 contestaron en forma afirmativa.
  ¿Cuál es el intervalo de confianza para un 90% de nivel de
  confianza?

9. En una encuesta a 673 tiendas, 521 reportaron problemas de
   robo por los empleados ¿Se puede concluir con un 99% de nivel
   de confianza que el 78% se encuentra en el intervalo de
   confianza. ?




                                                          242
       Instrucciones con Minitab
 Intervalo de confianza para la media

Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

En Options:

     Indicar el Confidence level -- 90, 95 o 99%

OK



                                                            243
          Instrucciones con Minitab
   Intervalo de confianza para proporción


Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data
Number of trials = n tamaño de la muestra
Number of events = D éxitos encontrados en la muestra

En Options:
   Indicar el Confidence Interval -- 90, 95 o 99%

Seleccionar Use test and interval based in normal distribution




                                                                 244
VI.B.5 Pruebas de hipótesis para
medias, varianzas y proporciones




                              245
             Elementos de una
             Prueba de Hipótesis

Prueba Estadística- Procedimiento para decidir no rechazar Ho
aceptando Ha o rechazar Ho.

Hipótesis Nula (Ho) - Usualmente es una afirmación representando
una situación “status quo”. Generalmente deseamos rechazar la
hipótesis nula.

Hipótesis Alterna (Ha) - Es lo que aceptamos si podemos rechazar
la hipótesis nula. Ha es lo que queremos probar.




                                                                246
            Elementos de una
            Prueba de Hipótesis

Estadístico de prueba: Calculado con datos de la muestra (Z, t, X2
or F).

Región de Rechazo Indica los valores de la prueba estadística para
que podamos rechazar la Hipótesis nula (Ho). Esta región esta
basada en un riesgo  deseado, normalmente 0.05 o 5%.




                                                                247
 Pasos en la Prueba de Hipótesis
1. Definir el Problema - Problema Práctico


2. Señalar los Objetivos - Problema Estadístico


3. Determinar tipo de datos - Atributo o Variable


4. Si son datos Variables - Prueba de Normalidad




                                                    248
 Pasos en la Prueba de Hipótesis
5. Establecer las Hipótesis
  - Hipótesis Nula (Ho) - Siempre tiene el signo =, , 


      Ho : , 2 , , ,  parametrode la hipotesis

  - Hipótesis Alterna (Ha) – Tiene signos , > o <.


       Ha :  , 2 , , ,  parametro de la hipotesis

El signo de la hipótesis alterna indica el tipo de prueba a usar
                                                               249
Elementos de una Prueba de Hipótesis
Pruebas de Hipótesis de dos colas:
Ho: a = b     Región de                                 Región de
Ha: a  b     Rechazo                                   Rechazo

                              -Z     0       Z
Pruebas de Hipótesis de cola derecha:
Ho: a  b
Ha: a > b                                               Región de
                                                        Rechazo


                                        0       Z
Pruebas de Hipótesis cola izquierda:
Ho: a  b
Ha: a < b       Región de
                 Rechazo

                                -Z       0    Z
                                                             250
  Pasos en la Prueba de Hipótesis
6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%) o el
nivel de confianza NC = 1 - alfa


7. Establecer el tamaño de la muestra, >= 10.


8.Desarrollar el Plan de Muestreo


9.Seleccionar Muestras y Obtener Datos


10. Decidir la prueba estadística apropiada y calcular el
estadístico de prueba (Z, t, X2 or F) a partir de los datos.
                                                               251
           Estadísticos para medias,
           varianzas y proporciones
    X 
Z        ;Una.media; n  30;   conocida
   / n
   X 
t       ;Una.media; n  30;   desconocida
   S/ n
    S12
F  2 ; DF  n1  1, n2  1; prueba.dos. var ianzas
    S2
        X1  X 2
t                  ; dos.medias;  ' s  desconocidas. pero. 
           1     1
     Sp /     
           n1    n2
        ( n1  1) s1  ( n2  1) s2
                   2              2
Sp                                 ; DF  n1  n2  2
               n1  n2  2
      X1  X 2
t               ; dos.medias;  ' s  desconocidas.diferentes
       2     2
       s    s
       1
            2
       n1   n2
DF  formula.especial                                            252
                Estadísticos para medias,
                varianzas y proporciones
   Para el caso de muestras pareadas se calculan las
    diferencias d individuales como sigue:

               d
    t             ; Pares.de.medias; d i . para.cada. par
            Sd / n
                ( n  1) S 2
    X   2
                              ; DF  ( n  1); prueba.una.v ar ianza
                   2
               (O  E ) 2
    X   2
                        ; DF  ( r  1)(c  1); bondad .ajuste
                  E




                                                                        253
Pasos en la Prueba de Hipótesis
11. Obtener el estadístico correspondiente de tablas o Excel.


12.Determinar la probabilidad de que el estadístico de prueba
calculado ocurre al azar.


13.Comparar el estadístico calculado con el de tablas y ver si
cae en la región de rechazo o ver si la probabilidad es menor a
alfa, rechaze Ho y acepte Ha. En caso contrario no rechaze Ho.


14.Con los resultados interprete una conclusión estadística
para la solución práctica.
                                                          254
                                      Estadístico
                  Prueba de Hipótesis Calculado con
Pruebas de Hipótesis de dos colas:    Datos de la muestra
Ho: a = b      Región de                                Región de
Ha: a  b      Rechazo                                  Rechazo

                              -Z     0       Z
Pruebas de Hipótesis de cola derecha:
Ho: a  b
Ha: a > b                                               Región de
                                                        Rechazo


                                        0       Z
Pruebas de Hipótesis cola izquierda:
Ho: a  b
Ha: a < b       Región de
                 Rechazo

                                -Z       0    Z
                                                             255
Prueba de hipótesis para la varianza
   Las varianzas de la población se ditribuyen de
    acuerdo a la distribución Chi Cuadrada. Por tanto las
    inferencias acerca de la varianza poblacional se
    basarán en este estadístico

   La distribución Chi Cuadrada se utiliza en:
    Caso I. Comparación de varianzas cuando la varianza de
      la población es conocida

    Caso II. Comparando frecuencias observadas y
      esperadas de resultados de pruebas cuando no hay
      una varianza de la población definida (datos por
      atributos)
                                                     256
Prueba de hipótesis para la varianza
   Las pruebas de hipótesis para comparar una varianza
    poblacional a un cierto valor constante 0, si la
    población sigue la distribución normal es:




   Con el estadístico Chi Cuadrada con n-1 grados de
    libertad



                                                  257
 Prueba de hipótesis para la varianza




      2.17

Ejemplo: ¿El material muestra una variación (sigma) en la
   resistencia a la tensión menor o igual a 15 psi con 95% de
   confianza?. En una muestra de 8 piezas se obtuvo una S = 8psi.

X^2c =(7)(8)^2/(15)^2 = 1.99
Como La Chi calculada es menor a la Chi de Excel de 2.17 se debe
  rechazar la hipótesis nula. Si hay decremento en la resistencia
                                                           258
       Prueba de hipótesis para atributos
    Ejemplo: Un supervisor quiere evaluar la habilidad de 3
       inspectores para detectar radios en el equipaje en un
       aeropuerto.
    ¿Hay diferencias significativas para un 95% de confianza?

Valores         Inspector   Inspector 2   Inspector 3   Total por
observados O    1                                       tratamiento
Radios              27           25           22            74
detectados
Radios no           3            5             8            16
detectados
Total de la         30           30           30            90
muestra
                                                                 259
       Prueba de hipótesis para atributos
    Ho: p1 = p2 = p3
    Ha: p1  p2  p3
    Grados de libertad = (No. de columnas -1)*(No. renglones -1)
    Las frecuencias esperadas son: (Total columna x Total renglón)

Valores       Inspector    Inspector 2   Inspector 3   Total por
esperados E   1                                        tratamiento
Radios           24.67        24.67         24.67          74
detectados
Radios no        5.33         5.33          5.33           16
detectados
Total de la       30           30            30            90
muestra
                                                                260
  Prueba de hipótesis para atributos
El estadístico Chi Cuadrado en este caso es:




                                                           5.99




El estadístico Chi Cuadrada de alfa = 0.05 para 4 grados de
   libertad es 5.99.
El estadístico Chi Cuadrada calculada es menor que Chi de alfa,
   por lo que no se rechaza Ho y las habilidades son similares
                                                             261
Ejemplo de Prueba de hipótesis para la media
Para una muestra grande (n>30)probar la hipótesis de una media u
1.) Ho: 
2.) Ha: 
3.) Calcular el estadístico de prueba
4.) Establecer la región de rechazo
    Las regiones de rechazo para prueba de 2 colas: -Z y Z
                                                    
                                           Zcalc=    s
                                                     n

         Región de                                   Región de
         Rechazo                                     Rechazo
                                   0


                         -Z             Z


Si el valor del estadístico de prueba cae en la región de rechazo
rechazaremos Ho de otra manera no podemos rechazar Ho.
                                                                    262
   Prueba de hipótesis de una población
       para muestras grandes con Z
¿Parecería ser correcta la afirmación de que se mantiene el precio promedio de las computadoras en $2,100?
Probarlo a un 5% de nivel de significancia
                                Datos
Minoristas          n                   64               media mu =               2100
Precio prom.        X                 2251
Desv. Estándar s                       812                        (Alfa =          0.05
Paso 1. Establecimiento de hipótesis
              Ho: uC = 2100                              Se inicia con el planteamiento de la hipótesis nula
             Ha: uC <> 2100             Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc
          X   HIPOTESIS.NULA                  151 = > Zc = 1.48768473
     Zc 
                    s
                                                  101.5     Error estándar
                     n
              Como el valor de Zc es positivo se comparará contra de Zexcel (1-alfa/2) positivo
Paso 3. Determinar la Ze de Excel o de tablas para el valor de probabilidad (Alfa / 2):
         Ze ( 0.025 ) =      1.95996398                 DIST.NORM.STAND.INV.( -0.025 )                         263
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene




    P(Z<= - Zexcel ) = alfa/2                                      P(Z>= + Zexcel ) = alfa/2




     Zexcel (      #¡REF!   )                               Zexcel (              -0.025 )
                -1.95996398                                  1.959963985
                                   Zc =       1.487684729
                Como Zc es menor que Zexcel, no cae en el área de rechazo,
                y por tanto no hay suficiente evidencia para RECHAZAR Ho
                Se concluye que el precio promedio no es diferente de $2,100
     O          Como el valor P = 0.068 correspondiente a la Z calculada Zc es mayor
                que el valor de Alfa / 2 = 0.025, también nos da el criterio
                para NO RECHAZAR la Ho
Paso 5. El Intervalo de confianza para la media poblacional                     (1-Alfa = 0.95 Porciento)
              al nivel de confianza 1-Alfa

                                               s
  IC. para.estimar.  X  Z                               Error estándar
                                                            Z alfa/2
                                                                                   101.5
                                                                             1.95996398
                                          2     n
                                          Intervalo de confianza                    2251            198.936344
El intervalo de confianza incluye a la media de la hipótesis
por tanto no se rechaza la Ho.                 2052.064 <=  <=                              ### )           264
    Prueba de hipótesis de una población
       para muestras pequeñas con t
Se piensa que las ventas promedio de $5,775 se han incrementado gracias a la campaña publicitaria
Probar esta afirmación a un nivel de significancia alfa de 1%
                                                             Se inicia con el planteamiento de la hipótesis Alterna
                                Datos
Semanas             n                   15                   media mu =              5775
Ventas prom         X                6012
Desv. Estándar      s                  977                          (Alfa =           0.01     (1-Alfa =            0.99
                                                                 (Alfa/2 =          0.005    (1-Alfa/2 =          0.995
Paso 1. Establecimiento de hipótesis

                 Ho: uC <=            5775
             Ha: uV >              5775    Se      trata de una prueba de cola derecha
Paso 2. Cálculo del estadístico de prueba tc

          X   HIPOTESIS . NULA                        237     = > tc =     0.93950568
     tc 
                   s                          252.2603153       Error estándar
                                                                                        NOTA:En excel poner 2alfa
                    n                                                                   para obtener t de alfa
             Como el valor de tc es positivo se comparará contra de t excel (1- alfa) positivo
Paso 3. Determinar la te de Excel o de tablas para                 Alfa            0.01

          te (            0.99 2.62449406                     DIST.T.INV(                          0.02 , gl. 14 )
                 Gl=14;                                                                                              265
Paso 4. Comparando los valores tc calculado contra t excel se tiene




                                                               P(t >= + t excel ) = alfa




                                                          texcel (               0.02 gl. 14)
                                                            2.62449406
                                    tc =    0.939505684                            Valor p para tc es igual a
                                                                                   P(tc) =         0.368130427
             Como tc es menor que texcel, no cae en el área de               rechazo,             p > Alfa
             y por tanto no hay suficiente evidencia para rechazar Ho
             Se concluye que la publicidad no ha tenido efecto en las ventas
O             Como el valor de P para Zc es 0.368 mayor a              Alfa = 0.05 no se rechaza Ho
Paso 5. El Intervalo de confianza para la media poblacional al nivel        (1-Alfa =        99    Porciento)


                            s
  IC . para.estimar .  X  t                   Error estándar 252.260315
                         2   n                    Z alfa/2       2.62449406
Como el intervalo de confianza Intervalo de confianza                  6012                           662.0557002
contiene a la media Hipótesis no se rechaza Ho 5349.94 <=                     <=          6674.06 )
                                                                                                           266
                                  Prueba de hipótesis
                               para una proporción con Z
El gerente de mercado considera que el 50% de sus clientes gasta menos de $10 en cada visita a la tienda.
¿Estás de acuerdo con esta afirmación a un nivel de significancia del 5%?
                                                        Se inicia con el planteamiento de la hipótesis nula
                               Datos
Clientes           n                  50                Proporción media =        0.5
30 gastaron        p                 0.6
menos de$10                                                     (Alfa =         0.05      (1-Alfa =          0.95
                                                             (Alfa/2 =         0.025    (1-Alfa/2 =         0.975
Paso 1. Establecimiento de hipótesis

                 Ho :  c  0.5
                 Ha :  c  0.5                Se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc

          p   HIPOTESIS. NULA                      0.1    = > Zc =       1.41421356
Zc 
         HIP. NULA (1   HIP. NULA )
                                              0.07071068     Error estándar
                      n

               Como el valor de Zc es positivo se comparará contra de Zexcel (alfa/2) positivo

Paso 3. Determinar la Ze de Excel o de tablas para           (1-Alfa/2 =        0.975

         Ze ( (1-Alfa/2 =        1.95996398                DIST.NORM.STAND.INV.(                 0.975 )            267
 Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene




 P(Z <= - Zexcel ) = alfa/2                                      P(Z>= Zexcel ) = alfa/2




 Zexcel (             0.025 )                                  Zexcel (              0.975 )
               -1.95996398                                      1.95996398

                                        Zc =      1.41421356                                  Valor p para Zc es igual a
                                                                                              P(-Zc) =        0.07926984
 Como Zc es menor que Zexcel, no cae en el área de rechazo,                                                  p > Alfa /2
 y por tanto no hay suficiente evidencia para rechazar Ho y se concluye
 que el porcentaje que compra menos de $10 no difiere del 50% de clientes
 O          Como el valor P de Zc es 0.079 mayor a Alfa/2 no se rechaza Ho
 Paso 5. El Intervalo de confianza para la media poblacional al nivel             (1-Alfa =        95      Porciento)


                                     p (1  p )                Error estándar 0.07071068
IC . para.estimar .  p  Z                                  Z alfa/2       1.41421356
                                 2       n
                                               Intervalo de confianza                  0.6                             0.1
 Como la media de p = 0.6 se encuentra
 dentro del intervalo, no se rechaza Ho                    (       0.5       <=                0.7      )
                                                                                                                 268
      Instrucciones con Minitab para la
      prueba de hipótesis de una media

Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

Proporcionar la Media de la hipótesis Test Mean

En Options:
   Indicar el Confidence Interval -- 90, 95 o 99%

     Indicar el signo de la hipótesis alterna: Less Than, Not equal,
     Greater than
OK

                                                                 269
      Instrucciones con Minitab para la
   prueba de hipótesis de una proporción

Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data

Number of trials = n tamaño de la muestra
Number of events = D éxitos encontrados en la muestra

En Options:
   Indicar el Confidence Interval -- 90, 95 o 99%
   Indicar la Test Proportion Proporción de la hipótesis
   Indicar el signo de la hipótesis alterna: Less Than, Not equal,
   Greater than

Seleccionar Use test and interval based in normal distribution
OK
                                                                 270
    Pruebas de hipótesis para
comparación de varianzas, medias, y
          proporciones




                                271
                      Prueba de Hipótesis
   Supongamos que tenemos muestras de dos reactores que
    producen el mismo artículo. Se desea ver si hay diferencia
    significativa en el rendimiento de “Reactor a Reactor”.
          Reactor A      Reactor B
          89.7           84.7        Estadísticas Descriptivas
          81.4           86.1
          84.5           83.2        Variable   Reactor N   Media Desv.Std
          84.8           91.9
          87.3           86.3        Rendimiento A     10 84.24     2.90
          79.7           79.3                     B    10 85.54     3.65
          85.1           82.6
          81.7           89.1
          83.7           83.7
          84.5           88.5
                                                                     272
                       Prueba de Hipótesis
          Pregunta Práctica: Existe diferencia entre los reactores?

 Pregunta estadística ¿La media del Reactor B (85.54) es significativamente
 diferente de la media del Reactor A (84.24)? O, su diferencia se da por
 casualidad en una variación de día a día.

    Ho: Hipótesis Estadística:             Ha: Hipótesis Alterna: Las
     No existe diferencia entre los          medias de los Reactores son
     Reactores                               diferentes.

                             Ho:  a   b
                             Ha:       a  b

Se busca demostrar que los valores observados al parecer no
corresponden al mismo proceso, se trata de rechazar Ho.
                                                                           273
                      Prueba de Hipótesis



   Hipótesis Estadística: No             Hipótesis Alterna: Cuando las
    existe diferencia entre los            medias de Reactores son
    Reactores
                                           diferentes. A esto se le llama
   Esto se llama Hipótesis Nula           Hipótesis Alterna (Ha)
    (Ho)




Debemos demostrar que los valores que observamos al parecer no
corresponden al mismo proceso, que la Ho debe estar equivocada


                                                                   274
               ¿Qué representa esto?

Reactor A                                         Reactor B




              B      B B B B BB    BB      B
               A   AA   AAAA   A    A
            80.0    82.5   85.0    87.5    90.0     92.5
            ¿Representan los reactores dos procesos diferentes?

               ¿Representan los reactores un proceso básico?
                                                                  275
        Prueba F de dos varianzas
   Si se toman dos muestras de dos poblaciones normales con
    varianzas iguales, la razón de sus varianzas crea una
    distribución muestral F. Las hipótesis son las siguientes:




   El estadístico F se muestra a continuación donde S1 se
    acostumbra tomar como la mayor




                                                             276
         Prueba F de dos varianzas




   Sea S1 = 900 psi, n1 = 9, s2 = 300 psi, n2 = 7. A un 95% de nivel de
    confianza se puede concluir que hay menor variación?

Ho: Varianza 1 <= Varianza 2      H1: Varianza 1 > Varianza 2
Grados de libertad para Var1 = 8 y para var 2 = 6

Falfa = F(0.05, 8, 6) = 4.15
Fcalculada = (900^2)/(300^2) = 9 >> Falfa, se rechaza Ho.
Hay evidencia suficiente para indicar que la variación ya se ha
   reducido
                                                                 277
                      Prueba de hipótesis de dos pob.
                        comparando varianzas con F
Se quiere comprobar si las varianzas de dos diferentes métodos de ensamble de CDs son diferentes en prod .
A un nivel de siginificancia del 5% ¿Qué se puede concluir?

                              Método 1                    Método 2
No. De CDs          n1                15       n2                 17                    Alfa/2         0.025
Desv. Estan.        s1               5.4       X2                4.8
Varianza            s12           29.16        s22            23.04

Paso 1. Establecimiento de hipótesis

               Ho :  1 
                      2
                                  2
                                   2


               Ha :  1
                      2
                                 2
                                   2            Por tanto se trata de una prueba de dos colas

Paso 2. Cálculo del estadístico de prueba Fc
                                                                       Grados de libertad
                      2
                      s                          1.266                 Numerador = n1 - 1 =                  14
               Fc    1
                      2                                                Denominador = n2 - 1 =                16
                      s
                      2




               Tomamos a s12 como el mayor para comparar Fc contra Fexcel (1- Alfa/2)


Paso 3. Determinar la Fe de Excel o de tablas para          Alfa/2            0.025

               Fe (0.975) =   2.81701784                 DIST.F.INV (0.025, 14,16)
                                                                                                        278
Paso 4. Comparando los valores Fc calculado contra Fexcel (0.025) se tiene


    f(F)



                                                              P(F>= + 2.81 ) = alfa/2




                                           Fe(0.025) =    2.81701784

                                    Fc =          1.266           Valor p para Fc es igual a
                                                                  P(Fc) =         0.32259599
             Como Fc es menor que Fexcel, no cae en el área de rechazo,          p > Alfa / 2
             y por tanto no hay suficiente evidencia para rechazar Ho
             Se concluye que la varianza de los dos métodos de ensamble no difieren
             significativamente
                                                                                          279
                        Prueba de hipótesis de dos pob.
                        Comparando dos medias con Z
Investigar si el ambiente libre de tensiones mejoran el engorde y la calidad de la carne de vacas
Las varianzas poblacionales son desconocidas
Determinar el intervalo de confianza al 90% donde se encuentra la media. Alfa = 0.10

                               Vacas vacaciones             Vacas normales
Vacas                   n1                 50       n2                 50
Peso promedio           X1                112       X2              105.7
Desv. Estándar          s1               32.3       s2               28.7

Paso 1. Establecimiento de hipótesis

          Ho :  VV   VN                     Como el planteamiento es que las vacas de vacaciones
          Ha :  VV   VN                     ganan más peso, se inicia planeando la Ha

Paso 2. Cálculo del estadístico de prueba Zc

                         X1  X 2                         6.3     = > Zc =     1.03099301
                 Zc 
                              2    3
                             s1   s2
                                               6.110613717
                             n1 n2

                 Tomamos a X1 como el mayor para comparar Zc contra Ze positiva


Paso 3. Determinar la Ze de Excel o de tablas para una alfa de 0.1

                 Ze (0.90) =      1.28155157                    DIST.NORM.STAND.INV (0.90)            280
Paso 4. Comparando los valores Zc calculado contra Zexcel (0.90) se tiene




                                                                                    P(Z>= + 1.28) = 0.90




                                                                  Ze (0.90)= 1.28
                           Zc =   1.03099301                                        Valor p para Zc es igual a
                                                                                    P(-Zc) =             0.149402368
                                                                                                   p > Alfa
             Como Zc es menor que Zexcel, no cae en el área de rechazo,
             y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que no hay diferencia entre vacas de vacaciones y normales
Paso adicional. El Intervalo de confianza del 90% sobre la diferencia de medias poblacionales,
                 con sigmas desconocidas es:
                                     2
                               s12 s 2
                 X 1 X 2                      = Error estándar                   6.11061372
                               n1 n2               Z (alfa/2) =                      1.64485363

                 ( X 1  X 2 )  Z  / 2 s X 1 X 2 = Intervalo de confianza
                                                                               6.3 + -                 10.05106514
La diferencia es del orden de cero,es decir   (    -3.75107 < = u < =                16.3511 )
                                                                                                             281
                  Prueba de dos medias
                   muestras pequeñas




Sigmas descono-
cidas e iguales




                              Sigmas desconocidas
                              y desiguales          282
                   Prueba de hipótesis de dos pob.
                    Comparando dos medias con t
Investigar si hay diferencia en los promedios de las ventas diarias de dos tiendas
Las varianzas de las dos poblaciones son iguales pero desconocidas  1   2
                                                                            2     2

Determinar el intervalo de confianza al 99% donde se encuentra la media (alfa = 0.01)
                                 Tienda 1                   Tienda 2
Semanas               n1                 12       n2                  15
Ventas promedio X1                    125.4      X2                117.2
Desv. Estandar        s1               34.5       s2                21.5

Paso 1. Establecimiento de hipótesis

         Ho :  T 1   T 2
         Ha :  T 1   T 2               Por tanto se trata de una prueba de dos colas

Paso 2. Cálculo del estadístico de prueba tc

                  s1 (n1  1)  s 2 (n 2  1)
                   2              2
                                                             19564.25          Sp2 =      782.57
              s 
               2

                        n1  n 2  2
               p
                                                                       25

                     X1  X 2                         8.2   = > tc =        0.75684444
              tc 
                      s2       s3              10.8344589
                           
                       p        p

                      n1       n2
              Tomamos a X1 como el mayor para comparar tc contra te positiva
                Si se toma a X1 como la media menor se debe comparar Zc contra -Ze

Paso 3. Determinar la te de Excel o de tablas para una alfa de 0.01 que corresponde a alfa/2 = 0.005
             Se tienen n1 + n2 - 2 grados de libertad o sean 25
             te (0.01) =      2.78743581                 DIST.T.INV (0.01, 25)
                                                                                                     283
                                                                                    Asi es para dos colas
Paso 4. Comparando los valores tc calculado contra texcel (0.01) se tiene




      P(t<=-2.787 ) = alfa/2                                        P(t>=2.787 ) = alfa/2




               te(0.01,25) = -2.787                           te(0.01, 25) = 2.787
                                                                                            Valor p para tc es igual a
                                                tc = 0.7568                                 P(tc) =          0.46025521
                                                                                                            p > Alfa / 2
               Como tc es menor que texcel, no cae en el área de rechazo,
               y por tanto no hay suficiente evidencia para rechazar Ho
               Se concluye que no hay diferencia sig. En las ventas de las dos tiendas
Paso adicional. El Intervalo de confianza del 99% sobre la diferencia de medias poblacionales,
             con sigmas desconocidas es:
                  s2       s2
                       
                   p        p                   = Error estándar              10.8344589
                  n1       n2
                                  s2       s2   = Intervalo de confianza    (8.2 + - 2.787*10.83)
         ( X 1  X 2 )  t / 2        
                                   p        p

                                  n1 n2
                                                                            ( -21.98 <= u <= 38.38)
                                                                                                             284
Se observa una diferencia positiva sin embargo el cero está incluido
                     Prueba de hipótesis de dos pob.
                    Comparando datos pareados con t
Las muestras pareadas de tamaño 25 reportaron una diferencia media de 45.2 y una desviación
estándar de las diferencias de 21.6. Pruebe la igualdad de medias a un nivel del 5%.
Paso 1.       Establecimiento de Hipótesis
Ho : 1   2
Ha : 1   2                                               Grados de libertad = No. de pares - 1
                                                            No. Pares de muestras n =                 25
Paso 2.         Se calcula el estadístico tc:               Diferencia media =                      45.2
                                                            Desv. Estándar de difs. =               21.6
                                                            Alfa                                    0.05
                            d                                            gl          =                24
                    tc              =          10.462963
                            sd
                             n
Paso 3.         Se determina el valor crítico del estadístico t de Excel o tablas para   Alfa / 2              0.025

                t excel =        2.06389855                 DISTR.T.INV(0.05, 24)        Excel divide entre 2 colas
                                                                                                             285
Paso 4.       Comparando el estadístico tcalculado contra t excel (0.025, 24) se tiene:
                                                                            tc =        10.462963




   P(t<=-2.063 ) = alfa/2                                        P(t>=2.063 ) = alfa/2




              te(0.025,24) = -2.063                       te(0.025, 24) = 2.063
                                                                                         Valor p para tc es igual a
                                                                                         P(t > tc) =                  0
                                                                                                         p < Alfa / 2
              Como tc es mayor que t excel, si cae en el área de rechazo,
              y por tanto si hay suficiente evidencia para rechazar Ho y aceptar Ha
              se concluye que si hay diferencia significativa entre las medias
Paso 5.       El intervalo de confianza para las diferencias en medias pareadas es
                                                           t alfa/2   =                          2.063
                                                           Error estándar =                      0.864
                                                           Dif. Promedio =                        45.2
                                            sd
              I .C. para. d  d  t / 2                          45.2    +-                    0.864
                                             n
Se observa diferencia positiva significativa entre diferencia de medias   43.4176 <= dm < =46.9824
                                                                                                            286
                Prueba de hipótesis de dos pob.
              Comparando dos proporciones con Z
Investigar si tiene razon el analista sobre si los bonos convertibles se sobrevaloraron más que los
bonos de ingresos.
Probar la hipótesis a un 10% de nivel de significancia o error de equivocarse en rechazar Ho.
                              Convertibles                   Ingresos
Bonos                 n1                 312        n2                205               Alfa                    0.1
Sobrevalorad          X1                 202        X2                102               1-Alfa                  0.9
                                                                       7.8
                      p1               0.647        p2              0.498 Fracción de las muestras
Paso 1. Establecimiento de hipótesis
  Ho :  1   2  0....otra. forma....Ho :  1   2
                                                             Por tanto se trata de una prueba de cola derecha
                             .......... Ha :  1   2
  Ha :  1   2  0..........        ......
Paso 2. Cálculo del estadístico de prueba Zc
                p1  p2                            0.150    = > Zc =    3.393046759
Zc 
        p1 (1  p1 ) p2 (1  p2 )
                                           0.04417119
             n1          n2
             Tomamos a p1 como el mayor para comparar Zc contra Ze positiva (1- Alfa)
Paso 3. Determinar la Ze de Excel o de tablas para 1-Alfa                   0.9
             Ze (0.9) =      1.28155157            DIST.NORM.STAND.INV (0.9)
                                                                                                        287
Paso 4. Comparando los valores Zc calculado contra Zexcel (0.9) se tiene


                                                                                         Zc =    3.39304676



                                                                        P(Z>= + 1.28 ) = Alfa




                                                               Ze(0.9) =        1.281551566
                                                                                                Valor p para Zc es igual a
                                                                                                P(-Zc) =        0.00034946
                                                                                                               p < Alfa
                Como Zc es mayo que Zexcel, si cae en el área de rechazo,
                y por tanto hay suficiente evidencia para rechazar Ho y aceptar Ha
                Se concluye que la diferencia en conv. entre los bonos es significativa
Paso adicional. El Intervalo de confianza del 98% sobre la diferencia de medias poblacionales,
             con sigmas desconocidas es:
              p1 (1  p1 ) p 2 (1  p 2 )
s p1 p 2                                      = Error estándar               0.044171193
                   n1           n2               Zexcel (para alfa/2)           1.644853627

              ( p1  p 2 )  Z  / 2 s p1 p 2   = Intervalo de confianza (            0.150                 0.07265515
                Se observa difererencia positiva entre proporciones         (        0.077 <= PI <=               0.223
                el cero no está incluido en el intervalo
                                                                                                               288
                     Robustez
   Los procedimientos estadísticos se basan en
    supuestos acerca de su comportamiento teórico.
    Cuando los estadísticos obtenidos no son afectados
    por desviaciones moderadas de su expectativa
    teórica, se dice que son robustos.




                                                  289
Resumen




          290
     Instrucciones con Minitab para la
       comparación de dos varianzas

Stat > Basic Statistics > 2-variances

Seleccionar samples in different columns o Summarized data
First-- Indicar la columna de datos de la muestra 1
Second- Indicar la columna de datos de la muestra 2

En Options:
   Indicar el Confidence Interval -- 90, 95 o 99%


OK




                                                             291
    Instrucciones con Minitab para la
      comparación de dos medias

Stat > Basic Statistics > 2-Sample t

Seleccionar samples in different columns o Summarized data
First-- Indicar la columna de datos de la muestra 1
Second- Indicar la columna de datos de la muestra 2
Seleccionar o no seleccionar Assume equal variances de acuerdo a
    los resultados de la prueba de igualdad de varianzas

En Options:
   Indicar el Confidence Interval -- 90, 95 o 99%
   Indicar la diferencia a probar Test Difference (normalmente 0)
   Indicar el signo de la hipótesis alterna: Less Than, Not equal,
   Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK
                                                              292
  Instrucciones con Minitab para la
comparación de dos medias pareadas

Stat > Basic Statistics > Paired t

Seleccionar samples in columns o Summarized data
First sample -  Indicar la columna de datos de la muestra 1
Second sample - Indicar la columna de datos de la muestra 2

En Options:
   Indicar el Confidence Interval -- 90, 95 o 99%
   Indicar la diferencia a probar Test Mean (normalmente 0)
   Indicar el signo de la hipótesis alterna: Less Than, Not equal,
   Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK


                                                               293
     Instrucciones con Minitab para la
  prueba de hipótesis de dos proporciones

Stat > Basic Statistics > 2-Proportions

Seleccionar Summarized Data
                Trials:                           Events:
First:  No. de elementos de la 1ª. Muestra y D1 éxitos encontrados
Second: No. de elementos de la 2ª. Muestra y D2 éxitos encontrados

En Options:
   Indicar el Confidence Interval -- 90, 95 o 99%
   Indicar la Test Difference Normalmente 0
   Indicar el signo de la hipótesis alterna: Less Than, Not equal,
   Greater than

Seleccionar Use pooled estimate of p for test
OK
                                                               294
VI.B.7 Pruebas de bondad de
           ajuste




                         295
                           Bondad de ajuste
PRUEBAS DE BONDAD DE AJUSTE

Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma
de distribución particular planteada como hipótesis
Si el ajuste es razonablemente cercano, puede concluirse que sí exite la forma de distribución
planteada como hipótesis

Por ejemplo:

Ho: La distribución poblacional es uniforme
Ha: La distribución poblacional no es uniforme

Se usa el estadístico Chi-Cuadrado

             (Oi  Ei) 2
               K
      
       2

        i 1     Ei

Oi = Frecuencia de los eventos observados en los datos muestrales

Ei = Frecuencia de los eventos esperados si la hipótesis nula es correcta
     Para que la prueba sea confiable Ei >= 5. De otra forma se combinan las categorias para
     cumplir con este requisito.
K = Número de categorías o clases
                                                                                           296
                             Bondad de ajuste
Ejemplo:

Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperaría que se vendieran
12 botes / mes. La cantidad real que se vendió fue:

             Ventas (Oi) Ventas (Ei)
Tipo de bote observadas esperadas
     A           15          12
     B           11          12
     C           10          12
     D           12          12
                                                                    DISTR.CHI


Entonces el estadístico Chi Cuadrado de la muestra es = 1.17 el valor P corresp.=     0.76020818

El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 3

Chi cuadrado de excel = 7.815

El estadístico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se acepta
la hipótesis nula

                                                      PRUEBA.CHI.INV                       297
       Prueba de Bondad de ajuste
      para la distribución de Poisson
1. Plantear la hipótesis nula y alterna
    Ho: La población tiene una distribución de prob. De Poisson
    Ha: Caso contrario
2. Tomar una muestra aleatoria, anotar la frecuencia observada fi y
   calcular la media de ocurrencias 
3. Calcular la frecuencia esperada de ocurrencias ei. Multiplicar el
   tamaño de muestra con la prob. de Poisson para cada valor de
   la variable aleatoria. Si hay menos de 5 combinar las categorías
                                                       n
                                                         ( f i  ei ) 2
                                              2
                                                   
4. Calcular el estadístico de prueba                i 1       ei


                     2  
                           2
5. Rechazar Ho si              o si p < alfa. Con gl=k-p-1 y alfa nivel de
   significancia
                                                                          298
                     Ejemplo:
           Distribución de Poisson =5
Ho: No. de clientes que llega en intervalos de 5 min. tiene una distribución
   de Poisson     Ha: No se sigue una distribución de Poisson
Clientes        Frec. observada      f(x) de Poisson    128*f(x) cantidad
                                                           esperada
   0                   2                 0.0067               0.8576
   1                   8                 0.0337               4.3136
   2                   10                0.0842              10.7776
   3                   12                0.1404              17.9712
   4                   18                0.1755              22.4640
   5                   22                0.1755              22.4640
   6                   22                0.1462              18.7136
   7                   16                0.1044              13.3662
   8                   12                0.0653               8.3584
   9                   6                 0.0363               4.6464
10 o más                                 0.0318               4.0704
                                                                    299
                     Ejemplo:
           Distribución de Poisson =5
Combinando X=0,1 y X=9, 10 o más para que la frecuencia observada sea
  mayor a 5 y se pueda aplicar la distribución Chi Cuadrada se tiene
Clientes      Frec. Observada     f(x) de Poisson      128*f(x)
                     (fi)                             frecuencia
                                                     esperada (ei)
 0o1                10           0.0067+0.0337          5.1712
   2                10                0.0842           10.7776
   3                12                0.1404           17.9712
   4                18                0.1755           22.4640
   5                22                0.1755           22.4640
   6                22                0.1462           18.7136
   7                16                0.1044           13.3662
   8                12                0.0653            8.3584
9 o más              6           0.0363+0.0318          8.7168
                                                              300
          Estadístico y conclusión
Con los datos anteriores se calcula el estadístico Chi cuadrada que
  se compara con Chi Cuadrada de alfa para k-p-1 grados de
  libertad (K – categorías: 9, p – parámetros a estimar: 1 media).

            ( f i  ei ) 2
            n
     
      2

       i 1       ei

Ho se rechaza si     o si p es mayor que alfa.
                  2    2




El valor de Chi Cuadrada calculado es de 10.9766 y el valor Chi
    Cuadrada de alfa 0.05 con 2 gl. Es de 14.07 no se rechaza Ho
En este caso p = 0.14 > 0.05 por tanto no se rechaza Ho y se
    concluye que los datos siguen una distribución de Poisson
                                                             301
        Prueba de Bondad de ajuste
         para la distribución Normal
1. Plantear la hipótesis nula y alterna
    Ho: La población tiene una distribución de prob. Normal
    Ha: Caso contrario

2. Tomar una muestra aleatoria, calcular la media  y la desviación
   estándar

3. Definir K intervalos de valores de forma que la frecuencia
   esperada sea 5 cuando menos para cada uno (intervalos de
   igual probabilidad). Anotar la frecuencia observada de los
   valores de datos fi, en cada intervalo


                                                              302
        Prueba de Bondad de ajuste
         para la distribución Normal
4. Calcular el número de ocurrencias esperado ei, para cada
   intervalo de valores. Multiplicar el tamaño de muestra por la
   probabilidad de que una variable aleatoria esté en el intervalo.
                                                   n
                                                     ( f i  ei ) 2
5. Calcular el estadístico de prueba      2
                                               
                                                i 1       ei


6. Rechazar Ho si     o si p < alfa. Con gl=k-p-1 y alfa nivel
                    2   2


   de significancia




                                                                      303
        Prueba de Bondad de ajuste
         para la distribución Normal
   Ejemplo: datos de calificaciones: Media = 68.42; S = 10.41


                       Calificaciones
        71       66      61      65      54     93
        60       86      70      70      73     73
        55       63      56      62      76     54
        82       79      76      68      53     58
        85       80      56      61      61     64
        65       62      90      69      76     79
        77       54      64      74      65     65
        61       56      63      80      56     71
        79       84                                        304
        Prueba de Bondad de ajuste
         para la distribución Normal
Ho: la población tiene una distribución normal con media 68.42 y
  S=10.41 Ha: Caso contrario

Para una muestra de 50 con una frecuencia mínima esperada de 5
   se tiene el 10% al menos por cada celda

La primera celda correspondiente al 10% está en Z = -1.28 con
X = (Media - Z*S) = 55.10

Para el área del 20%, Z = -0.84 y X = 59.68
y así sucesivamente


                                                           305
       Prueba de Bondad de ajuste
        para la distribución Normal
Intervalo       Frecuencia       Frecuencia      Se registran las
                observada (fi)   esperada (ei)   frecuencias de
Menos de              5                5         los datos
55.10                                            tomados de las
55.10 a 59.68         5                5         calificaciones
59.68 a 63.01         9                5
63.01 a 65.82         6                5
65.82 a 68.42         2                5
68.42 a 71.02         5                5
71.02 a 73.83         2                5
73.83 a 77.16         5                5
77.16 a 81.74         5                5
81.74 o más           6                5
                      50              50                       306
          Prueba de Bondad de ajuste
           para la distribución Normal
   Se determina el estadístico Chi Cuadrado = 7.2

            ( f i  ei ) 2
            n
     
      2

       i 1       ei

   El Valor de Chi Cuadrado de alfa = 0.10 para k – p – 1 grados
    de libertad. K = 10 categorías, p = 2 parámetros. Gl = 7. Chi
    Cuadrado es 12.017

   Como   2    no se puede rechazar la hipótesis nula de
                  2


    normalidad de las calificaciones


                                                                307
      Prueba de Bondad de ajuste
     para la distribución Multinomial
1. Enunciar la hipótesis nula y alternativa
   Ho: La población sigue una distribución de probabilidad
   multinomial con probabilidades especificadas para cada una de
   las K categorías    Ha: Caso contrario

2. Tomar una muestra aleatoria y anotar las frecuencias
   observadas fi para cada categoría

3. Suponiendo que Ho es cierta, determinar la frecuencia esperada
   ei, en cada categoría multiplicando la probabilidad de la
   categoría por el tamaño de muestra


                                                           308
         Prueba de Bondad de ajuste
        para la distribución Multinomial
4. Se determina el estadístico Chi Cuadrado de prueba


           ( f i  ei ) 2
               n
     2

      i 1       ei
5. Regla de rechazo:

             2  
                   2
   Si                  no se puede rechazar la hipótesis nula

   Rechazar si el valor p es menor a alfa

Con alfa nivel de significancia y los grados de libertad son k-1

                                                                309
      Prueba de Bondad de ajuste
     para la distribución Multinomial
Ejemplo: El año pasado la participación de mercado para la
   empresa A fue del 30%, 50% para la empresa B y 20% para la
   empresa C. La empresa C hace una prueba con un nuevo
   producto para estimar su impacto en las preferencias del
   mercado.

Se tomó una muestra de 200 clientes resultando preferencias de
   compra de: 48 para A, 98 para B y 54 para C.

De acuerdo a las probabilidades esperadas, en los 200 clientes las
  preferencias esperadas son: A=200*0.3=60, B=200*0.5=100,
  C=200*0.2=40

                                                            310
      Prueba de Bondad de ajuste
     para la distribución Multinomial
Datos para calcular el estadístico de prueba Chi Cuadrado

Categoría     Proporción     Frecuencia    Frecuencia
              hipotética     observada     esperada

Empresa A          0.3            48             60

Empresa B          0.5            98            100

Empresa C          0.2            54             40




                                                            311
      Prueba de Bondad de ajuste
     para la distribución Multinomial
Chi Cuadrado calculado = 7.34

Chi cuadrado de alfa = 0.05 con k – 1 = 2 grados de libertad = 2
   es de 5.99. El valor p correspondiente es de 0.025.

Como 7.34 es mayor a 5.99 o el valor p de 0.025 es menor a alfa
  de 0.05 se rechaza la hipótesis nula Ho y se concluye que el
  nuevo producto modificará las preferencias del mercado
  actuales

La participación de la empresa C aumenta con el nuevo producto


                                                           312
                Prueba de Bondad
               de ajuste en Minitab
La columna C1 – Observadas contiene las frecuencias observadas
   y la C2 – esperadas las frecuencias esperadas

Calc > Calculator > Store result in variable ChiCuadrada
    Teclear en el cuadro de expresión sum((Observadas-
      Esperadas)**2/Esperadas)

Calc > Probability distributions > Chi Square
    Seleccionar Cummulative probability
    Degrees of freedom 2
    Input column ChiCuadrada; Optional Storage CumProb OK
Calc > Calculator > Store results in variable p
    En el cuadro Expression teclear 1-CumProb
    OK
                                                           313
                  Prueba de Bondad
                 de ajuste en Minitab
     Ejemplo: investigación de mercado




Observadas Esperadas ChiCuadrada          CumProb       p
      48         60           7.34        0.974524   0.0254765
      98        100
      54         40




                                                         314
                 Prueba de Bondad
                 de ajuste en Excel
   Ejemplo: investigación de mercado

1. Calcular el estadístico Chi Cuadrada con =(A2-B2)^2/B2 y Suma
   Chi cuadrada = 7.34
2. El valor P es =distr.chi(7.34, 2)

3. El estadístico Chi Cuadrada de alfa es:
   =prueba.chi.inv(0.05,2) = 5.99

4. Como p es menor a alfa de 0.05 se rechaza la Ho



                                                          315
   VI.B.6 ANOVA para un factor
principal y una o más variables de
              bloqueo




                                316
                     Introducción
   Cuando es necesario comparar 2 o más medias poblacionales al
    mismo tiempo, para lo cual se usa ANOVA.

   El método ANOVA tiene los siguientes supuestos:
      La varianza es la misma para todos los tratamientos del

        factor en todos sus niveles
      Las mediciones indiviudales dentro de cada tratamiento se

        distribuyen normalmente
      El término de error tiene un efecto distribuido normalmente

        e independiente




                                                            317
                    Contenido
   ANOVA de un factor o dirección

   ANOVA de un factor y una variable de bloqueo

   ANOVA de un factor y dos variables de bloqueo –
    CUADRADO LATINO

   ANOVA de un factor y tres variables de bloqueo –
    CUADRADO GRECOLATINO


                                                   318
ANOVA de un factor
   o dirección




                     319
                    Introducción
   Con el ANOVA las variaciones en la respuesta se dividen
    en componentes que reflejan los efectos de una o más
    variables independientes

   La variabilidad se representa como la suma de cuadrados
    total que es la suma de cuadrados de las desviaciones de
    mediciones individuales respecto a la gran media, se
    divide en:
      Suma de cuadrados de las medias de los tratamientos

      Suma de cuadrados del residuo o error experimental




                                                       320
        ANOVA – Prueba de hipótesis para
         probar la igualdad de medias de
         varias poblaciones para un factor
Se trata de probar si el efecto de un factor o
Tratamiento en la respuesta de un proceso o sistema es
Significativo, al realizar experimentos variando
Los niveles de ese factor (Temp. 1, Temp. 2, Temp.3, etc.)



Ho : 1  2  3  ......... a
Ha : A lg unas. ' s.son.diferentes
                                                   321
               ANOVA - Condiciones
   Todas las poblaciones son normales

   Todas las poblaciones tiene la misma varianza

   Los errores son independientes con distribución
    normal de media cero

   La varianza se mantiene constante para todos los
    niveles del factor

                                                    322
              ANOVA – Ejemplo de datos
Niveles del Factor Peso % de algodón y Resistencia de tela
 Peso porc.            Respuesta
 de algodón       Resistencia de la tela
      15       7            7            15   11   9
      20       12          17            12   18   18
      25       14          18            18   19   19
      30       19          25            22   19   23
      35       7           10            11   15   11
                                                   323
    ANOVA – Suma de
     cuadrados total

                            Xij


                                  Gran media


               Xij
         a           b                2

SCT      ( Xij  X )
        i 1         j 1
                                          324
ANOVA – Suma de cuadrados de
  renglones (a)-tratamientos
 Media Trat. 1                Media Trat. a


            a renglones
                                       Gran media



                                   a

    Media trat. 2
                          SCTr   b( X i  X )     2

                                  i 1
                                              325
  ANOVA – Suma de cuadrados
           del error
                      X2j                         X3j
X1j

       Media X1.
                                                  Media X3.
                               Media X2.

      Muestra 1              Muestra 2            Muestra 3

                  a   b
      SCE           (X       ij    X i)   2

              i 1    j 1                              326
  ANOVA – Suma de cuadrados
           del error
                   X2j                 X3j
X1j

       Media X1.
                                       Media X3.
                           Media X2.

      Muestra 1          Muestra 2     Muestra 3



        SCE  SCT  SCTr
                                             327
     ANOVA – Grados de libertad:
     Totales, Tratamientos, Error


gl.SCT  n  1
gl.SCTr  a  1
gl.SCE  (n  1)  (a  1)  n  a
                                328
 ANOVA – Cuadrados medios:
  Total, Tratamiento y Error

MCT  SCT /(n  1)
MCTr  SCTr /(a  1)
MCE  SCE /(n  a)

                           329
     ANOVA – Cálculo del estadístico
             Fc y Fexcel

     MCTr
Fc 
     MCE
Fexcel  FINV ALFA, gl .SCTr , gl .SCE


                                  330
                             Tabla final de ANOVA
TABLA DE ANOVA

FUENTE DE VARIACIÓN           SUMA DE GRADOS DE CUADRADO                    VALOR F
                             CUADRADOS LIBERTAD MEDIO

Entre muestras (tratam.)       SCTR           a-1       CMTR                CMTR/CME

Dentro de muestras (error)      SCE           n-a        CME

Variación total                 SCT           n-1        CMT


Regla: Rechazar Ho si la Fc de la muestra es mayor que la F de Excel para una cierta alfa
o si el valor p correspondiente a la Fc es menor al valor de alfa especificado

                                                                                      331
      ANOVA – Toma de decisión

Distribución F                 Fexcel



                                   Alfa


   Zona de no rechazo de Ho        Zona de rechazo
   O de no aceptar Ha              De Ho o aceptar Ha

                          Fc
                                              332
         ANOVA – Toma de decisión

Si Fc es mayor que Fexcel se rechaza Ho
Aceptando Ha donde las medias son diferentes

O si el valor de p correspondiente a Fc es
menor de Alfa se rechaza Ho



                                             333
    ANOVA – Identificar las medias
   diferentes por Prueba de Tukey T
                         CME
T  q , a , n  a
                          b
Para diseños balanceado
(mismo número de columnas
en los tratamientos) el valor
de q se determina por medio
de la tabla en el libro de texto
                                   334
       ANOVA – Identificar las medias
      diferentes por Prueba de Tukey T
Se calcula la diferencia Di entre cada par de Medias Xi’s:

D1 = X1 – X2     D2 = X1 – X3 D3 = X2 – X3 etc.

Cada una de las diferencias Di se comparan con el
valor de T, si lo exceden entonces la diferencia es
Significativa de otra forma se considera que las medias
Son iguales




                                                    335
        ANOVA – Identificar las medias
     diferentes por Prueba de Diferencia
           Mínima Significativa DMS

            2(CME ) F ,1,n a
      DMS 
                 b
Para diseños balanceados (los tratamientos
tienen igual no. De columnas), se calcula un
factor DMS contra el que se comparan las
diferencias Xi – Xi’. Significativas si lo exceden
                                              336
      Prueba DMS para Diseños no
             balanceados
           1 1
DMS j ,k     (CME) F ,a1,na
            b j bk 
                   
Para diseños no balanceados (los
tratamientos tienen diferente no. De
columnas), se calcula un factor DMS
Para cada una de las diferencias Xi – Xi’
                                            337
                          Ejemplo:
      Considerar un experimento de un factor (máquina)
       con tres niveles (máquinas A, B, C). Los datos se
       muestran a continuación y debe verificarse si existe
       diferencia significativa a un alfa = 0.05

Máquinas    Datos    Su      Prom.
                     ma




                                                       338
                                   Ejemplo:




La tabla completa de ANOVA es la siguientes:
  Fuentes                     Cuadrado
  De variación                medio
   Máquinas



Como el valor calculado de F(33.2) excede el valor crítico de F, se
rechaza la Hipótesis nula Ho                                          339
                       Ejemplo:
   Con Minitab: Stat>ANOVA>One way unstacked
   Responses (in separate columns) A B C
   Interpretar los resultados


        A         B         C

        5         2         1
        7         0         0
        6         1         -2
        7         -2        -3
        6         2         0

                                                340
                                                        Ejemplo:
One-way ANOVA: A, B, C
Source       DF            SS       MS        F         P

Factor        2    137.20        68.60    33.19     0.000 Rechazo Ho
Error        12     24.80         2.07
Total        14    162.00
S = 1.438          R-Sq = 84.69%           R-Sq(adj) = 82.14%
Individual 95% CIs For Mean Based on
                                         Pooled StDev
Level    N         Mean      StDev       ---------+---------+---------+---------+
A        5        6.200      0.837                                     (-----*----)
B        5        0.600      1.673            (----*-----)
C        5        -0.800        1.643    (-----*----)
                                         ---------+---------+---------+---------+
                                                  0.0       2.5    5.0         7.5
Pooled StDev = 1.438

                                                                                      341
              Corrida en Minitab
   Se introducen las respuestas en una columna C1
   Se introducen los subíndices de los renglones en una
    columna C2      Durability    Carpet
                         18.95   1
                         12.62   1
                         11.94   1
                         14.42   1
                         10.06   2
                         7.19    2
                         7.03    2
                         14.66   2
                                                   342
              Corrida en Minitab
   Opción: stat>ANOVA – One Way (usar archivo
    Exh_aov)
   En Response indicar la col. De Respuesta (Durability)

   En factors indicar la columna de subíndices (carpet)
   En comparisons (Tukey)

   Pedir gráfica de Box Plot of data y residuales Normal
    Plot y vs fits y orden

   Si los datos estan en columnas pedir ANOVA – One
    Way (unstacked)                               343
                                        Results for: Exh_aov.MTW
                              One-way ANOVA: Durability versus Carpet


                                            Resultados
                              Analysis of Variance for Durabili
              Source              DF            SS            MS            F           P
              Carpet               3        111.6           37.2          2.60     0.101
                              Error            12       172.0          14.3
                                       Total          15       283.6
                                                             Individual 95% CIs For Mean
                                                                Based on Pooled StDev
Level             N           Mean        StDev       ---------+---------+---------+-------
      1                   4        14.483           3.157                  (-------*-------)
              2                   4       9.735         3.566      (-------*--------)
          3                   4       12.808         1.506           (--------*-------)
  4                   4       17.005           5.691                         (-------*-------)
                                                      ---------+---------+---------+-------
   Pooled StDev =                 3.786                            10.0          15.0       20.0
                                   Tukey's pairwise comparisons
                                       Family error rate = 0.0500
                                  Individual error rate = 0.0117
                                       Critical value = 4.20                                   344
ANOVA de dos vías un factor
 principal y una variable de
           bloqueo




                          345
                ANOVA de 2 vías
   Este es un procedimiento extensión de los patrones
    del ANOVA de una vía con tres fuentes de variación:
    Tratamiento del factor A (columnas), Tratamiento del
    factor B (renglones) y Error experimental.

    X ijk   Ef . Ai  Ef .B j  Ef . AxBij   kij




                                                       346
      ANOVA – Prueba de hipótesis para
       probar la igualdad de medias de
       varias poblaciones con dos vías
Se trata de probar si el efecto de un factor o
Tratamiento en la respuesta de un proceso o sistema es
Significativo, al realizar experimentos variando
Los niveles de ese factor (Temp.1, Temp.2, etc.)
POR RENGLON
Y
Considerando los niveles de otro factor que se piensa
Que tiene influencia en la prueba – FACTOR DE BLOQUEO
POR COLUMNA
                                                        347
                ANOVA – 2 vías
      Para el tratamiento – en renglones

Ho : 1   2  3  .........  a
                             
Ha : A lg unas. ' s.son.diferentes
     Para el factor de bloqueo – en columnas

Ho :  '1   '2   '3  .........  'a
                                  
Ha : A lg unas. ' s.son.dif erentes
                                               348
           ANOVA 2 vías - Ejemplo

                Experiencia en años de los operadores
Maquinas   1       2           3          4         5
 Maq 1       27        31         42         38       45
 Maq 2       21        33         39         41       46
 Maq 3       25        35         39         37       45
                                                  349
    ANOVA – Dos vías o direcciones
   La SCT y SCTr (renlgones) se determina de la misma
    forma que para la ANOVA de una dirección o factor

   En forma adicional se determina la suma de
    cuadrados del factor de bloqueo (columnas) de forma
    similar a la de los renglones

   La SCE = SCT – SCTr - SCBl



                                                 350
        ANOVA de 2 vías
        b
SCBl   a ( X j  X )   2

        j 1

gl.SCBl  b  1
CMBl  SCBl /(b  1)
                             351
          ANOVA de 2 vías


SCE  SCT  SCTr  SCBl
gl.SCE  (n  a)(n  b)
CME  SCBl /(n  a)(n  b)

                             352
    ANOVA –Estadístico Fc y Fexcel

     MCTr
Fc 
     MCE
Fexcel  FINV ALFA, gl .SCTr , gl .SCE


                                    353
         ANOVA – Estadístico Fb

     MCBl
Fc 
     MCE
Fexcel  FINV ALFA, gl .SCBl , gl .SCE


                                    354
                    Tabla final ANOVA 2 vías
FUENTE DE VARIACIÓN           SUMA DE GRADOS DE CUADRADO                    VALOR F
                             CUADRADOS LIBERTAD MEDIO

Entre muestras (tratam.)       SCTR           a-1       CMTR                CMTR/CME

Entre Bloques (Factor Bl)       SCBl          b-1       CMBL                CMBL/CME

Dentro de muestras (error)      SCE        (a-1)(b-1)    CME

Variación total                 SCT           n-1        CMT


Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
                                                                             355
    ANOVA – 2 vías: Toma de decisión

Distribución F                Fexcel



                                    Alfa


   Zona de no rechazo de Ho         Zona de rechazo
   O de no aceptar Ha               De Ho o aceptar Ha

                          Fc
                          Tr o Bl              356
       ANOVA – 2 vías: Toma de decisión

Si Fc (Tr o Bl) es mayor que Fexcel se rechaza
Ho Aceptando Ha donde las medias son
diferentes

O si el valor de p correspondiente a Fc (Tr o Bl)
es menor de Alfa se rechaza Ho


                                             357
            Cálculo de los residuales
yij  yi .  y. j  y..
ˆ                                          Y estimada

eij  yij  yij
            ˆ                              Error o residuo

              MSE                           Error estándar
s yi . 
               b
Rk  r0.05, k , gl . MSE * s yi .       Factor de comparación


Si la diferencia de medias excede a Rk es significativa
                                                          358
          Adecuación del modelo
   Los residuales deben seguir una recta en la gráfica
    normal

   Deben mostrar patrones aleatorios en las gráficas de
    los residuos contra el orden de las Yij, contra los
    valores estimados y contra los valores reales Yij




                                                    359
                 Corrida en Minitab
   Se introducen las respuestas en una columna C3 y los
    subíndices de renglones en columna C4 y de columnas en C5

       Plantas     Suplemento      Lago
         34            1           Rose
         43            1           Rose
         57            1         Dennison
         40            1         Dennison
         85            2           Rose
         68            2           Rose
         67            2         Dennison
         53            2         Dennison
         41            3           Rose
         24            3           Rose
         42            3         Dennison
         52            3         Dennison
                                                         360
              Corrida en Minitab
   Opción: stat>ANOVA – Two Way (usar archivo
    Exh_aov)

   En Response indicar la col. De Respuesta (Plantas)

   En Row factor y Column Factor indicar las columnas
    de subíndices de renglones y columnas (suplemento
    y lago) y Display Means para ambos casos

   Pedir gráfica residuales Normal Plot y vs fits y orden
                                                     361
              Two-way ANOVA: Zooplankton versus Supplement, Lake
                       Analysis of Variance for Zooplank
       Source             DF               SS            MS          F           P


                                  Resultados
       Suppleme               2       1919              959        9.25      0.015
       Lake                   1            21            21        0.21      0.666
       Interaction            2        561              281        2.71      0.145
                      Error             6             622           104
                          Total                 11          3123
                                                     Individual 95% CI
Suppleme               Mean       --+---------+---------+---------+---------
              1                      43.5             (-------*-------)
              2                     68.3                                  (--------*-------)
                  3                    39.8      (--------*-------)
                                  --+---------+---------+---------+---------
                                     30.0            45.0          60.0        75.0
                                                     Individual 95% CI
Lake                   Mean       ------+---------+---------+---------+-----
 Dennison               51.8           (----------------*----------------)
   Rose                   49.2        (----------------*----------------)
                                  ------+---------+---------+---------+-----
                                       42.0            48.0          54.0        60.0   362
ANOVA de un factor y dos o
 tres variables de bloqueo

  CUADRADO LATINO Y
     GRECOLATINO

                         363
          ANOVA – 3 y 4 factores
   El diseño de Cuadrado latino utiliza dos factores de
    bloqueo adicionales al de Tratamiento

   EL diseño de Cuadrado Grecolatino utiliza tres
    factores adicionales al del Tratamiento

   El cálculo de suma de cuadrados para renglones y
    para columnas es similar al de ANOVA de un factor
    principal y otro de bloqueo



                                                     364
                        Cuadrado Latino
Años exp.                      Turno
Empleado            Mañana     Tarde   Noche
   1                 B=15      A=18    C=11

   2                 C=12      B=20       A=9

    3                A=17      C=19    B=10
 A, B, C = Máquinas 1, 2 y 3
                                                365
    ANOVA – Cuadrado Latino:
     Factor principal (A,B,C,D)
         b
SCTr   a ( X Tr  X )   2

         j 1

gl.SCTr  a  1  b  1
CMTr  SCTr /(b  1)
                              366
   ANOVA – Cuadrado Latino: Cálculo
              del error

SCE  SCT  SCTcol  SC Re ng  SCTr
gl.SCE  (a  2)(a  1)
CME  SCE /(a  2)(a  1)




                                 367
     ANOVA – Cálculo del estadístico
             Fc y Fexcel

     MCTr
Fc 
     MCE
Fexcel  FINV ALFA, gl .SCTr , gl .SCE


                                  368
     ANOVA – Cuadrado Latino Reng / Col
         MC Re ng
Fcreng 
           MCE
        MCCols
Fcols 
         MCE
Fexcel  FINVALFA, gl .SCBl , gl .SCE
                                   369
                  Tabla final ANOVA 2 Factores
FUENTE DE VARIACIÓN           SUMA DE GRADOS DE CUADRADO     VALOR F
                             CUADRADOS LIBERTAD MEDIO

Renglores                      SCRen       a-1       CMRen   CMRen/CME

Columnas                       SCCol       b-1       CMCol   CMCol/CME

Tratamiento                     SCTr       a-1       CMTr    CMTr/CME

Dentro de muestras (error)      SCE     (a-2)(a-1)    CME

Variación total                 SCT        n-1        CMT

                                                             370
       Cuadrado latino en Minitab
   Se introducen las respuestas en una columna C1

   Se introducen los subíndices de los renglones en una
    columna C2

   Se introducen los subíndices de las columnas en una
    columna C3

   Se introducen las letras mayúsculas que indican el
    nivel del factor (A, B, C, D, etc.) correspondientes a
    cada respuesta en la columna C4
                                                      371
       Cuadrado latino en Minitab
   Opción: stat> ANOVA – General linear model

   En Response indicar la col. De Respuesta,

   En Model indicar las columnas de los factores y

   En Random factors indicar los factores adicionales al
    del efecto principal a probar (A, B, C, D). Se pueden
    pedir interacciones entre factores x – y con Cx*Cy

   Pedir gráfica de residuales Normal y vs fits y orden
                                                      372
                              Cuadrado Greco Latino
                                    Experiencia de los operadores

   Lotes MP               1                 2              3                 4                 5

        1              Aa=-1             Bc=-5           Ce=-6             Db=-1            Ed=-1

        2              Bb=-8             Cd=-1           Da=5              Ec=2             Ae=11

        3              Cc=-7             De=13           Eb=1              Ad=2             Ba=-4

        4               Dd=1              Ea=6           Ac=1              Be=-2            Cb=-3

        5              Ee=-3              Ab=5           Bd=-5             Ca=4              Dc=6


a, b, c y d son 5 diferentes tipos de montaje       A, B, C, D y E son las 5 formulaciones a probar
                                                                                               373
    Cuadrado Greco latino en Minitab
   Se introducen las respuestas en una columna C1
   Se introducen los subíndices de los renglones en una
    columna C2

   Se introducen los subíndices de las columnas en una
    columna C3
   Introducir los subíndices del factor adicional de letras
    griegas con letras latinas minúsculas (a,b,c,d,e) en C4

   Se introducen las letras mayúsculas que indican el nivel
    del factor (A, B, C, D, etc.) correspondientes a cada
    respuesta en la columna C5
                                                        374
     Cuadrado Greco latino en Minitab
   Opción: ANOVA – General linear model

   En Response indicar la col. De Respuesta,

   En Model indicar las columnas de los factores y

   En Random factors indicar los factores adicionales al del efecto
    principal a probar (A, B, C, D). También se pueden indicar
    interacciones entre factores x-y con Cx * Cy

   Pedir gráfica de residuales Normal y vs fits y orden


                                                                  375
 ANOVA – Cuadrado Grecolatino

       b
SCG   a( X m  X )   2

      m 1

gl.SCG  b  1
CMG  SCG /(b  1)
                           376
     ANOVA de 2 factores – Suma de
     cuadrados, gl. y Cuadrado medio
              para el error

SCE  SCT  SCTr  SCG  SC Re n  SCCol
gl.SCE  (a  3)(a  1)
CME  SCE /(a  3)(a  1)




                                    377
    ANOVA – Cálculo del estadístico
            Fc y Fexcel

     MCG
Fc 
     MCE
Fexcel  FINV ALFA, gl .SCTr , gl .SCE


                                    378
      ANOVA – Cuadrado Grecolatino

     MCTr
Fc 
     MCE
Fexcel  FINV ALFA, gl .SCBl , gl .SCE


                                    379
                  Tabla final ANOVA 2 Factores
FUENTE DE VARIACIÓN           SUMA DE GRADOS DE CUADRADO     VALOR F
                             CUADRADOS LIBERTAD MEDIO

Renglores                      SCRen       a-1       CMRen   CMRen/CME

Columnas                       SCCol       b-1       CMCol   CMCol/CME
Letras griegas                  SCG        a-1        CMG     CMG/CME
Tratamiento                    SCTr        a-1       CMTr    CMTr/CME

Dentro de muestras (error)      SCE     (a-3)(a-1)    CME

Variación total                 SCT        n-1        CMT

                                                             380
ANOVA para diseño factorial AxB
   En un experimento factorial involucrando el factor A con (a)
    niveles y un factor B con (b) niveles, la suma de cuadrados se
    puede dividir en:
    SST = SS(A) + SS(B) + SS(AB) + SSE




                                                             381
VI.B.8 Tablas de contingencia
      Prueba   Chi 2 (2)




                            382
     ¿Para qué se utiliza?

     1. Para probar si una serie de datos
     observada, concuerda con el modelo (serie
     esperada) de la información.

     2. Para probar las diferencias entre las
     proporciones de varios grupos (tabla de
     contingencia).
 Para todos los casos,   Ho: No hay diferencia
                         Ha: Hay diferencia




2
                                                 383
         Ejemplo 1: Chi Cuadrada(            2   )

Se lanza una moneda al aire 100 veces y que
obtenemos 63 águilas y 37 soles.

¿La proporción de águilas y soles sucede por
casualidad? O, se concluye que la moneda está
“cargada”?



Ho: La moneda es buena

Ha: La moneda “está cargada”

                                                      384
               Ejemplo 1: Chi Cuadrada(                  2   )


               Observada       Esperada      (fo - fe)2
                  ( fo )         ( fe )            fe

 Aguilas           63             50       3.38
 Soles             37             50       3.38
                                               2 = 3.38 + 3.38
                                               2 = 6.76


                                          Estadístico Chi Cuadrada
           g      (fo - fe)2
 2 c=   S
         j=1
                       fe




                                                                  385
Ejemplo 1: Chi cuadrada
Función de Distribución Acumulada Chi2 con 1 grado de
libertad (d.f)
               2c             P(2c > x)
               6.7600    p = 1 - 0.9907 = 0.0093

              De tablas X2Crítica, (0.05, 1) = 3.8414

         Ho: La moneda es buena.
         Ha: La moneda está “cargada”.

Para un 95% de confianza antes de concluir que la moneda “está
cargada”, se requiere que X2c > X2Crítica o que el valor de p sea 
0.05.

Como p  0.05, se puede concluir -con un 95% de confianza -
que la moneda “está cargada”.
                                                                 386
   Cálculo en Excel del estadístico Chi cuadrada

1. Posicionarse en una celda vacía

2. Accesar el menú de funciones con Fx

3. Seleccionar STATISTICAL o ESTADÍSTICAS, CHIINV.

4. Dar valores de probabilidad (0.05) y grados de libertad,
normalmente (n - 1) para un parámetro o (# de renglones -1)
* (# de columnas - 1) para el caso de tablas de proporciones.




                                                          387
                    Tabla de Valores Críticos Seleccionados de Chi2
df     . 250       . 100       . 050       . 025       . 010       . 005       . 001            
 1     1. 323      2. 706      3. 841     5. 024      6. 635       7. 879     10. 828
 2     2. 773      4. 605      5. 991     7. 378      9. 210      10. 597     13. 816
 3     4. 108      6. 251      7. 815     9. 348      11. 345     12. 838     16. 266
 4     5. 385      7. 779      9. 488     11. 143     13. 277     14. 860     18. 467
 5     6. 626      9. 236     11. 070     12. 832     15. 086     16. 750     20. 515

6      7. 841     10. 645     12. 592     14. 449     16. 812     18. 548     22. 458
7      9. 037     12. 017     14. 067     16. 013     18. 475     20. 278     24. 322
8     10. 219     13. 362     15. 507     17. 535     20. 090     21. 955     26. 125
9     11. 389     14. 684     16. 919     19. 023     21. 666     23. 589     27. 877
10    12. 549     15. 987     18. 307     20. 483     23. 209     25. 188     29. 588

11    13. 701     17. 275     19. 675     21. 920     24. 725     26. 757     31. 264
12    14. 845     18. 549     21. 026     23. 337     26. 217     28. 300     32. 909
13    15. 984     19. 812     22. 362     24. 736     27. 688     29. 819     34. 528
14    17. 117     21. 064     23. 685     26. 119     29. 141     31. 319     36. 123
15    18. 245     22. 307     24. 996     27. 488     30. 578     32. 801     37. 697

16    19. 369     23. 542     26. 296     28. 845     32. 000     34. 267     39. 252
17    20. 489     24. 769     27. 587     30. 191     33. 409     35. 718     40. 790
18    21. 605     25. 989     28. 869     31. 526     34. 805     37. 156     43. 312
19    22. 718     27. 204     30. 144     32. 852     36. 191     38. 582     43. 820
20    23. 828     28. 412     31. 410     34. 170     37. 566     39. 997     45. 315

21    24. 935     29. 615     32. 671     35. 479     38. 932     41. 401     46. 797
22    26. 039     30. 813     33. 924     36. 781     40. 289     42. 796     48. 268
23    27. 141     32. 007     35. 172     38. 076     41. 638     44. 181     49. 728
24    28. 241     33. 196     36. 415     39. 364     42. 980     45. 558     51. 179
25    29. 339     34. 382     37. 652     40. 646     44. 314     46. 928     52. 620

26    30. 434     35. 563     38. 885     41. 923     45. 642     48. 290     54. 052
27    31. 528     36. 741     40. 113     43. 194     46. 963     49. 645     55. 476
28    32. 620     37. 916     41. 337     44. 461     48. 278     50. 993     56. 892
29    33. 711     39. 087     42. 557     45. 722     49. 588     52. 336     58. 302
30    34. 800     40. 256     43. 773     46. 979     50. 892     53. 672     59. 703

40    45. 616     51. 805     55. 758     59. 342     63. 691     66. 766     73. 402
50    56. 334     63. 167     67. 505     71. 420     76. 154     79. 490     86. 661
60    66. 981     74. 397     79. 082     83. 298     88. 379     91. 952     99. 607

 70    77. 577    85. 527     90. 531     95. 023     100 .42 5   104 .21 5   112 .31 7
 80    88. 130    96. 578     101 .87 9   106 .62 9   112 .32 9   116 .32 1   124 .83 9
 90    98. 650    107 .56 5   113 .14 5   118 .13 6   124 .11 6   128 .29 9   137 .20 8

                                                                                          388
100   109 .14 1   118 .49 8   124 .34 2   129 .56 1   135 .80 7   140 .16 9   149 .44 9
            Tabla de contingencia
   Una tabla de clasificación de dos vías (filas y columnas) que
    contiene frecuencias originales, se puede analizar para
    determinar si las dos variables (clasificaciones) son
    independientes o tienen una asociación significativa.

   La prueba Chi Cuadrada probará si hay dependencia entre las
    dos clasificaciones.

   Además se puede calcular el coeficiente de contingencia
    (correlación) que en todo caso muestra la fuerza de la
    dependencia



                                                              389
            Tabla de contingencia
   Para esta prueba se usa la prueba Chi Cuadrada donde:




   Entre mayor sea su valor, mayor será la diferencia de la
    discrepancia entre frecuencias observadas y teóricas. Esta
    prueba es similar a la de bondad de ajuste.




                                                             390
            Tabla de contingencia
   Ejemplo: Cada una de las 15 celdas hace una contribución al
    estadístico Chi Cuadrado (una celda)




   Asumiendo Alfa = 0.1 y Gl= (reng – 1)*(Col – 1) = 4*2 = 8 Chi-
    Cuadrado de alfa = 20.09
   Como Chi Cuadrada calculada >> Chi C. Alfa, se rechaza Ho de
    igualdad de resultados entre negocios

                                                            391
Ejemplo 2: Chi2 Para comparación de dos
grupos; ¿son las mismas proporciones?)
Ho: No existen diferencias en los índices de defectos de las dos máquinas.
Ha: Existen diferencias en los índices de defectos de las dos máquinas.

Los valores observados (fo) son los siguientes:

                      Partes buenas       Partes defectuosas

      máquina 1            fo = 517            fo = 17         Total = 534

      máquina 2            fo = 234            fo = 11          Total = 245
                                                                      779
                   Total       751                 28

El índice de defectos totales es 28 / 779 = 3.6%


                                                                        392
Ejemplo 2: Chi2 Para comparación de dos
grupos; ¿son las mismas proporciones?)
Cálculo de los valores esperados

                     Partes buenas        Partes defectuosas

      máquina 1       fo = 751*534/779   fo = 28*534/779       Total = 534

      máquina 2       fo = 751*245/779   fo = 28*245/779       Total = 245
                                                                      779
 Basados en este índice, los valores esperados (fe) serían:
                         Partes          Partes defectuosas
                         buenas
        máquina 1          530.53               3.47

        máquina 2           233.47              1.53
                                                                             393
Prueba de chi cuadrada:
Los conteos esperados están debajo de los conteos observados
       Partes buenas     Partes Defectuosas          Total
1      532                    2                      534
       530.53                 3.47

2         232                              3                                235
          233.47                           1.53
Total     764                              5                                769

Chi2 = 0.004 + 0.624 + 0.009 + 1.418 = 2.056
DF= 1; valor de p = 0.152

2 celdas con conteos esperados menores a 5.0

Nota: Chi cuadrada no podrá aplicarse en los casos donde los conteos seas menores a 5 en  20%
de celdas.
Si cualquiera de los conteos esperados en las celdas es menor a uno, no deberá usarse Chi2.

Si algunas celdas tienen un conteo menor a los esperados, ya sea combinando u omitiendo
renglones y/o columnas, las categorías pueden ser de utilidad.
                                                                                          394
                            Tabla de Chi2
                       Tabla de valores críticos seleccionados para Chi2



DF    .250     .100              .050            .025            .010       .005        .001
1    1.323    2.706              3.841           5.024           6.635      7.879       10.828
2    2.773    4.605              5.991
                                         .       7.378           9.210     10.597       13.816
3    4.108    6.251              7.815           9.348          11.345     12.838       16.266
4    5.385    7.779              9.488          11.143          13.277     14.860       18.467
5    6.626    9.236             11.070          12.832          15.086     16.750       20.515

 6    7.841   10.645            12.592          14.449          16.812     18.548       22.458
 7    9.037   12.017            14.067          16.013          18.475     20.278       24.322
 8   10.219   13.362            15.507          17.535          20.090     21.955       26.125
 9   11.389   14.684            16.919          19.023          21.666     23.589       27.877
10   12.549   15.987            18.307          20.483          23.209     25.188       29.588

11   13.701   17.275            19.675          21.920          24.725     26.757       31.264
12   14.845   18.549            21.026          23.337          26.217     28.300       32.909
13   15.984   19.812            22.362          24.736          27.688     29.819       34.528
14   17.117   21.064            23.685          26.119          29.141     31.319       36.123
15   18.245   22.307            24.996          27.488          30.578     32.801       37.697

16   19.369   23.542            26.296          28.845          32.000     34.267       39.252
17   20.489   24.769            27.587          30.191          33.409     35.718       40.790
18   21.605   25.989            28.869          31.526          34.805     37.156       43.312
19   22.718   27.204            30.144          32.852          36.191     38.582       43.820
20   23.828   28.412            31.410          34.170          37.566     39.997       45.315




                                                                                    395
Problema: Fugas
Beneficios Potenciales: $10,000 de ahorro en retrabajos, y en la
    reducción de tiempo de ciclo.

Variación en familias a probar
Operador a operador
Ho: No existe diferencia en los índices de defecto de los diferentes
    operadores
Ha: Existe diferencia en los índices de defecto de los diferentes
    operadores

Máquina a máquina
Ho: No existe diferencia en los índices de defecto de las diferentes
    máquinas
Ha: Existe diferencia en los índices de defecto de las diferentes
    máquinas

Tamaño de la muestra:
5000 + total de oportunidades (172 piezas)
                                                                 396
Prueba de chi2 (máquina a máquina)
Los conteos esperados están colocados debajo de los conteos observados
       Con fugas      Sin fugas       Total
   1   30             610             640
       32.11          607.89

  2     235           4217           4452
        223.38        4228.62

  3     3             253            256
        12.84         243.16

  4     18            334            352
        17.66         334.34

Total   286           5414           5700

Chi2 = 0.139 + 0.007 + 0.604 + 0.032 + 7.546 + 0.399 + 0.006 +
0.000 = 8.734
DF= (4-1)(2-1) = 3; valor P = 0.033
                                                              397
Prueba de chi2 (operador a operador)
 Los conteos esperados están colocados debajo de los conteos observados.
          Con gotera Sin gotera        Total
    1     6           122              128
          6.61        121.39

    2     1           127              128
          6.61        121.39

    3     200         3836             4036
          208.55      3827.45

    4     54          202              256
          13.23       242.77

    5     5           699              704
          36.38       667.62

    6     12          116              128
          6.61        121.39
 Total    278         5102             5380

 Chi2 = 0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475
 + 4.386 + 0.239 = 171.132
 DF= 5; valor P = 0.000                                                       398
¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?
             (en este caso, operador a operador y máquina a máquina)

Se utiliza un procedimiento denominado “Coeficiente de Contingencia” como clave
para determinar qué grupo de variación debe investigarse primero.

                Coeficiente de                   Chi Cuadrada
                                                                  x 100
                Contingencia                          N
                             Chi2            N         CC

        Máquina              8.734          5700      0.15

        Operador            171.132         5380      3.18
                                            Controlador Mayor
SI el tamaño de la muestra (N), es similar para los grupos. Al dividir entre N,
probablemente, llevará a la misma ruta que hubiera alcanzado con sólo ver la
estadística Chi2.

Sin embargo, si N tiene una variación considerable, dependiendo del grupo de
variación que se investiga, el coeficiente de contingencia puede ser una herramienta
valiosa para determinar la prioridad sobre qué grupo debe investigarse primero.
                                                                             399
   ¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?
                   (en este caso, operador a operador y máquina a máquina)
 Ahora que la información nos
 ha llevado a investigar a los                  Con gotera Sin gotera      Total
 grupos de operador a                     1     6          122             128
 operador. ¿Qué debemos                         6.61       121.39
 hacer ahora?
 Encontremos cuál de los                  2     1          127             128
 operadores estaban fuera del                   6.61       121.39
 estándar.
 ¿Era alguno de ellos                     3     200        3836            4036
 notablemente peor (o mejor)                    208.55     3827.45
 que el resto?
               Mucho peor que           4     54          202             256
               lo esperado                    13.23       242.77

               Mucho mejor que          5     5           699             704
               lo esperado                    36.38       667.62

                                        6     12          116             128
                                              6.61        121.39
(Estos mismos operadores fueron quienes
tuvieron los números más grandes de chi2)
                                                                                400
Operador a operador: = 0.000
Rechace
Ho y acepte Ha
(Existe una diferencia significativa entre los operadores)

Los operadores 4 y 5 están fuera del estándar:
El operador 4 es notablemente peor que el resto,
El operador 5 es notablemente mejor que los demás

¿Cuál es el próximo paso? Hable con todos los operadores para averiguar qué diferencias
pueden existen en sus técnicas.

El operador 4 no tenía experiencia en este tipo de trabajo y apenas se estaba acostumbrado a
soldar este producto en particular.

El operador 5 encontró un modo de mejor de hacer el ensamble, con lo cual consiguió mejorar
el trabajo de soldadura, aunque esto mostraba un grado de dificultad ergonómica. Se añadió
un colocador para ensamblar la parte en forma segura. (Esto también redujo el tiempo que
requerían los operadores para “acostumbrarse” a trabajar en esta forma)




                                                                                  401
                         Ejercicios

1. Se quiere evaluar la habilidad de tres inspectores de rayos
X en un aeropuerto para detectar artículos clave. Como
prueba se pusieron radios de transistores en 90 maletas,
cada inspector fue expuesto a 30 maletas conteniendo radios
mezcladas entre otras que nos los contenían. Los resultados
se resumen a continuación:
                                 Inspectores
                                 1         2      3

Radios detectados               27       25       22
Radios no detectados            3        5        8

¿Con un 95% de confianza, existe una diferencia entre los
inspectores?

Ho: p1 = p2 = p3; Ha: al menos una es diferente
Grados de libertad = (columnas - 1) ( filas -1)
                                                                 402
                         Ejercicios

1. Se quiere evaluar si hay preferencia por manejar en un
carril de una autopista dependiendo de la hora del día. Los
datos se resumen a continuación:

                Hora del día
Carril          1:00   3:00     5:00
Izquierdo       44     37       18
Central         28     50       72
Derecho         8      13       30

¿Con un 95% de confianza, existe una diferencia entre las
preferencias de los automovilistas dependiendo de la hora?

Ho: P1 = P2 = P3; Ha: al menos una es diferente
Grados de libertad = (columnas - 1) ( filas -1)


                                                              403
       Coeficiente de Contingencia
   Coeficiente de contingencia es el grado de relación o
    dependencia de las clasificaciones en la tabla de contingencias
    es:

              X2
     C2
             X2 N

   Donde N es la frecuencia total y X es el estadístico Chi
    Cuadrado calculado



                                                               404
      Coeficiente de Contingencia
   Para los datos del ejemplo anterior se tiene:


              X2        66.22 2
     C2          2              0.38
             X N
              2
                     66.22  393
                          2




   El valor máximo de C se obtiene de:

                   k 2   82
     Max C                   0.866
                     k     8
                                                    405
           Correlación de atributos
   Para tablas de orden k * k, el coeficiente de correlación, r, es :


                                     2
                               X
                  r
                            N (k  1)
   Donde 0<= r <= 1




                                                                406
VI.B.9 Pruebas de Hipótesis
      no paramétricas




                          407
         Pruebas no paramétricas
   Las pruebas paramétricas asumen una distribución para la
    población, tal como la Normal

   Las pruebas no paramétricas no asumen una distribución
    específica de la población

   Bajo los mismos tamaños de muestra la Potencia o probabilidad
    de rechazar Ho cuando es falsa es mayor en las pruebas
    paramétricas que en las no paramétricas

   Una ventaja de las pruebas no paramétricas es que los
    resultados de la prueba son más robustos contra violación de
    los supuestos

                                                             408
                                      Prueba de Hipótesis

                  Variable                                            Atributo

        No Normal                                                            Tablas de
                                                                             Contingencia de

Varianza          Medianas
                                                                             Correlación
                   Correlación
Homogeneidad
                   Prueba de signos
de la Variación
de Levene          Wilcoxon
                                               Normal
                   Mann-
                   Whitney               Variancia         Medias
                    Kurskal-
                    Wallis                                 Pruebas de t
                                          Prueba-F               Muestra-1
                                                                                   Residuos
                  Prueba de Mood                                 Muestra-2
                                         Homogeneidad                              distribuidos
                    Friedman             de la Variación     ANOVA
                                         de Bartlett             Una vía           normalmente
                                                                 Dos vías
                                                            Correlación
                                                            Regresión                      409
             Resumen de pruebas de Hipótesis
      Datos Normales                      Datos No Normales
Pruebas de Variancias
                                  Pruebas de Varianzas
X2 : Compara la variancia de una Homogeneidad de la varianza de
  muestra con una variancia de un Levene : Compara dos o más
  universo conocido.               varianzas de muestras de la misma
                                   población.
Prueba F : Compara dos varianzas
  de muestras.

Homogeneidad de la variancia de
  Bartlett: Compara dos o más
  varianzas muestras de la misma
  población.

                                                               410
                    Resumen de pruebas de Hipótesis
       Datos Normales                                       Datos No Normales
Pruebas de los Promedios                          Pruebas de la Mediana

Prueba t de 1 muestra : Prueba si el promedio     Prueba de signos o Prueba Wilcoxon : Prueba
   de la muestra es igual a un promedio             si la mediana de la muestra es igual a un valor
   conocido o meta conocida.                        conocido o a un valor a alcanzar.
Prueba t de 2 muestras : Prueba si los dos        Prueba Mann-Whitney : Prueba si dos medianas
   promedios de las muestras son iguales.           de muestras son iguales.
ANOVA de un factor: Prueba si más de dos          Prueba Kruskal-Wallis: Prueba si más de dos
   promedios de las muestras son iguales.           medianas de muestras son iguales. Asume que
ANOVA de dos factores : Prueba si los               todas las distribuciones tienen la misma forma.
   promedios de las muestras clasificadas         Prueba de la mediana de Mood : Otra prueba
   bajo dos categorías, son iguales.                para más de dos medianas. Prueba más firme
                                                    para los valores atípicos contenidos en la
Correlación : Prueba la relación lineal entre       información.
   dos variables.                                 Prueba Friedman : Prueba si las medianas de las
                                                    muestras, clasificadas bajo dos categorías, son
Regresión : Define la relación lineal entre una     iguales.
  variable dependiente y una independiente.       Correlación : Prueba la relación lineal entre dos
  (Aquí la "normalidad" se aplica al valor          variables.
  residual de la regresión)
                                                                                           411
 Acciones a tomar con datos No Normales
Revise y asegúrese de que los datos no siguen una distribución normal.

• Desarrollar una Prueba de normalidad (para verificar realmente lo
  anormal. Para la prueba de Bartlet el valor de p debe ser < 0.05)

• Desarrollar una Prueba de Corridas (para verificar que no existen
  sucesos no aleatorios que puedan haber distorsionado la información)

• Revisar la información para detectar errores (tipográficos, etc.).
  Investiguar los valores atípicos.

• Una muestra pequeña (n < 30) proveniente de un universo normal, se
  mostrará algunas veces como anormal.

Intentar transformar los datos. Las transformaciones comunes incluyen:
     - Raíz cuadrada de todos los datos
     - Logaritmo de todos los datos
     - Cuadrado de todos los datos

• Si la información es todavía anormal, entonces usar las herramientas no
  paramétricas.                                                         412
                         7B8. Definiciones
   Promedio : Es la media aritmética de la información. Es la suma de todos
    los datos, dividida entre el número de datos de referencia.

   Mediana: Valor del punto medio de los datos, cuando se ordenan en forma
    ascendente (en caso de datos pares, obtener promedio).

   Moda : Valor que se repite con más frecuencia sobre el conjunto de datos.
    Ejemplo:
    Se cuestionó a veinte personas sobre cuánto tiempo les tomaba estar
    listas para ir a trabajar, en las mañanas. Sus respuestas (en minutos) se
    muestran más adelante. ¿Cuáles son el promedio y la mediana para esta
    muestra?

    30, 37, 25, 35, 42, 35, 35, 47, 45, 60
    39, 45, 30, 38, 35, 40, 44, 55, 47, 43                              413
                                         Un dibujo dice más que mil palabras

                                               Promedio
              Mediana




                       28.0            35.0             42.0            49.0   56.0   63.0
     -------+---------+---------+---------+---------+---------+------   C1

     Promedio = 40.35                                          Mediana = 39.5

El promedio puede estar influenciado considerablemente por los
valores atípicos porque, cuando se calcula un promedio, se incluyen los
valores reales de estos valores.

La mediana, por otra parte, asigna la misma importancia a todas las
observaciones, independientemente de los valores reales de los
valores atípicos, ya que es la que sencuentra en la posición media de
los valores ordenados.

                                                                                             414
        Pruebas Alternativas comúnmente usadas
Pruebas para datos No normales                 Analogía con datos normales

•   Prueba de Corridas : Calcula la            •   Prueba de Corridas (la misma
    probabilidad de que un X número de             prueba para ambos tipos de
    puntos de referencia, esté por encima o        información)
    por debajo del promedio aleatoriamente.

•   Prueba de signos, de 1 muestra :          •    Prueba t de una muestra
    Prueba la probabilidad de que la
    mediana de la muestra, sea igual al valor
    hipotético.

•   Prueba Mann-Whitney : Comprueba el         •   Prueba t de 2 muestras
    rango de dos muestras, por la diferencia
    entre dos medianas del universo.

•   Prueba de la Mediana de Mood :             •   ANOVA de un factor
    Prueba para más de dos medianas del
    universo. Más robusta para los valores
    atípicos o para los errores en la
    información.                                                             415
                             Prueba de Rachas
  Considere los siguientes datos (que se muestran aquí en orden cronológico):
  325, 210, 400, 72, 150, 145, 110, 507, 56, 120, 99, 144, 110, 110,
  320, 290, 101, 0, 80, 500, 201, 50, 140, 80, 220, 180, 240, 309, 80

  Es importante tener los datos registrados en orden cronológico.

  Una representación gráfica de los datos se asemeja a esto:
                 600

                 500                                      Promedio
Primera          400


"corrida"        300

                 200

                 100

                       0



                            Segunda ”racha"

                           Racha: Un punto o una serie consecutiva de puntos que caen
                           en un lado del promedio.
                           Número total de Rachas: 12
                           Número total de puntos > al promedio: 11
                           Número total de puntos < al promedio: 18
                   Prueba de Rachas
Ho: Los datos son aleatorios
Ha:Los datos NO so aleatorios

 Prueba de Rachas
 Promedio K = 184.4483                               Promedio

 Número de rachas observado = 12

 Número de rachas esperado = 14.6552
 => No se rechaza Ho                              Este es el valor p
                                                  de las Prueba de
 11 observaciones por encima de K; 18 por             Corridas
 debajo
 La prueba es significativa en p= 0.2860
 No se puede rechazar Ho con valor alfa = 0.05

   Ya que p > 0.05, no podemos rechazar la hipótesis nula.
   Los datos son aceptados, siendo aleatorios.
      Cálculos de la Prueba de Rachas
El estadístico Z cuando n > 20 se calcula como:

Z = (G - MediaG) / DesvStG

Con MediaG = 1 + (2n1*n2) / (n1 + n2)
DesvStG = Raiz [ (2n1*n2) (2n1*n2 - n1 -n2) / (n1 + n2)^2* (n1+n2 -1)

Del ejemplo anterior G = 12;    n1 = 11n2 = 18

MediaG = 14.655         DesStG = 2.4843

Z1 = (12 - 14.655) / 2.4843 = -1.0687
P(Z1) = 0.1430 y para dos colas se tiene

P(Z1) + P(Z2) = 0.2860 > Alfa crítico de 0.05, no rechazándose Ho

Si las n1 y n2 son menores a 21, entonces se consulta la tabla de
valores críticos para el número de Rachas G
                                                                418
              Corrida con Minitab
   Stat > Nonparametrics > Runs Test
    Variable C1, Above and below the mean


Runs Test: C1
Runs test for C1
Runs above and below K = 184.448
The observed number of runs = 12
The expected number of runs = 14.6552
11 observations above K, 18 below
P-value = 0.285
                        P > 0.05
                        No rechazar
                        Ho                  419
           Prueba de Signos de la Mediana

Ho : La mediana de la muestra es igual a la mediana de la hipótesis
Ha : Las medianas son diferentes

Ejemplo (usando los datos del ejemplo anterior):

Ho: Valor de la mediana = 115.0
Ha: Valor de la mediana diferente de 115.0

      N DEBAJO IGUAL ENCIMA VALOR P MEDIANA
      29 12   0       17    0.4576  144.0


Ya que p >0.05, no se puede rechazar la hipótesis nula.
No se puede probar que la mediana real y la mediana hipotética son
diferentes.

En las páginas siguientes se muestra el detalle del cálculo.
                                                               420
 Cálculos de la Prueba de Signos de la Mediana

Ejemplo: Con los datos del ejemplo anterior y ordenándo de menor a
mayor se tiene: n = 29, Mediana de Ho = 115

No.    Valor   Signo   No.     Valor   Signo   No.    Valor   Signo
1      0       -       11      110     -       21     220     +
2      50      -       12      110     -       22     240     +
3      56      -       13      120     +       23     290     +
4      72      -       14      140     +       24     309     +
5      80      -       15      144     +       25     320     +
6      80      -       16      145     +       26     325     +
7      80      -       17      150     +       27     400     +
8      99      -       18      180     +       28     500     +
9      101     -       19      201     +       29     507     +
10     110     -       20      210     +

Con la mediana en 144. Si el valor contra el cual se desea
probar es 115, entonces hay 12 valores por debajo de el (-) y 17
valores por arriba (+).
                                                              421
   Cálculos de la Prueba de Signos de la Mediana


El estadístico X es el el número de veces que ocurre el signo menos
frecuente, en este caso el 12 (-).

Cómo n  25, se calcula el estadístico Z para la prueba de signos con:

Z = [ (Y + 0.5) - (0.5*n) ]/ 0.5  n

En este caso Z1 = - 0.74278 y P(Z1) = 0.2288 para la cola izquierda
en forma similar P(Z2) 0-2288 para la cola derecha, por lo que la
probabilidad total es 0.4576 >> 0.05 del criterio de rechazo.

Si n hubiera sido < 25 entonces se hubiera consultado la tabla de
valores críticos para la prueba de signo.
                                                                    422
    Prueba de Signos de la Mediana

¿Es esto correcto?¿144 podría ser igual a 115?
 Bueno, veamos una gráfica de la información




    0     100    200         300   400   500

    115                144
                               Después de todo, tal vez
                                esto SEA lo correcto.
                                                      423
               Corrida en Minitab
   Stat > Nonparametrics > 1-Sample sign Variable C1
    Confidence interval 95% Test Median 115 Alternative Not equal


Sign Test for Median: Signos
Sign test of median = 115.0 versus not = 115.0

       N Below Equal Above   P    Median
Signos 29 12    0     17   0.4583 144.0

Como P > 0.05 no se rechaza Ho y la mediana es 115

                                                          424
          Prueba de Signos de la Mediana
           Para observaciones pareadas

Calificaciones de amas de casa a dos limpiadores de ventanas:

Ho: p = 0.5 no hay preferencia de A sobre B
Ha: p<>0.5
  Ama     Limpiador
  Casa    A           B
  1       10          7
  2       7           5
                                    ¿Hay evidencia que indique
                                    cierta preferencia de las amas
  3       8           7
                                    de casa por lo limpiadores?
  4       5           2
  5       7           6
  6       9           6                                         425
          Prueba de Signos de la Mediana
          Producto
Familia      A       B   Media = 0.5*n
1            -       +   Desv. Estand.= 0.5*raiz(n)
2            -       +
3            +       -   Zc = (Y – media) / Desv. Estánd.
4            -       +   Rechazar Ho si Zc ><Zalfa/2
5            0       0
6            -       +
7            -       +     ¿Hay evidencia que indique
8            +       -     cierta preferencia por un
9            -       +     Producto A o B?
10           -       +
11           -       +
                                                  426
       Prueba de Signos de la Mediana

Media = 0.5*11 = 5.5
Desv. Estand.= 0.5*raiz(n) = 1.67

Para Zc = (8 – 5.5) / 1.67 = 1.497

Zexcel = 1.96 para alfa/2 = 0.025

Como Zc < Zexcel no se rechaza Ho o
Como p value = 0.067 > 0.025
No hay evidencia suficiente de que los
Consumidores prefieran al producto B
                                         427
 Prueba rango con signo de Wilconox
      Es la alternativa no paramétrica de la prueba paramétrica de muestras
       pareadas
      Ejemplo: HO: Las poblaciones son idénticas Ha: Caso contrario
Trabaja    Método    Método    Diferen   Abs(difere              Rango
   dor         1         2        cias        n.)     Rango       c/signo
  1          10.2      9.5       0.7        0.7          8          8
  2          9.6       9.8      -0.2        0.2          2          -2
  3          9.2       8.8       0.4        0.4         3.5        3.5
  4          10.6     10.1       0.5        0.5         5.5        5.5
  5          9.9      10.3      -0.4        0.4         3.5        -3.5
  6          10.2      9.3       0.9        0.9         10         10
  7          10.6     10.5       0.1        0.1          1          1
  8           10       10         0          0        Eliminar
  9          11.2     10.6       0.6        0.6          7          7
  10         10.7     10.2       0.5        0.5         5.5        5.5
  11         10.6      9.8       0.8        0.8          9          9
                                                                  T =428
                                                                      44
Prueba rango con signo de Wilconox

Distribución muestral T para poblaciones idénticas
Se aproxima a la distribución normal para n >= 10


   T 0            T 
                              n(n  1)( 2n  1)
                                     6
En este caso n = pares eliminando las que son iguales con dif. = 0 para el
   trabajador 8.

 = raiz(10 x 11 x 21/6) = 19.62
Z = (T – )/ = 44/19.62 = 2.24

Z alfa/2 = Z0.025 = 1.96

Como Zc = 2.24 > Z0.025 se rechaza Ho, los métodos son diferentes
                                                                   429
          Prueba en Minitab para prueba de
               mediana con Wilconox
         File> Open worksheet > Exh_Stat
         Stat > Nonparametrics > 1-Sample Wilconox   Achievement
          Variables C1 Test Median 77                     77
          Altenative Not equal                            88
                                                          85
Wilcoxon Signed Rank Test: Achievement
Test of median = 77.00 versus median not = 77.00          74
for Wilcoxon       Estimated                              75
            for Wilcoxon       Estimated
         N Test Statistic    P   Median                   62
Achievement 9     8      19.5 0.889    77.50              80
                                                          70
Ho: Mediana = 77 Ha: Mediana <> 77
Como P de 0.889 >> alfa de 0.05 no se rechaza Ho          83

                                                          430
                     Prueba de Mann-Whitney
Se llevó a cabo un estudio que analiza la frecuencia del pulso en dos
grupos de personas de edades diferentes, después de diez minutos de
ejercicios aeróbicos.

Los datos resultantes se muestran a continuación.

                                       Edad 40-44         Edad 16-20
                                          C1                 C2
¿Tuvieron diferencias                     140                130
significativas las frecuencias de         135                166
pulso de ambos grupos?                    150                128
                                          140                126
                                          144                140
                                          154                136
                                          160                132
                                          144                128
                                          136                124
                                          148
                                                                        431
                            Prueba de Mann-Whitney
    Ordenando los datos y asignándoles el (rango) de su posición relativa se tiene (promediando
     posiciones para el caso de que sean iguales):
    Edad 40-44               Edad 16-20
          C1                     C2
        (7) 135                (1) 124
      (8.5) 136                (2) 126
       (11) 140               (3.5) 128
      (11) 140                (3.5) 128
     (13.5) 144                (5) 130
     (13.5) 144                (6) 132
      (15) 148                (8.5) 136
      (16) 150                 (11)140
      (17) 154                 (15)166
      (18) 160

     n1 = 10                    n2 = 9
    Ta = 130.5                 Tb = 55.5
                                                                                                   432
                          Prueba de Mann-Whitney
 Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
 Ha: Las distribuciones de frecuencias relativas poblacionales no son idénticas
 Ho: 1 = 2           Ha: 1  2            1, 2 = Medianas de las poblaciones
 Ordenando los datos y asignándoles su posición relativa se tiene:
 Ua = n1*n2 + (n1) * (n1 + 1) /2 - Ta
 Ub = n1*n2 + (n2) * (n2 + 1) /2 - Tb
 Ua + Ub = n1 * n2

 Ua = 90 + 55 - 130.5 = 14.5       P(Ua) = 0.006     Ub = 90 + 45 - 55.5 = 79.5
 El menor de los dos es Ua.
 Para alfa = 0.05 el valor de Uo = 25
 Como Ua < 25 se rechaza la Hipótesis Ho de que las medianas son iguales.



Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente
existe una diferencia significativa entre los dos grupos de edad.
                                                                                        433
                          Prueba de Mann-Whitney
 Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
 Ha: Las distribuciones de frecuencias relativas poblacionales no son idénticas

 Ua = 14.5                Ub = 79.5
 Utilizando el estadístico Z y la distribución normal se tiene:
                   45                     12.24
 Z = [ (U - (n1* n2 / 2 ) / Raiz (n1 * n2 * (n1 + n2 + 1) / 12)
 Con Ua y Ub se tiene:
 Za = (14.5 - 45) / 12.24 = - 2.49 P(Z) = 0.0064 similar a la anterior
 Zb = (79.5 -45) / 12.24 = 2.81 P(total) = 2 * 0.0064 = 0.0128 menor  = 0.05
 El valor crítico de Z para alfa 0.025 por ser prueba de dos colas, es 1.96.
 Como Za > Zcrítico se rechaza la Hipótesis Ho de que las medianas son iguales.



Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente
existe una diferencia significativa entre los dos grupos de edad.
                                                                                        434
Prueba de Mann-Whitney
                    16-20 años de edad
                 130   166   128     126     140    136     132     128     124
           140    10   -26   12       14       0     4       8       12     16
40-44 años de



           135    5    -31    7       9       -5     -1      3       7      11
           150    20   -16   22       24     10      14     18       22     26
           140    10   -26   12       14       0     4       8       12     16
           144    14   -22   16       18       4     8      12       16     20
           154    24   -12   26       28     14      18     22       26     30
           160    30    -6   32       34     20      24     28       32     36
edad




           144    14   -22   16       18       4     8      12       16     20
           136    6    -30    8       10      -4     0       4       8      12
           148    18   -18   20       22       8     12     16       20     24

                  Diferencias entre los encabezados de
                  los renglones y las columnas
De esta manera, se calcula la mediana de todas estas diferencias, denominada
"punto estimado". Este punto estimado es una aproximación de la diferencia entre
las medianas de los dos grupos (ETA1 y ETA2).

Una vez ajustados los "enlaces" (eventos de un mismo valor en ambos grupos de
información), Minitab usa este punto estimado para calcular el valor p.
                       Corrida en Minitab
            Stat > Nonparametrics > Mann Whitney
            First Sample C1 Second Sample C2 Conf. Level 95%
             Alternative Not equal

Mann-Whitney Test and CI: C1, C2
   N Median                               P>0.05
C1 10 144.00                              Se rechaza Ho
C2 9 130.00
Point estimate for ETA1-ETA2 is 12.00
95.5 Percent CI for ETA1-ETA2 is (4.01,20.00)
W = 130.5
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0143
The test is significant at 0.0140 (adjusted for ties)
                                                          436
                             Prueba de Kruskal Wallis
Ordenando los datos de ventas y asignándoles el (rango) de su posición relativa se tiene
    (promediando posiciones para el caso de que sean iguales):


    Zona 1                      Zona 2                    Zona 3
  (15.5) 147                  (17.5) 160                 (24) 215
  (17.5) 17.5                  (14) 140                   (8) 127
    (9) 128                    (21) 173                    (2) 98
   (19) 162                     (4) 113                 (15.5) 127
   (12) 135                      (1) 85                  (23) 184
   (10) 132                     (7) 120                   (3) 109
   (22) 181                    (25) 285                  (20) 169
   (13) 138                     (5) 117
                               (11) 133
                                (6) 119

     n1 = 8                    n2 = 10                    n3 = 7            N = n1 + n2 + n3 = 25
    Ta = 118                  Tb = 111.5                 Tc = 95.5

                                                                                             437
                              Prueba de Kruskal Wallis


Ho: Las poblaciones A, B y C son iguales
Ha: Las poblaciones no son iguales
Ho: 1 = 2 = 3 Ha: 1  2  3 ; 1, 2, 3 = Medianas de las poblaciones

Calculando el valor del estadístico H se tiene:
H = [ 12 /( N* ( N + 1)) ] * [ Ta2 / n1 + Tb2 / n2 + Tc2 / n3 ] - 3 * ( N +1 )
H = 0.01846 * (1740.5 + 1243.225 + 1302.893 ) - 78 = 1.138

Se compara con el estadístico 2 para  = 0.05 y G.l. = k - 1 = 3-1 = 1 (k muestras)
2 crítico = 5.991 (válido siempre que las muestras tengan al menos 5 elementos)

Como H < 2 crítico, no se rechaza la Hipótesis Ho: Afirmando que no hay
  diferencia entre las poblaciones


                                                                                       438
                Corrida en Minitab
    Stat > Nonparametrics > Kruskal Wallis
     Response C1 Factor C2 OK

    Kruskal-Wallis Test: Datos versus Factor
    Kruskal-Wallis Test on Datos
    Factor N Median Ave Rank          Z
    Zona 1 7 138.0         14.7 0.98
    Zona 2 10 126.5         11.1 -0.82
    Zona 3 7 127.0         12.3 -0.10
    Overall 24           12.5         P > 0.05
    H = 1.08 DF = 2 P = 0.581 No se rechaza Ho
    H = 1.09 DF = 2 P = 0.581 (adjusted for ties)
                                                439
     Prueba de Medianas de Mood
   Realiza prueba de hipótesis de igualdad de medias en un diseño de una
    vía. La prueba es robusta contra Outliers y errores en datos y es
    adecuada para análisis preliminares

   Determina si K grupos independientes han sido extraidas de la misma
    población con medianas iguales o poblaciones con formas similares

   Con base en la gran mediana, anotar un signo positivo si la
    observación excede la mediana o un signo menos si es menor. Los
    valores que coincidan se reparten en los grupos

   Hacer una tabla de contingencia K x 2 con las frecuencias de signos
    más y menos en cada grupo K


                                                                   440
     Prueba de Medianas de Mood
   Se determina el estadístico Chi Cuadrada con:


          (O  E )           2
      
       2

             E
Probar Ho: Todas las medianas son iguales
       Ha: Al menos una mediana es diferente

Se compara Chi Cuadrada calculada con Chi Cuadrada de alfa para
   0.05 y (reng – 1)*(Col – 1) grados de libertad

                                                         441
              Corrida con Minitab
Se les da a 179 participantes una conferencia con
  dibujos para ilustrar el tema. Después se les da la
  prueba OTIS que mide la habilidad intelectual. Los
  participantes se clasificaron por nivel educativo 0-No
  prof., 1-Prof., 2-Prepa

Ho: h1 = h2 = h3        Ha: no todas las medianas son
  iguales
    File > Open Worksheet > Cartoon.mtw
   Stat > Nonparametrics > Mood’s Median Test
    Response Otis Factor ED Ok
                                                   442
             Corrida con Minitab
Mood Median Test: Otis versus ED
Mood median test for Otis                        P>0.05
Chi-Square = 49.08     DF = 2     P = 0.0005 Se rechaza Ho
                       Individual 95.0% CIs
ED N<= N> Median Q3-Q1 ----+---------+---------+---------
+--
0   47 9    97.5 17.3 (-----*-----)
1   29 24 106.0 21.5               (------*------)
2   15 55 116.5 16.3                            (----*----)
                     ----+---------+---------+---------+--
                     96.0     104.0     112.0        120.0
Overall median = 107.0                                        443
      Diseños factoriales aleatorias
        bloqueados de Friedman
Esta prueba es una alternativa al ANOVA de dos vías, es
  una generalización de las pruebas pareadas con
  signo. La aditividad es requerida para para estimar
  los efectos de los tratamientos

Ho: Los tratamientos no tienen un efecto significativo
Ha: Algunos tratamientos tienen efecto significativo




                                                   444
       Diseños factoriales aleatorias
         bloqueados de Friedman
Resultados de salida:
 Se muestra el estadístico de prueba con distribución

  Chi Cuadrada aproximada con gl = Tratamientos – 1.

   Si hay observaciones parecidas en uno o más
    bloques, se usa el rango promedio y se muestra el
    estadístico corregido

   La mediana estimada es la gran mediana más el
    efecto del tratamiento

                                                  445
       Diseños factoriales aleatorias
         bloqueados de Friedman
Ejemplo:
 Se evalúa el efecto del tratamiento de una droga en
   la actividad enzimática con tres niveles, probado en
   cuatro animales

   Open the worksheet EXH_STAT.MTW.
   Stat > Nonparametrics > Friedman.
    Response, seleccionar EnzymeActivity.
    En Treatment, seleccionar Therapy.
    En Blocks, seleccionar Litter. Click OK.

                                                   446
         Diseños factoriales aleatorias
           bloqueados de Friedman
Datos:      EnzymeActivity   Therapy   Litter
                0.15           1         1
                0.26           1         2
                0.23           1         3
                0.99           1         4
                0.55           2         1
                0.26           2         2
                -0.22          2         3
                0.99           2         4
                0.55           3         1
                0.66           3         2
                0.77           3         3
                0.99           3         4      447
         Diseños factoriales aleatorias
           bloqueados de Friedman
Resultados:
              Friedman Test: EnzymeActivity versus Therapy
              blocked by Litter
              S = 2.38 DF = 2 P = 0.305 No rechazar Ho

              S = 3.80 DF = 2 P = 0.150 (adjusted for ties)
                               Sum
                                of
              Therapy N Est Median Ranks
              1     4    0.2450      6.5
              2     4    0.3117      7.0
              3     4    0.5783 10.5
              Grand median = 0.3783
                                                              448
          Diseños factoriales aleatorias
            bloqueados de Friedman
Resultados:
 El estadístico de prueba S tiene un valor P de 0.305 sin ajustar
  para observaciones en cero y 0.150 para el valor ajustado.

   Por tanto no hay evidencia suficiente para rechazar Ho

   Las medianas estimadas asociadas con los tratamientos son la
    gran mediana más los efectos estimados de los tratamientos.

   El estadístico de prueba se determina con base a los rangos en
    cada bloque y totales



                                                             449
         Diseños factoriales aleatorias
           bloqueados de Friedman
Resultados:




                                      450
         Diseños factoriales aleatorias
           bloqueados de Friedman
Resultados:




                                      451
         Diseños factoriales aleatorias
           bloqueados de Friedman
Resultados:




                                      452
              Prueba de igualdad de
               varianzas de Levene
   Se usa para probar la hipótesis nula de que las varianzas de k
    múltiples poblacionales son iguales

   Las igualdad de varianzas en las muestras se denomina
    homogeneidad de varianzas

   La prueba de Levene es menos sensible que la prueba de
    Bartlett o la prueba F cuando se apartan de la normalidad

   La prueba de Bartlett tiene un mejor desempeño para la
    distribución normal o aproximadamente normal


                                                             453
             Prueba de igualdad de
              varianzas de Levene
Para dos muestras el procedimiento es como sigue:

   Determinar la media

   Calcular la desviación de cada observación respecto a la
    media

   Z es el cuadrado de las desviaciones respecto a la media

   Aplicar la prueba t a las dos medias de los datos

                                                        454
                                Rot   Temp   Oxygen
                                13     10      2
Prueba de igualdad              11     10      2

de Varianzas-Minitab            3
                                10
                                       10
                                       10
                                               2
                                               6
                                4      10      6
Se estudian tamaños de papa     7      10      6
   inyectando con bacterias y
                                15     10      10
   sujetas a diferentes
                                2      10      10
   temperaturas. Antes del
                                7      10      10
   ANOVA se verifica la
   igualdad de varianzas        26     16      2
                                19     16      2
                                24     16      2
   Stat > ANOVA > Test for
                                15     16      6
    equal variances
                                22     16      6
    Response Rot
                                18     16      6
    Factors Temp Oxigen
                                20     16      10
    Confidence level 95%
                                24     16      10
                                8      16      10
                                             455
Resultados




             456
                             Resultados
Test for Equal Variances: Rot versus Temp, Oxygen
95% Bonferroni confidence intervals for standard deviations
Temp Oxygen N        Lower    StDev      Upper
 10      2 3 2.26029 5.29150 81.890
 10      6 3 1.28146 3.00000 46.427
 10     10 3 2.80104 6.55744 101.481
 16      2 3 1.54013 3.60555 55.799
 16      6 3 1.50012 3.51188 54.349
 16     10 3 3.55677 8.32666 128.862
Bartlett's Test (normal distribution)
Test statistic = 2.71, p-value = 0.744 P>0.05 no rechazar Ho
Levene's Test (any continuous distribution)
Test statistic = 0.37, p-value = 0.858
                                                               457
       Prueba de la concordancia del
           Coeficiente de Kendall
   El coeficiente expresa el grado de asociación entre las
    calificaciones múltiples realizadas por un evaluador

    Ho: Las variables son independientes
    Ha: Las variables están asociadas

   Kendall usa la información relacionada con las calificaciones
    relativas y es sensible a la seriedad de mala clasificación

Por ejemplo para K = jueces N = Muestras = 10

Rango medio = 220 / 22 S = 1066 Gl = n-1 = 9
Chi Cuadrada crítica = X2 0.01,9 = 21.67
                                                              458
       Prueba de la concordancia del
           Coeficiente de Kendall
   El Estadístico Chi Cuadrada calculado es:




   Como Chi Cuadrada de alfa es menor que la calculada, los
    cuatro jueces están asociados significativamente. Constituyen
    un panel uniforme. No quiere decir que estén en lo correcto,
    solo que responden de manera uniforme a los estímulos



                                                             459
      El coeficiente de correlación de
          rangos de Spearman (rs)
   El coeficiente de correlación es una medida de la asociación que
    requiere que ambas variables sean medidas en al menos una
    escala ordinal de manera que las muestras u observaciones a
    ser analizadas pueden ser clasificadas en rangos en dos series
    ordenadas
                                                           6 d  2

    Ho: Las variables son independientes
                                                rs  1 
                                                           N N
                                                             3
    Ha: Las variables están asociadas

   Para el ejemplo anterior si N = 10, el coeficiente es:

                     6(5.5)
            rs  1          1  0.03  0.97
                      990
                                                                 460
      Coeficiente de correlación de
       rangos para monotonía de
              preferencias
Una persona interesada en adquirir un TV asigna
  rangos a modelos de cada uno de 8 fabricantes
                                    Rango
  Fab.   Preferencia   Precio
                                    Di
                       (rango)              Di cuadrada
  1      7             449.50 (1)   6       36
  2      4             525.00 (5)   -1      1
  3      2             479.95 (3)   -1      1
  4      6             499.95 (4)   2       4
  5      1             580.00 (8)   -7      49
  6      3             549.95 (7)   -4      16
  7      8             469.95 (2)   6       36
  8      5             532.50 (6)   -1      1             461
     Coeficiente de correlación de
      rangos para monotonía de
             preferencias
Ho: No existe asociación entre los rangos
Ha: Existe asociación entre los rangos o es positiva o negativa

El coeficiente de correlación de rangos de Spearman es:

Rs = 1 – 6*suma(di cuadrada) / (n(n cuadrada – 1))

En este caso: Rs = 1 – 6(144)/(8*(64-1) = -0.714

R0 se determina de la tabla de Valores críticos del coeficiente de
   correlación del coeficiente de correlación de rangos de Spearman

Rt = 0.686

Por tanto si hay asociación significativa en las preferencias

                                                                  462
     Tabla de constantes
 n       Alfa=0.05   Alfa = 0.025
 5         0.900           -
 6         0.829         0.886
 7         0.714         0.786
 8         0.643         0.738
 9         0.600         0.683
10         0.564         0.648
11         0.523         0.623
12         0.497         0.591
13         0.475         0.566
14         0.457         0.545
15         0.441         0.525
16         0.425         0.507
17         0.412         0.490
18         0.388         0.476
19         0.377         0.462
20         0.368         0.450
21         0.359         0.438
22         0.351         0.428
23         0.343         0.418
24         0.336         0.409
25         0.329         0.400
26         0.329         0.392
27         0.323         0.385
28         0.317         0.377
29         0.311         0.370
30         0.305         0.364      463
                     Corrida con Minitab
Para la corrida en Minitab primero se      Fabric Prefe-         Preci
   deben determinar los rangos en           ante rencia Precio     o
   forma manual para las variables X
   y Y.                                     1      7      1       449
  Stat > Basic statistics > Correlation    2      4      5       525
   Variables Preferencia Precio             3      2      3       479
Correlations: Preferencia, Precio           4      6      4       499
Pearson correlation of                      5      1      8       580
Preferencia and Precio = -0.714             6      3      7       549
P-Value = 0.047                             7      8      2       469
                                            8      5      6       532
                                                                 464
                    Ejemplo con Minitab
Se estudia la relación entre colágeno y
   Proline en pacientes con cirrosis       Paciente   Colágeno   Proline
  Stat > Basic statistics > Correlation
                                              1         7.1       2.8
   Variables Colágeno Proline
                                              2         7.1       2.9
                                              3         7.2       2.8
Correlations: Colageno, Proline
                                              4         8.3       2.6
Pearson correlation of Colageno               5         9.4       3.5
and Proline = 0.935
                                              6         10.5      4.6
P-Value = 0.002                               7         11.4       5

                                                                  465
               Resumen de pruebas
                 no paramétricas
   Prueba de signos de 1 muestra: Prueba la igualdad de la
    mediana a un valor y determina el intervalo de confianza

   Prueba de Wilconox de 1 muestra: Prueba la igualdad de la
    mediana a un valor con rangos con signo y determina el
    intervalo de confianza

   Comparación de dos medianas poblacionales de Mann Whitney:
    Prueba la igualdad de las medianas y determina el intervalo de
    confianza




                                                               466
               Resumen de pruebas
                 no paramétricas

   Comparación de igualdad de medianas poblacionales de Kruskal
    Wallis: Prueba la igualdad de las medianas en un diseño de una
    vía y determina el intervalo de confianza



   Comparación de medianas poblacionales de Mood: Prueba la
    igualdad de medianas con un diseño de una vía




                                                            467
468
469
VI.C Análisis del Modo y
Efecto de Falla (FMEA)




                           470
                       ¿ Qué es el FMEA?
El Análisis de del Modo y Efectos de Falla es un grupo sistematizado de
   actividades para:


   Reconocer y evaluar fallas potenciales y sus efectos.

   Identificar acciones que reduzcan o eliminen las
    probabilidades de falla.

   Documentar los procesos con los hallazgos del análisis.

   Existe el estándar MIL-STD-1629, Procedure for Performing a Failure
    Mode, Effects and Criticality Analysis
                                                                   471
             Propósitos del FMEA
   Mejorar la calidad, confiabilidad y seguridad de los
    productos y procesos evaluados

   Reducir el tiempo y costo de re-desarrollo del producto

   Documenta y da seguimiento a acciones tomadas para
    reducir el riesgo

   Soporta el desarrollo de planes de control robustos



                                                           472
             Propósitos del FMEA
   Soporta el desarrollo de planes de verificación del
    desarrollo de diseño robusto

   Apoya a priorizar y enfocarse en eliminar/reducir
    problemas de proceso y producto y/o previene la
    ocurrencia de problemas

   Mejora la satisfacción del cliente/consumidor




                                                          473
                 Tipos del FMEA
   AMEF de concepto (CFMEA)
      A nivel de sistema, subsistema y componente




   AMEF de diseño (DFMEA)

   AMEF de Proceso (PFMEA)

   AMEF de maquinaria (como aplicación del DFMEA)



                                                     474
                Tipos de FMEAs
   FMEA de Diseño (AMEFD), su propósito es analizar como
    afectan al sistema los modos de falla y minimizar los
    efectos de falla en el sistema. Se usan antes de la
    liberación de productos o servicios, para corregir las
    deficiencias de diseño.

   FMEA de Proceso (AMEFP), su propósito es analizar como
    afectan al proceso los modos de falla y minimizar los
    efectos de falla en el proceso. Se usan durante la
    planeación de calidad y como apoyo durante la producción
    o prestación del servicio.



                                                      475
             PFMEA o AMEF de Proceso

Fecha límite:
        Concepto       Prototipo      Pre-producción /Producción

                FMEAD
                                      FMEAP



                       FMEAD                            FMEAP
                   Característica de Diseño    Paso de Proceso
Falla              Forma en que el             Forma en que el proceso falla
                   producto o servicio falla   al producir el requerimiento
                                               que se pretende
Controles          Técnicas de Diseño de       Controles de Proceso
                   Verificación/Validación
                                                                          476
            Flujo del FMEA y su rol
           en evitar el Modo de Falla
   DFMEA
      Es un análisis detallado de los modos de falla

       potenciales relacionados con las funciones primarias y
       de interfases del sistema.

       Es el documento primario para demostrar que se han
        evitado errores e identifica los controles y acciones
        para reducir los riesgos asociados




                                                         477
    Beneficios de los tipos de FMEA
            FMEA de Diseño
Soporta el proceso de diseño al reducir el riesgo de fallas
  (incluyendo las salidas no intencionadas) por:

   Soporta la evaluación objetiva de diseño, incluyendo
    requerimientos funcionales y alternativas de diseño

   Evaluar los diseños iniciales sobre requerimientos de
    manufactura, ensamble, servicio y reciclado

   Incrementar la probabilidad de que los modos de falla
    potencial y sus efectos en el sistema y operación del
    producto se han considerado en el procesos de
    diseño/desarrollo
                                                     478
    Beneficios de los tipos de FMEA
            FMEA de Diseño
   Proporcionar información adicional como apoyo en la
    planeación exhaustiva de programas de diseño
    eficiente, desarrollo y validación

   Desarrollo de una lista priorizada de modos de falla
    potenciales de acuerdo a su efecto en el “cliente”
    estableciendo un sistema de prioridades para mejoras
    al diseño, desarrollo, validación, prueba y análisis

   Proporcionar un formato de problemas pendientes para
    recomendar y dar seguimiento de acciones que
    reduzcan el riesgo
                                                   479
    Beneficios de los tipos de FMEA
           FMEA de Proceso
Los beneficios de un FMEA de proceso incluyen:
 Identifica las funciones y requerimientos del proceso



   Identifica modos de falla potenciales relacionados con el
    producto y proceso

   Evalúa los efectos de las fallas potenciales con el cliente

   Identifica las causas potenciales en el proceso de
    manufactura

   Identifica las variables de proceso en las cuales hay que
    enfocarse para reducir las fallas muy lejanas

                                                             480
    Beneficios de los tipos de FMEA
           FMEA de Proceso
Los beneficios de un FMEA de proceso incluyen:

   Identificar las variables del proceso centrandose en la
    ocurrencia

   Reducción o detección de las condiciones de falla

   Identificar variables del proceso a las cuales enfocar el
    control

   Desarrollar una lista ordenada clasificada de modos de falla
    estandarizados para establecer un sistema de prioridades

                                                              481
    Beneficios de los tipos de FMEA
           FMEA de Proceso
   Sistema del prioridad del riesgo para consideraciones de
    acciones preventivas y correctivas

   Documentar los resultados del proceso de manufactura o
    proceso de ensamble

   Documenta los resultados del proceso de manufactura
    o ensamble

   Identifica deficiencias del proceso para orientar a
    establecer controles para reducir la ocurrencia de
    productos no conformes o en métodos para mejorar su
    detección
                                                          482
    Beneficios de los tipos de FMEA
           FMEA de Proceso
   Identifica características críticas y/o significativas
    confirmadas

   Apoya en el desarrollo de Planes de Control a través de
    todo el proceso de manufactura

   Identifica aspectos de preocupación en relación con la
    seguridad del operador

   Retroalimenta información sobre cambios de diseño
    requeridos y factibilidad de manufactura a las áreas de
    diseño
                                                             483
    Beneficios de los tipos de FMEA
           FMEA de Proceso
   Se enfoca a modos de falla potenciales del producto
    causados por deficiencias de manufactura o ensamble

   Confirma la necesidad de controles especiales en
    manufactura y confirma las “Características Especiales”
    designadas en el DFMEA

   Identifica modos de falla del proceso que pudieran
    violar las reglamentaciones del gobierno o
    comprometer la seguridad del personal, identificando
    otras “Características especiales” – de Seguridad del
    operador (OS) y con alto impacto (HI)
                                                     484
     Salidas del FMEA de Proceso
   Una lista de modos potenciales de falla

   Una lista de Caracteríticas críticas y/o significativas

   Una lista de características relacionadas con la
    seguridad del operador y con alto impacto

   Una lista de controles especiales recomendados para
    las Características Especiales designadas y
    consideradas en el Plan de control


                                                         485
     Salidas del FMEA de Proceso
   Una lista de procesos o acciones de proceso para
    reducir la Severidad, eliminar las causas de los modos
    de falla del producto o reducir su tasa de ocurrencia, y
    mejorar la tasa de Detección de defectos si no se
    puede mejorar la capacidad del proceso

   Cambios recomendados a las hojas de proceso y
    dibujos de ensamble




                                                      486
               Modos de fallas vs
              Mecanismos de falla


   El modo de falla es el síntoma real de la falla (altos
    costos del servicio; tiempo de entrega excedido).

   Mecanismos de falla son las razones simples o
    diversas que causas el modo de falla (métodos no
    claros; cansancio; formatos ilegibles) o cualquier otra
    razón que cause el modo de falla




                                                      487
                    Definiciones
Modo de Falla


- La forma en que un producto o proceso puede fallar para cumplir
  con las especificaciones o requerimientos.

 - Normalmente se asocia con un Defecto, falla o error.

    Diseño                  Proceso
    Alcance insuficiente    Omisiones
    Recursos inadecuados    Monto equivocado
    Servicio no adecuado    Tiempo de respuesta excesivo


                                                             488
                     Definiciones
Efecto
 - El impacto en el Cliente cuando el Modo de Falla no se previene
  ni corrige.

 - El cliente o el siguiente proceso puede ser afectado.

   Ejemplos: Diseño                   Proceso
               Serv. incompleto       Servicio deficiente
               Operación errática     Claridad insuficiente
Causa
 - Una deficiencia que genera el Modo de Falla.
 - Las causas son fuentes de Variabilidad asociada con variables de
  Entrada Claves

  Ejemplos:   Diseño                   Proceso
              Material incorrecto      Error en servicio
              Demasiado esfuerzo       No cumple requerimientos
                                                              489
         Preparación del AMEF

   Se recomienda que sea un equipo
    multidisciplinario

   El responsable del sistema, producto o proceso
    dirige el equipo, así como representantes de las
    áreas involucradas y otros expertos en la materia
    que sea conveniente.




                                                        490
           ¿Cuando iniciar un FMEA?
   Al diseñar los sistemas, productos y procesos nuevos.
   Al cambiar los diseños o procesos existentes o que serán
    usados en aplicaciones o ambientes nuevos.

   Después de completar la Solución de Problemas (con el fin de
    evitar la incidencia del problema).

   El AMEF de diseño, después de definir las funciones del
    producto, antes de que el diseño sea aprobado y entregado
    para su manufactura o servicio.

   El AMEF de proceso, cuando los documentos preliminares del
    producto y sus especificaciones están disponibles.
                                                               491
FMEA de Diseño - DFMEA




                         492
               AMEF de Diseño


   El DFMEA es una técnica analítica utilizada por el
    equipo de diseño para asegurar que los modos de
    falla potenciales y sus causas/mecanismos asociados,
    se han considerado y atendido




                                                  493
                AMEF de Diseño
   El proceso inicia con un listado de lo que se espera
    del diseño (intención) y que no hará el diseño

   Las necesidades y expectativas de los clientes de
    determinan de fuentes tales como el QFD,
    requerimientos de diseño del producto, y/o
    requerimientos de manufactura/ensamble/servicio.

   Entre mejor se definan las características deseadas,
    será más fácil identificar Modos de de falla
    potenciales para toma de acciones correctivas /
    preventivas.
                                                    494
               Equipo de trabajo
   El equipo se divide en dos secciones:

   El equipo central (“core”) que participa en todas las
    fases del FMEA y el equipo de soporte que apoya
    conforme es requerido

   El apoyo de la alta dirección es crucial para el éxito




                                                      495
              Alcance del DMEA
   El alcance se establece en el Diagrama de límites
    (Boundary Diagram) por medio de consenso con el
    equipo de:

   ¿Qué se va incluir? ¿Qué se va a excluir?

   Establecer los límites adecuados antes de hacer el
    DFMEA evitará entrar en áreas que no se están
    revisando o creando, para asegurar que el equipo
    adecuado realice el análisis

                                                    496
                Alcance del DMEA
   Para determinar la amplitud del alcance, se deben hacer las
    decisiones siguientes:

   Determinar la estabilidad del diseño o desarrollo del proceso, a
    lo mejor primero se deben aclarar y resolver asuntos pendientes
    antes del DMFEA, ¿está finalizado o es un punto de control?

   ¿Cuántos atributos o características están todavía bajo discusión
    o la necesidad debe determinarse?

   ¿Qué tan avanzado va el diseño o proceso para su terminación?
    Tendrá cambios

                                                              497
             Entradas al DFMEA
          Herramientas de robustez
   Su propósito es reducir la probabilidad de campañas
    de calidad, mejorar la imagen, reducir reclamaciones
    de calidad e incrementar la satisfacción del cliente

   Se generan del diagrama P que identifica los cinco
    factores de ruido, para ser atendidos a tiempo
    haciendo al diseño insensible al ruido




                                                   498
         Modelo DFMEA – Paso 1
               Funciones

   Identificar todas las funciones en el alcance
   Identificar como cada una de las funciones puede fallar (Modos
    de falla)

   Identificar un grupo de efectos asociados para cada modo de
    falla
   Identificar el rango de severidad para cada uno de los grupos
    de efectos que prioriza los modos de falla

   Si es posible recomendar acciones para eliminar los modos de
    falla sin atender las “causas”
   Completar pasos 2 y 3


                                                             499
           Modelo DFMEA – Paso 1
                 Funciones

   La función da respuesta a ¿Qué se supone que hace este
    artículo?

   Las funciones son intenciones del diseño o especs. de ing. y:

        Se escriben en forma de verbo/nombre/caract. medible

        La característica Medible o SDS: Puede ser
         verificada/validada; incluye parámetros adicionales o
         parámetros de diseño como especificaciones de servicio,
         condiciones especiales, peso, tamaño, localización y
         accesibilidad o requerimientos de estándares (v. gr. EMVSS)

                                                              500
         Modelo DFMEA – Paso 1
               Funciones

   Las funciones representan las expectativas, necesidades y
    requerimientos tanto explícitos como no explícitos de los
    clientes y sistemas

   Las funciones no pueden “fallar” si no son medibles o
    especificadas

Ejemplos:
     Almacenar fluido, X litros sin fugas

     Controlar el flujo, X centímetros cúbicos por segundo

     Abrir con X fuerza

     Mantener la calidad del fluido durante X años bajo

      condiciones de operación
                                                              501
         Modelo DFMEA – Paso 1
        Modos de falla potenciales

   Son las formas en las cuales un componente, subsistema o
    sistema pueden potencialmente no cumplir o proporcionar la
    función intencionada, pueden ser también las causas

   El Modo de falla en un sistema mayor puede ser el efecto de un
    componente de menor nivel

   Listar cada uno de los modos de falla potenciales asociados con
    el artículo en particular y con su función (revisar el historial de
    garantías y fallas o hacer tormenta de ideas

   También se deben considerar modos de falla potenciales que
    pudieran ocurrir sólo bajo ciertas condiciones (vg. Calor, frío,
    humedad, polvo, etc)


                                                                502
     Modelo DFMEA – Paso 1
Tipos de Modos de falla potenciales

   No funciona
   Funciona parcialmente / sobre función / degradación
    con el tiempo

   Función intermitente
       A veces causado por los factores ambientales

   Función no intencionada
       Los limpiadores operan sin haber actuado el switch
       El coche va hacia atrás aún con la palanca en Drive


                                                         503
         Modelo DFMEA – Paso 1
    Preguntas para Modos Potenciales de falla


    ¿De que manera puede fallar este artículo para
     realizar su función intencionada?

    ¿Qué puede salir mal (go wrong), a pesar de que el
     artículo se fabrica de acuerdo al dibujo?

    ¿Cuándo se prueba la función, como se debería
     reconocer su modo de falla?

    ¿Dónde y cómo operará el diseño?


                                                      504
          Modelo DFMEA – Paso 1
    Preguntas para Modos Potenciales de falla


    ¿Bajo que condiciones ambientales operará?
    ¿El artículo será usado en ensambles de más alto nivel?
    ¿Cómo interactúa/interfase con otros niveles del diseño?

    No introducir modos de fallas triviales que no pueden o no
     ocurrirán

    Asumiendo la función:
       Almacenar fluido, X litros, 0 fugas, durante 10 años



    Sus modos de falla son:
       Almacenar < X, presenta fugas




                                                                505
          Modelo DFMEA – Paso 1
             Efectos Potenciales de falla


   Se definen como los efectos del modo de falla en la función
    percibida por el cliente. Qué puede notar o experimentar ya sea
    interno o final

   Establecer claramente si la función podría impactar a la
    seguridad, o no cumplimiento de reglamentaciones

   Los efectos se establecen en términos de sisemas específicos,
    subsistemas o componentes conforme sean analizados

   La intención es analizar los efectos de falla al nivel de experiecia
    y conocimiento del equipo.


                                                                 506
         Modelo DFMEA – Paso 1
            Efectos Potenciales de falla


   Describir las consecuencias de cada uno de los modos de falla
    identificados en:
      Partes o componentes

      Ensambles del siguiente nivel

      Sistemas

      Clientes

      Reglamentaciones




   NOTA. Todos los estados de error del diagrama P deben ser
    incluidos en la columna de Modos de falla o efectos del DMFEA



                                                            507
    Modelo DFMEA – Paso 1
Ejemplos de Efectos Potenciales de falla

   Ruidos

   Operación errática – no operable

   Apariencia pobre – olores desagradables

   Operación inestable

   Operación intermitente

   Fugas

   Ruido de radiofrecuencia (EMC)
                                              508
         Modelo DFMEA – Paso 1
               Severidad

   Es la evaluación asociada con el efecto más serio de la columna
    anterior. Habrá sólo una severidad para cada modo de falla

   Para reducir la severidad es necesario hacer un cambio de
    diseño

   La severidad se estima de la tabla siguiente




                                                             509
                Rangos de Severidad (AMEFD)
Efecto          Rango                              Criterio                                       .
No                1           Sin efecto
Muy poco          2           Cliente no molesto. Poco efecto en el desempeño del componente o
                              servicio.
Poco              3           Cliente algo molesto. Poco efecto en el desempeño del comp. o
                              servicio.
Menor             4           El cliente se siente un poco fastidiado. Efecto menor en el desempeño
                              del componente o servicio.
Moderado          5           El cliente se siente algo insatisfecho. Efecto moderado en el
                              desempeño del componente o servicio.

Significativo     6          El cliente se siente algo inconforme. El desempeño del comp. o
                             servicio se ve afectado, pero es operable y está a salvo. Falla parcial,
                  pero operable.
Mayor             7           El cliente está insatisfecho. El desempeño del servicio se ve
seriamente                    afectado, pero es funcional y está a salvo. Sistema afectado.
Extremo           8           Cliente muy insatisfecho. Servicio inadecuado, pero a salvo. Sistema
                              inoperable.
Serio             9           Efecto de peligro potencial. Capaz de descontinuar el uso sin perder
                              tiempo, dependiendo de la falla. Se cumple con el reglamento del
                              gobierno en materia de riesgo.
Peligro           10          Efecto peligroso. Seguridad relacionada - falla repentina.
                              Incumplimiento con reglamento del gobierno.                     510
          Modelo DFMEA – Paso 1
               Clasificación

   Cuando un modo de falla tiene un rango de severidad de 9 o
    10, existe una característica crítica, se identifica como “YC” y se
    inicia un FMEA de proceso

   Estas características del producto afectan su función segura y/o
    cumplimiento de reglamentaciones gubernamentales y pueden
    requerir condiciones especiales de manufactura, ensamble,
    abastecimiento, embarque, monitoreo y/o acciones de
    inspección o controles




                                                                511
          Modelo DFMEA – Paso 1
          Acciones recomendadas

   Eliminar el Modo de falla

   Mitigar el efecto

   Es necesario un énfasis especial en acciones posibles cuando la
    severidad es 9 o 10. Para valores menores también se pueden
    considerar acciones

   Para eliminar el modo de falla considerar la acción:
      Cambiar el diseño (vg. Geometría, material) si está

       relaionado a una característica del producto


                                                             512
         Modelo DFMEA – Paso 2
Identificar:
 Las Causas asociadas (primer nivel y raíz)



   Su tasa de ocurrencia estimada

   La designación de la característica adecuada (si
    existe) a ser indicada en la columna de clasificación

   Acciones recomendadas para Severidad y Criticalidad
    alta (S x O)

                                                     513
      Model DFMEA – Paso 2
Causa potencial o mecanismo de falla

   La causa potencial de falla se define como un
    indicador de debilidad del diseño cuya consecuencia
    es el modo de falla

   Listar como sea posible, cada causa de falla y/o
    mecanismo de falla para cada uno de los modos de
    falla. El detalle de la descripción permitirá enfocar los
    esfuerzos para atacar la causa pertinente




                                                       514
      Model DFMEA – Paso 2
Causa potencial o mecanismo de falla

Se puede emplear un diagrama de Ishikawa o un Árbol de falla
   (FTA), preguntarse:
  ¿Qué circunstancia pudo causar que fallara el artículo para su
   fúnción?
  ¿Cómo podría fallar el artículo para cumplir con las
   especificaciones?
  ¿Cómo pueden ser incompatibles artículos que interactúan?
  ¿Qué información desarrollada en los diagramas P y Matriz de
   Interfase pueden identificar causas potenciales?
  ¿Qué puede causar que el artículo no de la función
   intencionada?
  ¿Qué información en el Diagrama de límites pudo haberse
   pasado que pueda causar este modo de falla?
  ¿En que puede contribuir el historial de 8Ds y FMEAs a las
   causas potenciales?                                       515
      Model DFMEA – Paso 2
Causa potencial o mecanismo de falla

Supuesto 1: El artículo se fabricó de acuerdo a especificaciones,
  ejemplos de causas de falla:
 La especificación de Porosidad del material es muy alta
 La dureza del material especificada es muy baja

   El lubricante especificado es muy viscoso
   Torque especificado demasiado bajo

   Supuesto de confiabilidad inadecuada
   Degradación de parámetro del Componente

   Calor excesivo

                                                             516
      Model DFMEA – Paso 2
Causa potencial o mecanismo de falla

Supuesto 2: El artículo puede incluir una deficiencia que causa
  variabilidad introducida en el proceso de ensamble o
  manufactura:

   Especificar un diseño simétrico que permita que la parte se
    pueda instalar desde atrás o de arriba a abajo

   Torque incorrecto debido a que el hoyo está diseñado fuera de
    posición

   Cinturón equivocado debido a que el diseño es similar a otro
    que es estándar también en uso


                                                             517
      Modelo DFMEA – Paso 2
Causa potencial o mecanismo de falla

Precauciones:
  El DFMA no confía en los controles del proceso para subsanar
   debilidades del diseño, pero toma en cuenta sus limitaciones

   El objetivo es identificar las deficiencias del diseño que peuden
    causar variación inaceptable en el proceso de manufactura o
    ensamble a través de un equipo multidisciplinario

   Las causas de variación que no sean el resultado de directo de
    deficiencias de diseño pueden identificarse en el DFMEA y ser
    atendidas en el FMEA de Proceso

   Otro objetivo es identificar las características que mejoren la
    robustez del diseño que pueda compensar variaciones en
    proceso                                                     518
           Modelo DFMEA – Paso 2
                 Ocurrencia

   Ocurrencia es la probabilidad de que una causa/mecanismo
    (listado en la columna previa) ocurra durante la vida del diseño

   El rango de ocurrencia tiene un significado relativo más que sea
    absoluto

   La prevención o control de las Causas / Mecanismos del modo
    de falla se realiza a través de cambios de diseño o cambios de
    diseño del proceso para reducir la ocurrencia




                                                              519
         Modelo DFMEA – Paso 2
        Estimación de la Ocurrencia

   ¿Cuál es el historial de servicio y campo experimentado con
    artículos similares?
   ¿El artículo es similar al utilizado en niveles anteriores de
    subsistemas?

   ¿El componente es radicalmente diferente de los anteriores?
   ¿Ha cambiado la aplicación del componente?

   ¿Se han instalado controles preventivos en el proceso?
   ¿Cuáles son los cambios en el ambiente?

   ¿Se ha realizado un análisis análítico de la predicción de
    confiabilidad para estimar la tasa de ocurrencia?

                                                                 520
                Rangos de Ocurrencia (AMEFD)
Ocurrencia            Criterios                             Rango Probabilidad de Falla
Remota                Falla improbable. No existen fallas   1      <1 en 1,500,000   Zlt > 5
           asociadas con este producto o con
           un producto / Servicio casi idéntico
Muy Poca              Sólo fallas aisladas asociadas con    2      1 en 150,000      Zlt > 4.5
                      este producto / Servicio
                      casi idéntico
                                                            3      1 en 30,000
Poca                  Fallas aisladas asociadas con                                  Zlt > 4
                      productos / Servicios similares
Moderada              Este producto / Servicio ha
                      tenido fallas ocasionales             4      1 en 4,500        Zlt > 3.5
                                                            5      1 en 800          Zlt > 3
Alta                  Este producto / Servicio ha
                                                            6      1 en 150          Zlt > 2.5
                      fallado a menudo
                                                            7      1 en 50           Zlt > 2
Muy alta              La falla es casi inevitable
                                                            8      1 en 15           Zlt > 1.5
                                                            9      1 en 6            Zlt > 1
                                                            10     >1 en 3           Zlt < 1

       Nota: El criterio se basa en la probabilidad de ocurrencia de la
       causa/mecanismo. Se puede basar en el desempeño de un diseño similar en
       una aplicación similar.
                   Clasificación
   Cuando el Modo de falla/causa tien una severidad de
    5 a 8 y una ocurrencia de 4 o mayor, entonces se
    tiene una caracterítica significativa crítica potencial
    que se identifica con “YS” y se inicia el FMEA de
    proceso

   Estas características del producto afectan la función
    del producto y/o son importantes para la satisfacción
    del cliente y pueden requerir condiciones especiales
    de manufactura, ensamble, embarque, monitoreo y/o
    inspección

                                                      522
                   Modelo DFMEA
                      Paso 3
Si las causas no se pueden eliminar en paso 1 o 2, Identificar
   Controles actuales de prevención usados para establecer la
    ocurrencia
   Controles actuales de detección (vg. Pruebas) usadas para
    establecer la Detección
   Determinar la efectividad de los controles de Detección en
    escala de 1 a 10
   El RPN inicial (Risk Priority Number).
   Acciones Recomendadas (Prevenciónn and Detección).
   Cuando ya se hayan implementado las acciones recomenddas,
    se revisa el formato DFMEA en relación a la Severidad,
    Ocurrencia, Detección y RPN

                                                         523
          Modelo DFMEA – Paso 3
        Controles de diseño actuales
   Listar las actividades terminadas para prevención,
    vaidación/verificación del diseño (DV), u otras actividades que
    aseguran la adecuación del diseño para el modo de falla y/o
    causa / mecanismo bajo consideración

   Controles actuales (vg. Diseños falla/seguro como válvulas de
    alivio, revisiones de factibilidad, CAE, Confianilidad y robustez
    analítica) son los que han sido o estan usándose con los mismos
    diseños o similares.

   El equipo siempre debe enfocarse a mejorar los controles de
    diseño, por ejemplo la creación de nuevos sistemas de prueba
    en el laboratorio, o la creación de muevos algoritmos de
    modelado, etc.

                                                              524
           Modelo DFMEA – Paso 3
         Controles de diseño actuales
   Hay dos tipos de controles de diseño: Prevención y
    detección

   De prevención:
       Previenen la ocurrencia de la causa/mecanismo o Modo
        de falla/efecto reduciendo la tasa de Ocurrencia
   De detección:
       Detectan la causa/mecanismo o Modo de falla/efecto
        ya sea por métodos analíticos o físicos antes que el
        artículo se libere para Poducción
   Si solo se usa una columna indicarlos con P o D

                                                        525
          Modelo DFMEA – Paso 3
        Controles de diseño actuales
Identificación de controles de diseño
  Si una causa potencial no fue analizada, el producto
   con deficiencia de diseño pasará a Producción. Una
   forma de detectarlo es con su Modo de falla
   resultante. Se debe tomar acción correctiva

Identificar controles de diseño como sigue:
1. Identificar y listar los métodos que puedan ser
   utilizados para detectar el modo de falla, como:
   1.   FMEA anteriores, Planes de DV anteriores, Lista de
        verificáción de robustez, Acciones de 8Ds
                                                       526
        Modelo DFMEA – Paso 3
      Controles de diseño actuales
2. Listar todos los controles de diseño históricos que
   puedan ser suados para causas de primer nivel
   listadas. Revisar reportes históricos de pruebas

3. Identificar otros métodos posibles preguntando:
  ¿De que manera puede la causa de este modo de falla ser
  reconocida?

  ¿Cómo puedo descubrir que esta causa ha ocurrido?

  ¿De que manera este modo de falla puede ser reconocido?
  ¿Cómo puedo descubrir que este modo de falla ha ocurrido?
                                                        527
            Modelo DFMEA – Paso 3
                  Detección
   Cuando se estima una tasa de Detección, considerar solo los
    controles que serán usados para detectar los Modos de Falla o
    sus Causas. Los controles intencionados para prevenir o reducir
    la Ocurrencia de una Causa o Modo de falla son considerados al
    estimar la tasa de Ocurrencia

   Si los controles de prevención no detectan deben ser calificadas
    con 10

   Solo se deben considerar los métodos que son usados antes de
    la liberación a Producción para estimar la tasa de Detección
   Los programas de verificación de diseño deben basarse en la
    efectividad de los controles de diseño
                                                             528
              Modelo DFMEA – Paso 3
                    Detección
Para evaluar la efectividad de cada control de diseño considerar las
   siguientes categorías (de mayor a menor):

   Métodos de análisis de diseño
      Modelado y simulación probada (vg. Análisis de elementos
       finitos)
      Estudios de tolerancias (vg. Tolerancias deométricas
       dimensionales)
      Estudios de compatibilidad de materiales (vg. Expansión
       térmica, corrosión)
      Revisión de diseño subjetiva

   Métodos de desarrollo de pruebas:
      Diseño de experimentos/ experimentos de peor caso (vg.
       Ruido)
                                                               529
             Modelo DFMEA – Paso 3
                   Detección
   Métodos de desarrollo de pruebas (cont…):
      Pruebas en muestras de pre-producción o prototipo
      Maquetas usando partes similares

      Pruebas de durabilidad (verificación de diseño)

   Número de muestras a ser probadas
      Muestra significativa estadísticamente

      Cantidad pequeña, no significativa estadísticamente

   Oportunidad de la aplicación de control de diseño
        Desde la etapa de diseño del concepto (vg. Decisión
         del tema)
        Al tener prototipos de ingeneiría
        Justo antes de liberarse a Producción
                                                         530
      Rangos de Detección (AMEFD)
• Rango de Probabilidad de Detección basado en la
  efectividad del Sistema de Control Actual; basado en el
  cumplimiento oportuno con el Plazo Fijado

1      Detectado antes del prototipo o prueba piloto

2-3    Detectado antes de entregar el diseño

4-5    Detectado antes del lanzamiento del servicio

6-7    Detectado antes de la prestación del servicio

8      Detectado antes de prestar el servicio

9      Detectado en campo, pero antes de que ocurra la falla o error

10     No detectable hasta que ocurra la falla o error en campo
       DFMEA – Cálculo del riesgo
   El número de prioridad del rieso (RPN) es el producto de
    Severidad (S), Ocurrencia (O) y Detección (D)


   RPN = (S) x (O) x (D) con valores entre 1 y 1000

   Puede usarse como en un Pareto para priorizar riesgos
    potenciales con efectos que tengan las tasas más altas de
    severidad

   Atender los aspectos con Severidad 9 o 10 y después los efectos
    con Severidad alta; los de criticalidad alta (S x O) y al final los
    que tienen RPNs más altos


                                                                532
DFMEA – Acciones recomendadas
Considerar acciones como las siguientes:
 Revisión del diseño de la Geometría y/o tolerancias
 Revisión de especificación de materiales
 Diseños de experimentos (con múltiples causas interactuando) u
  otras técnicas de solución de problemas
 Revisión de planes de prueba
 Sistemas redundantes – dispositivos de aviso – estados de falla
  (ON y OFF)

El objetivo primario de las acciones recomendadas es reducir
   riesgos e incrementar la satisfacción del cliente al mejorar el
   diseño.
Para reducir la severidad es necesario un cambio de diseño
                                                               533
       DFMEA – Acciones tomadas
   Se identifica la organización y persona responsable para las
    acciones recomendadas y la fecha de terminación

   Dar seguimiento:
      Desarrollar una lista de características especiales parasu

       consideración en el DFMEA
      Dar seguimiento a todas las acciones recomendadas y

       actualizar las acciones del DFMEA

   Después de que se implementa una acción, anotar una
    descripción breve y la fecha de efectividad


                                                              534
     DFMEA – Nivel de riesgo RPN
   Después de haber implementado las acciones
    preventivas/correctivas, registrar la nueva Severidad,
    Ocurrencia y Detección

   Calcular el nuevo RPN

   Si no se tomaron acciones en algunos aspectos, dejarlos en
    blanco




                                                             535
     DFMEA – Lista de verificación de
                robustez
   Es una salida del proceso integrado de robustez:
       Resume los atributos de robustez clave y controles de
        diseño

       Enlaza el DFMEA y los 5 factores de ruido del diseño al
        Plan de verificación de diseño (DVP); vg., esta lista es
        una entrada al DVP

       Debe ser un documento clave a revisar como parte del
        proceso de revisión de diseño


                                                          536
FMEA de Proceso - PFMEA




                          537
                          PFMEA
   Equipo
       Se inicia por el Ing. responsable de la actividad, en
        conjunto con un equipo de personas expertas además
        de incluir personas de apoyo


   Alcance
       Define que es incluido y que es excluido




                                                        538
               Entradas al PFMEA
   Diagrama de flujo del proceso
       El equipo debe desarrollar el flujo del proceso,
        preguntando ¿Qué se supone que hace el proceso?;
        ¿Cuál es su propósito?; ¿Cuál es su función?


   El Diagrama P es una entrada opcional al PFMEA




                                                     539
                               ANALISIS DEL MODO Y EFECTO DE FALLA
                                      AMEF de Diseño / Proceso
Componente ______________________                    Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________                            Preparó _______________                  Pagina _______de _______
Equipo de Trabajo ___________                                                                 FECHA (orig.) de FMEA ______(rev.) ______


                                                                                                                           Resultados de Acción
                                                                       O   Controles de   D
    Función                                      S       Causa(s)
                                 Efecto (s)                            c    Diseño o      e R             Responsable                 S O D R
 del Producto/   Modos de Falla                  e     Potencial(es)                           Acción                       Acción
                                Potencial (es)                         c     Proceso      t P             y fecha límite              e c e P
   Paso del       Potenciales                    v    o Mecanismos                            Sugerida                     Adoptada
                                   de falla                            u    Actuales      e N            de Terminación               v c t N
    proceso                                      .        de falla
                                                                       r                  c




                                                                                                                                            540
       Modelo del PFMEA – Paso 1
   Identificar todos los requerimientos funcionales dentro del
    alcance

   Identificar los modos de falla correspondientes

   Identificar un conjunto de efectos asociados para cada modo de
    falla

   Identificar la calificación de severidad para cada conjunto de
    efectos que de prioridad el modo de falla

   De ser posible, tomar acciones para eliminar modos de falla sin
    atender las “causas”

                                                               541
        Modelo de PFMEA – Paso 1

   Requerimientos de la función del proceso
       Contiene características de ambos el producto y el
        proceso


   Ejemplos
       Operación No. 20: Hacer perforación de tamaño X de
        cierta profundidad
       Operación No. 22: Realizar el subensamble X al
        ensamble Y



                                                         542
                              ANALISIS DEL MODO Y EFECTO DE FALLA
                                     AMEF de Diseño / Proceso
 Componente ______________________                                                   AMEF Número _________________
                                                   Responsable del Diseño ____________
 Ensamble ________________                         Preparó _______________               Pagina _______de _______
 Equipo de Trabajo ___________                                                           FECHA (orig.) de AMEF ______(rev.) ______


                                                                                                                      Resultados de Acción
                                                                     O               D
     Función                                   S        Causa(s)       Controles del
                                 Efecto (s)                          c               e R             Responsable                 S O D R
        de       Modos de Falla                e      Potencial(es)      Diseño /         Acción                       Acción
                                Potencial (es)                       c               t P             y fecha límite              e c e P
 Componente/Paso  Potenciales                  v   de los Mecanismos     Proceso         Sugerida                     Adoptada
                                   de falla                          u               e N            de Terminación               v c t N
    de proceso                                 .         de falla         Actual
                                                                     r               c
 Factura correcta

                                        Relacione las
                                        funciones del
                                          diseño del
                                         componente




Pasos del proceso
Del diagrama de flujo
       Modelo de PFMEA – Paso 1

   Modos de falla potenciales
      No funciona

      Funcionamiento parcial / Sobre función / Degradación en el

       tiempo
      Funcionamiento intermitente

      Función no intencionada

   Los modos de falla se pueden categorizar como sigue:
      Manufactura: Dimensional fuera de tolerancia

      Ensamble: Falta de componentes

      Recibo de materiales: Aceptar partes no conformes

      Inspección/Prueba: Aceptar partes equivocadas




                                                           544
                               ANALISIS DEL MODO Y EFECTO DE FALLA
                                      AMEF de Diseño / Proceso
Componente ______________________                                               AMEF Número _________________
                                              Responsable del Diseño ____________
Ensamble ________________                     Preparó _______________                 Pagina _______de _______
Equipo de Trabajo ___________                                                         FECHA (orig.) de AMEF ______(rev.) ______


                                                                                                                   Resultados de Acción
    Función                                                      O                D
                                                    Causa(s)       Controles de
       del                     Efecto (s)    D                   c                e R             Responsable                 S O D R
               Modos de Falla                     Potencial(es)      Diseño /          Acción                       Acción
 componente/                  Potencial (es) i                   c                t P             y fecha límite              e c e P
                Potenciales                    de los Mecanismos     Proceso          Sugerida                     Adoptada
    Paso del                     de falla    v                   u                e N            de Terminación               v c t N
                                                     de falla       Actuales
    proceso                                                      r                c
Factura
correcta
               Datos incorrectos        Identificar modos
                                          de falla Tipo 1
                                          inherentes al
                                              diseño
        Modelo de PFMEA – Paso 1

   Efectos de las fallas potenciales (consecuencias en)
       Seguridad del operador
       Siguiente usuario
       Usuarios siguientes
       Máquinas / equipos
       Operación del producto final
       Cliente último
       Cumplimiento de reglamentaciones gubernamentales




                                                    546
        Modelo de PFMEA - Paso 1

   Efectos de las fallas potenciales (en usuario final)
       Ruido
       Operación errática
       Inoperable
       Inestable
       Apariencia mala
       Fugas
       Excesivo esfuerzo
       Retrabajos / reparaciones
       Insatisfacción del cliente

                                                      547
        Modelo de PFMEA –Paso 1

   Efectos de las fallas potenciales (en siguiente
    operación)
       No se puede sujetar
       No se puede tapar
       No se puede montar
       Pone en riesgo al operador
       No se ajusta
       No conecta
       Daña al equipo
       Causa excesivo desgaste de herramentales

                                                      548
                                 ANALISIS DEL MODO Y EFECTO DE FALLA
                                            AMEF de Diseño
Componente ______________________                                                       AMEF Número _________________
                                                      Responsable del Diseño ____________
Ensamble ________________                             Preparó _______________                  Pagina _______de _______
Equipo de Trabajo ___________                                                                  FECHA (orig.) de AMEF ______(rev.) ______


                                                                                                                            Resultados de Acción
                                                                        O   Controles de   D
     Función                                              Causa(s)
                               Efecto (s)         D                     c     Diseño /     e R             Responsable                 S O D R
del componente Modos de Falla                           Potencial(es)                           Acción                       Acción
                              Potencial (es)      i                     c     Proceso      t P             y fecha límite              e c e P
   / Paso del   Potenciales                             oMecanismos                            Sugerida                     Adoptada
                                 de falla         v                     u    Actuales      e N            de Terminación               v c t N
     proceso                                               de falla
                                                                        r                  c

                                 LOCAL:
Factura correcta Datos incorrectos
                                 Rehacer
                                 la factura

                                                              Describir los efectos de
                                 MAXIMO PROXIMO                   modo de falla en:
                                 Contabilidad                         LOCAL
                                 equivocada                    El mayor subsecuente
                                                                   Y Usuario final
                                 CON CLIENTE
                                 Molestia
                                 Insatisfacción




               CTQs del QFD o
               Matriz de Causa Efecto
                      CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA AMEFP

Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura
     / ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor de las dos severidades

                                 Efecto en el cliente                                     Efecto en Manufactura /Ensamble
 Efecto
                                                                                                                                             Calif.
Peligroso
sin aviso
            Calificación de severidad muy alta cuando un modo potencial de
            falla afecta la operación segura del producto y/o involucra un no
                                                                                Puede exponer al peligro al operador (máquina o ensamble)
                                                                                sin aviso                                                    10
            cumplimiento con alguna regulación gubernamental, sin aviso

Peligroso
con aviso
            Calificación de severidad muy alta cuando un modo potencial de
            falla afecta la operación segura del producto y/o involucra un no
                                                                                Puede exponer al peligro al operador (máquina o ensamble)
                                                                                sin aviso                                                    9
            cumplimiento con alguna regulación gubernamental, con aviso

Muy alto    El producto / item es inoperable ( pérdida de la función
            primaria)
                                                                                El 100% del producto puede tener que ser desechado op
                                                                                reparado con un tiempo o costo infinitamente mayor           8
Alto        El producto / item es operable pero con un reducido nivel de
            desempeño. Cliente muy insatisfecho
                                                                                El producto tiene que ser seleccionado y un parte
                                                                                desechada o reparada en un tiempo y costo muy alto           7
Modera
do
            Producto / item operable, pero un item de confort/conveniencia
            es inoperable. Cliente insatisfecho
                                                                                Una parte del producto puede tener que ser desechado sin
                                                                                selección o reparado con un tiempo y costo alto              6
Bajo        Producto / item operable, pero un item de confort/conveniencia
            son operables a niveles de desempeño bajos
                                                                                El 100% del producto puede tener que ser retrabajado o
                                                                                reparado fuera de línea pero no necesariamente va al àrea    5
                                                                                de retrabajo .
Muy bajo    No se cumple con el ajuste, acabado o presenta ruidos y
            rechinidos. Defecto notado por el 75% de los clientes
                                                                                El producto puede tener que ser seleccionado, sin desecho,
                                                                                y una parte retrabajada                                      4
Menor       No se cumple con el ajuste, acabado o presenta ruidos y
            rechinidos. Defecto notado por el 50% de los clientes
                                                                                El producto puede tener que ser retrabajada, sin desecho,
                                                                                en línea, pero fuera de la estación                          3
Muy
menor
            No se cumple con el ajuste, acabado o presenta ruidos, y
            rechinidos. Defecto notado por clientes muy críticos (menos del
                                                                                El producto puede tener que ser retrabajado, sin desecho
                                                                                en la línea, en la estación                                  2
            25%)
Ninguno     Sin efecto perceptible                                              Ligero inconveniente para la operación u operador, o sin
                                                                                efecto                                                       1
                      CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA PFMEA

Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura
     / ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor de las dos severidades

                                 Efecto en el cliente                                     Efecto en Manufactura /Ensamble
 Efecto
                                                                                                                                             Calif.
Peligroso
sin aviso
            Calificación de severidad muy alta cuando un modo potencial de
            falla afecta la operación segura del producto y/o involucra un no
                                                                                Puede exponer al peligro al operador (máquina o ensamble)
                                                                                sin aviso                                                    10
            cumplimiento con alguna regulación gubernamental, sin aviso

Peligroso
con aviso
            Calificación de severidad muy alta cuando un modo potencial de
            falla afecta la operación segura del producto y/o involucra un no
                                                                                Puede exponer al peligro al operador (máquina o ensamble)
                                                                                sin aviso                                                    9
            cumplimiento con alguna regulación gubernamental, con aviso

Muy alto    El producto / item es inoperable ( pérdida de la función
            primaria)
                                                                                El 100% del producto puede tener que ser desechado op
                                                                                reparado con un tiempo o costo infinitamente mayor           8
Alto        El producto / item es operable pero con un reducido nivel de
            desempeño. Cliente muy insatisfecho
                                                                                El producto tiene que ser seleccionado y un parte
                                                                                desechada o reparada en un tiempo y costo muy alto           7
Modera
do
            Producto / item operable, pero un item de confort/conveniencia
            es inoperable. Cliente insatisfecho
                                                                                Una parte del producto puede tener que ser desechado sin
                                                                                selección o reparado con un tiempo y costo alto              6
Bajo        Producto / item operable, pero un item de confort/conveniencia
            son operables a niveles de desempeño bajos
                                                                                El 100% del producto puede tener que ser retrabajado o
                                                                                reparado fuera de línea pero no necesariamente va al àrea    5
                                                                                de retrabajo .
Muy bajo    No se cumple con el ajuste, acabado o presenta ruidos y
            rechinidos. Defecto notado por el 75% de los clientes
                                                                                El producto puede tener que ser seleccionado, sin desecho,
                                                                                y una parte retrabajada                                      4
Menor       No se cumple con el ajuste, acabado o presenta ruidos y
            rechinidos. Defecto notado por el 50% de los clientes
                                                                                El producto puede tener que ser retrabajada, sin desecho,
                                                                                en línea, pero fuera de la estación                          3
Muy
menor
            No se cumple con el ajuste, acabado o presenta ruidos, y
            rechinidos. Defecto notado por clientes muy críticos (menos del
                                                                                El producto puede tener que ser retrabajado, sin desecho
                                                                                en la línea, en la estación                                  2
            25%)
Ninguno     Sin efecto perceptible                                              Ligero inconveniente para la operación u operador, o sin
                                                                                efecto                                                       1
        Modelo de PFMEA – Paso 2

   Paso 2 identificar:
       Las causas asociadas (primer nivel y raíz)

       Su tasa de ocurrencia

       La designación apropiada de la característica indicada
        en ola columna de clasificación

       Acciones recomendadas para alta severidad y
        criticalidad (S x O) así como la Seguridad del operador
        (OS) y errores de proceso de alto impacto (HI)


                                                         552
       Modelo de PFMEA – Paso 2

Causa/Mecanismo potencial de falla
      Describe la forma de cómo puede ocurrir la falla,
       descrito en términos de algo que puede ser corregido o
       controlado
      Se debe dar priorioridad a rangos de prioridad de 9 o
       10
Ejemplos, especificar claramente:
      Torque inadecuado (bajo o alto)
      Soldadura iandecuada (corriente, tiempo, presión)
      Lubricación inadecuada


                                                       553
      Efecto(s) Potencial(es) de falla
Evaluar 3 (tres) niveles de Efectos del Modo de Falla
• Efectos Locales
   – Efectos en el Área Local
   – Impactos Inmediatos

• Efectos Mayores Subsecuentes
   – Entre Efectos Locales y Usuario Final

• Efectos Finales
  – Efecto en el Usuario Final del producto o Servicio
                                                      554
        Modelo de PFMEA – Paso 2

   Suposición 1: Los materiales para la operación son
    correctos
       Ajuste de herramentales a la profundidad equivocada
       Desgaste de herramentales
       Temperatura del horno muy alta
       Tiempo de curado muy corto
       Presión de aire muy baja
       Velocidad del transportador no es constante
       Jets de lavadora desconectados



                                                       555
        Modelo de PFMEA – Paso 2

   Suposición 2: Los materiales para la operación tienen
    variación
       Material demasiado duro / suave / quebradizo
       La Dimensión no cumple especificaciones
       El acabado superficial de la operación 10 no cumple
        especificaciones
       El localizador de perforación fuera de posición correcta




                                                          556
        Modelo de PFMEA – Paso 2

   Ocurrencia:
       Es la probabilidad de que una causa/mecanismo ocurra
       Se puede reducir o controlar solo a través de un
        cambio de diseño
       Si la ocurrencia de la causa no puede ser estimada,
        entonces estimar la tasa de falla posible




                                                      557
   CRITERIO DE EVALUACIÓN DE OCURRENCIA SUGERIDO PARA AMEFP
      Probabilidad           Indices Posibles de          ppk     Calif.
                                    falla
Muy alta: Fallas             100 por mil piezas         < 0.55    10
persistentes
                                    50 por mil piezas    > 0.55     9

Alta: Fallas frecuentes             20 por mil piezas    > 0.78     8

                                    10 por mil piezas    > 0.86     7

Moderada: Fallas                     5 por mil piezas    > 0.94     6
ocasionales
                                     2 por mil piezas    > 1.00     5

                                      1 por mil piezas   > 1.10     4

Baja : Relativamente pocas          0.5 por mil piezas   > 1.20     3
fallas
                                    0.1 por mil piezas   > 1.30     2

Remota: La falla es           <   0.01 por mil piezas    > 1.67     1
improbable
        Modelo de PFMEA – Paso 2



   Clasificación de características especiales si:
       Afectan la función del producto final, cumplimiento con
        reglamentaciones gubernamentales, seguridad de los
        operadores, o la satisfacción del cliente, y

       Requieren controles especiales de manufactura,
        ensamble, proveedores, embarques, monitoreo y/o
        inspección o seguridad




                                                         559
                                ANALISIS DEL MODO Y EFECTO DE FALLA
                                       AMEF de Diseño / Proceso
Componente ______________________                                                      AMEF Número _________________
                                                     Responsable del Diseño ____________
Ensamble ________________                            Preparó _______________                   Pagina _______de _______
Equipo de Trabajo ___________                                                                  FECHA (orig.) de AMEF ______(rev.) ______


                                                                                                                            Resultados de Acción
                                                                       O                   D
     Función                                     S      Causa(s)            Controles de
                               Efecto (s)                              c                   e R             Responsable                 S O D R
del componente Modos de Falla                    e     Potencial(es)          Diseño /          Acción                       Acción
                              Potencial (es)                           c                   t P             y fecha límite              e c e P
   / Paso del   Potenciales                      v    o Mecanismos            Proceso          Sugerida                     Adoptada
                                 de falla                              u                   e N            de Terminación               v c t N
     proceso                                     .       de falla            Actuales
                                                                       r                   c
La abertura del
engrane propor La abertura no   LOCAL:
ciona una aber- es suficiente   Daño a sensor
tura de aire entre              de velocidad y
diente y diente                 engrane
                                                                               Usar tabla para
                                MAXIMO PROXIMO
                                Falla en eje 7                             determinar severidad o
                                                                                 gravedad

                                CON CLIENTE
                                Equipo
                                parado
                               ANALISIS DEL MODO Y EFECTO DE FALLA
                                      AMEF de Diseño / Proceso
Componente ______________________                                                     AMEF Número _________________
                                                    Responsable del Diseño ____________
Ensamble ________________                           Preparó _______________                 Pagina _______de _______
Equipo de Trabajo ___________                                                               FECHA (orig.) de AMEF ______(rev.) ______


                                                                                                                        Resultados de Acción
  Función                                                             O                D
                                           S            Causa(s)        Controles de
    del                      Efecto (s)                               c                e R             Responsable                 S O D R
             Modos de Falla                e          Potencial(es)       Diseño/           Acción                       Acción
Componente /                Potencial (es)                            c                t P             y fecha límite              e c e P
              Potenciales                  v         o Mecanismos         Proceso          Sugerida                     Adoptada
  Paso del                     de falla                               u                e N            de Terminación               v c t N
                                           .             de falla        Actuales
  proceso                                                             r                c

Factura correcta Datos         LOCAL:
                 equivocadso   Rehacer la
                               factura
                                                                                              Rango de
                                                                                       probabilidades en que
                               MAXIMO PROXIMO                                           la causa identificada
                               Contabilidad     7                     3                        ocurra
                               erronea

                               CON CLIENTE
                               Molestia
                               Insatisfacción
        Modelo de PFMEA – Paso 3



   En el paso 3 identificar:
       Controles actuales de prevención del proceso (con
        acciones de diseño o proceso) usados para establecer
        la ocurrencia
       Controles actuales de detección (vg. Inspección)
        usados para establecer la tasa de detección
       Efectividad de los controles de detección del proceso
        en una escala de 1 a 10
       El factor de riesgo RPN inicial
       Acciones recomendadas (Prevención y Detección)


                                                        562
     Identificar Causa(s) Potencial(es) de la Falla

• Causas relacionadas con el diseño - Características del
  servicio o Pasos del proceso
   – Diseño de formatos
   – Asignación de recursos
   – Equipos planeados

• Causas que no pueden ser Entradas de Diseño,
  tales como:
   – Ambiente, Clima, Fenómenos naturales

• Mecanismos de Falla
   – Rendimiento, tiempo de entrega, información completa
                                                            563
                                 ANALISIS DEL MODO Y EFECTO DE FALLA
                                            AMEF de Diseño
Componente ______________________                                                       AMEF Número _________________
                                                      Responsable del Diseño ____________
Ensamble ________________                             Preparó _______________                 Pagina _______de _______
Equipo de Trabajo ___________                                                                 FECHA (orig.) de AMEF ______(rev.) ______


                                                                                                                           Resultados de Acción
                                                                        O                 D
                                                  S        Causa(s)        Controles de
   Función                       Efecto (s)                             c                 e R             Responsable                 S O D R
                 Modos de Falla                   e      Potencial(es)    Diseño/Proces        Acción                       Acción
      de                        Potencial (es)                          c                 t P             y fecha límite              e c e P
                  Potenciales                     v   de los Mecanismos     o Actuales        Sugerida                     Adoptada
   Artículo                        de falla                             u                 e N            de Terminación               v c t N
                                                  .         de falla
                                                                        r                 c

                                 LOCAL:
Factura correcta Datos incorrectos
                                   Rehacer la                                      Identificar causas
                                 factura
                                                                                       de diseño, y
                                                                                     mecanismos de
                                 MAXIMO PROXIMO                                     falla que pueden
                                 Contabilidad 7
                                 erronea                                          ser señalados para
                                                                                  los modos de falla
                                 CON CLIENTE
                                 Molestia
                                                                                       identificada.

                                            Causas potenciales
                                 Insatisfacción


                                            De Diagrama de Ishikawa
                                            Diagrama de árbol o
                                            Diagrama de relaciones
        Modelo de PFMEA – Paso 3



   Controles de proceso actuales:
       Son una descripción de los controles ya sea para
        prevenir o para detectar la ocurrencia de los
        Modos/causas de falla

   Consideraciones
       Incrementar la probabilidad de detección es costosa y
        no efectiva
       A veces se requiere un cambio en el diseño para
        apoyar la detección
       El incremento del control de calidad o frecuencia de
        inspección sólo debe utilizarse como medida temporal
       Se debe hacer énfasis en la prevención de los defectos
                                                           565
    Identificar Controles de Diseño o de
    Proceso Actuales
• Verificación/ Validación de actividades de Diseño o
  control de proceso usadas para evitar la causa,
  detectar falla anticipadamente, y/o reducir impacto:

         Cálculos, Análisis, Prototipo de Prueba, Pruebas piloto
         Poka Yokes, planes de control, listas de verificación

•   Primera Línea de Defensa - Evitar o eliminar causas de falla o error

•   Segunda Línea de Defensa - Identificar o detectar fallas o errores
    Anticipadamente

•   Tercera Línea de Defensa - Reducir impactos/consecuencias de falla o
    errores
                                                                     566
                                ANALISIS DEL MODO Y EFECTO DE FALLA
                                           AMEF de Diseño
Componente ______________________                                                      AMEF Número _________________
                                                     Responsable del Diseño ____________
Ensamble ________________                            Preparó _______________                Pagina _______de _______
Equipo de Trabajo ___________                                                               FECHA (orig.) de AMEF ______(rev.) ______


                                                                                                                         Resultados de Acción
  Función                                                              O                D
                                           S             Causa(s)        Controles de
    del                      Efecto (s)                                c                e R             Responsable                 S O D R
             Modos de Falla                e           Potencial(es)       Diseño /          Acción                       Acción
Componente /                Potencial (es)                             c                t P             y fecha límite              e c e P
              Potenciales                  v          o Mecanismos         Proceso          Sugerida                     Adoptada
  Paso del                     de falla                                u                e N            de Terminación               v c t N
                                           .              de falla        Actuales
  proceso                                                              r                c

Factura correcta Datos correctos LOCAL:
                                 Rehacer la
                                 factura
                                                                                             ¿Cuál es el método de
                                                                                             control actual que usa
                                MAXIMO PROXIMO                                              ingeniería para evitar el
                                Contabilidad     7                     3                        modo de falla?
                                erronea

                                CON CLIENTE
                                Molestia
                                Insatisfacción
       Modelo de PFMEA – Paso 3



Seleccionar un rango en la tabla de detección
Si se usa inspección automática al 100% considerar:
      La condición del gages
      La calibración del gage
      La variación del sistema de medición del gage
      Probabilidad de falla del gage
      Probabilidad de que el sistema del gage sea punteado
Si se usa inspección visual al 100% considerar:
      Es efectiva entre un 80 a 100% dependiendo del proc.
      El número de personas que pueden observar el modo
       de falla potencialmente
      La naturaleza del modo de falla - ¿es claro o confuso?
                                                       568
         CRITERIO DE EVALUACIÓN DE DETECCION SUGERIDO PARA AMEFP
Detecciòn                 Criterio                  Tipos de           Métodos de seguridad de Rangos de                                    Calif
                                                   Inspección                      Detección
                                               A      B         C

Casi        Certeza absoluta de no detección                    X   No se puede detectar o no es verificada
imposible
                                                                                                                                            10
Muy         Los controles probablemente no                      X   El control es logrado solamente con
remota      detectarán
                                                                                                                                             9
                                                                    verificaciones indirectas o al azar
Remota      Los controles tienen poca                           X   El control es logrado solamente con
            oportunidad de detección
                                                                                                                                             8
                                                                    inspección visual
Muy baja    Los controles tienen poca                           X   El control es logrado solamente con
            oportunidad de detección
                                                                                                                                             7
                                                                    doble inspección visual
Baja        Los controles pueden detectar             X         X   El control es logrado con métodos gráficos con                           6
                                                                    el CEP
Moderada    Los controles pueden detectar             X             El control se basa en mediciones por variables después de que las
                                                                    partes dejan la estación, o en dispositivos Pasa NO pasa realizado en    5
                                                                    el 100% de las partes después de que las partes han dejado la
                                                                    estación


Moderada    Los controles tienen una buena     X      X             Detección de error en operaciones subsiguientes, o medición

mente       oportunidad para detectar
                                                                    realizada en el ajuste y verificación de primera pieza ( solo para       4
                                                                    causas de ajuste)
Alta
Alta        Los controles tienen una buena     X      X             Detección del error en la estación o detección del error en

            oportunidad para detectar
                                                                    operaciones subsiguientes por filtros multiples de aceptación:           3
                                                                    suministro, instalación, verificación. No puede aceptar parte
                                                                    discrepante


Muy Alta    Controles casi seguros para        X      X
            detectar
                                                                    Detección del error en la estación (medición automática
                                                                    con dispositivo de paro automático). No puede pasar la                   2
                                                                    parte discrepante

Muy Alta    Controles seguros para detectar    X                    No se pueden hacer partes discrepantes porque el item ha
                                                                    pasado a prueba de errores dado el diseño del                            1
                                                                    proceso/producto

Tipos de inspección: A) A prueba de error      B) Medición automatizada C) Inspección visual/manual
                                ANALISIS DEL MODO Y EFECTO DE FALLA
                                       AMEF de Diseño / Proceso
Componente ______________________                                                      AMEF Número _________________
                                                     Responsable del Diseño ____________
Ensamble ________________                            Preparó _______________                  Pagina _______de _______
Equipo de Trabajo ___________                                                                 FECHA (orig.) de AMEF ______(rev.) ______


                                                                                                                            Resultados de Acción
  Función                                                              O                  D
                                                 S      Causa(s)           Controles de
    del                      Efecto (s)                                c                  e R              Responsable                 S O D R
             Modos de Falla                      e     Potencial(es)         Diseño /          Acción                        Acción
Componente /                Potencial (es)                             c                  t P              y fecha límite              e c e P
              Potenciales                        v    o Mecanismos           Proceso          Sugerida                      Adoptada
  Paso del                     de falla                                u                  e N             de Terminación               v c t N
                                                 .       de falla           Actuales
  proceso                                                              r                  c

                                 LOCAL:
Factura correcta Datos incorrectos
                                 Rehacer la
                                 factura

                                                                                                         ¿Cuál es la probabilidad
                                MAXIMO PROXIMO
                                                                                                         de detectar la causa de
                                Contabilidad     7                     3                  5
                                                                                                                  falla?
                                erronea

                                CON CLIENTE
                                Molestia
                                Insatisfacción
        Modelo de PFMEA – Paso 3



   Número de prioridad de riesgo
       Se calcula como RPN = (S) x (O) x (D)

   Acciones recomendadas
       Se deben dirigir primero a las de valores altos de
        Severidad (9 o 10) o RPNs, después continuar con las
        demás
       Las acciones se deben orientar a prevenir los defectos
        a través de la eliminación o reducción de las causas o
        modos de falla


                                                         571
      Calcular RPN (Número de Prioridad de
                     Riesgo)

Producto de Severidad, Ocurrencia, y Detección

RPN / Gravedad usada para identificar principales CTQs

               Severidad mayor o igual a 8
                    RPN mayor a 150




                                                    572
               Planear Acciones

Requeridas para todos los CTQs

   Listar todas las acciones sugeridas, qué persona
    es la responsable y fecha de terminación.
   Describir la acción adoptada y sus resultados.
   Recalcular número de prioridad de riesgo .




      Reducir el riesgo general del diseño
                                                       573
        Modelo de PFMEA – Paso 3



   Acciones tomadas
       Identificar al responsable de las acciones
        recomendadas y la fecha estimada de terminación
       Después de terminar una acción, dar una descripción
        breve de la acción real y fecha de efectividad

   Responsabilidad y fechas de terminación
       Desarrollar una lista de características especiales
        proporcionándola al diseñador para modificar el DFMEA
       Dar seguimiento a las acciones recomendadas y
        actualizar las últimas columnas del FMEA


                                                       574
        Modelo de PFMEA – Paso 3



   RPN resultante
       Después de implementadas las acciones
        recomendadas, estimar de nuevo los rangos de
        Severidad, Ocurrencia y Detección y calcular el nuevo
        RPN. Si no se tomaron acciones dejarlo en blanco.


   Salidas del PFMEA
       Hay una relación directa del PFMEA a el Plan de
        Control del proceso



                                                          575
                               ANALISIS DEL MODO Y EFECTO DE FALLA
                                      AMEF de Diseño / Proceso
Componente ______________________                  Responsable del Diseño ____________ AMEF Número _________________
Ensamble ________________                          Preparó _______________                       Pagina _______de _______
Equipo de Trabajo ___________                                                                    FECHA (orig.) de AMEF ______(rev.) ______


                                                                                                                              Resultados de Acción
                                                                     O                 D
                                               S        Causa(s)
    Función                    Efecto (s)                            c                 e   R                 Responsable                 S O D R
               Modos de Falla                  e      Potencial(es)    Controles de               Acción                       Acción
       de                     Potencial (es)                         c                 t   P                 y fecha límite              e c e P
                Potenciales                    v   de los Mecanismos   Diseño Actual             Sugerida                     Adoptada
    Artículo                     de falla                            u                 e   N                de Terminación               v c t N
                                               .         de falla
                                                                     r                 c

Factura        Datos          LOCAL:
incorrecta     incorrectos    Rehacer
                              la factura

                                                                                                              Riesgo = Severidad x
                              MAXIMO PROXIMO                                                                 Ocurrencia x Detección
                              Contabilidad     7                     3                 5   105
                              erronea

                              CON CLIENTE
                              Molestia


                                                                         Causas probables a
                              Insatisfacción



                                                                         atacar primero
                              ANALISIS DEL MODO Y EFECTO DE FALLA
                                     AMEF de Diseño / Proceso
Componente ______________________                 Responsable del Diseño ____________ AMEF Número _________________
Ensamble ________________                         Preparó _______________                      Pagina _______de _______
Equipo de Trabajo ___________                                                                  FECHA (orig.) de AMEF ______(rev.) ______


                                                                                                                            Resultados de Acción
                                                                    O                D
     Función                                 S        Causa(s)        Controles de
                               Efecto (s)                           c                e   R                 Responsable                 S O D R
del componente Modos de Falla                e      Potencial(es)       Diseño /                Acción                       Acción
                              Potencial (es)                        c                t   P                 y fecha límite              e c e P
   / Paso del   Potenciales                  v     o Mecanismos         Prcoeso                Sugerida                     Adoptada
                                 de falla                           u                e   N                de Terminación               v c t N
     proceso                                 .         de falla        Actuales
                                                                    r                c

Factura correcta Datos       LOCAL:
                 erroneos    Rehacer la
                             factura


                             MAXIMO PROXIMO
                             Contabilidad     7                     3                5   105
                             erronea

                             CON CLIENTE
                             Molestia
                             Insatisfacción                                    Usar RPN para identificar
                                                                            acciones futuras. Una vez que
                                                                               se lleva a cabo la acción,
                                                                                   recalcular el RPN.
Herramientas para el FMEA




                        578
                 Herramientas
   Diagramas de límites
   Diagramas de flujo de proceso
   Matriz de características
   Tormenta de ideas
   Árboles de funciones
   Lista de efectos: FMEA de diseño
   Lista de efectos: FMEA de proceso
   Diagrama de Ishikawa
   Tecnica de preguntas

                                        579
                     Herramientas
   Análisis de árbol de fallas (FTA)
   Análisis del modo de falla (FMA)
   Diseño de experimentos (DOE)
   Proceso de solución de problemas de 8Ds
   Planes de Control
   Planeación dinámica de control (DCP)
   Despliegue de la función de calidad (QFD)
   Análisis de valor/ Ingeniería del valor (VA/VE)
   REDPEPR
   FMEA Express
   FMEA del software

                                                      580
              Diagrama de límites
   Diagramas de límites de funciones
       Salida del análisis de funciones para la fase de
        concepto CFMEA, ilustran funciones en vez de partes


   Diagramas de límites Hardware/funcional
       Dividen al sistema en elementos más pequeños desde
        un punto de vista funcional. Muestran relaciones
        físicas, se usan en los DFMEAs.




                                                       581
Nombres de verbos útiles




                           582
                  Tormenta de ideas

   Seleccionar el problema a tratar.
   Pedir a todos los miembros del equipo generen ideas para la solución
    del problema, las cuales se anotan en el pizarrón sin importar que tan
    buenas o malas sean estas.
   Ninguna idea es evaluada o criticada antes de considerar todos los
    pensamientos concernientes al problema.
   Aliente todo tipo de ideas, ya que al hacerlo pueden surgir cosas muy
    interesantes, que motivan a los participantes a generar más ideas.
   Apruebe la naturalidad y el buen humor con informalidad, en este
    punto el objetivo es tener mayor cantidad de ideas
   Se les otorga a los participantes la facultad de modificar o mejorar las
    sugerencias de otros.
   Una vez que se tengan un gran número de ideas el facilitador procede
    a agrupar y seleccionar las mejores ideas por medio del consenso del
    grupo
   Las mejores ideas son discutidas y analizadas con el fin del proponer
    una solución.

                                                                    583
        Herramientas para el FMEA
   Árbol de funciones
       Ayuda a que los requerimientos del cliente no
        expresados explícitamente sobre el producto o proceso
        se cumplan

       Es conveniente describir las funciones de un producto
        o proceso por un verbo – pronombre medible, por
        ejemplo:
            Calentar el interior a XºC
            Enfriar a los ocupantes a XºC
            Eliminar la niebla del parabrisas en X segundos

                                                               584
             Técnica de preguntas
   Hacer una oración con el modo de falla, causa y efecto y ver si
    la oración tiene sentido. Un modo de falla es debido a una
    causa, el modo de falla podría resultar en efectos, por ejemplo:
       MODO DE FALLA: No ajustan los faros delanteros
      P: ¿Qué podría ocasionar esta falla?

      R: La luz desalineada -> Efecto

      P: ¿A que se puede deber esta falla?

      R: Cuerda grande en tornillo de ajuste -> Causa

     El “No ajuste de faros delanteros” se debe a “Cuerda
        grande en tornillo de ajuste”. El “desajuste de los
        faros” ocasiona “haces de luz desalineados”

                                                              585
                 Técnica de preguntas
Paso 3            Paso 1
¿Qué lo causa?                    Paso 2
                  Modo de falla   ¿Qué efecto tiene?




                                                 586
    Análisis de árbol de fallas (FTA)
   Es una técnica analítica deductiva que usa un árbol para
    mostrar las relaciones causa efecto entre un evento indeseable
    (falla) y las diversas causas que contribuyen. Se usan símbolos
    lógicos para interconectar las ramas

   Después de hacer el FTA e identificadas las causas raíz, se
    pueden determinar las acciones preventivas o los controles
    necesarios

   Otra aplicación es determinar las probabilidades de las causas
    que contribuyen a la falla y propagarlas hacia adelante



                                                             587
    Análisis del Modo de Falla (FMA)
   Es un enfoque sistemático disciplinado para
    cuantificar el modo de falla, tasa de falla, y causa raíz
    de fallas o tasas de reparación conocidas (el FMEA
    para las desconocidas)

   Se basa en información histórica de garantías, datos
    de campo, datos de servicios, y/o datos de procesos

   Se usa para identificar la operación, modos de falla,
    tasas de falla y parámetros críticos de diseño de
    hardware o procesos. También permite identificar
    acciones correctivas para causas raíz actuales
                                                     588
    Diseño de experimentos (DOE)
   Es un método para definir los arreglos en cuales se puedas
    realizar experimentos, donde se cambian de manera controlada
    las variables independientes de acuerdo a un plan definido y se
    determinan los efectos

   Para pruebas de confiabilidad el DOE usa un enfoque estadístico
    para diseñar pruebas para identificar los factores primarios que
    causas eventos indeseables

   Se usan para identificar causas raíz de modos de falla, cuando
    varios factores pueden estar contribuyendo o cuando estos
    factores están interrelacionados y se desean conocer los efectos
    de sus interacciones
                                                             589
    Método de 8 disciplinas (8Ds)
   Es un método de solución de problemas orientado a
    equipos de trabajo, las disciplinas o pasos son:
       Preparar el proceso
       Establecer el equipo
       Describir el problema
       Desarrollar las acciones de contención o contingentes
       Diagnosticar el problema (definir y verificar causa raíz)
       Seleccionar y verificar acciones correctivas
        permanentes (PCAs) para causas raíz y puntos de
        escape
       Implementar y validar PCAs
       Reconocer contribuciones del equipo y los miembros
                                                           590
               Planes de control
   Es una descripción escrita del sistema para controlar
    el proceso de producción

   Lista todos los parámetros del proceso y
    características de las partes características de las
    partes que requiere acciones específicas de calidad

   El plan de control contiene todaslas características
    críticas y significativas
   Hay planes de control a nivel de manufactura de:
    Prototipos, producción piloto (capacidad de procesos)
    y de producción
                                                      591
Planeación dinámica de control (DCP)
Es un procesos que liga las herramientas de calidad
   para construir planes de control robustos a través de
   un equipo

1. Lanzamiento – definir los requerimientos de recursos

2. Estructura del equipo central y de soporte

3. Bitácora de preguntas


                                                  592
Planeación dinámica de control (DCP)
4. Información de soporte (ES, DFMEAs, DVP&R, PFMEA, etc.)

5. Diagrama de flujo y carácterísticas de enlace

6. Pre lanzamiento o controles preliminares

7. PFMEA

8. Plan de control

9. Desarrollar ilustraciones e instrucciones

10. Implementar y mantener                              593
    Despliegue de la función de calidad
                  (QFD)
    El QFD es un método estructurado en el cual los
     requerimientos del cliente son traducidos en requerimientos
     técnicos para cada una de las etapas del desarrollo del
     producto y producción

    El QFD es entrada al FMEA de diseño o al FMEA de concepto.
     Los datos se anotan en el FMEA como medidas en la columna
     de función

    La necesidad de obtener datos de QFD pueden ser también
     una salida del FMEA de concepto



                                                            594
    Análisis del valor / Ingeniería del
              valor (VA/VE)
   Son metodologías usadas comúnmente para despliegue del
    valor. La Ingeniería del valor se realiza antes de comprometer
    el herramental. El análisis del valor (VA) se realiza después del
    herramentado. Ambas técnicas usan la fórmula:

    Valor = Función (primaria o secundaria) / Costo
   Los datos de VA/VE pueden ser entradas al FMEA de diseño o
    de proceso en columna de Función como funciones primaria y
    secundaria. También pueden ser causas, controles o acciones
    recomendadas

   La metodología VA debe ser incluida en la revisión de FMEAs
    actuales como apoyo para evaluar riesgos y beneficios cuando
    se analizan varias propuestas                           595
   REDPEPR (Robust Engineering
Design Product Enhacement Process)
Es una herramienta que proporciona a los equipos de
   Diseño:
   Un proceso paso a paso para aplicar el RED
   Las herramientas necesarias para completar el diagrama P,
    listas de verificación de confiabilidad y robustez (RRCL) y la
    matriz de demostración de confiabilidad y robustez (RRDM)
   Preguntas y tips para guiar al equipo en el proceso
   Capacidad para generar reportes en Excel
   Un proceso para mejorar la comunicación con el equipo de
    ingeneiría
El Web site donde se encuentra el software es
    www.redpepr.ford.com

                                                               596
Aplicaciones del FMEA

       Express
      Ambiental
     De máquinas



                        597
                  FMEA Express
Es un proceso que aplica técnicas de FMEA
   simultaneamente tanto a los aspectos de diseño
   como a los de manufactura de un proyecto:

Consiste de cuatro fases:
  Preparación: Se forma un equipo directivo para definir el
   alcance del proyecto, equipo de trabajo multidisciplinario,
   colección de información y documentos de modos de falla
   conocidos, causas, efectos y controles




                                                            598
                   FMEA Express
   Desarrollo del FMEA: El equipo de trabajo multidisciplianrio
    completa el FMEA utilizando formatos y definiciones estándar


   Posterior a la tarea: El facilitador y el equipo directivo
    generan un reporte final y un plan de seguimiento. El líder del
    equipo de FMEA es responsable de monitorear el avance


   Auditoría de calidad: Después de una verificación de
    calidad, se proporciona un certificado de cumplimiento

Software para el FMEA: www.quality.ford.com/cpar/fmea/

                                                             599
E-FMEA ambiental




                   600
E-FMEA ambiental




                   601
Matriz de requerimientos ambientales
        con criterios múltiples
   Para cada alternativa de diseño resumir la siguiente
    información
   Uso de substancias prohibidas o de uso restringido
   Tipo y cantidad de residuos (refleja el nivel de materiales
    utilizados)
   Consumo de energía por componente
   Consumo de agua por componente
   Otros objetivos ambientales




                                                                  602
                          E-FMEA
Ejemplos de acciones recomendadas (hacer una
   revisión previa de efectos secundarios en la vida del
   producto):
   Sistemas de conexión alternos
   Reciclar

   Rutas alternas de disposición de residuos
   Uso de materiales naturales

   Revisar rutas de transporte
   Reducir trayectorias de proceso
   Optimizar el consumo de agua y energía

                                                    603
                      E-FMEA
Salidas del FMEA ambiental:
 Recomendaciones de materiales



   Recomendaciones de diseño (vg. Tipo de enlace)

   Recomendaciones de proceso (vg. Potencial de
    ahorro de energía)

   Recomendación para rutas de disposición

                                                   604
MFMEA – FMEA de maquinaria




                         605
               FMEA de maquinaria
   Su propósito es que a través de un equipo se asegure que los
    modos de falla y sus causas/mecanismos asociados se hayan
    atendido

   Soporta el proceso de diseño en:
      Apoyar en la evaluación objetiva de las funciones del equipo,

       requerimientos de diseño y alternativas de diseño

        Incrementar la probabilidad de que los modos de falla y sus
         efectos en la maquinaria se han considerado en el proceso
         de diseño y desarrollo


                                                              606
         FMEA de maquinaria

   Proporcionar información adicional como apoyo a la
    planeación de todos los programas de diseño, prueba y
    desarrollo

   Desarrollar una lista de modos de falla potenciales en
    base a su efecto con el cliente, estableciendo
    prioridades para mejoras al diseño y desarrollo

   Proporcionar documentación para referencia futura
    para el análisis de problemas de campo, evaluando
    cambios de diseño y desarrollo de maquinaria.

                                                     607
              FMEA de maquinaria
   Ejemplos de descripción de funciones
       Proceso de partes – 120 tareas / hora

       Cabezal del índice – MTBF > 200 Hrs

       Control del flujo hidráulico – 8p cl/seg.

       Sistema de posición – Ángulo de rotación de 30º

       Hacer un barreno – Rendimiento a la primera 99.9%

                                                          608
              FMEA de maquinaria
   Efectos potenciales como consecuencias de falla de subsistemas
    en relación a seguridad y “Las 7 grandes pérdidas”
      Falla – pérdidas resultado de una pérdida funcional o

        reducción de la función sobre una parte del equipo
        requiriendo intervención de mantenimiento

       Preparación y ajustes – pérdidas que son resultado de
        procedimientos de preparación tal como herramentado,
        cambio de modelo o cambio de molde. Los ajustes incluyen
        el tiempo muerto usado para ajustar el equipo para evitar
        defectos y bajo rendimiento, requiriendo intervención del
        operador o ajustador


                                                           609
          FMEA de maquinaria
   Tiempo de espera y paros menores – pérdidas
    resultado de interrupciones menores al flujo del
    proceso (como atoramiento de microswitch)
    requiriendo intervención del operador. El tiempo de
    espera sólo se puede resolver revisando el sistema /
    línea completa

   Capacidad reducida – pérdidas que resultan de la
    diferencia entre el ciclo de tiempo ideal del equipo y su
    tiempo de ciclo real. El tiempo de ciclo ideal se
    determina por: a) velocidad original; b) condiciones
    óptimas y c) tiempo máximo de ciclo logrado con
    maquinaria similar
                                                       610
         FMEA de maquinaria
   Pérdidas en el arranque – pérdidas que ocurren
    durante los primeros pasos del proceso productivo
    después de paros largos (fines de semana, días de
    azueto, o entre turnos), resultando en rendimiento
    reducido o incremento de desperdicio y rechazos

   Partes defectivas – pérdidas que resultan de la
    generación de defectos que producen retrabajo,
    reaparaciones, y/o partes no útiles

   Herramentales – pérdidas que resultan de fallas en
    el herramental, rotura, deterioración o desgaste (vg.
    Herramientas de corte, tips de soldadura, etc.)
                                                     611
 FMEA de maquinaria
Criterios de Severidad




                         612
             FMEA de maquinaria
   Causas potenciales, se asume que la maquinaria se
    fabricó, instaló, usó, y se dispuso de acuerdo a sus
    especificaciones, preguntarse para identificar causas
    potenciales lo siguiente:
       ¿Cuáles son las circunstancias que pueden orientar al
        componente, subsistema y sistema a no cumplir sus
        requerimientos funcionales / de desempeño?

       ¿A qué grado pueden los componentes, subsistemas y
        sistemas que interactúan ser compatibles?

       ¿Qué especificaciones garantizan compatibilidad?
                                                           613
 FMEA de maquinaria
Criterios de Ocurrencia




                          614
FMEA de maquinaria
Criterios de Detección




                         615
         Herramientas de la
          Fase de Análisis

Identificación de causas potenciales
Cartas Multivari y Análisis de Regresión
Intervalos de confianza y Pruebas de Hipótesis



                                                 616
Identificación de causas
       potenciales

Tormenta de ideas
Diagrama de Ishikawa
Diagrama de Relaciones
Diagrama de Árbol
Verificación de causas raíz


                              617
             Tormenta de ideas
   Técnica para generar ideas creativas cuando la mejor
    solución no es obvia.

    Reunir a un equipo de trabajo (4 a 10 miembros) en
    un lugar adecuado

   El problema a analizar debe estar siempre visible

    Generar y registrar en el diagrama de Ishikawa un
    gran número de ideas, sin juzgarlas, ni criticarlas

    Motivar a que todos participen con la misma
    oportunidad                                     618
             Tormenta de ideas
   Permite obtener ideas de los participantes




                                                 619
         Diagrama de Ishikawa
   Anotar el problema en el cuadro de la derecha

   Anotar en rotafolio las ideas sobre las posibles causas
    asignándolas a las ramas correspondientes a:
      Medio ambiente

      Mediciones

      Materia Prima

      Maquinaria

      Personal y

      Métodos

     o
      Las diferentes etapas del proceso de manufactura o
       servicio
                                                         620
                       Diagrama de Ishikawa
            Medio
           ambiente                   Métodos                Personal
                         Frecuencia             Falta de
                                                                        Rotación de
      Clima                                                             personal
                         de visitas             supervi
      húmedo                                             Falta de
                                                ción
                                                         motivación
                           Posición de                                    Ausentismo
  Distancia de             exhibidores
  la agencia al
                                                      Elaboración                   ¿Qué
  changarro                                           de pedidos                    produce
                                                                                    bajas ventas
      Clientes con                                                      Calidad del de
      ventas bajas            Seguimiento                               producto    Tortillinas
         Malos
                              semanal                                               Tía Rosa?
                                            Conocimiento
         itinerarios
                                            de los                      Tipo de
Descompostura                               mínimos por                 exhibidor
del camión                                  ruta
repartidor

           Maquinaría         Medición                    Materiales
Diagrama de relaciones                                                                  Perdida de mercado
                                                                                            debido a la
                                                                                           competencia
                            No hay flujo
                          efectivo de mat.                 Influencia de la                                                        Compra de material
                            Por falta de                 situación econ del                                                        para el desarrollo de
                           programación                          país                                                             nuevos productos por
                            de acuerdo                                                                                          parte inv..... Y desarrollo’’’
                                                                                                    No hay coordinación
                             a pedidos                                                                entre marketing
                                                                              Falta de                  operaciones
                                                 No hay control         coordinación al fincar
                                               de inv..... En proc.        pedidos entre
  Constantes
                         Falta de prog. De                                marketing y la op.
cancelaciones
                          la op. En base a                                                                           No hay coordinación
  de pedidos
                             los pedidos                                                                      entre la operación y las unidades
 de marketing
                                                  Programación                                                           del negocio
                                                                         Las un. Reciben
                                                    deficiente
                                                                         ordenes de dos
                                                                        deptos diferentes
                                  Capacidad
                                   instalada                                                                                        Falta de coordinación
                                 desconocida                                                                                     entre el enlace de compras
                                                             Altos                Duplicidad         Demasiados deptos
                                                                                                                                de cada unidad con compras
         Falta de control de                              inventarios            de funciones       de inv..... Y desarrollo
                                                                                                                                          corporativo
           inventarios en
                                          Compras
              compras
                                         aprovecha
                                                                          Falta de com..... Entre
                                           ofertas                                                      No hay com..... Entre
                                                                              las dif. áreas de
                                                                                                          las UN y la oper.
                                                                                 la empresa
                                                          Marketing no
                      Mala prog. De                     tiene en cuenta
                    ordenes de compra                       cap de p.

                                                                                No hay com..... Entre compras
                                                                                     con la op. general
                                    Influencia directa de
                                      marketing sobre
                                          compras
                                                                                      Falta de comunicación
                                                                                        entre las unidades
                                                                                            del negocio
                                                                                                                                                     622
                                ¿Que nos puede provocar Variación de Velocidad
                           Durante el ciclo de cambio en la sección del Embobinadores?


13/0                                 2/1
                                         Bandas de
         Dancer                         transmisión
2/4    Taco generador             1/1                               Causas a validar
          del motor                 Empaques de arrastre

0/4     Poleas guías             0/3
                                   Presión de aire de trabajo

1/2      Presión del                 5/2
                                         Drive principal
           dancer


5/1      Mal guiado                 4/1
                                      Voltaje del motor


1/4   Sensor de velocidad
           de línea                  1/5 principales
                                       Ejes
                                                                Entradas      Causa
                                                                Salidas       Efecto
1/4          Sensor
                                   1/5
                                     Poleas de transmisión
         circunferencial
        What Data Needs to be Collected to understand
         the sources of variation in a key measure ?
                                          Interrelationship Diagraph
Allows a team to identify & classify the cause and effect relationships that exist among variables
                                          Business Planning Process
                                                              Means not                Driver
                                                               clearly
                                                               defined
                                                                                      Plan not
                                                             In = 3 Out = 2          integrated
                                Communica-
                                 tion issues                                       In = 2   Out = 4
                                  within the
                                    group
                                 In = 1   Out = 3                                                        Fast new
                                                                                                          product
                                                                                                      introductions
                                                                                                          stretch
                                                                                                        resources
                                                                                                      In = 1 Out = 2


                            No strong
                           commitment
                           to the group
                           In = 2 Out = 0


                                                                                                        Capacity
                                                                                                        may not
                                                                                                       meet needs

                                  Planning                                                            In = 5   Out = 1
                                approach not
                                standardized                                                           Outcome
                                 In = 0 Out = 5

                                                       External                  Lack of
                                   Driver           factors impact              time and
                                                      implemen-                resources
                                                         tation
                                                                              In = 5 Out = 0
                                                    In = 0    Out = 2
      Diagrama de árbol o sistemático

               Meta   Medio
                      Meta       Medio
                                 Meta       Medio
                      Segundo            Tercer     Cuarto
           Primer       nivel             nivel      nivel
            nivel
                                                    Medios
                                         Medios
                        Medios

           Medios
           o planes


Meta u
objetivo



           Medios
           o planes

                                                             625
   Diagrama de Arbol- Aplicación Sistema SMED
                                                     ¿Cómo?                  ¿Cuándo?
                                                 Filmar la preparación      5- 12 - Mar-04
                           Preparación
                           para el SMED
                                                   Analizar el video        10 y 17 –Mar-04

                                                  Describir las tareas        17- Mar-04


        ¿Objetivo?                                Separar las tareas          17- Mar-04
                       Fase 1: Separación
                       de la preparación       Elaborar lista de chequeo       2- Mar-04
       Implantar el    interna de la externa
         Sistema                                 Realizar chequeo de
                                                                              24- Mar-04
                                                       funciones
          SMED
       Producto DJ                             Analizar el transporte de
                                                                              24- Mar-04
          2702                                 herramientas y materiales
                                                Analizar las funciones y
          ¿Qué?        Fase 2: Conversión       propósito de c/operación
                                                                             12 - Abr- 04
                       de preparación
                                               Convertir tareas de prepa-
                       interna en externa       ración interna a externas
                                                                              15 –Abr - 04
Elaboramos       un
Diagrama de Arbol                              Realización de operaciones
                                                                              5 –May -04
                                                      en paralelo.
para          poder
analizar     nuestro   Fase 3: Refinamiento
                                                  Uso de sujeciones
problema siguiendo     de todos los aspectos         funcionales.
                                                                              19– May -04

el sistema SMED.       de la preparación.
                                                 Eliminación de ajustes       12- May -04
                                                                                              19
    Verificación de posibles causas
   Para cada causa probable , el equipo deberá
    por medio del diagrama 5Ws – 1H:
       Llevar a cabo una tormenta de ideas para
        verificar la causa.
       Seleccionar la manera que:
           represente la causa de forma efectiva, y
           sea fácil y rápida de aplicar.


                                                       627
                                                                              Calendario de las actividades

     ¿qué?             ¿por qué?                            ¿cómo?                      ¿cuándo     ¿dónde   ¿quién?
                                                                                           ?           ?
1                1.1 Por variación de     1.1.1 Tomar dimensiones de ensamble entre     Abril ’04    1804     J. R.
Tacogenerador    voltaje durante el       coples.                                                   Embob.
de motor         ciclo de cambio          1.1.2 Verificar estado actual y
embobinador                               especificaciones de escobillas.
                                          1.1.3 tomar valores de voltaje de salida
                                          durante el ciclo de cambio.
2 Sensor         2.1 Por que nos          2.1.1 Tomar dimensiones de la distancia       Abril ’04    1804     U. P.
circular y de    genera una varión en     entre poleas y sensores.                                  Embob.
velocidad de     la señal de referencia   2.1.2 Tomar valores de voltaje de salida de
linea.           hacia el control de      los sensores.
                 velocidad del motor      2.1.3 Verificar estado de rodamientos de
                 embobinador              poleas.
3 Ejes           3.1 Por vibración        3.1.1 Tomar lecturas de vibración en          Abril’04     1804     F. F.
principales de   excesiva durante el      alojamientos de rodamientos                               Embob.
transmisión.     ciclo de cambio          3.1.2 Comparar valores de vibraciones con
                                          lecturas anteriores.
                                          3.1.3 Analizar valor lecturas de vibración
                                          tomadas.

4 Poleas de      4.1 Puede generar        4.1.1 Verificar alineación, entre poleas de   Abril’04     1804     J. R.
transmisión de   vibración excesiva       ejes principales y polea de transmisión del               Embob.    U. P.
ejes             durante el ciclo de      motor.
embobinadores    cambio.                  4.1.2 Tomar dimensiones de poleas(dientes
.                                         de transmisión).
                                          4.1.3 Tomar dimensiones de bandas (dientes
                                          de transmisión)
                                          4.1.4 Verificar valor de tensión de bandas.                         628
        Resumen de la validación de las causas

 # de
Causa              Causas                   Resultados       Causa
                                                              Raíz
 1       Ensamble de ojillos, bloques y   SI ES CAUSA RAIZ     X
         contrapesos no adecuados en
         aspas.
 2       Amortiguadores dañados.          SI ES CAUSA RAIZ     X
 3       Desgaste de bujes en los
         carretes.                        NO ES CAUSA RAIZ
 4       Fabricación y reemplazo de       NO ES CAUSA RAIZ
         ejes y poleas no adecuados en
         ensamble de aspas.
         Desalineamiento de poleas y
                                          SI ES CAUSA RAIZ     X
  5      bandas de transmisión de
         aspas.
         Método de Balanceo no
 6                                        SI ES CAUSA RAIZ     X
         adecuado.
 7       Desalineación de pinolas en      NO ES CAUSA RAIZ
         cuna.
VI.D Métodos de análisis
      adicionales




                           630
  Métodos adicionales de análisis
1. Análisis de brecha

2. Análisis de causa raíz

3. Análisis del Muda




                               631
VI.D.1 Análisis de brecha




                            632
   El análisis de brecha (Gap Analysis) es una
    herramienta de evaluación para comparar el
    desempeño actual de la organización, a un
    desempeño potencial deseado.

   Identifica la diferencia de lo que es y lo que debería
    ser




                                                      633
               Análisis de brecha
   Se pueden redirigir los esfuerzos a objetivos como:
       Permanecer en el negocio
       Mantener o incrementar la participación del mercado
       Mejorar el clima laboral
       Igualar o exceder a Benchmarks
       Igualar o exceder a la competencia
       Reducir tiempos de ciclo
       Lograr certificaciones
       Mejorar la productividad
       Mejorar los niveles de calidad

                                                       634
               Análisis de brecha
   Se requieren tres categorías de información
       ¿Dónde estamos?
       ¿Dónde queremos ir?
       ¿Cómo vamos a medir los resultados?




                                                  635
        Planeación de escenarios
   Al elaborar planes estratégicos, los directivos pueden
    confiarse o ser orgullosos de aceptar cambios. Por lo
    que se sugiere considerar escenarios del mejor y del
    peor caso, para evitar errores en la toma de
    decisiones

   Los escenarios permiten imaginar el desempeño
    futuro de la organización ante riesgos, para tomar las
    mejores decisiones y atender estos eventos. Aunque
    algunos elementos sean desconocidos

                                                     636
         Planeación de escenarios
   El proceso de planeación es como sigue:
       Seleccionar al personal que pueda dar muchas
        perspectivas
       Desarrollar una lista de cambios percibidos, sociales,
        técnicos y económicos
       Agrupar estas percepciones en patrones relacionados
       Desarrollar una lista de las mejores percepciones
        (prioridades)




                                                          637
         Planeación de escenarios
   El proceso de planeación es como sigue:
       Desarrollar un escenario grueso del futuro basado en
        estas prioridades
       Determinar como afectan los escenarios a la
        organización
       Determinar los cursos de acción potenciales a tomar
       Monitorear, evaluar, y revisar los escenarios




                                                        638
         Planeación de escenarios
   Por lo común se perciben de 6 – 10 amenazas u
    oportunidades en 2 o 3 escenarios desarrollados.
    Evitar las siguientes trampas:

       No utilizar un facilitador experimentado

       Considerar escenarios como pronósticos

       Hacer escenarios simplistas

       Limitar el impacto global de los escenarios

                                                      639
         Planeación de escenarios
   Evitar las siguientes trampas…..:
       No incluir a un equipo directivo en el proceso

       Tratar los escenarios solo como actividad informativa

       Limitar el estímulo imaginativo en el diseño del
        escenario

       No desarrollar escenarios para área de impacto clave
        del negocio

                                                           640
              Planeación Hoshin
   Es una herramienta de ejecución, usada para
    organizar y desplegar planes estratégicos

   Hoshin traduce la visión de la empresa en resultados
    medibles dramáticos y rupturas estratégicas

   Hoshin se enfoca a identificar los pocos logros vitales
    de ruptura



                                                     641
                Planeación Hoshin
   Tiene seis objetivos:
       Alinear las metas organizacionales

       Enfocarse en las pocas brechas vitales estratégicas

       Trabajar con otros para cerrar las brechas

       Especificar los métodos para lograr los objetivos

       Hacer visible el enlace entre planes locales

       Mejora continua del proceso de planeación
                                                            642
    Otras técnicas de análisis clave
   Benchmarking

   Análisis FODA

   Análisis PEST

   Las cinco fuerzas competitivas de Porter




                                               643
         Evaluación organizacional
   Análisis funcional con datos de colección:
       Entrevistas cara a cara
       Selección de muestra apropiada
       Entradas de grupo de enfoque
       Observaciones de visitas a la planta
       Datos colectados de fuentes de la industria

   Se divide a la organización en áreas funcionales clave
       Liderazgo, prácticas de negocio, análisis financiero,
        mercadotecnia, gestión de la calidad, diseño y
        desarrollo, manufactura, salud y seguridad, etc…

                                                           644
        Evaluación organizacional
   Se deben analizar los resultados y presentarlos a la
    dirección, quien debe promover e implementar
    planes de acción claros

   Normalmente el consultor colecta y resume la
    información en categorías principales para su revisión
    por la dirección. Quienes deben generar e
    implementar las soluciones y guiar al éxito




                                                    645
         Métricas organizacionales
   Se establecen metas de desempeño organizacional y
    sus métricas en las áreas de:
       Utilidades
       Tiempos de ciclo
       Recursos
       Respuestas del mercado

   Por cada meta organizacional mayor deben
    desarrollarse métricas, con unidades y métodos de
    medición.

                                                  646
         Métricas organizacionales
Para los anteriores, las métricas pueden ser:
 Utilidades a corto y largo plazo

       Valor de acciones, inversión de capital, costos
        personales, comparaciones competitivas, ROI, ventas$


   Tiempos de ciclo
       Tiempos de ciclo actuales
       Benchmarks internos
       Benchmarks externos
       Reducción en tiempos de ciclo

                                                      647
         Métricas organizacionales
   Recursos
      No. De proyectos de mejora, ROI de proyectos, estudios de

       capacidad de procesos, reducciones de variabilidad, costos
       de calidad con relación a una base, porcentaje de defectos
       con relación a alguna base

   Respuestas del mercado
      Encuestas con clientes

      Análisis de devoluciones

      Desarrollo de nuevos productos

      Retención de clientes

      Pérdidas con clientes

      Tasas de cortesías e instalaciones
                                                           648
         Métricas organizacionales
Las métricas permiten medir los avances en relación a
  las metas organizacionales

   De acuerdo a Juran se debe tomar en cuenta lo
    siguiente:
       Las métricas deben tener un significado estándar
       Deben apoyar el proceso de toma de decisiones
       Deben proporcionar información valiosa
       Debe ser fácil de instalar
       Si son valiosas, deben usarse en todo
   Las métricas se basan en la retroalimentación con
    base en clientes, proveedores, o internas
                                                    649
VI.D.2 Análisis de causa raíz




                            650
             Análisis de causa raíz

   Un equipo tiene la responsabilidad de determinar la
    causa raíz de una deficiencia y corregirla. Pueden
    tomar varios pasos:

       Situación (presa con fuga)
       Acción inmediata (desahogarla)
       Acción intermedia (reparar la presa)
       Acción en la causa raíz (identificar que causó la fuga
        para evitar su recurrencia y reconstruir la presa)



                                                          651
            Análisis de causa raíz

Se pueden utilizar las siguientes herramientas:
 Herramientas subjetivas:

      Preguntar por qué cinco veces, tormenta de ideas,

      análisis de flujo de proceso, PHVA, grupo nominal,

      observación de operación, diagrama de causa efecto,

      técnicas de consenso, seis sombreros de pensamiento,
   

      equipos de trabajo, FMEA, FTA
                                                       652
            Análisis de causa raíz

Se pueden utilizar las siguientes herramientas:
 Herramientas analíticas:

      Colección y análisis de datos

      Análisis de Pareto, análisis de regresión, hoja de
       verificación

      Análisis de matriz de datos
      Análisis de capacidad de procesos, división de variación

      Subgrupos de datos, experimentos simples, DOE
      Pruebas analíticas, cartas de control
                                                            653
            Análisis de causa raíz

Ante una acción correctiva permanente, la dirección
  debe determinar si:

   El análisis de causa raíz ha identificado el impacto
    completo del problema

   La acción correctiva es efectiva para eliminar o
    prevenir la recurrencia

   La acción correctiva es realista y sostenible
                                                       654
                   Los 5 Por qués
   Se hace la pregunta ¿Por qué? Cinco veces
       ¿Por qué? Nos faltaron partes por máquina dañada
       ¿Por qué? La máquina no ha tenido mantenimiento en
        los últimos 3 meses
       ¿Por qué? El departamento de mantenimiento se ha
        reducido a 6 personas de 8
       ¿Por qué? Se pasó del presupuesto, les quitaron el
        tiempo extra y dos personas
       ¿Por qué? La empresa no ha tenido los resultados
        esperados y el director ha hecho recortes para salvar la
        situación, teme por su puesto

                                                         655
                    5Ws y 1H
   El método de las 5Ws y 1H se resume al preguntar
    ¿quién?, ¿qué?, ¿cuándo?, ¿dónde?, ¿por qué? Y
    ¿cómo?.

   Pueden usarse las ramas del diagrama de causa
    efecto




                                                    656
        Diagrama de causa efecto
   Rompe el problema en partes más pequeñas
   Muestra muchas causas potenciales gráficamente
   Muestra como interactúan las causas
   Sigue las reglas de la tormenta de ideas
   Las sesiones tienen tres partes:
       Tormenta de ideas
       Dar prioridades (identificar las tres causas principales)
       Desarrollo de un plan de acción



                                                           657
            Diagrama de Pareto
   Sirve para identificar problemas u oportunidades
    prioritarias o mayores

   De acuerdo a Juran permite identificar “los pocos
    vitales” de los “muchos triviales”

   El principio de Pareto sugiere que unas cuantas
    categorías de problemas (20% aprox.) presentan la
    mayor oportunidad para la mejora (80% aprox.)


                                                   658
Método de las 8 disciplinas - Ford
   El método de Ford para el análisis de causa raíz es:
    D1.   Establecer el equipo
    D2.   Describir el problema
    D3.   Desarrollar una acción de contención
    D4.   Identificar la causa raíz
    D5.   Desarrollar alternativas de solución
    D6.   Implementar una acción correctiva permanente
    D7.   Prevenir la recurrencia
    D8.   Reconocer al equipo y las contribuciones individuales


                                                         659
    Análisis de árbol de falla - FTA
   FTA es un método sistemático deductivo, para definir
    un evento singular específico e indeseable, y
    determinar todas las posibles razones (fallas) que
    pueden hacer que ocurra el evento

   Se utiliza el las primeras fases del diseño como
    herramienta para impulsar modificaciones iniciales de
    diseño.




                                                   660
    Análisis de árbol de falla - FTA
   Otras áreas de su aplicación son:
       Análisis funcional de sistemas complejos
       Evaluación de requerimientos de seguridad,
       confiabilidad,
       defectos de diseño,
       riesgos de peligro,
       acciones correctivas,
       simplificación de mantenimiento y detección de falla,
       eliminación lógica de causas de falla


                                                         661
    Análisis de árbol de falla - FTA
   Se prefiere el FTA en vez del FMEA cuando:
       La seguridad el personal es importante
       Se pueden identificar un número pequeño de eventos
        superiores
       Hay alto potencial de falla
       El problema es cuantificar la evaluación del riesgo
       La funcionalidad del producto es altamente compleja
       El producto no es reaprables




                                                      662
    Análisis de árbol de falla - FTA
   Se prefiere el FMEA en vez del FTA cuando:
       Los eventos superiores no se pueden definir
        explícitamente
       Son factibles múltiples perfiles potencialmente exitosos
       La identificación de todos los modos de falla es
        importante
       La funcionalidad del producto tiene poca intervención
        externa




                                                          663
    Análisis de árbol de falla - FTA
   Símbolos de compuertas lógicas para determinar la
    confiabilidad del sistema. Hay símbolos de eventos y
    símbolos de compuertas

   Símbolos de eventos

Evento superior, falla a nivel sistema o evento
indeseable

Evento básico, evento falla de más bajo nivel
a estudiar

Evento de falla, evento de falla de bajo nivel. Puede recibir
entradas o proporcionar salidas a una compuerta lógica

                                                                664
    Análisis de árbol de falla - FTA
   Símbolos de compuertas lógicas

“AND”. El evento de salida ocurre solo
Si ocurren todos los eventos de entrada
Simultaneamente

“OR”. El evento de salida ocurre si
Ocurre alguno de los eventos de
La entrada

                                          665
    Análisis de árbol de falla - FTA
   Ejemplo: se asume que falla el sistema superior




                                                      666
    Análisis de árbol de falla - FTA
   La probabilidad de falla del sistema es 5.02%. Se
    indica que el teclado es prioritario (0.20), después la
    CPU (0.015) y el monitor (0.015)




                                                      667
VI.D.3 Análisis del Muda




                           668
                Análisis de Muda
   Las actividades que no agregan valor se clasifican
    como Muda, de acuerdo a Imai son:
       Sobreproducción
       Inventarios
       Reparaciones / rechazos
       Movimientos
       Transportes
       Re – Procesos
       Esperas



                                                    669
                 Sobreproducción
   Se produce más en cierto momento, por:
       Producir más de lo necesario por el siguiente proceso
       Producir antes de lo requerido por el siguiente proceso
       Producir más rápido de lo requerido por el siguiente
        proceso
   Sus consecuencias son:
       Espacio extra en las instalaciones del cliente
       Materias primas adicionales en uso
       Utilización de energéticos y transportes adicionales
       Costos de programación adicionales

                                                          670
             Inventario en exceso
   Las partes, materias primas, inventario en proceso,
    refacciones y productos terminados forman el
    inventario, el inventario es Muda ya que requiere:
       Espacio en piso, Transporte, Montacargas
       Sistemas de transportadores
       Interés sobre el costo de los materiales

   Puede verse afectado por:
       El polvo, deterioro, obsolescencia
       Humedad (oxidación), daño durante el manejo

                                                      671
             Inventario en exceso
   Las partes, materias primas, inventario en proceso,
    refacciones y productos terminados forman el
    inventario, el inventario es Muda ya que requiere:
       Espacio en piso, Transporte, Montacargas
       Sistemas de transportadores
       Interés sobre el costo de los materiales

   Puede verse afectado por:
       El polvo, deterioro, obsolescencia
       Humedad (oxidación), daño durante el manejo

                                                      672
         Reparaciones / defectos
   Las reparaciones o el retrabajo de partes defectivas
    significa un segundo intento de producirlas bien. Se
    rompe el Takt Time

   Puede haber desperdicio de materiales o productos
    no recuperable

   Si hay defectos, no puede implementarse el flujo de
    una pieza
   Los cambios de diseño también son Muda

                                                    673
                  Movimientos
   Los movimientos adicionales del personal son Muda.
    Caminar mucho, cargar pesado, agacharse, estirarse
    mucho, repetir movimientos, etc.

   El lugar de trabajo debe diseñarse ergonómicamente,
    analizando cada estación de trabajo

   La ergonomía puede causar daños y producción
    perdida


                                                   674
                     Movimientos
   Algunas reglas de la ergonomía incluyen:
       Enfatizar la seguridad todas las veces
       Adecuar el empelado a la tarea
       Cambiar el lugar de trabajo para que se adecue al
        empleado
       Mantener posiciones neutrales del cuerpo
       Rediseñar las herramientas para reducir esfuerzo y
        daños
       Variar las tareas con rotación de puestos
       Hacer que la máquina sirva al ser humano

                                                        675
                     Reprocesos
   Consiste de pasos adicionales en el proceso de
    manufactura, por ejemplo:
       Remoción de rebabas
       Maquinado de partes mal moldeadas
       Agregar procesos de manejo adicionales
       Realizar procesos de inspección
       Repetir cambios al producto innecesarios
       Mantener copias adicionales de información




                                                     676
                      Transportes
   Todo transporte es Muda excepto la entrega al
    cliente. Incluye:
       Uso de montacargas
       Uso de transportadores
       Uso de movedores de pallets y camiones


   Puede ser causado por:
       Deficiente distribución de planta o de celdas
       Tiempos de espera largos, áreas grandes de
        almacenaje, o problemas de programación

                                                        677
                        Esperas
   Ocurre cuando un operador está listo para realizar su
    operación, pero permanece ocioso, por falla de
    máquina, falta de partes, paros de línea, etc. El Muda
    de espera puede ser por:
       Operadores ociosos
       Fallas de maquinaria
       Tiempos de ajuste y preparación largos
       Tareas no programadas a tiempo
       Flujo de materiales en lotes
       Juntas largas e innecesarias

                                                    678
                Mudas adicionales
   Otros mudas adicionales a los 7 desperdicios son:
       Recursos mal utilizados
       Recursos poco utilizados
       Actividades de conteo
       Búsqueda de herramientas o partes
       Sistemas múltiples
       Manos múltiples
       Aprobaciones innecesarias
       Fallas de máquinas
       Envío de producto defectivo al cliente o mal servicio

                                                          679
     Salidas de la Fase de Análisis
   Causas raíz validadas

   Guía de oportunidades de mejora




                                      680
                Preguntas ejemplo
1. En un sentido amplio, cuantas de las siguientes causas de
    variación en estudios multi vari pueden incluir elementos de
    proceso relacionados con el tiempo:
I. Posicional
II. Cilíndrica
III. Temporal
a. I y II        c. II y III
b. I y III                 d. I, II y III

2. En un estudio de análisis de regresión con dos variables, ¿que
    representa el término Beta 1?:
a. La pendiente de la línea
b. La interacción de la medición
c. La intersección en el eje X
d. La intersección en el eje Y
3. Se hace un estudio entre la velocidad de coches y su consumo
    de gasolina. El coeficiente de correlación es de 0.35. Después se
    encontró que el velocímetro está equivocado y debió haber
    marcado 5 km. De más. Se recalcula el coeficiente de
    correlación, que debe dar:
a. 0.30 b. 0.35 c. 0.40 d. -0.35
                                                              681
                Preguntas ejemplo
4. La siguiente ecuación es:
a. La covarianza de X y Y
b. El coeficiente de correlación de X y Y
c. El coeficiente de determinación de X y Y
d. La varianza del producto de X y Y

5. Según la figura, ¿Cuál de las afirmaciones siguientes es falsa?




I. El coeficiente de correlación es negativo
II. El coeficiente de determinación es positivo
III. El coeficiente de determinación es menor que el coeficiente de
    correlación
a. Sólo I                          c. Sólo III
b. Sólo II                         d. II y III
                                                              682
             Preguntas ejemplo
6. Un problema de correlación:
a. Se resuelve estimado el valor de la variable
   dependiente para varios valores de la variable
   independiente
b. Considera la variación conjunta de las dos
   mediciones, ninguna de las cuales es restringida por
   el experimentador
c. Es un caso donde la distribución relevante debe ser
   geométrica
d. Se resuelve al asumir que las variables son normales
   e independientemente distribuidas con media cero y
   varianza “s”



                                                  683
                  Preguntas ejemplo
7. Una muestra aleatoria de tamaño n se toma de una gran población con
    desviación estándar de 1.0”. El tamaño de muestra se determina de
    manera que haya un 0.05 de probabilidad de riesgo de exceder 0.1” de
    error de tolerancia al usar la media de la muestra para estimar la Mu.
    ¿Cuál de los siguientes valores es el más cercano al tamaño de muestra
    requerido?

   a. 365         b. 40    c. 200    d. 100

8. La diferencia entre poner alfa de 0.05 y alfa igual a 0.01 en una prueba
    de hipótesis es:
a. Con alfa de 0.05 se tiene mayor tendencia a cometer un error tipo I
b. Con alfa de 0.05 se tiene más posibilidad de riesgo de cometer un error
    tipo II
c. Con alfa de 0.05 es una prueba más “conservadora” de la hipótesis nula
    Ho
d. Con alfa de 0.05 se tiene menos posibilidad de cometer un error tipo I

9. Si un tamaño de muestra de 16 tiene un promedio de 12 y una
    desviación estándar de 3, estimar el intervalo de confianza para un
    nivel de confianza del 95% para la población (asumir una distribución
    normal)

                                                                   684
                Preguntas ejemplo
10. En una muestra aleatoria de 900 vehículos, 80% tienen frenos
   ABS. ¿Cuál es el intervalo del 95% para el porcentaje de
   vehículos con frenos ABS?
    a. 0.778 – 0.821     c. 0.639 – 0.964
    b. 0.771 – 0.829     d. 0.774 – 0.826

11. Determinar si los siguientes dos tipos de misiles tienen
   diferencias significativas en sus varianzas a un nivel del 5%:
Misil A: 61 lecturas               Varianza = 1.347 km2.
Misil B: 31 lecturas               Varianza = 2.237 km2.
a. Hay diferencia significativa ya que Fcalc < Ftablas
b. No hay diferencia significativa por que Fcalc < Ftablas
c. Hay diferencia significativa por que Fcalc > Ftablas
d. No hay diferencia significativa pro que Facla > Ftablas

12. El valor crítico para t, cuando se hace una prueba t de dos
   colas, con muestras de 13 y alfa de 0.05 es:
    a. 1.782               c. 2.064
    b. 2.179               d. 1.711
                  Preguntas ejemplo
13. Tres personas en entrenamiento se les proporciona el mismo lote de
   50 piezas y se les pide que las clasifiquen como buenas o defectuosas,
   con los resultados siguientes:
                  Persona
                      A            B            C           Total
    Defectivos        17           30           25           72
    Buenos            33           20           25           78
    Total             50           50           50           150


Para determinar si hay o no hay diferencia en la habilidad de las tres
    personas para clasificar adecuadamente las partes, ¿cuál de los
    siguiente es (son) verdadero?
I. El valor calculado de Chi cuadrada es de 6.9
II. Para un nivel de significancia de 0.05, el valor crítico de Chi cuadrada
    es de 5.99
III. Como el valor calaculado de Chi cuadrada en mayor a 5.99, se rechaza
    la hipótesis nula
      a. Sólo I              c. Sólo II
      b. I y II              d. I, II y III

14. Un análisis de varianza de dos vías tiene r niveles para una variable y c
    niveles para la otra, con dos obseraciones por celda. Los grados de
    libertad para la interacción son:
a. 2 (r ) (c ) b. (r-1) (c-1)      c. rc – 1 d. 2 (r -1) (c – 1)
                    Preguntas ejemplo
15. Los supuestos básicos del análisis de varianza oncluyen:
I. Las observaciones vienen de poblaciones normales
II. Las observaciones vienen de poblaciones con vaianzas iguales
III. Las observaciones vienen de poblaciones con medias iguales
     a. I y II           c. II y III
     b. I y III          d. I, II y III



16. El valor teórico esperado para una celda en la tabla de
   contingencia se calcula como:
                    Preguntas ejemplo
17. ¿Cuál de las siguientes afirmaciones son verdaderas en relación a
    las pruebas no paramétricas?
I. Tienen mayor eficiencia que sus equivalentes pruebas paramétricas
II. Pueden ser aplicadas a estudios de correlación
III. Requieren supuestos acerca de la forma oi naturaleza de las
    poblaciones involucradas
IV. Requieren cálculos que son más difíciles que sus equivalentes
    pruebas paramétricas
a. Sólo II               c. II y IV
b. I y III               d. I, II y III

				
DOCUMENT INFO
Description: Incrementa Tu Iq Financiero document sample