Pruebas de significancia para datos cualitativos by oWEP44

VIEWS: 47 PAGES: 33

									Pruebas de significancia
 para datos cualitativos
       Chi cuadrado
   ¿ z, t y r son todos calculados de datos
    cualitativos o cuantitativos?
   Cuantitativos.
   Χ es la letra griega chi que se usa para
    representar las puebas de chi cuadrado que se
    simboliza por Χ2.
   Estas pruebas dependen de f al igual que en las
    pruebas de t.
   Donde recordemos que f representa el número
    de grados de libertad.
        Los datos cualitativos son
    usualmente contados en grupos o
               categorías

 Un ejemplo son los grupos sanguíneos.
 La hipótesis de nulidad dice que cualquier
  variación entre el número observado en el
  grupo y lo que usted espera encontrar se
  debe a________
 La casualidad
Si hay una diferencia significativa la
variación es más de lo esperado por
 casualidad y esto sugiere que hay
     algún otro factor envuelto.
 Al igual que con z y t si el valor calculado
  de Χ2 es mayor que el valor significativo
  usted acepta/rechaza la hipótesis de
  nulidad.
 Si Χ2 es mayor, p es menor; la hipótesis
  de nulidad es rechazada.
Al igual que con z y t las tablas de X2
   son usadas directamente en las
          pruebas de 2 colas
 ¿qué significan las columnas?
 Qué significan las filas?
 ¿cuál es la diferencia con las tablas de t?
 ¿qué significan los niveles 0.99 y 0.95?
      Criterios para aplicar X2
 Las muestras son tomadas al azar.
 Los datos son cualitativos
 Idealmente la frecuencia esperada más
  baja en cualquier grupo no es menor de 5.
Un genetista estaba interesado por saber si dos plantas tenían el
genotipo Aa. El las cruzó para ver qué tan cerca de la razón teórica se
encontraban las progenies. Las razones teóricas son:
½ Aa     :        ¼ AA              :        ¼ aa
Hubo 100 progenies y estos fueron los resultados (muestra al azar)

  genotipo                 Número        Número
                           observado (O) esperado (E)
                                         por la teoría
  Aa                       53            50
  AA                       23            25
  aa                       24            25
  total                    100           100
 ¿se aplican todos los criterios para usar
  X2?
 Establezca la hipótesis de nulidad y su
  alternativa.
           (número observado – número esperado)2
X2    =Σ
                     número esperado



     Lo vamos a representar de ahora en adelante por


                      ( O – E )2
                 Σ
                          E
 Substituyendo los números según el
  cuadro tenemos que
 X2 = 0.38
 Debemos buscar ahora f
       Uso de X2 para probar si lo
    observado se “ajusta” a una teoría

 En este caso X2 se usa para ver si los
  resultados obtenidos se ajustan a esta
  teoría genética en particular.
 En estos casos f=k-1, donde k= número
  de clases.
 Las clases en este caso son los genotipos,
  o sea, 3.
 Por consiguiente f= 2
   Los investigadores que usan X2 casi siempre están
interesados en dos colas. Es decir, están interesados en
  las diferencias entre lo observado y lo esperado, en
                   cualquier dirección


   ¿es éste o no el caso en nuestro problema?
   Si
   Recuerde que las tablas de X2 tal cual están,
    registran ambas colas.
   Entonces el X2 significativo con f=2 es
   X2 = 5.991 al nivel 0.05 y 9.210 al nivel 0.01
X2 calculado es 0.38 y es menor que el valor
 significativo de X2. ¿cuál es su conclusión?

                                                 Ud. Acepta la hipótesis
                                                 de nulidad. La
                                                 conclusión es que la
                                                 variación es
                                                 insuficiente para
                                                 sospechar que hay
                                                 otro factor envuelto y
                                                 ésta es debida
                                                 solamente a la
                                                 casualidad. Es decir,
                                                 los resultados “se
                                                 ajustan a la teoría
            0                               X2   genética”
                         X2 significativa




                 X2 calculada
 En pruebas ordinarias de t donde µ
    no es conocida, f = N-1. en X2
cuando probamos si algo se ajusta a
 la teoría, f = k-1. N en las pruebas
   de t es el número de resultados,
 mientras que en X2 k representa el
           número de clases
En las pruebas pareadas de t,
también f = N-1. aquí, N es el
    número de diferencias
El mismo genetista decide hacer otro experimento para comprobar si la
combinación de dos factores de segregación genética se ajustan a la teoría
genética que establece que estos se combinan de acuerdo a la razón: 9 AB:
3Ab: 3aB: 1ab

Sus resultados fueron los siguientes:
                                                 ¿cuáles son los
                                                 números
                                                 esperados?
fenotipo     Número       Número
             observado(O) esperado(E)
                                              ¿podemos aplicar
AB           245             225              X2? ¿por qué?

Ab           80              75              X2=                    ¿cuál es X2
aB           70              75                                     significativo?
                                            f=
ab           5               25
total        400             400            ¿una o dos
                                            colas?                 ¿conclusión?
Uso de X2 para probar asociación en
    vez de “ajuste a una teoría”

 Se afecta f (lo veremos más adelante)
 Los datos para probar “asociación” se
  arreglan en una “tabla de contingencia”
               En un estudio, para ayudar a decidir si una inoculación
               en particular tiene alguna propiedad protectiva, se
               obtuvieron los siguientes resultados durante una
               epidemia
                                                        Establezca la
                Inoculados    No          Total         hipótesis de
                              inoculados  de fila       nulidad y su
                                                        alternativa
Afectados      5            55           60
No afectados   95           145          240
                                                      Asumimos la
Total de
columna        100          200          300          hipótesis de
                                                      nulidad como
                                                      cierta y calculamos
                                                      los resultados
                                                      esperados usando
¿es esta una tabla de                                 los totales de las
observados o esperados                                filas y las
                                                      columnas.
Podemos observar, usando los
                                         En el cuadro vemos también
totales de columnas que 100 de un
                                         que se afectaron 60 personas.
total de 300, o sea 1/3 fueron
                                         Por consiguiente podemos
inoculados. Como hemos asumido
                                         esperar que1/3 de ellos fueron
como cierta la hipótesis de nulidad,
                                         inoculados(pues la vacuna no
entonces se deriva que la
                                         está asociada con la incidencia
inoculación no está asociada con la
                                         de la enfermedad). Así, tenemos
incidencia de la enfermedad.
                                         que 20 fueron inoculados y
Esperamos entonces que 1/3 de
                                         tuvieron la enfermedad.
aquellos afectados fueron
inoculados.

                                         Ya que se asume que la
De manera similar, 2/3 del total no      inoculación no tiene ningún
fueron inoculados, de modo que se        efecto y 1/3 han sido
puede esperar que 2/3 de los 60          inoculados se puede esperar
afectados, o sea 40, no fueron           también que 1/3 de los 240 no
inoculados                               afectados fueron inoculados.
                                         Es decir, 80 personas.

Finalmente, ¿cuántos no inoculados, no
afectados podría esperar?                   2/3 de 240, o sea 160
Complete entonces su tabla de
   resultados esperados
      Abajo se observan las tablas de contingencia para los resultados
                       observados y los esperados
Observados (O)                                          Observe que el total de filas
                   Inoculados   No           Total      es igual al total de columnas
                                inoculados   de         en las dos tablas
                                             fila
    Afectados      5            55           60
    No afectados   95           145          240
                                                     Observe también que cada
                                                     resultado esperado es igual a
    Total de                                         Su total de fila x total de columna
    columna        100          200          300
                                                              gran total
Esperados (E)
                   Inoculados   No           Total   ¿cuál sería el resultado
                                inoculados   de      esperado para el grupo
                                             fila    afectado inoculado?
    Afectados      20           40           60
    No afectados   80           160          240
                                                        60 x 100
    Total de                                                           = 20
    columna        100          200          300           300
   Recuerde que estamos            Si
    interesados en saber si la      Se esperaban 20 pero
    inoculación protege              sólo 5 fueron observados
    contra la enfermedad.            en este grupo.
   Si esto es así, esperamos       Prueba de una sóla cola.
    observar menos gente            Una vez resuelto todo lo
    inoculada afectada que lo        anterior podemos
    esperado. ¿esto es así?          entonces utilizar la
   De otra manera debíamos          fórmula ya conocida y
    rechazar la teoría               calcular X2.
    inmediatamente
   ¿esta es una prueba de
    una o dos colas?
 Cuando X2 fué usado para probar el “ajuste a una
  teoría”, f = k-1
 Ahora que usamos X2 para probar asociación usando las
  tablas de contingencia, f = (r-1) (c-1), donde r es el
  número de filas y c el número de columnas en el cuerpo
  de la tabla.
 Por consiguiente, en nuestro problema f = (2-1) (2-1) =
  1
 O sea que hay 1 grado de libertad.
 Esto es porque si 1 resultado esperado es calculado en
  una tabla de contingencia de dos filas y dos columnas,
  ya que los totales de las filas y las columnas son fijos, el
  resto de los números en la tabla no se pueden escoger
  libremente.
 ¿cuál es el valor de f en una tabla de
  contingencia con 3 filas y 8 columnas?
 (3-1)(8-1) = 14
 En este caso el grado de libertad para
  escoger resultados se amplía por haber un
  número mayor de filas y de columnas.
 Con toda la información que tenemos podemos
  ir a la tabla y buscar el valor significativo de X2.
 Los cuales son: 2.706 para 0.05 y 5.412 para
  0.01
 ¿cuál es su conclusión?
 La hipótesis de nulidad es rechazada. Podemos
  ver que menos gente que está inoculada contrae
  la enfermedad. Ahora podemos decir también
  que el grado de protección es estadísticamente
  significativo (0.01 > p)
Para probar el nivel de “ajuste a una
 teoría”, ésta por si misma es usada
     para calcular los resultados
  esperados. Sin embargo, cuando
     usamos X2 para probar una
“asociación”, usamos los resultados
    observados para calcular los
         resultados esperados

								
To top