MATEMÁTICA Y ESTADÍSTICA Trabajo Práctico No Análisis de la Varianza

Document Sample
MATEMÁTICA Y ESTADÍSTICA Trabajo Práctico No Análisis de la Varianza Powered By Docstoc
					MATEMÁTICA Y ESTADÍSTICA                                                                         27

Trabajo Práctico No. 11: Análisis de la Varianza (ANOVA)

Contenido: Introducción al análisis de la varianza (ANOVA). Supuestos teóricos. Cálculo e
interpretación de ANOVA. Diseño experimental. ANOVA de una vía. Comparaciones múltiples.
Lecturas recomendadas: Spiegel, 1991. Cap.16: 375-410; Cap.17: 411-439. Sokal & Rohlf,
1979.Cap.8:195-226; Cap.9:227-280; Cap.13:405-443. Merodio, 1986. Cap.3: 39-48.
Koch y Link, 1980. Cap.5: 132-148, 192-198 (ANOVA). Cap.8: 325-333 (DISEÑO EXPERIMENTAL)

Idea principal
El Análisis de la Varianza (ANOVA) resulta un método muy importante dentro de las ciencias
naturales con aplicaciones diversas algunas de las cuales se vinculan con el diseño de experimentos
dado que muchas veces nos encontramos ante la disyuntiva de tener que comparar más de 2 grupos
de muestras a partir de sus medias muestrales.
Cuando se realiza un experimento o se mide una variable en el campo siempre se incluye una
variabilidad natural y un error experimental que surge de la falta de control previo de la
experiencia. El ANOVA permite diferenciar la fuente de variabilidad de las observaciones en estas
dos componentes, cada uno interpretable en términos disciplinares.
En el caso de una única variable el test de significación que permite discriminar si existen o no
diferencias entre grupos es un test de “F”. Esencialmente se calcula un cociente entre dos varianzas,
la varianza entre los grupos de datos y una varianza ponderada promedio dentro de los grupos. Si la
varianza entre grupos es significativamente mayor, debe existir una diferencia significativa entre las
medias
Algunos conceptos asociados a este análisis son:
Unidad experimental es la mínima porción del material experimental sobre el cual se puede realizar
un tratamiento.
Tratamientos o factores son el conjunto de acciones que se aplican a las unidades experimentales
con la finalidad de observar como responden a éstas (variable independiente).
Variable aleatoria observada o respuesta es la medida u observación que se obtiene de cada una
de las unidades experimentales.
Réplicas o repeticiones son cada una de las realizaciones de un tratamiento.

Para el desarrollo del TP se requiere el uso de la tabla de probabilidades “F” y Rangos
Studentizados “q” (Nº 6 y Nº 7 del Anexo TABLAS)

1) Los resultados de los siguientes estudios pueden analizarse estadísticamente a través de
un ANOVA. Indique o defina para cada caso la variable dependiente, y elabore una tabla
resumen de ANOVA en donde consten las fuentes de variación y los grados de libertad.
a) Un geólogo ha mapeado en un área 5 afloramientos de calizas que no sabe si pertenecen
a la misma Formación. El supone que el contenido de arena de las rocas puede ser la clave
para determinarlo. Por ello toma de cada afloramiento 5 muestras de mano y se pesa el
contenido de arena en cada una.
b) Una falla ha cortado una veta portadora de plata desplazándola aproximadamente 35
metros. Para comparar el contenido de plata a ambos lados de la falla se han tomado 63
muestras sobre el lado Sur y 55 sobre el lado Norte.
c) Existe interés en conocer qué método de preparación de muestras es mejor para estimar
y posteriormente extraer el contenido de mineral en un yacimiento, para ello se extrajeron 20
muestras del yacimiento, cada una de ellas es cuarteada y procesada de tres formas
diferentes: trituración, tamizado y pulverizado.
d) Con el propósito de comparar la concentración de monóxido de Carbono (CO) en la
ciudad de La Plata. Se seleccionan 5 esquinas de la ciudad que difieren en su nivel de
transito automotor. A una determinada hora (12:00 a.m.), se realizan 7 estimaciones
puntuales del nivel de CO en cada esquina.
e) En un sector que se sospecha de potencial minero se toman 20 muestras en sectores
silicificados y 15 en ignibritas brechadas que se analizan por su contenido en As, ya que
este elemento es trazador de Au.
f) Con el objeto de verificar la variabilidad introducida en la determinación de Cuarzo modal
por diferentes operadores se realiza el siguiente experimento:
Se entrenan 5 graduados en el recuento de puntos al microscopio, cada uno examina los
mismos 5 cortes delgados de un granito. El experimento se repite luego de 6 meses.
MATEMÁTICA Y ESTADÍSTICA                                                                    28


2) Se obtuvieron 5 muestras de areniscas con cemento carbonático de 5 afloramientos
diferentes del que se supone es un único cuerpo litológico. Cada muestra es ligeramente
diferente a la otra, una tiene grano grueso, otra contiene algo de arcilla, una tercera es
levemente ferruginosa, etc. Dado que el contenido de carbonatos es una clave para
determinar si pertenecen al mismo cuerpo rocoso de cada muestra se obtuvieron 6
fragmentos de los que se determinó el contenido de carbonato en % que se presenta a
continuación:

                     Replica      M1          M2         M3       M4          M5
                       1          19,2        18,7       12,5     20,3       19,9
                       2          18,7        14,3       14,3     22,5       24,3
                       3          21,3        20,2        8,7     17,6       17,6
                       4          16,5        17,6       11,4     18,4       20,2
                       5          17,3        19,3        9,5     15,9       18,4
                       6          22,4        16,1       16,5     19,0       19,1

a) Realizar una gráfica comparativa de los resultados. (Incluir la media, el desvío estándar y
los valores máximo y mínimo)
b) Plantear Ho y H1,
c) ¿Qué supuestos se requieren para realizar el análisis? Si corresponde, realizar la prueba
de Tukey.
d) Realizar el ANOVA (α = 0,05). Interpretar los resultados.

3) Se desea investigar el contenido de Potasio de gneisses expuestos en un afloramiento.
Se seleccionaron aleatoriamente 10 sitios transversales a la foliación y de cada uno se
tomaron 5 muestras. Los 50 valores de contenido de potasio de los análisis químicos se
presentan a continuación:

           Sector                                                                   Media
              1         6.4            6.8         6.8          6.0         7.6      6.72
              2         2.4            2.5         2.3          3.3         2.5      2.60
              3         3.0            1.4         2.4          3.7         1.6      2.42
              4         4.3            4.3         4.1          5.7         4.6      4.60
              5         6.0            6.6         7.2          6.7         6.2      6.45
              6         2.8            3.1         3.7          4.0         2.8      3.28
              7         2.2            3.3         3.4          0.4         3.5      2.56
              8         5.0            5.7         4.2          3.3         5.1      4.66
              9         7.4            7.1         6.4          7.8         5.2      6.78
             10         2.7            4.6         6.4          5.6         3.0      4.46

a) Efectuar un análisis de la varianza con los datos presentados.
b) Presentar los resultados en una tabla resumen de ANOVA (indicando fuentes de
variación, grados de libertad, cuadrados medios, valor de F y su significación).
c) Evalúe las diferencias entre grupos de medias con un test a posteriori (Tuckey).
Considere los siguientes grupos de medias: T1 (1, 5 y 9); T2 (8, 4, 10 y 6) y T3 (2, 7 y 3).

4) Con el objeto de estudiar las características del pH en suelos Pedocal, se han extraído 6
perfiles de suelo, en cada uno de ellos se midió el pH en tres horizontes: O, A y E. Se desea
conocer si el pH es el mismo a lo largo de todo el perfil de suelo. Analice los datos siguiendo
un diseño de ANOVA para comprobar si existen estas diferencias.


                           Perfil N°          O            A           E
                              1              7,5          7.6         7.2
                              2              7,2          7.1         6.7
MATEMÁTICA Y ESTADÍSTICA                                                                        29

                            3          7,3             7.2       7.0
                            4          7.5             7.4       7.0
                            5          7.7             7.7       7.0
                            6          7.6             7.7       6.9

a) Efectúe un análisis de la varianza con los datos presentados. Incluya un diagrama box-
plot para mostrar datos y resultados.
b) Evalúe el supuesto de homogeneidad de varianzas, utilice los resultados hallados
después de aplicar 3 pruebas estadísticas con un software:

                         Hartley Cochran Bartlett   df                p
                    pH 2.512500 0.522078 1.075274 2             0.584127

c) Presente los resultados en una tabla resumen de ANOVA (indicando fuente de variación,
grados de libertad, cuadrados medios, valor de F y su significancia).
d) Existen diferencias en el pH de los distintos horizontes del suelo? fundamente su
respuesta.
f) Evalúe en cuál/es localidad/es el pH es mayor. Utilice una prueba a posteriori

5) Los sistemas hidrotermales de baja temperatura (epitermales) que forman depósitos
minerales de oro y plata suelen desarrollar, en áreas de descarga superficiales (hot-spring)
sinter silíceos, sin embargo en algunas ocasiones, la silicificación de rocas laminadas
(tufitas o calizas laminadas) producida en profundidad puede generar rocas similares a
sinters. La determinación correcta de la génesis de estas rocas tiene gran importancia a la
hora de proceder a la modelación del depósito mineral. Los contenidos de Al (ppm) podría
ser una clave, por lo que se muestrearon y analizaron 5 sectores en una región donde se
determinó la presencia de estas rocas. A continuación se presentan los resultados obtenidos
con un programa estadístico.
                SECTOR            Means Al         Stand. Deviat. Al       Valid N
                    A             14931.36            14599.63              22
                    B             8254.17              9363.48              24
                    C             4506.82              4494.96              67
                    D             4761.96              2902.12              27
                    E             58658.57             6195.38               7
               All Groups         9304.29             13885.18              147

Summary of all Effects. 1-SECTOR
        df Effect     MS Effect       df Error     MS Error             F             p-level
    1   4            4968281088       142          58277708            85.25183       0.00

Scheffe test; variable Al . MAIN EFFECT: SECTOR
                   {1}             {2}            {3}             {4}                {5}
                14931.36        8254.167       4506.821        4761.963           58658.57
A {1}                       .072498          .000012         .000462         .000000
B {2}         .072498                        .376459         .617505         .000000
C {3}         .000012       .376459                          .999942         0.000000
D {4}         .000462       .617505          .999942                         0.000000
E {5}         .000000       .000000          0.000000        0.000000

   a) Realice un diagrama de los pasos seguidos justificando porque se han llevado a
      cabo.
   b) Formule las hipótesis nula y alternativa utilizadas.
   c) Analice los resultados. Enuncie sus conclusiones.