unidad I by E9o0sv

VIEWS: 21 PAGES: 29

									INSTITUTO TECNOLÓGICO DE APIZACO            Estadística                       Ingeniería Administrativa




                          SEP                DGIT           SEIT



           INSTITUTO TECNOLÓGICO DE APIZACO



           DEPARTAMENTO DE CIENCIAS BÁSICAS


                                     ESTADÍSTICA
                                   (Ingeniería Administrativa)




                        M. en C. JOSÉ LUIS HERNÁNDEZ GONZÁLEZ
                                  www.itapizaco.edu.mx/~joseluis
                                     tareasjlhg@yahoo.com




                Alumno:________________________________________________




Apizaco Tlax., Agosto 2005


                                        1                        M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO              Estadística                               Ingeniería Administrativa


Objetivo: Que los estudiantes:
Conozcan los conceptos y métodos fundamentales de la estadística y reflexionen sobre su uso en el
área de la administración.
    - Desarrollen habilidades para utilizar los conceptos y métodos de la estadística en la toma de
        decisiones.
    - Desarrollen habilidades para utilizar los conceptos y métodos de la estadística como
        herramientas en proyectos de investigación.

         1.     Distribuciones muestrales
         1.1    Estadísticos muestrales y distribuciones muestrales
         1.2    Distribución muestral de la media
         1.3    Teorema del límite central
         1.4    Distribución muestral de s2
         1.5    Dsitribución t

         2.     Estimación
         2.1    Métodos clásicos de estimación
         2.2    Estimación de la media
         2.3    Estimación de la proporción
         2.4    Estimación de la varianza

         3.     Pruebas de hipótesis para una y dos muestras
         3.1    Conceptos generales
         3.2    Pruebas de una y dos colas
         3.3    Uso de valores de p para la toma de decisiones
         3.4    Pruebas con respecto a la media
         3.5    Relación de la estimación del intervalo de confianza
         3.6    Elección del tamaño de la muestra para probar medias
         3.7    Pruebas con respecto a la proporción
         3.8    Pruebas referentes a varianzas
         3.9    Pruebas de bondad de ajuste
         3.10   Pruebas de independencia
         3.11   Pruebas de homogeneidad

         4.     Pruebas de hipótesis no paramétricas
         4.1    Métodos estadísticos paramétricos contra no paramétricos
         4.2    Pruebas de rachas o corridas para aleatoriedad
         4.3    Una muestra: Prueba de los signos
         4.4    Una muestra: Prueba de Wilcoxon
         4.5    Dos muestras independientes: Pruebas de Mann-Whitney
         4.6    Observaciones pareadas: pruebas de los signos
         4.7    Observaciones pareadas: Prueba de Wilcoxon
         4.8    Varias muestras independientes: prueba de Kruskal-Wallis

         5. Regresión lineal simple y correlación
         5.1 Introducción a al regresión lineal simple

                                          2                                M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO               Estadística                               Ingeniería Administrativa


         5.2    Método de mínimos cuadrados
         5.3    Inferencias acerca de los coeficientes de relación
         5.4    Procedimiento de análisis de varianza
         5.5    Correlación

         6.     Regresión lineal múltiple
         6.1    Objetivos y supuestos del análisis de regresión lineal múltiple (RLM)
         6.2    Conceptos adicionales del análisis de RLM
         6.3    Residuales y graficas de residuales
         6.4    Análisis de varianza en el análisis de RLM
         6.5    Objetivos y supuestos en el análisis de correlación múltiple
         6.6    Conceptos adicionales
         6.7    Peligros y limitaciones asociados con el análisis de regresión y correlación múltiple
         6.8    Análisis en computadoras

         7.     Análisis de series de tiempo y pronósticos económicos
         7.1    Modelo clásico de series de tiempo
         7.2    Análisis de tendencias
         7.3    Análisis de variaciones cíclicas
         7.4    Medición de variaciones estaciónales
         7.5    Aplicación de ajustes estaciónales
         7.6    Pronósticos basados en factores de tendencia estaciónales
         7.7    Pronósticos basados en ciclos e índices económicos
         7.8    Pronósticos basados en promedios móviles
         7.9    La suavización exponencial como método de pronostico
         7.10   Otros métodos de pronostico con suavización

   Bibliografía
   Probabilidad y estadística para ingeniería y ciencias
   Devore Jay. L
   Thomson editores. México. 1998. Cuarta edición

   Estadística aplicada a la administración y economía
   Hidelbrand David K y Ott Lyman R.
   Editorial Addisosn Wesley Longman. México. 1998

   Probabilidad y estadística aplicada a la ingeniería
   Montgomery Douglas C. y Runger George C.
   Editorial McGraw Hill. España. 1997

   Probabilidad y estadística para ingeniería y ciencias
   Velasco Sotomayor G.
   Thomson editores. México. 2001

   Hoja de cálculo de Excel
   Paquete estadístico SPSS, SAS o MINITAB

                                           3                                M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO             Estadística                 Ingeniería Administrativa


                                         ESTADÍSTICA I

                                   BIBLIOGRAFÍA (Apuntes)
Estadística I
Napoleón Labastida López
I.P.N. – Limusa

Estadística Inferencial y Econometría
José Felipe Padilla Díaz
I.P.N.

Probabilidad y Estadística
Walpole y Mier
Mc Graw Hill

Probabilidad y Estadística
Problemas de Probabilidad
Hugo E. Borras García
Rafael Iriarte B.
Facultad de Ingeniería
UNAM



Probabilidad y Estadística para Ingeniería
Richard L. Scheaffer
James T. McClave
Grupo Editorial Iberoaméricana

Problemas resueltos de probabilidad
Francisco Montes de Oca Puzio
Mario Alberto Lira Rodante
UPIICSA
I.P.N.

Colección de Problemas y Ejercicios de Bioestadística
María José Marques dos Santos
Teresa Guerra Dávila
Ángel Barajas Chavarría
Facultad de Estudios Superiores Zaragoza
UNAM




                                         4                  M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO       Estadística                Ingeniería Administrativa


http://www.minitab.com




http://www.spss.com/corpinfo/




http://xlstat.com/indexes.htm




                                   5                 M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO                Estadística                              Ingeniería Administrativa




                                           UNIDAD I


         DISTRIBUCIÓN DE PROBABILIDAD CONTINUAS

ESPACIO MUESTRAL. El el conjunto de todos los resultados posibles de un experimento estadístico
denotado por “S” o “  ”

VARIABLE. Se denomina variable a la entidad que puede tomar un valor cualesquiera durante la
duración de un proceso dado. Si la variable toma un solo valor durante el proceso se llama constante.

VARIABLE ALEATORIA: Es una función que asocia un número real a cada elemento del espacio
muestral. Es decir son aquellas que pueden diferir de una respuesta a otra.

Una variable aleatoria se puede clasificar en:

                                       Variable aleatoria discreta.

                                       Variable aleatoria continua.

Variable aleatoria discreta. Una variable discreta proporciona datos que son llamados datos
cuantitativos discretos y son respuestas numéricas que resultan de un proceso de conteo.

Variable aleatoria continua. Es aquella que se encuentra dentro de un intervalo comprendido entre
dos valores cualesquiera; ésta puede asumir infinito número de valores y éstos se pueden medir.


                                          DISTRIBUCIONES

Una distribución de frecuencias es un listado de las frecuencias observadas de todos los resultados
de un experimento que, en realidad se han presentado cuando se lleva a cabo un experimento; en
cambio, una distribución de probabilidad es un listado de las probabilidades de todos los resultados
posibles que podrían presentarse si se efectuara el experimento.

Las probabilidades que se asocian a cada uno de los valores que toma la variable aleatoria x constituyen
lo que se conoce como DISTRIBUCIÓN DE PROBABILIDAD. La diferencia consiste en que la
función matemática se transforma en una función probabilística.



                                            6                               M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO            Estadística                                                Ingeniería Administrativa


Se pueden clasificar en:
                                                          P(x)


                                    Discretas




                                                                       x1      x2   xn             x
               Distribuciones
                                                     P(x)

                                    Continuas




                                                                       x1           xn              x

Distribuciones discretas. Son aquellas donde las variables asumen un número limitado de valores,
por ejemplo el número de años de estudio.

                                                    Binomial
                            Discretas               Hipergeométrica
                                                    Multinomial
                                                    Poisson

Distribuciones continuas. Son aquellas donde las variables en estudio pueden asumir cualquier
valor dentro de determinados límites; por ejemplo, la estatura de un estudiante.

                                   Uniforme


           Continuas               Exponencial



                                   Normal

Las distribuciones de probabilidad pueden ser representadas mediante una modelo matemático, una
gráfica o una tabla de valores

                                    S    E0    E1                ...    En
                                    X    x0    X1                ...    xn
                                   P(X) p(x0) p(x1)              ...   p(xn)

                                        7                                                M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO                  Estadística                                                   Ingeniería Administrativa


Dados los eventos E1, E2, ..., En  S, se dice que x es una variable aleatoria, si a cada valor de xi que
asume cada Ei, se le asocia su probabilidad de ocurrencia y cumple con las siguientes condiciones:

a)     La probabilidad para todo valor que asuma la variable aleatoria xi, será mayor o igual a cero
       pero menor que uno.
                                        0  P(xi)  1  xi

b)     La suma de todas las probabilidades asociadas a todos los valores que toma la variable x, es
       igual a la unidad.
                                                     

                                                      P(x )dx  1
                                                    
                                                                i


c)     La probabilidad de seleccionar una variable aleatoria para a < x < b esta dada por:
                                                                         b
                                           P(a  X  b)   f ( x )dx
                                                                         a


Lo cual equivale a calcular el área bajo la curva
                       P(x)




                                    a                    b                   x

Las distribuciones de probabilidad de una variable aleatoria están caracterizadas por magnitudes
llamadas momentos de la distribución, las mas usuales son:
La media aritmética o esperanza matemática
                                                                    
                                             E ( X)               x p(x) dx
                                                                    
La desviación estándar
                                                                
                                    var(X)     ( x  ) 2 p( x) dx
                                                         2

                                                             


                                        DISTRIBUCIÓN NORMAL

La función de densidad de la variable aleatoria normal X, con media  y varianza 2, es:
                                                                                               2
                                                                                  1  x  
                                                                    1                    
                                                                                  2  
                                         n ( x; , )                       e
                                                                    2
                                           x  




                                              8                                                    M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO            Estadística                              Ingeniería Administrativa




                                       DISTRIBUCIÓN t

La distibución t pertenece a la familia Euler de las distribuciones gamma. La función de densidad
para cierto grado de libertad ( v ) es:
                                          v 1
                                                       
                                                            v 1
                                                  t2  2
                              h(t )  
                                             2 
                                                 1   ,    t  
                                                 
                                         v          v
                                         v         
                                         2
Donde
                                               (v)  (v - 1)!

La distibución T se parece a la Z, ya que ambas son simétricas alrededor de la media cero. Tienen
forma de campana, pero la distribución t varia más, debido al hecho de que los valores de T
dependen de X y S2.




                            Cuando el tamaño de n  , entonces T  Z




                                        9                               M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO            Estadística                                   Ingeniería Administrativa



                                           DISTRIBUCIÓN  2
                                                                   v
Es un caso especial de la gamma, se obtiene haciendo   y   2
                                                                   2
La variable continua aleatoria X tiene una distribución  2 , con v grados de libertad, si su función de
densidad es:
                                                 1
                                                          v
                                                            1 
                                                                 x

                                             v          x e 2, x0
                                                          2
                                            
                                  f ( x )   2 2  v 
                                                    
                                                  2
                                            0 en cualquier otro caso
                                            
                                  v  0, entero




                                         DISTRIBUCIÓN F

Sean U y V dos variables aleatorias independientes que tiene distribución  2 con v1 y v2 grados de
libertad, respectivamente. Entonces la distribución de variable aleatoria:
                                                         U
                                                        v
                                                  F 1
                                                         V
                                                        v2
está dada por,
                                                   v1
                                  v1  v 2  v1  2
                                                       v1
                                2  v                       1

                                             2          f 2
                                                                            , 0 f 
                       h(x)        v1   v 2                  v1  v 2

                                  1  v1 f                   1
                                    2  2                   
                              
                                                          v2   
                              
                                           0, en cualquier otro caso




                                           10                                M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO             Estadística                                    Ingeniería Administrativa


                         DISTRIBUCIÓN NORMAL DE PROBABILIDAD.

La función de densidad de probabilidad normal es comúnmente empleada en el análisis estadístico ya
que existe una gran cantidad de fenómenos continuos de tipo económico, sociales, de ingeniería,
bilógicos, entre otros los cuales son posible expresarlos con ella; siendo la base tanto para la descripción
como para la inferencia.

La distribución normal de probabilidad es una distribución continua de probabilidades que es simétrica
y mesokúrtica. Representada por la siguiente figura.

                            P(x)




                                                                     x

       La distribución normal de probabilidad es muy importante por las siguientes razones:

1.-    Se sabe que las mediciones que se obtienen en muchos procesos aleatorios tienen esta clase de
       distribución.
2.-    Con frecuencia puede utilizarse en probabilidades normales para aproximar otras distribuciones
       de probabilidad tales como la distribución Binomial y Poisson.
3.-    Las distribuciones estadísticas como la media muestral y la proporción muestral tienen
       distribución normal cuando el tamaño de la muestra es grande, sin importar la forma de la
       distribución de la población de origen.

En el caso de distribuciones continuas de probabilidad sólo es posible determinar el valor de
probabilidad para un intervalo de valores. La altura de la función de densidad o curva de probabilidad
para una variable con distribución normal está dada por:
                                                                      2
                                                   1       1  x  
                                                        e 2  
                                                         -
                                          f(x) =                   
                                                   2 
donde:
       π        = 3.1416
       e        = 2.7183
       μ        = Media de la distribución
       σ        = Desviación estándar de la distribución
La tabla de probabilidades normales se basan en la distribución específica de la distribución normal
estándar, donde μ = 0 y σ = 1 cualquier valor de x de una población con distribución normal se puede
convertir a su valor normal estándar equivalente z por la siguiente ecuación.
                                                      x-
                                                z =
                                                       



                                            11                                 M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO          Estadística                                  Ingeniería Administrativa


         CARACTERÍSTICAS DE UNA DISTRIBUCIÓN NORMAL DE PROBABILIDAD.
1.-    Es unimodal ya que sólo tiene un valor máximo en el que coincide la media, la mediana y la
       moda.
2.-    Presenta una forma de campana y es simétrica.
3.-    La media de una población distribuida normalmente se encuentra en el centro de su curva
       normal.
4.-    Los dos extremos de una distribución normal de probabilidad se extienden de manera indefinida
       y nunca tocan el eje horizontal.
5.-    Está determinada por medio de dos parámetros: la media y la desviación estándar.
6.-    El área total bajo la curva se considera igual a la unidad y se usa como masa probabilística.
7.-    El área comprendida bajo la curva entre dos valores x1 y x2 es igual a la probabilidad de que
       dicha variable suma cualquier valor dentro de ellos.

  El promedio de estudiantes inscritos en jardín de niños es de μ = 500, con una desviación estándar σ
 = 100. El número de alumnos inscritos tienen una distribución aproximadamente normal. ¿Cuál es la
              probabilidad de que el número de alumnos inscritos en una escuela elegida al azar sea?:
a) entre 500 y 650.
b) entre 450 y 600.
c) menor de 500.
d) menor de 500.
e) menor de 300.
f) mayor de 650.
g) mayor de 400.
h) menor de 610.




                                         12                               M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO          Estadística                Ingeniería Administrativa


SOLUCIÓN:
a) P(500 < x < 650)
      x -  650  500
z=                         1.50
                  100
de las tablas estandarizadas obtenemos
A = 0.4332 = 43.32%




b) P(450 < x < 600)
       x -  450  500
z1 = 1                       0.50
                    100
de las tablas estandarizadas obtenemos
A1 = 0.1915
        x -  600  500
z2 = 2                        1.00
                     100
de las tablas estandarizadas obtenemos
A1 = 0.3413
A = A1 + A2 = 0.1915 + 0.3413 = 0.5338 = 53.38%




c) P(x > 500)
                                         13             M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO         Estadística                Ingeniería Administrativa


      500  500
z =                0.00
         100
de la gráfica observamos que:
A = 0.5000 = 50%




d) P(x < 500)
     500  500
z=                0.00
         100
de la gráfica observamos que:
A = 0.5000 = 50%




e) P(x < 300)
       300  500
z1 =                2.00
          100
de las tablas estandarizadas obtenemos
A1= 0.4772 = 47.72%
A = 0.5 - A1 = 0.5 - 0.4772 = 0.0228 = 2.28%

                                        14             M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO         Estadística                Ingeniería Administrativa




f) P(x > 650)
       650  500
z1 =                1.50
          100
de las tablas estandarizadas obtenemos
A1 = 0.4332 = 43.32%
A = 0.5 - A1 = 0.5 - 0.4332 = 0.0668 = 6.68%




g) P(x > 400)
       400  500
z1 =                1.00
          100
de las tablas estandarizadas obtenemos
A1 = 0.3413
A = A1 + 0.5 = 0.3413 + 0.5 = 0.8413 = 84.13%




                                        15             M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO         Estadística                                Ingeniería Administrativa




h) P(x < 610)


       610  500
z1 =                1.10
          100
de las tablas estandarizadas obtenemos
A1 = 0.3665
A = 0.5 + A1 = 0.5 + 0.3665 = 0.8665 = 86.65%




                                        POBLACIONES

Dependiendo de cómo se seleccionen los elementos para un estudio podremos tener las siguientes
poblaciones:
                                              Población finita
                                              Población infinita

Población finita. Se llama así a la población que es de tamaño limitado cuyos elementos son
numerables.

Población infinita. Se llama así a la población de tamaño limitado cuya cantidad de elementos son
innumerables.

                                        16                             M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO           Estadística                                   Ingeniería Administrativa


                                            MUESTREOS

El hecho de regresar un elemento muestreado a la población antes de extraer otro elemento de la misma,
determina si el muestreo es con o sin reemplazo

                                               Con reemplazo
                                               Sin reemplazo
Con reemplazo.
Si un elemento se extrae de la población y posteriormente se regresa a la misma, tiene la posibilidad de
quedar incluido otra vez en la muestra en otra extracción.

Sin reemplazo.
Si el elemento extraído no se regresa a la población entonces, solamente formará parte de la muestra
una sola vez.

                               DISTRIBUCIONES MUESTRALES.

La distribución de todos los valores posibles que pueden ser tomados por alguna estadística, calculados
a partir de muestras del mismo tamaño extraídas aleatoriamente de la misma población, se llama
distribución muestral de esa estadística.

Las distribuciones muestrales pueden construirse empiricamente cuando se obtiene de una población
finita, discreta. Para lo cual se procede como:

1.- De una población finita, discreta de tamaño N, se extraen aleatoriamente todas las muestras posibles
de tamaño n.
2.- Se calcula la estadística de interés para cada muestra.
3.- Se enumeran en una columna los diferentes valores observados de la estadística y, en otra columna,
la frecuencia correspondiente de la ocurrencia de cada uno de esos valores.

EJEMPLO:
Suponga se que de una población de tamaño N = 5 edades de niños, dadas como {6, 8, 10, 12, 14}, la
media poblacional μ = 10 y la varianza poblacional σ2 = 8 y la varianza muestral es s2 = 10. Si
extraemos todas las muestras posibles de tamaño n = 2, si consideramos un muestreo con remplazo y
calculamos la media tendremos Nn muestras posibles es decir 52 = 25 posibles muestras de tamaño 2.

x1 = ( 6 + 6)/2     = 6       x2 = ( 6 + 8)/2     = 7       x3 = ( 6 + 10)/2    = 8
x4 = ( 6 + 12)/2    = 9       x5 = ( 6 + 14)/2    = 10      x6 = ( 8 + 6)/2     = 7
x7 = ( 8 + 8)/2     = 8       x8 = ( 8 + 10)/2    = 9       x9 = ( 8 + 12)/2    = 10
x10 = ( 8 + 14)/2   = 11      x11 = (10 + 6)/2    = 8       x12 = (10 + 8)/2    = 9
x13 = (10 + 10)/2   = 10      x14 = (10 + 12)/2   = 11      x15 = (10 + 14)/2   = 12
x16 = (12 + 6)/2    = 9       x17 = (12 + 8)/2    = 10      x18 = (12 + 10)/2   = 11
x19 = (12 + 12)/2   = 12      x20 = (12 + 14)/2   = 13      x21 = (14 + 6)/2    = 10
x22 = (14 + 8)/2    = 11      x23 = (14 + 10)/2   = 12      x24 = (14 + 12)/2   = 13
x25 = (14 + 14)/2   = 14


                                          17                                M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO            Estadística                              Ingeniería Administrativa


LA TABLA DE FRECUENCIAS ES:

                            X                    Frecuencia   Frecuencia relativa
                            6                         1             1/25
                            7                         2             2/25
                            8                         3             3/25
                            9                         4             4/25
                            10                        5             5/25
                            11                        4             4/25
                            12                        3             3/25
                            13                        2             2/25
                            14                        1             1/25
                           Total                     25               1


Las graficas son las siguientes:

                  Distribución de la población                  Distribución muestral




                                           18                           M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO              Estadística                                  Ingeniería Administrativa


                           DISTRIBUCIÓN MUESTRAL DE LA MEDIA

TEOREMA:Si X1, X2,..., Xn constituyen una muestra aleatoria de una población finita que tiene la
media μ y la varianza σ2, entonces:

                                                  E(x) = μ = μx

                                                              
                                                   x 
                                                                  n

                                             Población infinita

                                                                 N-n
                                             x =
                                                         n        N -1


                                              Población finita

Se denomina el error estándar de la media.

               n
A la fracción    se le llama fracción de muestreo. Cuando la fracción de muestreo es menor que 0.05,
               N
no es necesario usar el multiplicador de población finita.


                               TEOREMA DEL LIMITE CENTRAL.

Si X1, X2,..., Xn constituye un muestra aleatoria de población infinita que tiene la media μ, la desviación
estándar σ, entonces la distribución limitante es de:
                                                      x 
                                                 z=
                                                        
                                                         n


                                           DISTRIBUCIÓN t

Si el tamaño de muestra es pequeño, los valores de S2, varian considerablemente de muestra a muestra,
para ello es necesario usar la distribución t.

                                                            x 
                                                    t=
                                                              s
                                                              n


                                             19                               M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO            Estadística                                 Ingeniería Administrativa


                                   DIFERENCIA DE MEDIAS

Si se sacan al azar muestras independientes de tamaños n1 y n2 de dos poblaciones discretas o
continuas, con medias 1 2 y varianzas 1 y 2 respectivamente entonces la distribución muestral de
la diferencia de medias X1  X 2 , esta distribuida aproximadamente en forma normal con medias y
varianzas:
                                                                  2 2
                                X1  X 2  1   2 y  2 1 X2  1  2
                                                         X
                                                                  n1 n 2

Se tiene que

                                           (X 1  X 2 )  (1   2 )
                                      Z
                                                       1  2
                                                        2
                                                           2
                                                       n1 n 2

                             DISTRIBUCIÓN DE PROPORCIONES

Si una población es infinita y distribuida binomialmente, si p y q son las probabilidades respectivas y
considerando muestras de tamaño n extraídas de esta población, la distribución muestra de
proporciones está dada por:

                                                          ~p
                                                          p
                                                z
                                                       p(1  p)
                                                          n

 DISTRIBUCION DE LA DIFERENCIA ENTRE DOS PROPORCIONES DE MUESTRAS.

                                           (~1  ~ 2 )  (p 1  p 2 )
                                            p p
                                    z
                                           p 1 (1  p 1 ) p 2 (1  p 2 )
                                                         
                                                n1             n2



                               DISTRIBUCIÓN MUESTRAL DE 

Si S2 es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene
varianza 2, entonces los valores de la variable aleatoria X2 se calculan con:

                                                       (n  1)s 2
                                                2 
                                                          2



                                           20                              M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO              Estadística                                      Ingeniería Administrativa


                                                                     1
                               DISTRIBUCIÓN MUESTRAL DE
                                                                     2
Si S1 y S2 son las varianzas de variables aleatorias independientes de tamaños n1 y n2 , que se sacan
de poblaciones normales con varianzas 1 y 2, respectivamente, entonces,

                                                      2
                                                     S1
                                                     1
                                                      2
                                                                 2 S1
                                                                     2
                                              F                 2

                                                     S2
                                                      2         1 S 2
                                                                 2
                                                                     2

                                                22
tiene una distribución F con v1 = n1 – 1 y v2 = n2 – 1 grados de libertad

si se escribe f(v1, v2) para f con v1 y v2 grados de libertad, se tiene que:

                                                                      1
                                         f 1  (v1 , v 2 ) 
                                                                f  (v 2 , v1 )




                                             21                                   M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO        Estadística                                 Ingeniería Administrativa


                               PARÁMETROS Y ESTIMADORES

Toda medida de tendencia central o de dispersión obtenida de una población, se conoce como
parámetro de la población; aquellas que son obtenidas de una muestra se denominan estimadores, ya
que con ellas se realizará la estimación de esos parámetros.

Muestreo. Es la operación para tomar una muestra del universo. El objetivo es contar con datos
necesarios para estimar parámetros en la población, hacer inferencia estadística con la mayor
confiabilidad posible.




                                       22                              M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO                  Estadística                                                    Ingeniería Administrativa


Parámetros y estimadores más usuales

                             Parámetros                               Estimadores
                         Media poblacional:                          Media muestral
                                   N                                          n
                                       X                                         x
                              i                                      x i
                                  i 1 N                                    i 1 n
                        Varianza poblacional:                       Varianza muestral
                                   N                                        n

                                    (X   i    ) 2                        (x    i        x) 2
                          2      i 1
                                                                    s2    i 1
                                    N                                       n 1
                         Desviación estándar                       Desviación estándar
                            poblacional:                                     n
                                    N                                       (x             x) 2
                                    (X
                                                                                       i
                                          i    )   2
                                                                   s2      i 1

                                 i 1                                         n 1
                                      N                         Donde x es el valor de cada
                        Donde X es el valor de                  medición desde i = 1 hasta
                      cada medición desde i = 1                               n
                                hasta N                         n es el número de elemento
                     N es el número de elemento                 que constituyen la muestra
                          que constituyen la                              estudiada
                        población bajo estudio
                     Proporción poblacional de                  Proporción poblacional de
                       elementos con atributo:                   elementos con atributo:

                              Px 
                                    Xi                                px 
                                                                              xi
                                     N                                         n
                          N es el número de                         n es el número de
                      elementos de la población                  elementos de la muestra




ESTIMACIÓN: Es el procedimiento que consiste en emplear los estadísticos obtenidos de una
muestra para inferir o estimar los parámetros de una población.

Existen dos tipos de estimaciones fundamentales:

       ESTIMACIÓN POR PUNTO
       ESTIMACIÓN POR INTERVALO DE CONFIANZA




                                                 23                                                 M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO                    Estadística                                           Ingeniería Administrativa


                                   ESTIMACIÓN PUNTUAL O POR PUNTO

ESTIMACIÓN PUNTUAL O POR PUNTO: Consiste en emplear un solo valor de la muestra para
estimar el parámetro poblacional respectivo para que el estimador puntual sea bueno deberá reunir
las siguientes características.

         INSESGADO: Es cuando al aumentar el tamaño de la muestra el valor del estadístico x se
         aproxima al valor del parámetro . En el caso de que sean diferentes decimos que es sesgado
         y que e = x –.
         CONSISTENTE: Es cuando al aumentar el tamaño de la muestra n, el valor del estadístico
         x  se aproxima al valor del parámetro . n  N, x  
         EFICIENTE : Un estimador es eficiente cuando es de varianza mínima.
         SUFICIENTE: Un estimador es suficiente cuando es un estadístico que utiliza toda la
         información que posee una muestra sobre el parámetro que se estima.

                          ESTIMACIÓN POR INTERVALOS DE CONFIANZA

Es el rango dentro del cual se espera que se encuentre el valor del parámetro en cuestión, la ventaja
de la estimación por intervalos es que muestra la exactitud con que estima el parámetro a menor
longitud del intervalo mayor exactitud en la estimación. la probabilidad de que un intervalo
contenga el parámetro que se estima se denomina coeficiente de confianza. Un valor cercano a la
unidad indica un intervalo más reducido.


          Nivel de significancia  / 2                                              Nivel de significancia  / 2
                                                       Nivel de
                                                     confianza 1-


                                  l -  ivel de confianza
 ivel de significancia

                      Intervalo de confianza para la media con n  30 y  conocida.

                                             x  z / 2x    x  z / 2x

                                                        x  z / 2x

                    Intervalo de confianza para la media con n < 30 y  desconocida.

                                              x  t  / 2s x    x  t  / 2s x

                                                            x  t  / 2s x

                                                   24                                        M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO                       Estadística                                       Ingeniería Administrativa


               Intervalo de confianza para diferencia de medias 1 y 2 conocidas

                                                                            1  2
                                                                             2
                                               (x 1  x 2 )  z  / 2           2
                                                                            n1 n 2

             Intervalo de confianza para diferencia de medias 1 y 2 desconocidas

                                                                            1   1
                                               (x 1  x 2 )  t  / 2 s p     
                                                                            n1 n 2

                                                   (n 1  1)s 1  (n 2  1)s 2
                                                              2
                                              sp                            2

                                                          n1 + n 2  2

                                                            = n1 + n2 –2

             Intervalo de confianza para diferencia de medias 1  2 desconocidas

                                                                             2
                                                                            s1 s 2
                                                (x 1  x 2 )  t  / 2          2
                                                                            n1 n 2

                                                                              2
                                                               s1 s 2 
                                                                 2
                                                                2 
                                                              n       
                                                               1 n2 
                                                   =                2            2
                                                             s1 
                                                                2
                                                                      s2 
                                                                    2 
                                                            n      n 
                                                             1      2
                                                                   
                                                             n 1 1 n 2 1

                                             Intervalo de confianza para 2

                                                   (n  1)s 2 2 (n  1)s 2
                                                               2
                                                      / 2
                                                       2
                                                                 1 / 2

                                                = n - 1 grados de libertad

                                                                                      1
                                                                                       2
                                         Intervalo de confianza para
                                                                                      2
                                                                                       2


                       2
                      s1         1            1 s 1
                                               2   2
                                              2  2 f /2( 1 , v 2 ) con 1 = n1 – 1, 2 = n2 - 1
                      s 2 f /2( 1 , 2 )
                        2                     2 s2

                                                      25                                    M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO           Estadística                                   Ingeniería Administrativa




                                   PRUEBAS DE HIPÓTESIS.
       Dentro de la inferencia estadística se encuentra la prueba de hipótesis, cuyo objetivo es
probar o comprobar si la afirmación que se hace sobre un parámetro poblacional basados en
conclusiones obtenidas de una muestra es correcta o incorrecta.

Hipótesis estadística.

       Es una proposición o suposición que se hace sobre los parámetros de una distribución de
probabilidad de una variable aleatoria. Dicha hipótesis puede ser verdadera o falsa, por lo que se
puede aceptar o rechazar.

Prueba de hipótesis estadística.

       Es el procedimiento empleado para decidir si se acepta o se rechaza por su veracidad o
falsedad, una hipótesis estadística también se le conoce como “ensayos de significación”, “reglas de
decisión” ó “contraste de hipótesis”. Su objetivo es evaluar proposiciones o afirmaciones que se
hacen acerca de los parámetros poblacionales basados en estadísticos muestrales con un grado o
nivel de significancia determinado.

Hipótesis nula e hipótesis alternativa.

       En una prueba de hipótesis de significación se plantean dos tipos de hipótesis excluyentes,
llamadas hipótesis nula e hipótesis alternativa.
       La hipótesis nula expresa que una proposición es verdadera, mientras que la hipótesis
alternativa afirma que es falsa ó viceversa.

       Ho = hipótesis nula                     H1 = hipótesis alternativa

Ejemplos:

       Ho       = 1.68                                  H1     1.68
                                                         H1    < 1.68
                                                         H1    > 1.68



       Ho       = 4200                                  H1    > 4200
                                                         H1    < 4200
                                                         H1     4200




                                          26                                M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO            Estadística                                  Ingeniería Administrativa


                                      Errores tipo I y tipo II.

       En el proceso de emplear una muestra para formar una decisión poblacional en una prueba de
hipótesis, podemos cometer dos equivocaciones, al rechazar una hipótesis verdadera o al aceptar una
hipótesis falsa; las equivocaciones se conocen como:

a) Error tipo I. Se comete cuando se rechaza una hipótesis que por ser verdadera debería ser
aceptada.

b) Error tipo II. Se comete cuando se acepta una hipótesis que por ser falsa debería ser rechazada.

                                       Buen estudiante       Mal estudiante
                         Aprobarlo     Decisión correcta     Error tipo II
                         Repobarlo       Error tipo I       Decisión correcta

                            Nivel de significancia y nivel de confianza.

       El nivel de significancia se refiere a la probabilidad  de cometer error tipo I, es decir,
rechazar una hipótesis verdadera.

       El nivel de confianza se refiere a la probabilidad 1-  de aceptar una hipótesis verdadera.

                             H0 verdadera                             H1 falsa
  Se acepta Ho         Decisión correcta (1 – )                  Error tipo II ()
 Se rechaza Ho              Error tipo I ()                Decisión correcta (1 – )

Procedimiento para realizar una prueba de hipótesis.
1.- Del fenómeno estadístico a probar. Se establecen las hipótesis nula Ho, y la hipótesis alternativa
H1.

2.- Se especifica la probabilidad del error tipo I () como nivel de significancia y 1 –  como nivel
de confianza.

3.- Se selecciona el tamaño de la muestra, la función de distribución de probabilidad y el estadístico
muestral que sirva de base para la regla de decisión conocido como estadístico de prueba.

4.- Se determinan los valores críticos que limita la región de aceptación de la región de rechazo (que
dependerá del valor de  y de la hipótesis alternativa).

5.- Si el valor del estadístico muestral cae dentro de la región de rechazo, rechazamos Ho, debido a
que la probabilidad de obtener ese valor del estadístico muestral cuando Ho es cierta o verdadera, es


                                          27                                M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO            Estadística                                  Ingeniería Administrativa


tan pequeño que no debe atribuirse a errores de muestreo, lo que nos conduce a deducir que Ho es
falsa.

6.- Dar conclusión acerca del problema y/o formar una decisión.

                                    Hipótesis unilateral y bilateral.

       Al realizar una prueba de hipótesis nuestro interés puede estar en el valor extremo de un solo
lado de la distribución, o en ambos lados. En el primer casi, las pruebas se denominan unilaterales o
de una cola; en el segundo caso se conoce como bilaterales o de dos colas.

       En los ensayos unilaterales la región de rechazo es única a un lado de la distribución con un
área determinada por el valor de .

        En las bilaterales la región de rechazo el área se determina dividiendo el nivel de
significancia en dos partes iguales.

                                            BILATERAL 
                                    Zona de aceptación

           Zona de rechazo                                      Zona de rechazo


                              /2                      /2

                                           UNILATERAL >


           Zona de aceptación                                   Zona de rechazo

                                                         
                                           UNILATERAL <



         Zona de rechazo                                   Zona de aceptación

                                                



                                           28                               M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO    Estadística                                                      Ingeniería Administrativa




                     H0                                       Estadístico de prueba
            Distribución normal                                                  x 
                    = 0                                              z=
                                                                                   
                                                                                    n
               Distribución t                                          x 
                   = 0                                        t=          ;v = n – 1
                                                                         s
                                                                          n
            Distribución normal                                        (x 1  x 2 )  d 0
               1 – 2 = d0                                     z
                                                                                1  2
                                                                                 2
             1 y 2 conocidas                                                      2
                                                                                n1 n 2
               Distribución t                     (x 1  x 2 )  d 0        (n 1  1)s 1  (n 2  1)s 2
                                                                                       2

               1 – 2 = d0                t                          ;s  2                         2

                                                                                   n1  n 2  2
                                                                            p
                                                         1   1
           1 = 2 desconocidas                   sp       
                                                         n1 n 2
               Distribución t                                                             s1 s 2 
                                                                                            2            2

               1 – 2 = d0                                                                2 
                                                       (x 1  x 2 )  d 0                n       
           1  2 desconocidas                   t                            ;v       1 n2 
                                                                                              2              2
                                                            s1 s 2                      s1     s2 
                                                             2                             2
                                                                2                             2 
                                                            n1 n 2                     n      n 
                                                                                        1      2
                                                                                              
                                                                                        n 1 1 n 2 1
            Distribución normal                                             x  np 0
                   p = p0                                        z
                                                                         np 0 (1  p 0 )
            Distribución normal                                 (p 1  p 2 )
                                                                 ˆ     ˆ                      x1  x 2
                   p1= p2                              z                              ;p 
                                                                                        ˆ
                                                                  1   1                     n1  n 2
                                                              pq  
                                                              ˆ ˆ        
                                                                          
                                                                  n1 n 2 
              Distribución 2                                                   (n  1)s 2
                   = 0                                           2 
                                                                                   2
              Distribución F                                                       2
                                                                                  s1
                 1 = 2                                                 f
                                                                                  s2
                                                                                   2




                                   29                                                   M. en C. José Luis Hernández González

								
To top