Inferencia estadística P. Reyes / Sept. 2003
Hay dos formas de estimar el valor de un parámetro poblacional (Mu, Sigma, Pi):
a) Usando un estimador puntual por medio de un estadístico de la muestra tal como la media, desv. Estándar o proporción
Por ejemplo si la media de n = 500 mediciones de viscocidad es Xmedia = 5.5, este es el estimado de la media total
b) Determinando un Intervalo donde se puede encontrar el parámetro con un cierto nivel de confianza, normalmente del 95%
Por ejemplo si se determina un Intervalo de confianza en base a datos de muestra de una resistencia de (35, 38)
para un nivel de confianza del 95%, en este rango se encuentra el valor real de la media poblacional o del proceso.
Los niveles de confianza más comunes son: 90%, 95% y 99% dependiendo de que tan crítica sea la determinación.
n = 30
Alfa es la probabilidad de Error tipo I, indica la Alfa/2
probabilidad de que un intervalo de confianza dado n = 15
no contenga a la media desconocida n = 10
Alfa = 1 - Nivel de confianza
Z t gl = n-1
Las fórmulas para los intervalos de confianza son: Distribución Normal Distribución t
grados de libertad = # observaciones - # restricciones
IC paraestimarm = X ± Za / 2 (s / n ) Para n >= 30 y la sigma de la población es conocida, usar Z.
Para n >= 30 y la sigma de la población es desconocida, usar S y Z.
IC paraestimarm = X ± Za / 2 (s / n )
IC paraestimarm = X ± ta / 2 (s / n ) Para n 30 se estima el intervalo de confianza para proporciones
n
Z a2 / 2 s 2 Tamaño muestral para estimar la media poblacional en base a un error máximo
n =
(X - m )2
Z a2 / 2 ( p )( 1 - p ) Tamaño muestral para estimar la proporción poblacional en base a un error máximo
n =
( p - p )2
Ejemplos:
Z 1. El peso de una muestra de 50 bultos de productos es en promedio Xmedia = 652.58 Kgs., con S = 217.43 Kgs.
Determinar el intervalo de confianza al NC del 95% y al 99% en donde se encuentra la media del proceso (poblacional).
Alfa = 1 - NC
3. Un intervalo de confianza del 90% para estimar la ganancia proemdio del peso de ratones de laboratorio oscila
entre 0.93 y 1.73 onzas. ¿Cuál es el valor de Z?.
4. 100 latas de 16 onzas de salsa de tomate tienen una media de Xmedia = 15.2 onzas con una S = 0.96 onzas.
¿A un nivel de confianza del 95%, las latas parecen estar llenas con 6 onzas?.
9. Una muestra de 16 soluciones tienen un peso promedio de 16.6 onzas con S = 3.63. Se rechaza la solución si el
peso promedio de todo el lote no excede las 18 onzas. ¿Cuál es la decisión a un 90% de nivel de confianza?.
t 1. 20 cajas de producto pesaron 102 grs. Con S = 8.5 grs. ¿Cuál es el intervalo donde se encuentra la media del lote
para un 90% de nivel de confianza?. Grados de libertad = gl = 20 - 1 = 19
17. Una muestra de 25 productos tienen un peso promedio de 23.87 grs. Con una S = 9.56. ¿Cuál es la estimación
del intervalo de confianza para un nivel de confianza del 98% del peso de productos del lote completo?.
2. Con los datos del problema anterior, determinar el Intevalo de confianza para un 95% de nivel de confianza.
Instrucciones en Minitab
Stat > Basic Statistics > 1-Sample Z o t o p
Variable -- Indicar la columna de los datos
Confidence Interval -- 90, 95 o 99%
En caso de requerirse dar el valor de Sigma = dato OK
Ejemplo: Se toman los siguientes datos de calificaciones:
9 6 4 8 7 7 6 3 4 3 5 4 8 10
a) Determinar el intervalo de confianza para la media con un 95% de nivel de confianza
Ejemplo: De 814 encuestados 562 contestaron en forma afirmativa
a) ¿Cuál es el intervalo de confianza para un 90% de nivel de confianza?
Ejemplo: Los pesos de 25 paquetes enviados a través de UPS tuvieron una media de 3.7 libras
y una desviación estándar de 1.2 libras. Hallar el intervalo de confianza del 95% para
estimar el peso promedio de todos los paquetes. Los pesos de los paquetes se
distribuyen normalmente.
Ejemplo: En una encuesta a 673 tiendas, 521 reportaron problemas de robo por los empleados
¿Se puede concluir con un 99% de nivel de confianza que el 78% se encuentra en el
intervalo de confianza. ? CNN reportó este 78% en un informe reciente.
Capítulo 8. PRUEBAS DE HIPÓTESIS
Una hipótesis es una afirmación a comprobar, por ejemplo:
Un proveedor de bebidas afirma que sus botellas contienen 16 onzas; un productor de software dice que su rechazo
promedio es de 3%; etc.
La hipótesis planteada que contiene el signo de igualdad se denomina Hipótesis nula Ho (=, >=, =, ,
Signo diferente dos colas Signo 30 X - m Si n>30 X - mH
Z = H ZC =
Sigma es C
s Sigma es s
conocida n Desconocida n
H = Hipótesis
Si n= a Zexcel se rechaza Ho y se acepta Ha
y concluir Para cola izquierda: Si Zc = Zexcel o p = 30
Texto: Estadística aplicada a los negocios y al economía, Allen L. Webster, MacGraw Hill, Capítulo 8
Prob. 10 ¿Parecería ser correcta la afirmación de que se mantiene el precio promedio de las computadoras en $2,100?
Pag. 205 Probarlo a un 5% de nivel de significancia
Se inicia con el planteamiento de la hipótesis nula
Datos
Minoristas n 64 media mu = 2100
Precio prom. X 2251
Desv. Estándar s 812 (Alfa = 0.05
(Alfa/2 = 0.025
Paso 1. Establecimiento de hipótesis
Ho: uC = 2100
Ha: uC 2100 Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc
X - m HIPOTESIS. NULA 151 = > Zc = 1.48768473
Zc =
s
101.5 Error estándar
n
Como el valor de Zc es positivo se comparará contra de Zexcel (1-alfa/2) positivo
Paso 3. Determinar la Ze de Excel o de tablas para el valor de probabilidad (Alfa / 2):
Ze ( 0.025 ) = 1.95996398 DIST.NORM.STAND.INV.(
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
P(Z= + Zexcel ) = alfa/2
Zexcel ( 0.025 ) Zexcel ( 0.025
-1.95996398 1.959963985
Zc = 1.487684729
Como Zc es menor que Zexcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para RECHAZAR Ho
Se concluye que el precio promedio no es diferente de $2,100
Paso 5. Como el valor P = 0.068 correspondiente a la Z calculada Zc es mayor
que el valor de Alfa / 2 = 0.025, también nos da el criterio
para NO RECHAZAR la Ho
Paso 6. El Intervalo de confianza para la media poblacional (1-Alfa =
al nivel de confianza 1-Alfa
s
IC. para.estimar.m = X ± Za Error estándar 101.5
2 n
s
IC. para.estimar.m = X ± Za
2 n Z alfa/2 1.95996398
Intervalo de confianza 2251
El intervalo de confianza incluye a la media de la hipótesis
por tanto no se rechaza la Ho. 2052.063656 50 Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc
X - m HIPOTESIS. NULA -2.8 = > Zc = -1.23949634
Zc =
s
2.258982072 Error estándar
n
Como el valor de Zc es negativo se comparará contra de Zexcel (alfa/2) negativo
Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa/2 = 0.995
Ze ( 0.005 -2.5758293 DIST.NORM.STAND.INV.(
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
P(Z= + Zexcel ) = alfa/2
Zexcel ( 0.005 ) Zexcel ( 0.005
-2.5758293 2.575829304
Zc = -1.239496336
Como Zc es menor que Zexcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que el tiempo promedio para llegar
no es diferente de 50 minutos
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa =
s
IC. para.estimar.m = X ± Za Error estándar
Z alfa/2
2.25898207
2.5758293
2 n
Intervalo de confianza 47.2
La media está cercana a la afirmación, o sea (: 41.38125 7880 Se trata de una prueba de cola derecha
Paso 2. Cálculo del estadístico de prueba Zc
X - m HIPOTESIS. NULA 143 = > Zc = 0.49509521
Zc =
s
288.8333333 Error estándar
n
Como el valor de Zc es positivo se comparará contra de Zexcel (1- alfa) positivo
Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa = 0.99
Ze ( 0.99 2.32634787 DIST.NORM.STAND.INV.(
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
P(Z>= + Zexcel ) = alfa
) Zexcel ( 0.99
2.326347874
Zc = 0.495095211
Como Zc es menor que Zexcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que la publicidad no ha tenido efecto en las ventas
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa =
s
IC. para.estimar.m = X ± Za Error estándar
Z alfa/2
288.833333
2.32634787
2 n
Intervalo de confianza 8023
La media está cercana a la afirmación, o sea (: 7351.073 = 34.4
Ha: uV Zc = -4.0369502
Zc =
s
0.2972541 Error estándar
n
Como el valor de Zc es negativo se comparará contra de Zexcel (alfa) negativo
Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa = 0.99
Ze ( 0.04 -1.75068607 DIST.NORM.STAND.INV.(
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
Zc = -4.0369502
P(Z = 30
9/7/2003
edio de las computadoras en $2,100?
planteamiento de la hipótesis nula
ba de dos colas
xcel (1-alfa/2) positivo
bilidad (Alfa / 2):
0.025 )
Zexcel ) = alfa/2
)
Valor p para Zc es igual a
P(-Zc) = 0.06841765
p > Alfa / 2
0.95 Porciento)
± 198.936344
2449.936344 )
os para llegar al trabajo.
planteamiento de la hipótesis nula
(1-Alfa = 0.99
(1-Alfa/2 = 0.995
na prueba de dos colas
excel (alfa/2) negativo
0.005 )
Zexcel ) = alfa/2
)
Valor p para Zc es igual a
P(-Zc) = 0.1075987
ea de rechazo, p > Alfa / 2
chazar Ho
99 Porciento)
± 5.81875222
53.01875222 )
s tradicionales de $7880
planteamiento de la hipótesis Alterna
(1-Alfa = 0.99
(1-Alfa/2 = 0.995
eba de cola derecha
xcel (1- alfa) positivo
0.99 )
Zexcel ) = alfa
)
Valor p para Zc es igual a
P(-Zc) = 0.31206695
ea de rechazo, p > Alfa
chazar Ho
o efecto en las ventas
99 Porciento)
± 671.926811
8694.926811 )
debajo de los 34.4 años
planteamiento de la hipótesis Alterna
(1-Alfa = 0.96
(1-Alfa/2 = 0.98
rueba de cola izquierda
excel (alfa) negativo
0.04 )
)
Valor p para Zc es igual a
P(-Zc) = 0
área de rechazo, p 500 Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba tc
X - m HIPOTESIS 45.3 = > tc = 1.05436386
tc = . NULA
s 42.9642953 Error estándar
n
Como el valor de tc es positivo se comparará contra de Zexcel (alfa/2) positivo
Paso 3. Determinar la te de Excel o de tablas para (1-Alfa/2 = 0.025
te ( 0.025 2.14478668 DIST.T.INV(
gl = 14
Paso 4. Comparando los valores tc calculado contra t excel se tiene
P(t = + t excel ) = alfa/2
t excel ( 0.025 ) t excel ( 0.05
-2.14478668 2.14478668
tc= 1.05436386
Como tc es menor que t excel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que el cableado promedio
no es diferente de 500 yardas
Paso 6. El Intervalo de confianza para la media poblacional al nivel (1-Alfa =
s
IC. para.estimar.m = X ± ta
2 n
s
IC. para.estimar.m = X ± ta Error estándar 42.9642953
2 n Z alfa/2 2.14478668
Como el intervalo de confianza
contiene a la media de la Hipótesis no se rechaza Ho 453.150752 5775 Se trata de una prueba de cola derecha
Paso 2. Cálculo del estadístico de prueba tc
X - m HIPOTESIS 237 = > tc = 0.93950568
tc = . NULA
s 252.260315 Error estándar
n
Como el valor de tc es positivo se comparará contra de t excel (1- alfa) positivo
Paso 3. Determinar la te de Excel o de tablas para Alfa 0.01
te ( 0.99 2.62449406 DIST.T.INV( 0.02
gl = 14
Paso 4. Comparando los valores tc calculado contra t excel se tiene
P(t >= + t excel ) = alfa
texcel ( 0.02
2.62449406
tc = 0.93950568
Como tc es menor que texcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que la publicidad no ha tenido efecto en las ventas
Paso 5. Como el valor de P para Zc es 0.368 mayor a Alfa = 0.05 no se rechaza Ho
Paso 6. El Intervalo de confianza para la media poblacional al nivel
(1-Alfa =
s
IC. para.estimar.m = X ± ta Error estándar 252.260315
t alfa 2.62449406
n
Como el intervalo de confianza Intervalo de confianza 6012
contiene a la media de la Hipótesis no se rechaza Ho 5349.9443 Alfa / 2
95 Porciento)
637.449248 )
ias a la campaña publicitaria
planteamiento de la hipótesis Alterna
(1-Alfa = 0.99
(1-Alfa/2 = 0.995
eba de cola derecha
xcel (1- alfa) positivo
NOTA:En excel poner 2alfa
para obtener t de alfa
, gl. 14 )
excel ) = alfa
gl. 14)
Valor p para tc es igual a
P(tc) = 0.368130427
p > Alfa
se rechaza Ho
99 Porciento)
± 662.0557002
6674.0557 )
EJERCICIOS DE PRUEBAS DE HIPOTESIS E INTERVALOS EN LA PROPORCIÓN DE UNA POBLACION
Prob. El gerente de mercado considera que el 50% de sus clientes gasta menos de $10 en cada visita a la tienda.
DATOS: ¿Estás de acuerdo con esta afirmación a un nivel de significancia del 5%?
Se inicia con el planteamiento de la hipótesis nula
18.17 Datos
7.17 Clientes n 50 Proporción media = 0.5
2.08 30 gastaron p 0.6
4.17 menos de$10 (Alfa = 0.05
18.02 (Alfa/2 = 0.025
8.73 Paso 1. Establecimiento de hipótesis
4.12
8.15 Ho : p c = 0.5
5.15 Ha : p c ¹ 0.5 Se trata de una prueba de dos colas
17.15
21.12 Paso 2. Cálculo del estadístico de prueba Zc
17.18
6.12 p - p HIPOTESIS. NULA 0.1 = > Zc = 1.41421356
Zc =
2.12 p HIP. NULA (1 - p HIP. NULA )
9.99 0.07071068 Error estándar
10 n
5.12
5.12 Como el valor de Zc es positivo se comparará contra de Zexcel (alfa/2) positivo
12.12
18.17 Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa/2 = 0.975
4.12
27.18 Ze ( (1-Alfa/2 = 1.95996398 DIST.NORM.STAND.INV.(
2.17
8.15 Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
3.02
0.65
11.12
3.32
4.83
10.12
8.73 P(Z = Zexcel ) = alfa/2
2.17
6.42
12.18
8.84 Zexcel ( 0.025 ) Zexcel ( 0.975
17.17 -1.95996398 1.95996398
11.17
17.89 Zc = 1.41421356
11.12
8.92 Como Zc es menor que Zexcel, no cae en el área de rechazo,
8.42 y por tanto no hay suficiente evidencia para rechazar Ho y se concluye
7.12 que el porcentaje que compra menos de $10 no difiere del 50% de clientes
9.17
2.63 Paso 5. Como el valor P de Zc es 0.079 mayor a Alfa/2 no se rechaza Ho
21.22
18.42 Paso 6. El Intervalo de confianza para la media poblacional al nivel
4.82 (1-Alfa =
5.55
p(1 - p)
IC. para.estimar.p = p ± Z a
2 n
11.11 p(1 - p) Error estándar 0.07071068
17.83 IC. para.estimar.p = p ± Z a Z alfa/2 1.41421356
2 n
Intervalo de confianza 0.6
Como la media de p = 0.6 se encuentra
dentro del intervalo, no se rechaza Ho ( 0.5 0.53 Se trata de una prueba de cola derecha
Paso 2. Cálculo del estadístico de prueba Zc
p - p HIPOTESIS. NULA 0.03 = > Zc = 1.49909648
Zc =
p HIP. NULA (1 - p HIP. NULA )
0.02001205 Error estándar
n
Como el valor de Zc es positivo se comparará contra de Zexcel (alfa) positivo
Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa = 0.96
Ze ( (1-Alfa = 1.75068607 DIST.NORM.STAND.INV.(
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene
P(Z>= Zexcel ) = alfa
Zexcel ( 0.96
1.75068607
Zc = 1.49909648
Como Zc es menor que Zexcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que el incremento en publicidad
no ha resultado en incrementos de ventas
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa =
p(1 - p) Error estándar 0.02001205
IC. para.estimar.p = p ± Z a Z alfa/2 2.05374891
2 n
Intervalo de confianza 0.56
La media está cercana a la afirmación, o sea (: 0.5189 Alfa /2
95 Porciento)
± 0.1
p Alfa /2
echazar Ho
0.96 Porciento)
alfa/2 = 0.02
± 0.04109973
0.6011 )