What is Statistics

Reviews
Universidade Tiradentes Curso de Pós-graduação (lato sensu) Avaliação Imobiliária Coordenador: Prof. M.Sc. João Lago Disciplina: Métodos quantitativos aplicados Professores: Dr. Antônio Martins de Oliveira Junior Ch1 Larson/Farber 1 AVALIAÇÃO IMOBILIÁRIA Métodos Quantitativos Aplicados Prof. Dr. Antonio Martins Fevereiro/2007 Ch1 Larson/Farber 2 BIBLIOGRAFIA BÁSICA Estatística Básica (Larson e Farber) A Prática da Estatística Empresarial (Moore et al.) Ch1 Larson/Farber 3 O que é estatística? Estatística é a ciência que se ocupa de coletar, organizar, analisar e interpretar dados para que se tomem decisões. 4 Ch1 Larson/Farber Termos importantes População O conjunto de todas as respostas, medidas ou contagens que sejam de interesse. Amostra Uma parte ou subconjunto da população. Ch1 Larson/Farber 5 Termos importantes Parâmetro Descrição numérica de uma característica da população. A renda média bruta de todos os norte-americanos em 2002. Estatística Descrição numérica de uma característica da amostra. Renda bruta, em 2002, de uma amostra formada pelos habitantes de três estados norte-americanos. Ch1 Larson/Farber 6 Os dois ramos da estatística Estatística descritiva Trata da organização, resumo e organização dos dados. Estatística inferencial A partir de uma amostra, tira conclusões sobre a população. Ch1 Larson/Farber 7 Níveis de medida Um conjunto de dados pode ser classificado de acordo com o nível de medida mais alto que ele aplica. Os quatro níveis de medida, do mais baixo para o mais alto, são: 1. Nominal 2. Ordinal 3. Intervalar 4. Racional Ch1 Larson/Farber 8 Níveis de medida 1. Nominal: Categorias, nomes, marcas ou qualidades. Nenhuma operação matemática pode ser feita com esses dados. Ex.: o modelo do seu carro, seu curso na faculdade. 2. Ordinal: Os dados podem ser arranjados em ordem. Você pode dizer que uma entrada de dados é superior a outra. Ex.: os programas de TV mais assistidos, a condição de pacientes hospitalizados. Ch1 Larson/Farber 9 Níveis de medida 3. Intervalar: Os dados podem ser ordenados e a diferença entre duas entradas pode ser calculada. Não existe o zero inerente (um zero que significa „nenhum‟). Ex.: temperatura, ano de nascimento. 4. Racional:Existe o zero inerente.Os dados podem ser ordenados, as diferenças podem ser calculadas, e uma razão pode ser formada, de modo que se possa expressar determinado valor como múltiplo de outro. Ex.: altura, peso, idade. Ch1 Larson/Farber 10 Amostra aleatória: Cada membro da população tem a mesma chance de ser selecionado. Amostra aleatória simples: Todas as amostras de mesmo tamanho são igualmente prováveis. Atribua um número a cada membro da população. Números aleatórios podem ser gerados por uma tabela apropriada, por um software ou ainda por uma calculadora. Os dados dos membros da população que correspondam a tais números passarão a ser os membros da amostra. Ch1 Larson/Farber 11 Amostra aleatória estratificada Divida a população em grupos (estratos) e selecione uma amostra aleatória de cada grupo. Os estratos podem ser faixas etárias, gêneros ou graus de escolaridade, por exemplo. Ch1 Larson/Farber 12 Amostra por agrupamento Divida a população em unidades individuais ou grupos. Em seguida, selecione aleatoriamente uma ou mais unidades. A amostra consistirá em todos os membros da(s) unidade(s) selecionada(s). Ch1 Larson/Farber 13 Amostra sistemática Selecione aleatoriamente um valor inicial. Depois, escolha os membros da amostra a intervalos regulares. Digamos que vamos selecionar cada kº membro. Nesse caso, k = 5. Logo, cada 5o membro da população será selecionado. Ch1 Larson/Farber 14 Outras amostras Amostra de conveniência: Para formar sua amostra, escolha os membros disponíveis da população. Ch1 Larson/Farber 15 Coleta de dados Experimento: Aplica-se determinado tratamento a uma parte do grupo. Simulação: Usa-se um modelo matemático (em geral no computador) para reproduzir certa condição. Censo: Contagem ou medição de toda uma população. Amostragem: Contagem ou medição de parte da população. Ch1 Larson/Farber 16 Distribuições de freqüência Minutos gastos ao telefone 102 71 103 105 109 124 104 116 97 99 108 112 85 107 105 86 118 122 67 99 103 87 87 78 101 82 95 100 125 92 Faça uma tabela de distribuição de freqüência com cinco classes. Valores-chave: Ch1 Larson/Farber Valor mínimo = Valor máximo = 67 125 17 Passos para construir uma distribuição de freqüência 1. Decida o número de classes, que deve ficar entre 5 e 15. (Para este problema use 5.) 2. Calcule a amplitude das classes. Primeiro calcule: amplitude total = valor máximo – mínimo. Em seguida, divida o resultado pelo número de classes. Por fim, arredonde até o próximo número conveniente. (125 – 67)/5 = 11,6 (arredondado para 12) 3. Calcule os limites das classes. O limite inferior da classe é o valor mais baixo que pertence a ela e o limite superior é o mais alto. Use o valor mínimo (67) como limite inferior da primeira classe. 4. Marque um risco | em cada entrada de dado na classe apropriada. Quando todos os valores estiverem marcados, conte os riscos em cada classe para determinar a freqüência dessa classe. Ch1 Larson/Farber 18 Construa uma distribuição de freqüência Mínimo = 67, Máximo = 125 Número de classes = 5 Amplitude de classe = 12 Classe 67 Limites 78 90 102 Riscos 3 5 8 9 5 19 79 91 103 114 126 115 Faça primeiro todos os limites inferiores. Ch1 Larson/Farber Histograma de freqüência Classe 67–78 79–90 91–102 3 Fronteiras 66,5–78,5 78,5–90,5 5 8 9 5 90,5–102,5 9 Tempo ao telefone 9 8 8 7 103–114 115–126 102,5–114,5 114,5–126,5 6 5 4 3 2 5 5 3 1 0 66,5 78,5 90,5 102,5 114,5 126,5 minutos Ch1 Larson/Farber 20 Polígono de freqüência Classe 67–78 79–90 91–102 103–114 3 9 Tempo ao telefone 9 8 8 7 6 5 4 5 8 9 5 5 3 5 115–126 3 2 1 0 72,5 84,5 96,5 108,5 120,5 minutos Marque o ponto médio no topo de cada barra. Conecte os pontos médios consecutivos. Estenda o polígono até os eixos. Ch1 Larson/Farber 21 Outras informações Ponto médio: (limite inferior + limite superior)/2 Freqüência relativa: freqüência da classe/freqüência total Freqüência cumulativa: número de valores em determinada classe ou abaixo dela Classe Ponto médio Freqüência relativa 3/30 0,10 0,17 0,27 0,30 0,17 Freqüência cumulativa (67 + 78)/2 67–78 79–90 91–102 103–114 115–126 3 5 8 9 5 72,5 84,5 96,5 108,5 120,5 3 8 16 25 30 22 Ch1 Larson/Farber Histograma de freqüência relativa Tempo ao telefone Freqüência relativa 0,30 0,20 0,1 0 0 0,1 0 0,30 0,2 7 0,17 0,17 66,5 78,5 90,5 102,5 114,5 126,5 minutos A escala vertical mede as freqüências relativas. Ch1 Larson/Farber 23 Gráfico de freqüência cumulativa (ogiva) Um gráfico de freqüência cumulativa (ou ogiva) mostra o número de valores, em um conjunto de dados, que são iguais ou inferiores a um dado valor x. Freqüência cumulativa Tempo ao telefone 30 25 30 20 16 10 3 0 8 0 66,5 78,5 90,5 102,5 114,5 126,5 minutos 24 Ch1 Larson/Farber Diagrama de pizza • • É usado para descrever as partes de um todo. O ângulo central para cada segmento é: Número na categoria Número total O orçamento da Nasa (em bilhões de dólares) dividido em três categorias Bilhões de US$ Vôo espacial humano Tecnologia Apoio às missões Ch1 Larson/Farber 5,7 5,9 2,7 Construa um diagrama de pizza para esses dados. 25 Diagrama de pizza Vôo espacial humano Tecnologia Apoio às missões Total Apoio às missões 19% Bilhões de US$ Graus 5,7 5,9 2,7 14,3 5,7 14,3 143 149 68 360 5,9 14,3 Vôo espacial humano 40% Tecnologia 41% Ch1 Larson/Farber Orçamento da Nasa (em bilhões de dólares) 26 Mapa de dispersão Faltas x 8 2 5 12 15 9 6 Nota final y 78 92 90 58 43 74 81 Nota final 95 (y) 90 85 80 75 70 65 60 55 50 45 40 0 2 4 6 8 10 12 14 16 27 Faltas (x) Ch1 Larson/Farber Medidas de tendência central Média: A soma de todos os valores dividida pelo número de valores. Em uma população: Em uma amostra: Mediana: Ponto que tem um número igual de valores acima e abaixo de si. Moda: O valor com a maior freqüência. Ch1 Larson/Farber 28 Um instrutor registra a média de faltas de seus alunos em determinado semestre. Em uma amostra aleatória, os dados são: 2 4 2 0 40 2 4 3 6 Calcule a média, a mediana e a moda. Média: Mediana: 0 Ordene os dados. 2 2 2 3 4 4 6 40 O valor que fica no meio é 3, logo a mediana é 3. Moda: A moda é 2, pois esse é o valor que ocorre mais vezes. Ch1 Larson/Farber 29 Suponha que o aluno com 40 faltas abandone o curso. Calcule a média, a mediana e a moda dos valores restantes. Compare o efeito da mudança para cada tipo de média. 2 4 2 0 2 4 3 6 Calcule a média, a mediana e a moda. Média: Mediana: 0 Coloque os dados em ordem. 2 2 2 3 4 4 6 2,875 Os valores que ficaram no meio são 2 e 3, logo a mediana é 2,5. Moda: vezes. A moda é 2, pois esse é o valor que ocorre mais 30 Ch1 Larson/Farber Aspecto das distribuições Simétrica Uniforme Média = Mediana Anti-simétrica à direita Anti-simétrica à esquerda Média > Mediana Ch1 Larson/Farber Média < Mediana 31 Dois conjuntos de dados O preço de fechamento atingido por dois pacotes de ações foi registrado em dez sextas-feiras consecutivas. Calcule a média, a mediana e a moda de cada pacote. Ações A Média = 61,5 Mediana = 62 Moda = 67 Ch1 Larson/Farber 56 56 57 58 61 63 63 67 67 67 33 42 48 52 57 67 67 77 82 90 Ações B Média = 61,5 Mediana = 62 Moda = 67 32 Medidas de variação Para aprender a calcular medidas de variação que usem todo e qualquer valor do conjunto de dados, primeiro você precisa saber o que é um desvio. O desvio de cada valor x é a diferença entre o valor de x e a média do conjunto de dados. Em uma população, o desvio de cada valor x é: Em uma amostra, o desvio de cada valor x é: Ch1 Larson/Farber 33 Desvios Ações A 56 Desvio – 5,5 56 – 61,5 56 – 61,5 56 57 58 61 63 – 5,5 – 4,5 – 3,5 – 0,5 1,5 61,5 57 – 61,5 58 – 61,5 63 67 67 67 1,5 5,5 5,5 5,5 A soma dos desvios é sempre zero. 34 Ch1 Larson/Farber Variância populacional Variância populacional: a soma dos quadrados dos desvios, dividida por N. x 56 56 57 58 61 63 63 67 67 67 – 5,5 – 5,5 – 4,5 – 3,5 – 0,5 1,5 1,5 5,5 5,5 5,5 30,25 30,25 20,25 12,25 0,25 2,25 2,25 30,25 30,25 30,25 188,50 18,85 188,50 Ch1 Larson/Farber Soma dos quadrados 35 Desvio padrão populacional Desvio padrão populacional: a raiz quadrada da variância populacional. 18,85 4,34 O desvio padrão populacional é US$ 4,34. Ch1 Larson/Farber 36 Variância e desvio padrão amostrais Para calcular uma variância amostral, divida a soma do quadrados por n – 1. 188,50 20,94 Para calcular o desvio padrão amostral, s, tire a raiz quadrada da variância amostral. 20,94 Ch1 Larson/Farber 4,58 37 Resumo Amplitude total = valor máximo – valor mínimo Variância populacional Desvio padrão populacional Variância amostral Desvio padrão amostral Ch1 Larson/Farber 38 Regra Empírica (68-95-99,7%) Dados com distribuição simétrica na forma de sino têm as seguintes características. 13,5% 2,35% –4 –3 –2 –1 0 1 2 13,5% 2,35% 3 4 Cerca de 68% dos dados estão a até 1 desvio padrão da média. Cerca de 95% dos dados estão a até 2 desvios padrão da média. Cerca de 99,7% dos dados estão a até 3 desvios padrão da média. Ch1 Larson/Farber 39 Como usar a Regra Empírica O valor médio das casas de determinada rua é de US$ 125 mil,com um desvio padrão de US$5 mil. O conjunto de dados tem uma distribuição na forma de sino. Estime o porcentual de casas que custam entre US$ 120 e US$ 135 mil. 105 110 115 120 125 130 135 140 145 US$ 120 mil fica 1 desvio padrão abaixo da média e US$ 135 mil fica 2 desvios padrão acima da média. 68% + 13,5% = 81,5% Logo, 81,5% das casas custam entre US$ 120 e US$ 135 mil. Ch1 Larson/Farber 40 Teorema de Chebychev Em qualquer distribuição, independentemente de sua forma, a porção de dados que está dentro de k desvios padrão (k > 1) da média é pelo menos 1 – 1/k2. 3,84 Se k = 2, pelo menos 1 – 1/4 = ¾ = 75% dos dados estão dentro de dois desvios padrão da média. Se k = 3, pelo menos 1 – 1/9 = 8/9 = 88,9% dos dados estão dentro de três desvios padrão da média. Ch1 Larson/Farber 41 Teorema de Chebychev A média feminina nos 400 metros rasos é de 52,4 segundos,com um desvio padrão de 2,2 segundos. Aplique o Teorema de Chebychev com k = 2. Trace uma linha de números nas unidades de desvio padrão. 2 desvios padrão A 45,8 48 50,2 52,4 54,6 56,8 59 Pelo menos 75% dos tempos femininos nos 400 metros rasos estarão entre 48 e 56,8 segundos. Ch1 Larson/Farber 42 Quartis Os três quartis Q1, Q2 e Q3 dividem os dados em quatro partes iguais. Q2 é igual à mediana. Q1 é a mediana dos dados que ficaram abaixo de Q2. Q3 é a mediana dos dados que ficaram acima de Q2. Você é gerente de uma loja. A média de vendas em 27 dias do ano passado, selecionados aleatoriamente, é dada abaixo. Determine Q1, Q2 e Q3. 28 43 48 51 43 30 55 44 48 33 45 37 37 42 27 47 42 23 46 39 20 45 38 19 17 35 45 Ch1 Larson/Farber 43 Como determinar quartis Coloque os dados (n = 27) em ordem: 17 19 20 23 27 28 30 33 35 37 37 38 39 42 42 43 43 44 45 45 45 46 47 48 48 51 55. A posição da mediana é: (27 + 1)/2 = 14. A mediana = Q2 = 42. Há 13 valores abaixo da mediana. A posição de Q1 = 7. Q1 é 30. Q3 é a posição 7 a partir do último valor. Q3 é 45. A amplitude interquartil é Q3 – Q1 = 45 – 30 = 15. Ch1 Larson/Farber 44 Plote maria-chiquinha Um plote maria-chiquinha usa cinco valores-chave para descrever um conjunto de dados: Q1, Q2 e Q3, o valor mínimo e o valor máximo. Q1 30 Q2 = a mediana 42 Q3 45 Valor mínimo 17 Valor máximo 55 30 17 42 45 55 15 25 35 45 55 Amplitude interquartil = 45 – 30 = 15 Ch1 Larson/Farber 45 Percentis Os percentis dividem os dados em cem partes. Existem, portanto, 99 percentis: P1, P2, P3…P99. P50 = Q2 = a mediana P25 = Q1 P75 = Q3 Uma pontuação no 63º percentil indica que ela é igual ou superior a 63% das pontuações e igual ou inferior a 37% delas. Ch1 Larson/Farber 46 Percentis 66,5 78,5 90,5 102,5 114,5 126,5 Distribuições cumulativas podem ser usadas para calcular percentis. 114,5 é igual ou inferior a 25 dos 30 valores. 25/30 = 83,33. Logo, você pode aproximar que 114 = P83. Ch1 Larson/Farber 47 Escore padrão O escore padrão, ou escore z, representa o número de desvios padrão que separa um valor x da média. valor – média desvio padrão Em um concurso público, as pontuações tiveram uma média de 152 e desvião padrão de 7. Calcule o escore z para um candidato com uma pontuação de: (a) 161 (b) 148 (c) 152 Ch1 Larson/Farber 48 Cálculos de escore z (a) Um valor de x = 161 está 1,29 desvio padrão acima da média. 1,29 (b) 0,57 (c) Um valor de x = 148 está 0,57 desvio padrão abaixo da média. Um valor de x = 152 é igual à média. Ch1 Larson/Farber 49 Distribuições discretas de probabilidade x = número de respostas corretas x = número de chegadas pontuais x = número de funcionários que alcançou a cota de vendas Ch1 Larson/Farber x = número de pontos feitos num jogo 50 Variáveis aleatórias Uma variável aleatória, x, é o resultado numérico de um experimento probabilístico. x = o número de pessoas num carro. x = quantos metros cúbicos de gás são comprados numa semana. x = o tempo que leva para ir de carro de casa até a escola. x = o número de vezes que você vai à escola por semana. Ch1 Larson/Farber 51 Tipos de variáveis aleatórias Uma variável aleatória é discreta se o número de resultados possíveis é finito ou pode ser contado. Variáveis aleatórias discretas são determinadas por uma contagem. Uma variável aleatória é contínua se pode assumir qualquer valor dentro de determinado intervalo. O número de resultados possíveis não pode ser listado. Variáveis aleatórias contínuas são determinadas por uma medição. Ch1 Larson/Farber 52 Tipos de variável aleatória Identifique cada variável aleatória como discreta ou contínua. x = o número de pessoas em um carro. Discreta – você conta o número de pessoas: 0, 1, 2, 3… Os valores possíveis podem ser enumerados. x = quantos metros cúbicos de gás são comprados numa semana. Contínua – você mede os metros cúbicos de gás. Você não pode enumerar todos os valores possíveis. x = o tempo que leva para ir de carro de casa até a escola. Contínua – você mede a quantidade de tempo. Os valores possíveis não podem ser enumerados. x = o número de vezes que você vai à escola por semana. Discreta – você conta o número de vezes que vai. Os valores possíveis podem ser enumerados. Ch1 Larson/Farber 53 Distribuições discretas de probabilidade Uma distribuição discreta de probabilidade enumera cada valor possível da variável aleatória, bem como sua probabilidade. x P (x ) 0 0,004 1 0,435 2 0,355 3 0,206 Propriedades de uma distribuição de probabilidade Em um levantamento, perguntou-se a uma número de veículos amostra de famílias quantos veículos elas possuíam. • Cada probabilidade precisa estar entre 0 e 1, inclusive. • A soma de todas as probabilidades é 1. Ch1 Larson/Farber 54 Histograma de probabilidade Número de veículos 0,435 0,40 0,30 0,355 P(x) 0,206 0,20 0,10 0,004 0 x • A altura de cada barra corresponde à probabilidade de x. • Se a largura da barra é 1, sua área corresponde à probabilidade de que o valor de x ocorra. Ch1 Larson/Farber 55 0 0 11 22 3 3 Média,variância e desvio padrão A média de uma distribuição discreta de probabilidade é: A variância de uma distribuição discreta de probabilidade é: O desvio padrão de uma distribuição discreta de probabilidade é: Ch1 Larson/Farber 56 Média (valor esperado) Calcule a média: Multiplique cada valor por sua probabilidade. Some os produtos. x 0 1 2 3 P (x ) 0,004 0,435 0,355 0,206 xP (x ) 0 0,435 0,71 0,618 1,763 O valor esperado (a média) é de 1,763 veículo. Ch1 Larson/Farber 57 Calcule a variância e o desvio padrão A média é de 1,763 veículo. x 0 1 2 3 P (x ) 0,004 0,435 0,355 0,206 0,661 x- μ -1,763 -0,763 0,237 1,237 (x - μ ) 3,108 0,582 0,056 1,530 P(x)(xP(x) - ) 0,012 0,253 0,020 0,315 0,601 variância 0,775 O desvio padrão é de 0,775 veículo. 58 Ch1 Larson/Farber Experimentos binomiais Características de um experimento binomial n n O número de tentativas é fixo (n). As n tentativas são independentes e repetidas em condições idênticas. Para cada tentativa há dois resultados possíveis, S = sucesso ou F = fracasso. A probabilidade de sucesso numa tentativa única é p. P(S) = p A probabilidade de fracasso é q. P(F) =q, onde p + q = 1 O problema central está em determinar a probabilidade de x sucessos em n tentativas, sendo x = 0 ou 1 ou 2 … n. n n n A variável aleatória x é uma contagem do número de sucessos em n tentativas. Ch1 Larson/Farber 59 Tente adivinhar as respostas 1. Qual é o 11o dígito depois do ponto decimal de um número irracional e? (a) 2 (b) 7 (c) 4 (d) 5 2. Qual foi o Índice Dow Jones em 27 de fevereiro de 1993? (a) 3.265 (b) 3.174 (c) 3.285 (d) 3.327 3. Quantos jovens do Sri Lanka estudaram em universidades norteamericanas entre 1990 e 1991? (a) 2.320 (b) 2.350 (c) 2.360 (d) 2.240 4. Quantos transplantes de rins foram feitos em 1991? (a) 2.946 (b) 8.972 (c) 9.943 (d) 7.341 5. Quantos verbetes há no American Heritage Dictionary? (a) 60.000 (b) 80.000 (c) 75.000 (d) 83.000 Ch1 Larson/Farber 60 Resultados do teste As respostas corretas são: 1. d 2. a 3. b 4. c 5. b Conte o número de questões a que você respondeu corretamente. Chamemos esse número de x. Por que esse foi um experimento binomial? Quais são os valores de n, p e q? Quais são os valores possíveis de x? Ch1 Larson/Farber 61 Experimentos binomiais Um teste de múltipla escolha tem oito questões, cada qual com três alternativas, uma delas correta. Você quer saber qual a probabilidade de „chutar‟ certo em exatamente cinco questões. Determine n, p, q e x. n=8 p = 1/3 q = 2/3 x=5 Um médico lhe diz que certa cirurgia é bem-sucedida em 80% das vezes. Se a cirurgia for realizada sete vezes, determine a probabilidade de ser bem-sucedida em exatamente seis. Determine n, p, q e x. n=7 p = 0,80 q = 0,20 x=6 62 Ch1 Larson/Farber Probabilidades binomiais Determine a probabilidade de acertar exatamente três questões naquele teste que você fez. Escreva as primeiras três corretas e as últimas duas erradas como SSSFF P(SSSFF) = (0,25)(0,25)(0,25)(0,75)(0,75) = (0,25)3(0,75)2 = 0,00879 Uma vez que a ordem não importa, qualquer combinação de três questões corretas entre cinco servirá. Enumere essas combinações . SSSFF SSFSF SSFFS SFFSS SFSFS FFSSS FSFSS FSSFS SFSSF FFSSF Cada uma dessas dez maneiras tem uma probabilidade de 0,00879. P(x = 3) = 10(0,25)3(0,75)2 = 10(0,00879) = 0,0879 Ch1 Larson/Farber 63 Combinação de n valores, escolhendo-se x Há maneiras. Determine a probabilidade de alguém acertar exatamente três questões naquele teste. Cada uma dessas dez maneiras tem uma probabilidade de 0,00879. P(x = 3) = 10(0,25)3(0,75)2= 10(0,00879)= 0,0879 Ch1 Larson/Farber 64 Probabilidades binomiais Em um experimento binomial, a probabilidade de ocorrerem exatamente x sucessos em n tentativas é de Use a fórmula para calcular a probabilidade de alguém não acertar nenhuma questão, exatamente uma, duas, três, quatro ou todas as cinco questões do teste. (0,25)0 (0,75)5 = 0,237 (0,25)1 (0,75)4 = 0,396 (0,25)2 (0,75)3 = 0,264 P(3) = 0,088 Ch1 Larson/Farber P(4) = 0,015 P(5) = 0,001 65 Distribuição binomial x 0 1 2 3 4 5 P(x) 0,237 0,396 0,264 0,088 0,015 0,001 Histograma binomial 0,40 0,30 0,396 0,294 0,237 0,20 0,10 0 0 Ch1 Larson/Farber 0,088 0,015 1 2 3 4 0,001 5 x 66 Probabilidades x 0 1 2 3 4 5 P(x) 0,237 0,396 0,264 0,088 0,015 0,001 1. Qual é a probabilidade de se responder a duas ou quatro questões corretamente? P(x = 2 ou x = 4) = 0,264 + 0,015 = 0,279 2. Qual é a probabilidade de se responder corretamente a pelo menos três questões? P(x  3) = P(x = 3 ou x = 4 ou x = 5) = 0,088 + 0,015 + 0,001 = 0,104 3. Qual é a probabilidade de se responder corretamente a pelo menos uma questão? P(x  1) = 1 – P(x = 0) = 1 – 0,237 = 0,763 67 Ch1 Larson/Farber Parâmetros para um experimento binomial Média: Variância: Desvio padrão: Use as fórmulas binomiais para determinar a média, a variância e o desvio padrão da distribuição de respostas corretas no teste. 5(0,25) 1,25 5(0,25)(0,75) 0,9375 0,968 68 0,9375 Ch1 Larson/Farber A distribuição geométrica Segundo uma pesquisa de mercado, a probabilidade de que cada pessoa que entra em determinada loja faça uma compra é de 0,30. • A probabilidade de que a primeira compra seja feita pela primeira pessoa que entrar na loja é de 0,30. Ou seja: P(1) = 0,30. • A probabilidade de que a primeira compra seja feita pela segunda pessoa que entrar na loja é de (0,70) (0,30). Logo, P(2) = (0,70) (0,30) = 0,21. • A probabilidade de que a primeira compra seja feita pela terceira pessoa que entrar na loja é de (0,70)(0,70)(0,30). Logo, P(3) = (0,70) (0,70) (0,30) = 0,147. A probabilidade de que a primeira compra seja feita pela pessoa número x é de P(x) = (0,70)x – 4(0,30) Ch1 Larson/Farber 69 A distribuição geométrica Uma distribuição geométrica é uma distribuição discreta de probabilidade da variável aleatória x que satisfaz as seguintes condições. 1. A tentativa é repetida até que o sucesso ocorra. 2. As sucessivas tentativas são independentes entre si. 3. A probabilidade de sucesso, p, é a mesma a cada tentativa. A probabilidade de que o primeiro sucesso ocorra na tentativa número x é: P(x) = (q)x – 1p , onde q = 1 – p. Ch1 Larson/Farber 70 Aplicação Um fabricante de cereais colocou uma peça premiada nas embalagens de seu produto. A probabilidade de ganhar um prêmio é de um para quatro. Determine a probabilidade de que você: a) ganhe seu primeiro prêmio na quarta compra; P(4) = (0,75)3 . (0,25) = 0,1055 b) ganhe seu primeiro prêmio na segunda ou terceira compra; P(2) = (0,75)1(0,25) = 0,1875 e P(3) = (0,75)2(0,25) = 0,1406 Logo, P(2 ou 3) = 0,1875 + 0,1406 = 0,3281 c) não ganhe nenhum prêmio nas quatro primeiras compras. 1 – (P(1) + P(2) + P(3) + P(4)) 1 – ( 0,25 + 0,1875 + 0,1406 + 0,1055) = 1 – 0,6836 = 0,3164 Ch1 Larson/Farber 71 A distribuição de Poisson A distribuição de Poisson é uma distribuição discreta de probabilidade de uma variável aleatória x que satisfaz as seguintes condições: 1. O experimento consiste em contar o número de vezes, x, que um evento ocorre num intervalo de tempo, área ou espaço. 2. A probabilidade de que o evento ocorra é a mesma em cada intervalo. 3. O número de ocorrências em um intervalo independe do número de ocorrências em outro. A probabilidade de exatamente x ocorrências em um intervalo é e é um número irracional aproximadamente igual a 2,71828.  é o número médio de ocorrências por intervalo. Ch1 Larson/Farber 72 Aplicação Estima-se que, em todo o mundo, os tubarões matem dez pessoas por ano. Determine a probabilidade: a) de que três pessoas sejam mortas por tubarões este ano (2,71828)–10 0,0076 b) de que duas ou três pessoas sejam mortas por tubarões este ano (2,71828)–10 0,0023 P(3) = 0,0076 P(2 ou 3) = 0,0023 + 0,0076 = 0,0099 Ch1 Larson/Farber 73 Distribuição normal de probabilidade Ch1 Larson/Farber 74 Propriedades de uma distribuição normal x • Suas média, mediana e moda são iguais. • Tem forma de sino e é simétrica em torno da média. • A área total sob a curva é de 100%. Ch1 Larson/Farber 75 Propriedades de uma distribuição normal Ponto de inflexão Ponto de inflexão x • À medida que a curva se afasta da média, aproxima-se cada vez mais do eixo x, mas nunca o toca. • Os pontos em que a curvatura muda são chamados pontos de inflexão. O gráfico curva-se para baixo entre os pontos de inflexão e, para cima, à esquerda e à direita deles. 76 Ch1 Larson/Farber Médias e desvios padrão Curvas com médias diferentes e o mesmo desvio padrão 10 11 12 13 14 15 16 17 18 19 20 Curvas com médias diferentes e desvios padrão diferentes 9 Larson/Farber 12 13 14 15 16 17 18 19 20 21 22 Ch1 10 11 77 Regra Empírica Cerca de 68% da área está a um desvio padrão da média. 68% Cerca de 95% da área está a dois desvios padrão. Cerca de 99,7% da área está a três desvios padrão da média. Ch1 Larson/Farber 78 Como determinar intervalos 4,2 horas 0,3 hora x 3,3 3,6 3,9 4,2 4,5 4,8 5,1 Segundo o manual de instruções, o tempo de montagem de certo produto é normalmente distribuído, com uma média de 4,2 horas e um desvio padrão de 0,3 hora. Determine o intervalo no qual caem 95% dos tempos de montagem. 95% dos dados caem a até dois desvios padrão da média. 4,2 – 2 (0,3) = 3,6 e 4,2 + 2 (0,3) = 4,8. 95% dos tempos de montagem estarão entre 3,6 e 4,8 horas. Ch1 Larson/Farber 79 O escore padrão O escore padrão, ou escore z, representa o número de desvios padrão que separa uma variável aleatória x da média. valor – média desvio padrão As pontuações em um concurso público estão normalmente distribuídas, com média de 152 e desvio padrão de 7. Determine o escore z para um candidato com pontuação de: (a) 161 (b) 148 (c) 152 (a) (b) (c) Ch1 Larson/Farber 1,29 0,57 80 A distribuição normal padrão A distribuição normal padrão tem média 0 e desvio padrão de 1. Se usar escores z, você pode transformar qualquer distribuição normal numa distribuição normal padrão. –4 –3 –2 –1 Ch1 Larson/Farber 0 1 2 3 4 z 81 Áreas acumuladas A área total sob a curva é 1. –3 –2 –1 0 1 2 3 z • A área acumulada está próxima de 0 para escores z próximos de –3,49. • A área acumulada para z = 0 é 0,5000. • A área acumulada está próxima de 1 para escores z próximos de 3,49. Ch1 Larson/Farber 82 Áreas acumuladas Determine a área acumulada para um escore z de –1,25. 0,1056 –3 –2 –1 0 1 2 3 z Percorra a coluna z, à esquerda, até z = –1,25; depois siga na transversal até a coluna sob o número 0,05. O valor da célula, 0,1056, corresponde à área acumulada. A probabilidade de que z esteja no máximo até –1,25 é de 0,1056. P Ch1 Larson/Farber 1,25) 0,1056 83 Como determinar probabilidades Para determinar a probabilidade de z ser inferior a um valor dado, encontre a área acumulada na tabela de acordo com o correspondente escore z. Determine P(z < –1,45). P(z < –1,45) = 0,0735 –3 –2 –1 0 1 2 3 z Percorra a coluna z até –1,4; depois, vá na transversal até 0,05. A área acumulada é 0,0735. Ch1 Larson/Farber 84 Como determinar probabilidades Para determinar a probabilidade de z ser superior a um valor dado, subtraia de 1 a área acumulada que você encontrar na tabela. Determine P(z > –1,24). 0,1075 0,8925 z –3 –2 –1 0 1 2 3 A área acumulada (área à esquerda) é de 0,1075. Logo, a área à direita é: 1 – 0,1075 = 0,8925. P(z > –1,24) = 0,8925 Ch1 Larson/Farber 85 Como determinar probabilidades Para determinar a probabilidade de z estar entre dois valores dados, determine as áreas acumuladas para cada valor e, depois, subtraia a menor da maior. Determine P(–1,25 < z < 1,17). –3 –2 –1 0 1 2 1. P(z < 1,17) = 0,8790 3 z 2. P(z < –1,25) = 0,1056 3. P(–1,25 < z < 1,17) = 0,8790 – 0,1056 = 0,7734 Ch1 Larson/Farber 86 Resumo Para determinar a probabilidade de z ser inferior a dado valor, encontre a área acumulada correspondente. -3 -2 -1 0 1 2 3 Para determinar a probabilidade de z ser superior a dado valor, subtraia de 1 a área acumulada que você encontrou na tabela. z z - -2 -1 0 1 2 3 3 Para determinar a probabilidade de z estar entre dois valores dados, determine as áreas acumuladas para cada valor e, depois, subtraia a menor da maior. -3 - -1 0 1 2 3 Ch1 Larson/Farber 87 z Probabilidades e distribuições normais Se uma variável aleatória x é normalmente distribuída, a probabilidade de que ela esteja dentro de dado intervalo é igual à área sob a curva nesse intervalo. Pontuações de QI são normalmente distribuídas, com uma média de 100 e um desvio padrão de 15. Determine a probabilidade de que uma pessoa selecionada aleatoriamente tenha uma pontuação de QI inferior a 115. 100 115 Para determinar a área nesse intervalo, primeiro encontre o escore z correspondente a x = 115. Ch1 Larson/Farber 88 Probabilidades e distribuições normais Distribuição normal É O MESMO Distribuição normal padrão 100 115 Determine P(z < 1). 0 1 Ch1 Larson/Farber P(z < 1) = 0,8413, logo P(x < 115) = 0,8413 É O MESMO Determine P(x < 115). 89 Aplicação As contas mensais de serviços públicos em determinada cidade são normalmente distribuídas, com média de US$ 100 e desvio padrão de US$ 12. Uma conta é escolhida aleatoriamente. Determine a probabilidade de ela estar entre US$ 80 e US$ 115. Distribuição normal P(80 < x < 115) 1,67 P(–1,67 < z < 1,25) 1,25 0,8944 – 0,0475 = 0,8469 A probabilidade de uma conta estar entre US$ 80 e US$ 115 é 0,8469. Ch1 Larson/Farber 90 Da área ao escore z Determine o escore z correspondente a uma área acumulada de 0,9803. z = 2,06 corresponde mais ou menos ao 98º percentil. 0,9803 –4 –3 –2 –1 0 1 2 3 4 Localize 0,9803 na tabela. Leia os valores no início da linha e no alto da coluna correspondentes. O escore z será 2,06. Ch1 Larson/Farber 91 z Determinando escores z a partir de áreas Determine o escore z correspondente ao 90º percentil. 0,90 0 z Na tabela, o valor mais próximo é 0,8997. O início da linha é 1,2 e o topo da coluna é 0,08. Isso corresponde a z = 1,28. Um escore z de 1,28 corresponde ao 90º percentil. Ch1 Larson/Farber 92 Determinando escores z a partir de áreas Determine um escore z que tenha uma área de 0,60 à sua direita. 0,40 0,60 z 0 z Com 0,60 à direita, a área acumulada é de 0,40. O valor mais próximo é de 0,4013. O início da linha é 0,2 e o topo da coluna é 0,05. Logo, o escore z é 0,25. Um escore z de 0,25 tem uma área de 0,60 à sua direita. Isso corresponde ao 40º percentil. Ch1 Larson/Farber 93 Determinando escores z a partir de áreas Determine um escore z tal que 45% da área sob a curva fique entre –z e z. 0,275 0,275 0,45 –z 0 z A área restante nas pontas é de 0,55. Metade dessa área está em cada ponta; logo, 0,55/2 = 0,275 é a área acumulada para o valor negativo de z, e 0,275 + 0,45 = 0,725 é a área acumulada para o z positivo. O valor mais próximo na tabela é de 0,2743 e, assim, o escore z Ch10,60. O escore z positivo é 0,60. é Larson/Farber 94 De escores z a escores brutos Para determinar um valor x a partir de um escore z: As pontuações em um concurso público estão normalmente distribuídas, com média de 152 e desvio padrão de 7. Determine a pontuação de um candidato com escore z: (a) 2,33 (b) –1,75 (c) 0 (a) x = 152 + (2,33)(7) = 168,31 (b) x = 152 + (–1,75)(7) = 139,75 (c) x = 152 + (0)(7) = 152 Ch1 Larson/Farber 95 Determinando percentis ou valores de corte As contas mensais de serviços públicos em determinada cidade são normalmente distribuídas, com média de US$ 100 e desvio padrão de US$ 12. Qual é o valor mais baixo entre os 10% mais altos? 90% US$ 115,36 é o valor mais baixo entre os 10% mais altos. 10% z Determine, na tabela, a área acumulada mais próxima a 0,9000 (o 90º percentil). A área 0,8997 corresponde a um escore z de 1,28. Para determinar o valor x correspondente, use: Ch1 Larson/Farber x = 100 + 1,28(12) = 115,36. 96 Distribuições amostrais Uma distribuição amostral é a distribuição de probabilidade de uma estatística da amostra formada quando amostras de tamanho n são colhidas várias vezes de uma população. Se a estatística da amostra for a sua média simples, a distribuição será uma distribuição amostral de médias das amostras. Amostra Amostra Amostra Amostra Amostra Amostra A distribuição amostral consiste nos valores das médias da amostra, Ch1 Larson/Farber 97 O Teorema do Limite Central Se uma amostra n  30 for tirada de uma população com qualquer tipo de distribuição, média = e desvio padrão = x as médias da amostra terão distribuição normal. Média: Desvio padrão: Ch1 Larson/Farber 98 O Teorema do Limite Central Se uma amostra de qualquer tamanho for tirada de uma população com distribuição normal, média = e desvio padrão = x a distribuição das médias da amostra de tamanho n será normal, com média e desvio padrão Ch1 Larson/Farber 99 Aplicação A média de altura dos homens norte-americanos (de 20 a 29 anos) é de 69,2 e 2,9 polegadas. Amostras aleatórias de 60 homens são selecionadas. Determine a média e o desvio padrão (erro padrão) da distribuição amostral. 69,2 2,9 69,2 média , 69,2, A distribuição de médias da amostra de tamanho 60, será normal. Desvio padrão 2,9 0,3744 100 Ch1 Larson/Farber Interpretando o Teorema do Limite Central A média de altura dos homens norte-americanos (de 20 a 29 anos) é = 69,2 polegadas. Se uma amostra aleatória de 60 homens nessa faixa etária for selecionada, qual é a probabilidade de que a média de altura na amostra seja superior a 70 polegadas? Admita um desvio padrão de 2,9 polegadas. Uma vez que n > 30, a distribuição amostral de Média: será normal 69,2 2,9 Desvio padrão: 0,3744 Determine o escore z para uma média amostral de 70: 69,2 0,3744 Ch1 Larson/Farber 2,14 101 Interpretando o Teorema do Limite Central P P 2,14 0,9838 z 0,0162 2,14 Há uma probabilidade de 0,0162 de que uma amostra com 60 homens tenha uma média de altura superior a 70 polegadas. Ch1 Larson/Farber 102 Aplicando o Teorema do Limite Central Em certa semana o preço médio da gasolina na Califórnia foi de US$ 1,164 por galão. Qual é a probabilidade de que o preço médio em uma amostra de 38 postos esteja entre US$ 1,169 e US$ 1,179? Admita que o desvio padrão seja de US$ 0,049. Uma vez que n > 30, a distribuição amostral de Média: Desvio padrão: será normal. 1,164 0,049 0,0079 Calcule o escore z para valores amostrais de US$ 1,169 e US$ 1,179. 1,169 – 1,164 Ch1 Larson/Farber 0,0079 0,63 1,179 – 1,164 0,0079 1,90 103 Aplicando o Teorema do Limite Central P(0,63 < z < 1,90) = 0,9713 – 0,7357 = 0,2356 z 0,63 1,90 A probabilidade de que a média da amostra esteja entre US$ 1,169 e US$ 1,179 é de 0,2356. Ch1 Larson/Farber 104 Características da distribuição binomial • O número de tentativas independentes (n) é fixo. • Cada tentativa pode ter dois resultados, sucesso ou fracasso. • A probabilidade de sucesso numa única tentativa é p e de fracasso é q. p+q=1 • É possível determinar a probabilidade de exatamente x sucessos em n tentativas, sendo x = 0 ou 1 ou 2 … n. • x é uma variável aleatória discreta que representa uma contagem do número de sucessos em n tentativas. e Ch1 Larson/Farber 105 Aplicação 34% dos norte-americanos têm sangue tipo A+. Se 500 pessoas dessa nacionalidade forem selecionadas aleatoriamente, qual é a probabilidade de ao menos 300 terem sangue tipo A+? Com as técnicas do Capítulo 4, você poderia calcular a probabilidade de exatamente 300, exatamente 301… exatamente 500 norte-americanos terem sangue tipo A+ e depois somar as probabilidades. Ou… você pode usar as probabilidades de curva normal para aproximar as probabilidades binomiais. Se np  5 e nq  5, a variável aleatória binomial x tem distribuição aproximadamente normal com: e Ch1 Larson/Farber 106 Por que precisamos de np  5 e nq  5? n=5 p = 0,25, q = 0,75 np = 1,25 nq = 3,75 n = 20 p = 0,25 np = 5 nq = 15 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 1 2 3 4 5 n = 50 p = 0,25 np = 12,5 nq = 37,5 0 10 Ch1 Larson/Farber 20 30 40 50 107 Probabilidades binomiais A distribuição binomial é discreta e pode ser representada por um histograma de probabilidade. A probabilidade de que um específico valor de x ocorra é igual à área do retângulo com ponto médio x. Se n = 50 e p = 0,25, determine P . Some as áreas dos retângulos com pontos médios em x = 14, x = 15, x = 16. 0,111 + 0,089 + 0,065 = 0,265 0,111 0,089 0,065 14 Ch1 Larson/Farber 15 16 P 0,265108 Correção pela continuidade Use a aproximação normal para a binomial a fim de se n = determinar P 0,25 . e Verifique que 12,5 37,5 e 14 15 16 Os valores para a variável aleatória binomial x são 14, 15 e 16. Ch1 Larson/Farber 109 Correção pela continuidade Use a aproximação normal para a binomial a fim de determinar P . se n = 0,25. e 12,5 37,5 Verifique que e 14 15 16 O intervalo de valores sob a curva normal é 13,5 16,5 Para garantir que as fronteiras de cada retângulo estejam incluídas no intervalo, subtraia 0,5 das fronteiras à esquerda e some 0,5 às que estão à direita. Ch1 Larson/Farber 110 Aproximação normal para a binomial Use a aproximação normal para a binomial a fim de se n = determinar: P e . 0,25. Com as fórmulas de distribuição binomial, determine a média e o desvio padrão. (0,25) 12,5 3,062 (0,50)(0,75) Ajuste os pontos extremos para corrigir pela continuidade 16,5 . P 13,5 Converta cada ponto extremo em um escore z. 13,5 12,5 16,5 3,062 Ch1 Larson/Farber 0,33 12,5 3,062 1,31 0,9049 0,6293 1,31 111 0,33 0,2756 Aplicação Segundo um levantamento entre os usuários da Internet, 75% são a favor de que o governo regulamente o „lixo eletrônico‟. Se 200 internautas forem selecionados aleatoriamente, determine a probabilidade de que menos de 140 sejam a favor da regulação governamental. Uma vez que np = 150  5 e nq = 50  5, você pode usar a distribuição normal para aproximar a probabilidade binomial. (0,75) (0,75)(0,25) 6,1237 A frase binomial “menos de 140” significa 0, 1, 2, 3…139. Use a correção pela continuidade para traduzir isso à variável 139,5).. Determine P(x < 139,5). contínua no intervalo Ch1 Larson/Farber 112 Aplicação Segundo um levantamento entre os usuários da Internet, 75% são a favor de que o governo regulamente o „lixo eletrônico‟. Se 200 internautas forem selecionados aleatoriamente, determine a probabilidade de que menos de 140 sejam a favor da regulação governamental. Use a correção pela continuidade P(x < 139,5). 139,5 6,1237 P(z < –1,71) = 0,0436 1,71 A probabilidade de que menos de 140 sejam a favor da regulação governamental é de aproximadamente 0,0436. Ch1 Larson/Farber 113

Related docs
What are Statistics
Views: 91  |  Downloads: 12
What is Statistics
Views: 35  |  Downloads: 3
WHAT THE CRIME STATISTICS SAY
Views: 0  |  Downloads: 0
What is statistics
Views: 19  |  Downloads: 1
What is Statistics
Views: 20  |  Downloads: 1
What is statistics
Views: 12  |  Downloads: 0
STATISTICS
Views: 13  |  Downloads: 0
statistics
Views: 3  |  Downloads: 0
Statistics
Views: 14  |  Downloads: 6
Statistics of the Fifties
Views: 10  |  Downloads: 0
history of statistics
Views: 12  |  Downloads: 0
The Evolution of Statistics
Views: 601  |  Downloads: 49
Statistics
Views: 125  |  Downloads: 15
STATISTICS
Views: 35  |  Downloads: 3
premium docs
Other docs by rrboy
BJ Services company Ammendments and By laws
Views: 257  |  Downloads: 4
Directors Agree to Meeting Without Notice
Views: 150  |  Downloads: 1
Kraft Foods Inc Ammendments and Bylaws
Views: 192  |  Downloads: 1
OSHA Form 301
Views: 508  |  Downloads: 4
Employee Attendance Record
Views: 598  |  Downloads: 42
Stock Ledger and Capitalization Summary
Views: 1265  |  Downloads: 94
Your Company Requests A Credit Reference
Views: 237  |  Downloads: 0
2007 Form W-2G (PDF) Certain Gambling Winnings
Views: 295  |  Downloads: 5
aycock-all
Views: 500  |  Downloads: 2
Schedule SE (Form 1040) Self-Employment Tax
Views: 1458  |  Downloads: 9