Prévia do material em texto
CPS - CENTRO PAULA SOUZA
FATEC-SP
Faculdade de Tecnologia de São Paulo
ESTATÍSTICA
APLICADA
2024
RESUMO TEÓRICO e EXERCÍCIOS
Versão Simplificada
para Cursos de Tecnologia da FATEC-SP
Material de acompanhamento em sala de aula
Prof.Me.Katsuyoshi Kurata
FATEC-SP – 01/02/2024
ALUNO(A) ............................................................................................... ......
CONTEÚDO PROGRAMÁTICO
• Introdução à Estatística. Histórico. Considerações gerais sobre a Estatística Descritiva e Indutiva.
• Distribuição de frequências. Variável discreta e variável contínua. Histograma.
• Medidas de tendência central. Medidas de dispersão.
• Medidas de posição relativa: mediana, quartil, decil e percentil.
• Noções de análise combinatória. Princípio fundamental da contagem.
• Probabilidades: definições, teoremas fundamentais. Probabilidade condicional e independência estatística.
• Conceito de variável aleatória e função densidade de probabilidade. Parâmetros: média e variância. Propriedades.
• Variáveis aleatórias bidimensionais.
• Distribuições de probabilidades de variáveis aleatórias discretas: geométrica, hipergeométrica, Binomial e Poisson.
• Revisão: Integral Definida.
• Distribuição Normal. Variável padronizada. Tabela normal.
• Distribuição amostral da média e parâmetros. Teorema das Combinações Lineares e Teorema do Limite Central.
• Estimação por intervalos de confiança (média e variância) . Distribuição t de Student e Distribuição Qui-Quadrado.
• Testes de hipótese para a média e para a variância de uma população.
• Correlação amostral e regressão linear simples. Método dos Mínimos Quadrados.
• Implementação de programas no computador.
CRITÉRIO DE AVALIAÇÃO
Resumo do Critério de Avaliação das disciplinas da Área de Matemática do Departamento de Ensino Geral a partir
do 1º. semestre de 2022 (aprovado pela Congregação da Faculdade de Tecnologia de São Paulo)
Total de 3 provas: p1 , p2 e pS (prova substitutiva)
Seja 𝐌𝟏 =
𝐩𝟏 + 𝐩𝟐
𝟐
= média aritmética entre p1 e p2
a) 𝐌𝟏 ≥ 𝟔, 𝟎 Aprovado com a nota 𝐌𝟏
b) 𝐌𝟏 < 𝟐, 𝟎 Reprovado com a nota 𝐌𝟏
c) 2,0 ≤ 𝐌𝟏 < 𝟔, 𝟎 Poderá fazer a prova pS
A nota da pS substituirá somente uma das notas p1 ou p2, caso seja de maior valor
Nesse caso, tem-se uma nova média 𝐌𝟐 ∶ entre a nota da pS e (p1 ou p2)
Nota final NF (de aprovação ou reprovação) é a maior entre 𝐌𝟏 𝐞 𝐌𝟐
Conclusão: NF < 6,0 Reprovado
NF ≥ 6,0 Aprovado
Todas as provas são realizadas sem consulta
O conteúdo das provas é cumulativo
Todos os celulares deverão estar desligados, e dentro da mochila, durante as provas
A duração das provas é de 90 minutos
DATA DAS PROVAS
p1 : .......................... nota : ..............
p2 : .......................... nota : .................
pS : .......................... nota : ................
APRESENTAÇÃO
A disciplina “Estatística”, além da extensão do conteúdo, requer do docente escrever determinadas explicações
no quadro negro que tornam as aulas cansativas, conduzindo os alunos mais em copiar a matéria do que participar das
explicações e da compreensão dos assuntos. Aqui, muitas vezes, os enunciados dos exercícios são longos, o que demanda
tempo para ser colocado na lousa para depois ser discutido e resolvido.
Também, nem todas as salas estão equipadas com recursos audiovisuais adequados, e com o objetivo de
facilitar as aulas tanto para os alunos como para o professor, é que se apresenta esse material didático como uma alternativa
de método de trabalho.
Desde início, é bom registrar que não se trata de uma apostila. É um caderno previamente semielaborado
para facilitar o acompanhamento das aulas.
Em função da carga horária, a extensão e a profundidade dos assuntos apresentados neste material,
foram devidamente dimensionados para dar cumprimento total ao programa estabelecido pela Congregação da
FATEC-SP.
As lacunas, tanto gráficas, teóricas, matemáticas ou práticas foram colocadas de propósito para que o docente,
junto com os alunos, pudesse ir preenchendo no decorrer das aulas.
O texto foi elaborado com a preocupação de não formalizar demasiadamente, sempre usando uma linguagem
simples, de modo que os alunos pudessem captar as ideias básicas de cada assunto. Para maior embasamento, caberá ao
aluno quando necessário, consultar os livros indicados na página 110.
Nessa atualização, foi incluído cálculo de áreas planas pela Integral Definida – como revisão - , para melhor
entendimento das variáveis aleatórias contínuas.
Como este material está sujeito a reformulações periódicas, solicita-se aos alunos que apresentem suas
críticas e sugestões. Para acessar este Material Didático, digite https://sites.google.com/a/fatecsp.br/kkurata/
Obrigado.
KATSUYOSHI KURATA
Professor Mestre da Área de Matemática da
Faculdade de Tecnologia de São Paulo
do Centro Estadual de Educação Tecnológica Paula Souza
São Paulo, 01 de fevereiro de 2024
https://sites.google.com/a/fatecsp.br/kkurata/
SUMÁRIO
Introdução : Conceitos e Distribuição de Frequências 01
Distribuição de frequências 02
Média 02
Variância 03
Histograma 04
Medidas de posição relativa 05
Probabilidades 12
Definição axiomática 13
Espaços amostrais finitos equiprováveis 13
Probabilidade condicional 14
Eventos independentes 15
Princípio Multiplicativo e Princípio Aditivo 15
Permutações Simples e Combinações Simples 16
Arranjos Simples 17
Variáveis aleatórias discretas 22
Variável aleatória 22
Função de probabilidade 23
Distribuição de probabilidades 24
Primeiras ideias sobre variáveisaleatórias bidimensionais 25
Variáveis aleatórias independentes 27
Parâmetros de variáveis aleatórias unidimensionais 27
Covariância 29
Modelos de distribuições de probabilidade de variáveis aleatórias discretas 33
Distribuição geométrica 33
Distribuição hipergeométrica 34
Distribuição binomial 35
Distribuição de Poisson 37
Variáveis aleatórias contínuas 42
Revisão: Integral Definida 42
Conceito: Variáveis aleatórias contínuas 43
Distribuição Normal 46
Tabela da distribuição normal padronizada 51
Distribuição amostral da média 59
Teorema das Combinações Lineares e Teorema do Limite Central 60
Noções básicas sobre estimação por intervalos de confiança 67
Intervalo de confiança para a média com variância conhecida 67
Graus de liberdade 70
Intervalo de confiança para a média com variância desconhecida 71
Distribuição t de Student 71
Função par 73
Tabela da Distribuição t de Student 74
Intervalo de confiança para a variância populacional 76
Distribuição Qui-Quadrado 76
Tabela da Distribuição Qui-Quadrado 77
Testes de hipóteses: Introdução 85
Teste para a média com variância conhecida e desconhecida 88
Teste para a variância populacional 89
Primeiras ideias sobre Regressão e Correlação Linear 96
Método dos mínimos quadrados 97
Regressão linear simples 98
Cálculo das estimativas pela calculadora 100
Coeficiente de correlação linear 101
Apêndice A: Tabelas NORMAL, STUDENT e QUI-QUADRADO 108
Apêndice B: Capa do livro GMat 109
Referências 110
01.
Introdução : Conceitos e Distribuição de Frequências (medidas)
1. População: É o conjunto constituído de indivíduos ou objetos ou entes materiais, que apresentam pelo menos uma
característica em comum, cujo comportamento interessa analisar.
2. Amostra: É uma parte ou uma parcela da população escolhida de maneira conveniente.
3. Tamanho da amostra: É a quantidade de elementos existentes na amostra.
4. Estatística Descritiva: De um modo geral, a Estatística Descritiva pode ser entendida como uma função cujo objetivo é a
de observar fenômenos de mesma natureza, a de coletar dados numéricos referentes a esses fenômenos, a de organizar, a
de sumarizar e a de classificar esses dados observados, além da sua apresentação por meio de tabelas, diagramas e gráficos.
E para descrever os fenômenos de maneira resumida, faremos o uso de algumas medidas-sínteses.
População
Amostra
Etapas básicas: Definição do problema
Planejamento
Coleta de dados
Apuração dos dados
Apresentação de dados
Análise e interpretação de dados
5. Estatística Indutiva ou Estatística Inferencial: É um processo de generalização, a partir de resultados particulares. Isto é, a
inferência de propriedades para o TODO com base na PARTE, no particular. O processo de generalização, que é
característico do método indutivo, está associado a uma margem de erro - e, para minimizar este grau de incerteza - , a
TEORIA DE PROBABILIDADES será de fundamental importância para o desenvolvimento da Estatística Aplicada.
6. Rol: É o arranjo de dados numéricos brutos, em ordem de grandeza crescente ou decrescente.
7. Frequência absoluta: É o número de vezes que o i-ésimo valor observado repete. Denotamos: if
8. Se n é o número total de elementos observado, então n =
=
k
1i
if , em que k é o número de diferentes valores existentes
da variável.
09. Frequência relativa (da absoluta): É a porcentagem do i-ésimo elemento observado. Denotamos:
ir
f
10. Distribuição de frequências: É o arranjo dos dados por categorias ou classes, juntamente com as frequências absolutas
correspondentes.
02.
Exemplo 1: Distribuição de frequências de variável discreta, em que ix representa as notas de uma prova
notas ( xi) frequências ( f i ) 𝑓𝑟𝑖
ou (em %)
3,5 5 0,0625 6,25
5,0 15 0,1875 18,75
5,5 18 frequências relativas 0,2250 22,50
7,0 25 0,3125 31,25
8,5 10 0,1250 12,50
9,0 7 0,0875 8,75n = 80 1 100
A pergunta é: Qual foi a nota média nessa distribuição de frequências ? E qual o desvio-padrão em
torno dessa média ?
A média aritmética é a medida de posição mais importante para resumir o conjunto de valores representativo do
fenômeno que se deseja estudar. Notação: x (média amostral)
n
f x
f
f x
f . . . f f
f x . . . f x fx
x
k
1i
ii
k
1i
i
k
1i
ii
k21
kk2211
=
=
= ==
+++
+++
=
É a média aritmética ponderada dos xi com os respectivos pesos fi , i = 1, 2, 3, ... , k.
Mostre na distribuição acima, que a nota média (com aproximação de duas casas decimais) é 6,43
..................................................................................................................................................................................
..................................................................................................................................................................................
..................................................................................................................................................................................
..................................................................................................................................................................................
Se na distribuição de frequências, é dada as frequências relativas, e não é dado o tamanho da amostra n, como calculamos
a média ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
Dentre as medidas que permitem aferir o grau de dispersão dos valores x i em torno de uma medida de posição (média),
destacamos a variância (desvio-padrão) amostral
( )
1 - n
f .x - x
s
k
1i
i
2
i
2
== .
03.
Mostre que a expressão retromencionada é equivalente a
=
=
=
n
f x
- f x
1 - n
1
s
2
k
1i
ii
k
1i
i
2
i
2 .
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
Na definição acima, consideramos que os dados se referem a uma amostra. Se esses dados representassem toda uma
população, a variância populacional é:
( )
==
=
=
=
n
f x
- f x
n
1
n
f .x - x
2
k
1i
ii
k
1i
i
2
i
k
1i
i
2
i
2
A razão pela qual se utiliza “n – 1” no denominador da variância amostral, está ligado à teoria de estimação sobre os
chamados graus de liberdade.
O DESVIO-PADRÃO σ é definido como sendo a raiz quadrada positiva da variância, tanto para o amostral como para o
populacional. O seu cálculo é feito através da variância:
2 += .
Para o Exemplo 1 da página 02, mostre que o desvio-padrão amostral s (com aproximação de 4 casas decimais) é 1,5359 :
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
04.
Exemplo 2: Distribuição de frequências de variável contínua, em que a variável representa o comprimento das peças..
comprimento das peças (cm) freq. abs.
CLASSES fifri (xi) ponto médio
amplitude = 0,05
5,32 | 5.37 3 0,03 5,345
5,37 | 5,42 10 0,10 5,395
5,42 | 5,47 25 frequências relativas 0,25 5,445
5,47 | 5,52 27 0,27 5,495
5,52 | 5,57 20 0,20 5,545
5,57 | 5,62 15 0,15 5,595
n = 100 1
A representação gráfica de uma tabela de distribuição de freqüências de variável contínua é denominada de HISTOGRAMA :
é um gráfico por colunas, justapostas, que se obtém colocando no eixo horizontal as classes, e no eixo vertical, as freqüências
absolutas de cada classe.
Um outro gráfico que sobrepõe o Histograma é o POLÍGONO DE FREQUÊNCIAS: é uma poligonal aberta que se obtém
unindo-se os pontos médios das bases superiores dos retângulos do Histograma.
𝑓𝑖
30 - 27
25 polígono de frequências
20 - Histograma
10 -
3
Classes
5,32 5,37 5,42 5,47 5,52 5,57 5,62
Mostre que o comprimento médio das peças é 5,49 cm nessa distribuição de frequência. Mostre, também que o desvio-
padrão amostral s é 0.0659 cm.
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
05.
MEDIDAS DE POSIÇÃO RELATIVA (Separatrizes)
Tanto a média como o desvio-padrão são afetados, de forma exagerada, pelos valores extremos. E apenas com esses
dois valores, muitas vezes, não temos ideia se a distribuição dos dados é simétrica ou assimétrica. Daí surgem as chamadas
medidas separatrizes ou de posição relativa.
1. MEDIANA
A mediana M é o valor da abscissa que deixa metade dos dados abaixo dela e metade acima.
M
0% 50% 100%
É também considerada uma medida de posição.
2. QUARTIS
Os quartis dividem um conjunto de dados em 4 partes iguais e o seu cálculo pode ser realizado de forma semelhante
àquela descrita para a mediana, obtendo-se os valores que fornecem 4 subgrupos de mesmo tamanho.
1q 2q 3q
0% 100%
Primeiro quartil q1 deixa 25% dos elementos abaixo e 75% acima.
Segundo quartil q2, coincide com a mediana M.
Terceiro quartil q3 deixa 75% dos elementos abaixo e 25% acima.
NOTA: Uma medida de dispersão, alternativa ao desvio-padrão é o intervalo interquartil , definido por q3 – q1. É
o intervalo “central” que contém 50% das observações.
3. DECIS
Analogamente, são as separatrizes que dividem um conjunto de dados em 10 partes iguais.10% 20% 30% 40% 50% 60% 70% 80% 90%
| | | | | | | | | | |
0% d1 d2 d3 d4 d5 d6 d7 d8 d9 100%
1º. decil d1 , 2º. decil d2 , 3º. decil d3 , . . . , 9º. decil d9
Por exemplo, o 7d é o valor da abscissa que deixa 70% abaixo, e 30% acima.
4. PERCENTIS
Neste caso, são separatrizes que dividem a amostra em 100 partes iguais.
1% 2% 3% 4% 97% 98% 99%
. | | | | | | | | |
0% p1 p2 p3 p4 . . . . . . . . . . . . . . . p97 p98 p99 100%
Por exemplo, o 36p é o valor da abscissa que deixa 36% abaixo, e 64% acima.
06.
Exercícios variados
01. Mostre que a média amostral é um número divisível por 6, e a variância amostral com 2 casas de aproximação é 6,67 na
distribuição de frequências abaixo.
ix
i
f
ii
fx i
2
i fx
1,5 6 . .
3,4 9 . .
4,4 10 . .
6,2 12 . .
8,5 8 . .
10,0 5 . .
a)
n
f x
x
k
1i
ii
== = ..........................................................................................................................................................
b)
=
=
=
n
f x
- f x
1 - n
1
s
2
k
1i
ii
k
1i
i
2
i
2 = ........................................................................................................................
02. A tabela ao lado representa a distribuição salários (em reais)
irf (%)
dos salários (em reais) de funcionários de 1600 |.................... 2400 10
uma empresa com suas respectivas 2400 |.................... 3200 25
frequências relativas. 3200 |.................... 4000 x
4000 |.................... 4800 18
4800 |.................... 5600 15
a) Mostre que o salário médio x̅ , em porcentagem, é um número múltiplo de 8, nessa distribuição de frequências.
b) Faça uma ilustração gráfica da distribuição de frequências em função das frequências relativas.
c) Determine o salário mediano M nessa distribuição de frequências.
d) Mostre que a porcentagem dos funcionários que ganham pelo menos R$ 4160,00, é menor que 30%.
a) Salário médio
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
b) Gráfico fri
Classes
07.
c) Salário mediano
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
d) Porcentagem dos que ganham pelo menos R$ 4160,00
32
.............................................................................
25
18 p
......................................................................
. . . . . .
. . . . . 3200 4000 4800 . . . . .
......................................................................
4160
03. O tempo de utilização de caixas eletrônicos depende de cada usuário e das operações efetuadas. Usando uma
determinada técnica de amostragem, foram coletadas 80 medidas desse tempo, apresentando a seguinte distribuição de
frequências:
tempo (em minutos)frequência ( if ) fri
0,6 | 1,0 24 .......
1,0 | 1,4 18 .......
1,4 | 1,8 15 .......
1,8 | 2,2 10 .......
2,2 | 2,6 8 .......
2,6 | 3,0 5 .......
..............
Determine: q3 (3º. quartil) , 4d (4º. decil) e p68 (sexagésimo oitavo percentil)
a) 3º. quartil q3
..................................................................................
18,75%
.................................................................................. 12,5%
p
..................................................................................
........ ..........
..................................................................................
.... 1,8 2,2 ........
q3
08.
30%
b) 4º. decil 4d
22,5% p
.......................................................................................
....................................................................................... ..............
.......................................................................................
1,0 1,4
........................................................................................
4d
c) 68º. percentil p68
...................................................................................................
22,5%
..................................................................
18,75% p
........................................................................................
........................................................................................
1,4 1,8
........................................................................................
p68
04. A tabela abaixo representa a distribuição do consumo de gás ( em m3 por mês ) de 120 residências na cidade de São Paulo.
Consumo (em m3 por mês) Frequência absoluta fri
18,5 |............................ 21,0 15 ......
21,0 |............................ 23,5 24 ......
23,5 |............................ 26,0 42 ......
26,0 |............................ 28,5 36 ......
28,5 |............................ 31,0 3 ......
Mostre que a porcentagem das residências que consomem de 22,5 m3/mês até 26,5 m3/mês na distribuição dada, é menor
que 50%;
...........................................................................................................................................................................................................
...........................................................................................................................................................................................................
...........................................................................................................................................................................................................
...........................................................................................................................................................................................................
...........................................................................................................................................................................................................
.....................................................................................................................................................................................................................................................................................................................................................................................................................
...........................................................................................................................................................................................................
...........................................................................................................................................................................................................
09.
05. Um provedor de acesso à internet está monitorando a duração do tempo das conexões de seus clientes, com o objetivo
de dimensionar seus equipamentos. Uma amostra de 50 conexões apresentou a seguinte distribuição de frequências:
tempo (em minutos) freqüência ( if ) fri
(%) ix ii
fx i
2
i fx
18,2 |.......... 20,6 8 .... .... ..... .......
20,6 |.......... 23,0 10 .... .... ..... .......
23,0 |.......... 25,4 13 .... .... ..... ........
25,4 |.......... 27,8 12 .... .... ..... ........
27,8 |.......... 30,2 5 .... .... ..... ........
30,2 |.......... 32,6 2 .... .... ..... ........
Calcule: a) tempo médio 24,30 min.
b) desvio-padrão 3,29 min.
c) 88º. percentil 28,28 min.
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
06. Um radar fotográfico, instalado em uma rodovia na qual o limite de velocidade é de 100 km/h, registrou em uma semana
a porcentagem de multas por excesso de velocidade, assim distribuídas:
velocidade em km/h % de ocorrências
101 |............ 110 40,0 a) Calcule a velocidade média dos veículos multados
Resp: 115,625 km/h
110 |............ 119 25,0
119 |............ 128 20,0 b) Calcule a velocidade mediana dos veículos multados
Resp: 113,6 km/h
128 |............ 137 12,5
137 |............ 146 2,5
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
10.
Testes (somente uma alternativa é verdadeira)
07. A tabela ao lado representa a distribuição de Idade (em anos) 𝑓𝑟𝑖
(%)
idades dos candidatos a um determinado 18 |................. 22 40
curso de graduação com suas respectivas 22 |................. 26 20
frequências relativas.26 |.................. 30 25
30 |................. .34 10
34 |.................. 38 5
A porcentagem dos candidatos com pelo menos 28 anos de idade é
a) 35,5%
b) 32,5%
c) 30,5%
d) 29,5%
e) 27,5%
08. .A média aritmética da amostra de 10 elementos: 3,8 x + y 4,5 5,6 2,2
3,0 4,9 4,8 x - y 5,2 é igual a 4,6.
É verdade que x é um número
a) entre 6,5 e 6,8
b) maior que 5,6
c) menor que 4,2
d) racional, não inteiro
e) divisível por 5
09. A tabela abaixo representa a distribuição de temperaturas (em graus Celsius) durante o ano de 2023 de uma determinada
região do país com suas respectivas frequências relativas.
Temperatura (em graus Celsius) Frequência relativa (%)
8 |............................ 14 12
14 |............................ 20 20
20 |............................ 26 40
26 |............................ 32 18
32 |............................ 38 10
O octogésimo quarto percentil na distribuição dada, em graus, é um número
a) quadrado perfeito
b) múltiplo de 4
c) divisível por 5
d) primo
e) menor que 28
11.
10. A estatura média de um grupo de 40 pessoas de um país X é de 180 cm, e a de um grupo de 50 pessoas de um país
Y é de 170 cm. A estatura média do conjunto formado pelos dois grupos reunidos, em centímetros, é um número
a) compreendido entre 175 e 178
b) quadrado perfeito
c) maior que 175
d) compreendido entre 173 e 176
e) inteiro
11. Um provedor mediu o tempo, em minutos, do uso diário da internet por seus assinantes. Com os dados obtidos,
construiu-se o gráfico abaixo. Fonte: ¨Matemática – Ciência e Aplicações ¨ - V.3
frequências absolutas
. 22
18
13
11 8
5
2
1
0 30 60 90 120 150 180 210 240 270
Classes (tempo em minutos)
Na distribuição de frequências dada, a porcentagem de assinantes que ficam no máximo 126 min. na rede
a) está entre 68% e 75%
b) está entre 58% e 65%
c) é maior que 85%
d) é menor que 65%
e) está entre 65% e 71%
12. Considere as afirmações abaixo:
(I) A variância é a raiz quadrada positiva do desvio-padrão
(II) As medidas de dispersão permitem aferir o grau de homogeneidade dos valores em torno de uma medida de posição
(III) Nas separatrizes: Quartil , Decil e Percentil, existe somente um caso em que os três coincidem
É verdade que somente
a) (I) é verdadeira
b) (II) é verdadeira
c) (III) é verdadeira
d) (I) e (II) são verdadeiras
e) (II) e (III) são verdadeiras
12.
PROBABILIDADES
Conceitos
Fenômenos aleatórios: são aqueles que ocorrem, com ou sem, a interferência do homem, e que mesmo repetida várias
vezes, sob condições semelhantes, apresentam resultados totalmente imprevisíveis.
Experimento aleatório: uma experiência que, embora executada repetidas vezes, em condições aparentemente idênticas,
pode apresentar resultados variados, não sendo possível a previsão lógica de cada resultado.
Espaço Amostral: Para cada experimento aleatório E, diz-se espaço amostral S, ao conjunto formado por TODOS os
resultados possíveis desse experimento. Quando esse espaço amostral é finito e não vazio, denotaremos o número de
resultados por n(S).
Evento: Denomina-se evento, a qualquer SUBCONJUNTO do espaço amostral S. Em termos práticos, o evento é um
conjunto formado pelos resultados cuja ocorrência desejamos observar, pelos resultados que queremos ver acontecer.
Indicaremos o número de elementos de um evento A por n(A).
Nota: A = Ø → A é o evento impossível
certo. evento o é A S A →=
Evento união (ou reunião) B A . É o evento formado pelos
resultados que pertencem a pelo menos um dos eventos.
S
Evento intersecção B A . É o evento formado pelos resultados
que pertencem a ambos os eventos A e B.
S
Evento complementar. Um evento é complementar de um evento
A, associado a um experimento aleatório, que denotaremos A , ao
evento que somente ocorre, se A não ocorrer. Ou seja, é o evento
formado por todos os elementos do espaço amostral S que não
pertencem a A.S
Eventos mutuamente exclusivos (ou excludentes). Dois eventos
A e B são mutuamente exclusivos, se o evento A ∩ B = Ø, ou
seja, o evento .impossível é B A .
S
13.
Exemplos:
a) Sejam K = cara e C = coroa. Descreva o espaço amostral S do experimento aleatório E: “lançamento de duas moedas
honestas”.
S = .............................................................................................. e n(S) = ................
b) Seja o experimento E: “lançamento de dois dados honestos”. Então, n(S) = ......................
c) Descreva o espaço amostral S do experimento E: “lançam-se 3 moedas honestas”.
S = ........................................................................................................................................................................................
n(S) = ..............
d) Descreva o espaço amostral S do experimento E: ¨sorteiam-se 2 pessoas¨ do conjunto formado pelas pessoas
{ 𝐀ntonio , 𝐁enedito, 𝐂arlos , 𝐃enis }
S = ....................................................................................................................................... ∴ n(S) = ........
Definição axiomática de probabilidade
Seja E um experimento aleatório, e S um espaço amostral associado a E. A cada evento A associamos um número real p(A)
denominado probabilidade de A, que satisfaça às seguintes condições:
a) 1. p(A) 0
b) p(S) = 1.
c) Se A1 , A2 , A3 , . . . , A n forem, dois a dois, eventos mutuamente exclusivos, então
==
=
n
1i
i
n
1i
i )p(A A p .
Consequências: p(Ø) = 0 e p(A) = 1 - p(A)
Espaços amostrais finitos equiprováveis
p(A) =
n(S)
n(A)
)ocorrer pode E oexperiment o quais pelos casos de total número(
) Aevento ao favoráveis casos de número(
=
Exemplo: No lançamento de dois dados, mostre que a probabilidade de obter produto dos pontos um número múltiplo de 5,
é mais de 30%.
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
14.
Analisando o 3º.axioma da página anterior para dois eventos A e B mutuamente exclusivos, temos:
𝑝 (𝐴 ⋃ B ) = 𝑝(𝐴) + 𝑝(B)
Exemplo: No lançamento de dois dados, descreva a solução da questão: ¨ a probabilidade de obter soma dos pontos
igual a 4 ou o produto dos pontos igual a 2 ¨ .
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
No entanto, se A e B NÃO forem mutuamente exclusivos, o resultado acima NÃO é verdadeiro, pois
( ) B) n(A - n(B) n(A) B A n +=
Dividindo, ambos os membros por n(S), tem-se:
.........................................................................................................
......................................................................................................... S
p (A ⋃ B ) = p(A) + p(B) − p(A ⋂ B)
Exemplo: Retira-se, ao acaso, uma carta de um baralho de 52 cartas. Qual a probabilidade de sair uma carta de ¨reis¨
ou uma carta de “ouro” ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
Probabilidade condicional. Sejam A ≠ Ø e B, dois eventos do mesmo espaço amostral S.
Chama-se probabilidade de B condicionada a A (probabilidade de ocorrer B, uma vez que o evento A tenha ocorrido),
indica-se p (B/A), ao número definido por .
p(A)
B) p(A
)A/B(p
=
S
Num certo sentido, mede a probabilidade relativa de B em relação ao
espaço (reduzido) A . Isto é, interessa somente os resultados do evento
B que estejam em A. Se S é um espaço finito equiprovável, então
n(A)
B) n(A
)A/B(p
= .
Analogamente, tem-se: .
n(B)
B) n(A
)B/A(p
=
15.
Exemplo: Considere o experimento aleatório E: “lançam-se dois dados”. Sejam os eventos A : ¨ soma dospontos obtidos é
igual a 8 ¨ e B : ¨ produto dos pontos obtidos é igual a 12 ¨. Descreva a solução da probabilidade p( B / A ).
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
Eventos independentes. Dois eventos A e B são independentes quando a probabilidade de ocorrer um deles independe do
fato do outro ter ocorrido ou não ter ocorrido . Portanto, p(A/B) = p(A) e p(B/A) = p(B).
Como p(B). . p(A) B) p(A então , p(A/B) . p(B) p(B/A) . p(A) B) A(p ===
p(B) p(A)
p (A ⋂ B ) = p(A) . p(B)
Generalização: Se os eventos A1 , A2 , A3 , . . . , A n são independentes , então
==
=
n
1i
i
n
1i
i
)p(A A p
Exemplo: Uma caixa contém 12 bolas, sendo 3 pretas, 4 brancas e 5 vermelhas. Retirando-se uma bola, com reposição,
duas vezes ao acaso, descreva a solução da probabilidade da primeira ser branca e a segunda ser não branca.
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
Exercícios variados: Contagem e Probabilidades
01. Suponhamos que não exista vôo direto de São Paulo a Bahamas – somente com conexão em Panamá ou em Miami.
Semanalmente, sabe-se que de São Paulo a Panamá tem 3 vôos e de Panamá a Bahamas tem 5 vôos ; De Sâo Paulo a
Miami tem 7 vôos, e de Miami a Bahamas tem 4 vôos. De quantas maneiras uma pessoa poderá viajar de São Paulo a
Bahamas ?
É um problema de CONTAGEM : PRINCÍPIO MULTIPLICATIVO e PRINCÍPIO ADITIVO
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
16.
02. Considere uma senha de acesso na Internet formada de 3 letras e 3 algarismos, nessa ordem. Se a senha solicitada
permite escolher quaisquer letras, mas algarismos distintos, então qual é o número total de senhas que podem ser formadas ?
É um problema de CONTAGEM : PRINCÍPIO MULTIPLICATIVO
ou PRINCÍPIO FUNDAMENTAL DA CONTAGEM
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
03. Em uma urna vazia foram colocadas fichas iguais, em cada uma das quais foram escritos apenas um dos anagramas da
palavra ALUNO. Sorteado uma única ficha dessa urna, qual é a probabilidade das duas consoantes aparecerem juntas no
anagrama nela marcado ?
O cálculo dos anagramas das letras da palavra ALUNO, é um problema denominado de Permutações Simples
Permutações Simples de n elementos, indicamos 𝐏𝐧
Formação de agrupamentos que diferem somente pela ordem dos elementos
𝐏𝐧 = n!
n! = fatorial do número natural n = 1 . 2 . 3 . 4 . ... , (n-2) . (n-1) . n = produto dos n primeiros números naturais
com 0! = 1 e 1! = 1
......................................................................................................................................................................................................
............................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
04. De um grupo de 9 pessoas: sendo 4 paulistas, 3 cariocas e 2 gaúchos, sorteamos 4 pessoas. Qual a probabilidade de
ocorrer 2 paulistas e 2 cariocas ?
O cálculo das possibilidades de agrupar 4 pessoas dentro das 9 pessoas, é um problema chamado de Combinações
Simples
Combinações Simples de n elementos, tomados r a r, indicamos 𝐂𝐧,𝐫 ou (𝐧
𝐫
) ou n C r
Formação de agrupamentos que diferem somente pela natureza dos elementos
𝐂𝐧,𝐫 = (𝐧
𝐫
) = n C r =
𝐧!
𝐫! (𝐧−𝐫)!
, r ≤ n
17.
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
05. Para disputar a final de um torneio internacional de natação, classificaram-se 8 atletas: 6 estrangeiros e 2 brasileiros.
Considerando que todos os atletas são excelentes e têm iguais condições de receber uma medalha (de ouro, prata ou bronze),
qual a probabilidade de que os dois brasileiros estejam entre os três primeiros colocados ?
O cálculo das possibilidades dos 8 atletas ocuparem o pódio, é um problema chamado de Arranjos Simples
Arranjos Simples de n elementos, tomados r a r, indicamos 𝐀𝐧,𝐫 ou n P r
Formação de agrupamentos que diferem tanto pela ordem como pela natureza dos elementos
𝐀𝐧,𝐫 = n P r =
𝐧!
(𝐧−𝐫)!
, r < n
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
06. Mostre que o maior inteiro n que satistaz a sentença
(n−2)!
(n−1)!
<
1
3n−94
é um número par.
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
07. Três atletas A , B e C disputam uma corrida. Se A tem 1,8 vezes mais probabilidade de vencer que B, e B tem 2,5 vezes
mais probabilidade de vencer que C, então quais são as probabilidades de vitória de cada um ?
Solução: p(A) = 1,8 . p(B)
p(B) = 2,5 . p(C) . Portanto, p(A) = 4,5 . p(C). Por outro lado, p(A) + p(B) + p(C) = 1
Substituindo:
4,5 . p(C) + 2,5 . p(C) + p(C) = 1 → 8.p(C) = 1 → p(C) = 12,50% e {
p(B) = 31,25%%
p(A) = 56,25%
08. Sabe-se que na fabricação de um produto cerâmico, ocorrem defeitos dos tipos A e B, com probabilidades 0,12 e 0,07,
respectivamente. Admitindo-se a independência na ocorrência dos defeitos, qual a probabilidade de um produto escolhido,
ao acaso, ser perfeito?
Solução: Se a ocorrência dos defeitos são independentes, então da não ocorrência também são independentes.
Assim, p(produto ser perfeito) = % 81,84 0,93 0,88 )Bp( . )A p( ) B A (p ===
18.
09. Numa determinada região do planeta, 18% das pessoas são suspeitas de terem contraído o vírus COVID-19 da síndrome
respiratória e são submetidas a um rigoroso exame; entre estas constatou-se que 25%, realmente havia contraído o vírus
COVID-19. Sabe-se que entre as não suspeitas, 8% têm o vírus COVID-19. Se uma pessoa dessa região é escolhida, ao
acaso, qual é a probabilidade de ela ter sido
a) suspeita, sabendo-se que havia contraído o vírus COVID-19? suspeita não suspeita total
b) não suspeita, sabendo-se que não havia contraído o vírus COVID-19? com COVID
sem COVID
............................................................................................................. Total
............................................................................................................. Resp: a) 40,68% e b) 84,82%
............................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
10. A eficácia de um determinado teste de laboratório para checar certo defeito num componente eletrônico de fabricação
industrial que comprovadamente tem defeito é de 80%. Esse mesmo teste, porém, produz um falso defeito (acusa defeito em
produtos que não tem defeito) da ordem de 5%. Em uma população de componentes em que a incidência desse defeito é de
2%, seleciona-se um componente, ao acaso, para fazer o teste. Qual a probabilidade de que o resultado desse teste venha
a ser defeituoso? Mutuamente exclusivos
Solução:
p (teste acusar defeito) = p (teste acusar defeito nos defeituosos) + p (teste acusar defeito nos não defeituosos)
independentes independentes
= 0,80 . 0,02 + 0,05 . 0,98 = 0,065 = 6,5%
11. Uma urna contém 2 bolas brancas, 3 pretas e 5 vermelhas. Retirando-se, 3 bolas sucessivamente, qual a probabilidade
de obtermos três vezes bola vermelha ? Discutir o problema com reposição e sem reposição.
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
a) com reposição
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
b) sem reposição
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
Observação: Este caso, sem reposição, equivale a ¨ retirar 3 bolas simultaneamente ¨ ,
e obter três bolas vermelhas.
p(três vermelhas) =
n( três vermelhas )
n(S)
= ..........................................................................................
19.
12. O setor de controle de qualidade de uma indústria elétrica examina lotes de 50 peças para automóveis fabricados em
série. Sabe-se que 20% apresentam defeitos. Escolhendo-se 5 peças, ao acaso, sem reposição, calcule a probabilidade de
obter no a) máximo uma com defeito ? Resp: 74,19%
b) mínimo uma com defeito ? Resp: 68,94%
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
13. Uma caixa contém: 3 bolas vermelhas, 4 brancas e 5 pretas. Retirando-se, ao acaso, 3 bolas sucessivamente, sem
reposição, qual a probabilidade de obtermos todas de mesma cor ? Resp: 6,82%
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
14. Sabe-se que na fabricação de um componente eletroeletrônico ocorrem defeitos dos tipos A , B e C com probabilidades
0,15 , 0,10 e 0,08 , respectivamente. Admitindo-se a independência na ocorrência dos defeitos, qual a probabilidade de
um produto escolhido, ao acaso, tenha pelo menos um dos três defeitos ? Resp: 29,62%
......................................................................................................................................................................................................
............................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
15. No sistema abaixo, cada um dos subsistemas A , B , C e D funcionam independentemente um do outro com confiabilidade
p. Se a confiabilidade desejada do sistema é 96%, então qual deve ser o valor de p ?
( CONFIABILIDADE de um sistema é a probabilidade dele não falhar ) A B
C D
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
16. Um sistema é composto de 2 subsistemas X e Y , independentes entre si, como mostra o esquema abaixo.
X
Y
Se a probabilidade de falha de quaisquer um dos subsistemas é 5%, qual é a confiabilidade do sistema ? Resp: 99,75%
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
20.
Testes (somente uma alternativa é verdadeira)
17. Em uma urna vazia foram colocadas fichas iguais, em cada uma das quais foram escritos apenas um dos anagramas da
palavra PERNAMBUCO. Sorteado uma única ficha dessa urna , a probabilidade da ficha conter um anagrama começando
e terminando por vogal, em porcentagem, é um número
a) entre 15 e 18
b) entre 13 e 16
c) entre 10 e 13
d) entre 8 e 11
e) menor que 9
18. Uma caixa contém 20 peças, sendo 8 defeituosas e 12 boas. Extraindo-se, ao acaso, sucessivamente, 5 peças com
reposição, a probabilidade de obter exatamente 3 peças com defeito, é
a) 23,04%
b) 20,36%
c) 18,25%
d) 16,42%
e) 15,64%
19. Duas retas r e s são paralelas. Sobre a reta r tem-se 10 pontos distintos, e sobre a reta s, 7 pontos distintos.
Escolhendo-se ao acaso, 4 pontos quaisquer entre os 17 pontos, a probabilidade de esses pontos serem vértices de um
quadrilátero é, aproximadamente, igual a
a) 77,21%
b) 70,13%
c) 47,41%
d) 43,26%
e) 39,71%
20. Sejam A e B dois eventos de um mesmo espaço amostral de probabilidades p(A) =
1
2
, p(B) =
3
5
e
p(A ∩ B) =
1
5
. A probabilidade condicional p(�̅�/�̅�) ( probabilidade de ocorrer �̅� , sabendo-se que ocorreu o �̅� )
é igual a
a) 35%
b) 33%
c) 30%
d) 27%
e) 25%
21.
21. Chama-se palíndromo qualquer número, palavra ou frase que se pode ler da esquerda para a direita ou da direita para a
esquerda, sem que o seu sentido seja alterado.
Por exemplo: são palíndromos o número 770 585 077 e a palavra ROTOR.
Com os algarismos de 0 a 9 , formam-se todos os números X de 3 algarismos tais que 100 < X < 400. Um deles é
escolhido ao acaso. A probabilidade de que seja um palíndromo
a) está entre 9,5% e 10,5%
b) é aproximadamente 9,92%
c) é exatamente 10,4%
d) é maior que 10,3%
e) é menor que 9,4%
22. Em uma caixa existem 11 bolas numeradas de 1 a 11. Retirando-se, duas bolas simultaneamente, ao acaso, a
probabilidade das duas aparecerem com numeração par é, aproximadamente,
a) 45,45%
b) 36,36%
c) 27,27%
d) 18,18%
e) 13,13%
23. Uma caixa contém: n bolas brancas, 3n bolas pretas e 10 bolas verdes. Uma bola é extraída, ao acaso, dessa caixa. O
menor inteiro n de modo que a probabilidade da bola extraída ser PRETA seja maior que 71% , é um número
a) múltiplo de 5
b) compreendido entre 37 e 44
c) divisível por 4
d) primo
e) menor que 41
24. De um grupo de 10 professores e x alunos, escolhe-se ao acaso duas pessoas, uma após a outra. Se a probabilidade
das duas pessoas serem alunos é
𝟐
𝟑
, então x é um número
a) maior que 50
b) compreendido entre 50 e 55
c) menor que 40
d) divisível por 7
e) múltiplo de 9
25. Dentre 8 (oito) números positivos e 6 (seis) negativos, escolhem-se ao acaso, 4 (quatro) números, sem reposição, e
multiplicam-se esses quatro números. A probabilidade de que o produto desses quatro seja um número positivo é,
aproximadamente, igual a
a) 50,45%
b) 48,95%
c) 43,46%
d) 41,96%
e) 38,49%
22.
VARIÁVEIS ALEATÓRIAS DISCRETAS
I. Variável aleatória
Dado um experimento aleatório E, os seus resultados (eventos) mutuamente exclusivos sempre estão associados a uma
probabilidade. E esses resultados podem ser expressos numericamente, mesmo quando têm natureza qualitativa(neste
caso, mediante uma convenção adequada, associamos a cada resultado um número). Da necessidade de atribuir um número
real x a todo elemento do espaço amostral S, surge o conceito de variável aleatória X. Ou seja, a variável X que assume
um valor numérico cada vez que ocorre um evento.
Definição: Uma função X que associa a cada elemento s S um número real X(s) é chamada de variável aleatória.
Veja que, o nome é muito infeliz... Variável aleatória X , em vez de “ função aleatória X ”.
s X(s)
X
S ℝ
Se X(s) é um conjunto finito ou infinito numerável , a variável aleatória denomina-se DISCRETA. Se for um intervalo ou
coleção de intervalos, ela se diz CONTÍNUA. No caso finito, indicaremos por X(S) = . . . , x, x, x 321 .
Exemplo de uma variável aleatória discreta: Seja o experimento aleatório E: “lançamento de 3 moedas”, e seja
X: “ número de ocorrência da face cara ”.
O espaço amostral de E é:
S = .........................................................................................................................................................................................
Se X representa o número de caras, então X assume os valores: 0 , 1 , 2 e 3.
s1 = (c , c , c) ....................................................... X(s1) = 0
1 )X(s )X(s )X(s .................................................
c) ,c , (k s
c) , k ,(c s
k) ,c ,(c s
432
4
3
2
===
=
=
=
2 )X(s )X(s )X(s .............................................
c) , k , (k s
k) , k,(c s
k) ,c , (k s
765
7
6
5
===
=
=
=
s8 = (k , k , k) ...................................................... X(s8) = 3
23.
S ℝ
0
s1
s2
1
s3
s4
X
s5 2
s6
s7
s8 3
s X(s)
II. Função de probabilidade
Se x1 , x2 , x3 , . . . são possíveis valores de uma variável aleatória X, então a cada resultado xi associamos um número
p(xi) = P(X = xi) chamado probabilidade de xi tal que:
i) p (xi) 0 para todo xi.
ii) 1. )x(p
1i
i =
+
=
A função assim definida, denomina-se função de probabilidade da variável aleatória X.
No exemplo citado anteriormente, temos:
X Ai
(variável) (evento correspondente)
0 ........................ A1 = 1s P(X = 0) = P(A1) = p(0) = 1/8
1 ........................ A2 = 4 32 s ,s , s P(X = 1) = P(A2) = p(1) = 3/8
2 ........................ A3 = 765 s , s , s P(X = 2) = P(A3) = p(2) = 3/8
3 ........................ A4 = 8s P(X = 3) = P(A4) = p(3) = 1/8
É a função que associa a cada valor assumido pela variável aleatória, a probabilidade do evento correspondente, isto é,
P(X = xi) = P(Ai) = p(xi) =
)S(n
)A(n i , i = 1 , 2 , 3 , . . . , em que Ai = ijj x )X(s | S s = , j = 1 , 2 , 3 , . . .
24.
III. Distribuição de probabilidades
Ao conjunto ( ) . . . , 3 , 2 , 1 i , p(x , x ii = , chamamos distribuição de probabilidades da variável aleatória X. É importante
observar que: para que haja uma distribuição de probabilidades de uma determinada variável aleatória X, é necessário que
1. )x(p
1i
i =
+
=
No exemplo das 3 moedas, a distribuição de probabilidades da variável aleatória X: “número de
ocorrência da face cara “ , é
X = xi P(X = xi) = p(xi)
0 ........................ 1/8
1 ........................ 3/8
2 ........................ 3/8
3 ........................ 1/8
p(xi)
8
3
8
1
xi
0 1 2 3
Exercícios sobre Distribuição de Probabilidades
01. De um grupo de 5 alunos, 4 professores e 2 funcionários, sorteamos 3 pessoas. Seja X a variável aleatória discreta
definida por ¨ocorrência do número de alunos¨ . Determine a distribuição de probabilidades da variável X .
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
............................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................
02. Uma urna contém 4 bolas brancas e 3 pretas. Seja E: “retira-se, ao acaso, 3 bolas sucessivamente, sem reposição” e
seja X: “número de bolas brancas”. Encontre a distribuição de probabilidades de X.
Solução: n(S) = 35 C 3,7 =
X = 0 : 1 C 3,3 =
X = 1 : 12 C C 3,21,4 = ) x P(X x X ii ==
X = 2 : 1,32,4 CC = 18 0 1/35
X = 3 : 4 C 3,4 = 1 12/35
2 18/35
3 4/35
1
25.
03. Suponha que a variável aleatória X tenha função de probabilidade dada por P(X = k) =
1
2k para
k = 1 , 2 , 3 , . . . . Calcule ( )3 X P .
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
04. De um lote de 12 peças, sabe-se que 7 são defeituosas. Seja o experimento aleatório E : “escolhe-se, ao acaso, 3 peças
sem reposição “. Se a variável aleatória X é “ o número de peças defeituosas “ , determine a distribuição de
probabilidades dessa variável X.
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.
05. Uma variável aleatória discreta X pode assumir seis valores, conforme a Distribuição de Probabilidades abaixo, sendo k
uma constante positiva:
xi 1 2 3 4 5 6
p(xi)
k
2
0,30 k 0,24
k
4
0,25
Mostre que p(1) + p(3) = 18%
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
IV. Primeiras ideias sobre variáveis aleatórias bidimensionais
O estudo feito até aqui, envolveu apenas as variáveis aleatórias unidimensionais. Ou seja, o resultado do experimento
representado por um único número x.
Todavia, há casos em que estamos interessados em dois ou mais característicos simultaneamente. Por exemplo, a dureza
X e a tensão de ruptura Y de uma peça manufaturada de aço, teria o par (x , y) como um único resultado experimental.
Seja S um espaço amostral associado a um experimento aleatório E, e X = X(s) e Y = Y(s), duas funções, cada uma
associando um número real a cada resultado s S. Definimos assim, (X , Y) uma variável aleatória bidimensional.
26.
X(s)
X
s
S
Y Y(s)
Tal como no caso unidimensional, (X , Y) poderá ser discreta ou contínua, valendo as mesmas considerações feitas
anteriormente. Nessa pequena introdução, consideramos (X , Y) discreta, em que os valores possíveis (finitos ou infinitos
numeráveis) de (X , Y) possam ser representados por (xi , yj) , i = 1 , 2 , 3 , . . . , m , . . . e j = 1 , 2 , 3 , . . . , n , . . . .
Função de probabilidade conjunta
Seja (X , Y) umavariável aleatória discreta bidimensional tal que X assume os valores x1 , x2 , x3, ... , xm , ... e Y assume
os valores y1 , y2 , y3 , ..., yn , ... . A função de probabilidade conjunta associa a cada resultado possível (xi , yj), a
probabilidade p(xi , yj) que representa P(X = xi , Y = yj), satisfazendo às seguintes condições:
i) p(xi , yj) 0 para todo (xi , yj).
ii)
+
=
+
=1i 1j
ji )y ,p(x = 1.
Ao conjunto dos ternos ( ) 1,2,3,... j e 1,2,3,... i que taly,p(x , y , x jiji == , damos o nome de distribuição
conjunta de probabilidades da variável aleatória bidimensional (X , Y).
Exemplo: Dada a tabela abaixo, referente ao salário e tempo de serviço de 10 funcionários, determine a distribuição conjunta
de probabilidades das variáveis X: salário (em reais) e Y: tempo de serviço (em anos).
funcionário A B C D E F G H I J
X (salário) 10000 12000 12000 16000 16000 16000 14000 14000 14000 12000
Y (tempo) 7 6 7 5 7 7 6 7 7 6
Para isso, fazemos uma tabela de dupla entrada, colocando a probabilidade conjunta das duas variáveis.
Y 5 6 7
X
10000
12000
14000
16000
Veja, por exemplo, P( X = 10000 , Y = 6 ) = 0 , porque não há funcionário que ganhe R$ 10000,00 e tenha 6 anos de
serviço. Mas, P( X = 16000 , Y = 7 ) = 2 10⁄ .
27.
Variáveis aleatórias independentes
Seja (X , Y) uma variável aleatória discreta bidimensional, tal que:
X: x1 , x2 , x3 , . . . com P(X = xi) = p(xi) para todo i, e
Y: y1 , y2 , y3 , . . . com P(Y = yj) = p(yj) para todo j.
Diz-se que as variáveis X e Y são independentes se, e somente se, P(X = xi , Y = yj) = P(X = xi) . P(Y = yj), ou seja,
p(xi , yj) = p(xi) . p(yj) para todo par (xi , yj) , i = 1 , 2 , 3 , . . . e j = 1 , 2 , 3 , . . .
No exemplo dos salários (X) e tempo de serviço (Y), essas variáveis NÃO são independentes, porque não satisfaz a
definição: enquanto que P(X = 10 000 , Y = 5) = 0 e P(X = 10 000) . P(Y = 5) =
𝟏
𝟏𝟎
.
𝟏
𝟏𝟎
, por exemplo.
V. Parâmetros da distribuição de probabilidades de uma variável aleatória discreta
MÉDIA ou VALOR ESPERADO ou ESPERANÇA MATEMÁTICA ou EXPECTÂNCIA
PARA VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS
Chama-se média da variável aleatória X, a soma dos produtos dos valores da variável X pelas respectivas probabilidades:
=
==
n
1i
iiX )P(X . X )X(E
No caso discreto, tal que X(S) = n321 x, . . . , x, x, x e ( )ii p(x )xXP == , i = 1 , 2 , 3 , . . . , n , então a média de X é
E(X) X ==
=
n
1i
ii )p(x x É uma média aritmética ponderada.
É oportuno observar, a semelhança entre a média amostral
=
=
n
1i
ii fr x x vista na página 02 com a média populacional de
uma variável aleatória discreta:
=
=
n
1i
iiX )p(x x .
Comparando as duas expressões, nota-se que a média teórica (ou seja a populacional X ) é semelhante à média amostral
x . À medida que o tamanho da amostra aumenta, a frequência relativa fri =
n
fi aproxima-se de p(xi), isto é, a média
amostral aproxima-se da média populacional.
28.
Exemplo. O número de chamadas telefônicas recebidas por uma central e suas respectivas probabilidades para um intervalo
de um minuto foram:
xi (número de chamadas) 0 1 2 3 4 5
p ( xi ) (probabilidades) 0,50 0,25 0,14 0,06 0,03 0,02
Calcule a média E(X).
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
Propriedades da média E(X)
a) Média de uma constante é igual a própria constante: E(k) = k , k – constante.
De fato, E(k) =
=
n
1i
i)p(x . k = k . 1 = k.
b) Multiplicando-se ou dividindo-se cada valor de uma variável aleatória X por uma constante k, a média ficará multiplicada
ou dividida pela constante k:
E(k.X) = E(X). . k )p(x x . k )p(x x. k
n
1i
ii
n
1i
ii ==
==
c) A média da soma (diferença) de duas variáveis aleatórias é igual à soma (diferença) das médias destas variáveis:
E(X Y) = E(X) E(Y) De fato,
E(X Y) =
+
=
+
=
+
=
+
=
+
=
+
=
=
1i 1j
jij
1i 1j
jiiji
1i 1j
ji )y,p(x . y )y,p(x . x )y,p(x . )y (x =
= E(Y). E(X) )p(y . y )p(x . x )y,p(x y )y,p(x x
1j
jj
1i
ii
1j 1i
jij
1i 1j
jii ==
+
=
+
=
+
=
+
=
+
=
+
=
d) E(a.X b) = E(a.X) E(b) = a . E(X) b , a e b constantes.
e) E(X - )X = E(X) - E( )X = E(X) - X = XX - = 0.
VARIÂNCIA
Uma medida que estabelece o grau de concentração de probabilidade em torno da média E(X) = X , é
chamada variância e é definida por VAR (X) = 2
X
= 𝐄 {[ 𝐗 − 𝐄(𝐗)]𝟐} = 𝐄 { [𝐗 − 𝛍]𝟐 } .
29.
No caso discreto, se X(S) = in321 x P(X e x, . . . , x, x, x = ) = p (xi) , i = 1 , 2 , 3 , . . . , n , então a variância de
X é VAR (X) = ( )
=
=
n
1i
i
2
Xi
2
X
)(x p . - x . É a média aritmética dos quadrados dos desvios.
Uma relação importante para os exercícios: VAR (X) =
2
X
2 )( - )X(E , em que
=
=
n
1i
i
2
i
2 )p(x . x )X(E . De fato,
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.
DESVIO-PADRÃODesvio-padrão da variável aleatória X, é a raiz quadrada positiva da variância de X, ou seja, (X) VAR X =
Propriedades da variância VAR(X)
a) VAR (k) = 0 , k – constante. De fato,
b) VAR (k.X) =
2k . VAR (X) , k - constante. De fato,
......................................................................................................................................................................................................
c) Uma medida que dá o grau de dependência entre duas variáveis X e Y é denominada covariância entre X e Y, e é definida
por cov (X , Y) = . E(Y) - Y . E(X) - X E É a média aritmética do produto dos desvios de X e Y em torno de
YX e , respectivamente.
d) Y), (X cov . 2 (Y) VAR (X) VAR Y) (X VAR += . Vejamos a justificativa para a variância da soma de duas variáveis
X e Y: VAR (X + Y) = VAR (X) + VAR (Y) + 2 . cov (X , Y).
22 ) E(Y) -(Y ) E(X) - (X E Y) E(X - Y) (X E Y) X(VAR +=++=+
= E(Y) - Y . E(X) - X . 2 E(Y) - Y E(X) - X E 22
++
= E(Y) - Y . E(X) - X E . 2 E(Y) - Y E E(X) - X E 22
++
= VAR (X) + VAR (Y) + 2 . cov (X , Y) .
Analogamente, VAR (X – Y) = VAR (X) + VAR (Y) - 2 . cov (X , Y)
Teorema: Se X e Y são independentes, então cov (X , Y) = 0 (a recíproca não é verdadeira).
Isso significa que, se X e Y são independentes, então VAR ( X ± Y ) = VAR (X) + VAR (Y)
30.
e) VAR (a . X b) =
2a . VAR (X) , a e b constantes.
Como Cov (a.X , b) = .................................................................................................................................................................
então, VAR (a.X b) = ............................................................................................................................................................
Exercícios sobre a média e a variância
01. Uma caixa contém: 6 chips com defeito e 4 perfeitas. Retira-se, 3 chips desta caixa com reposição. Seja X: “número de
chips com defeito”. Calcule E(X) e σ(X).
Solução: Se D representa o evento “defeito” , então D , é o evento “perfeito”.
P(X = 0) = p(nenhuma com defeito) = P(3 D ) = ...................................... = ...................
P(X = 1) = p(1D e 2 D ) = P
D D D
D D D
D D D
= 3 . ( .........................................) = ...................
P(X = 2) = p(2D e 1 )D = P
D D D
D D D
D D D
= 3 . ( ........................................ ) = ....................
P(X = 3) = p(todas com defeito) = P(3 D) = ............................................... = ....................
x p(x) x . p(x) x2. p(x)
E(X) = ∑ x . p(x) = ....................
0 ........... ............ ..............
E(X2) = ∑ x2 . p(x) = .....................
1 ........... ............ ..............
VAR(X) = E(X2) − [E(X)]2
2 ........... ............ ..............
= ...........................................
3 ........... ............ ..............
σ(X) = √VAR(X) ≈ 0,85
.............. ...............
02. Se a média E(5X +7) = 62 , então quanto vale a média E(3X – 5) ? Resp: 28
......................................................................................................................................................................................................
......................................................................................................................................................................................................
31.
03. Sejam X e Y variáveis aleatórias independentes tais que (X) = 5 e (Y) = 2. Calcule o desvio-padrão da variável
aleatória Z = 6 X + 8 Y - 13 .
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
04. . Se a VAR (3 X + 1) = 63, então quanto vale σ (2 X + 3) ? Resp: ≈ 5,29
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
05. Sejam X e Y duas variáveis aleatórias independentes tais que
=−
=+
48)3Y4(VAR
18)5X3(VAR
. Calcule VAR( 2X + 5Y).
Resp: 83
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
............................................................................................................................................................................................................................................................................................................................................................................................................
06. Um rebite é montado num furo. O diâmetro médio dos rebites fabricados é igual a 12 mm com desvio-padrão de 0,2 mm.
E o diâmetro médio dos furos produzidos é igual a 12,8 mm e seu desvio-padrão 0,4 mm. Se a folga é a diferença entre o
diâmetro do furo e o do rebite (independentes), qual deve ser a média e o desvio-padrão da folga?
Solução: Sejam X : ¨diâmetro dos furos¨
Y : ¨diâmetro dos rebites¨
Z : ¨diferença de X e Y ¨
E(Z) = E( X – Y ) = .....................................................................................................................................................................
VAR(Z) = VAR( X – Y ) = ..........................................................................................................................................................
e σ (Z) = σ ( X – Y ) = √VAR(X − Y) ≈ ......................
07. Seja X uma variável aleatória para a qual E(X) = 10 e VAR(X) = 25. Para quais valores positivos de a e b deve
a variável Y = a.X – b ter valor esperado 0 e variância 1 ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
32.
Testes (somente uma alternativa é verdadeira)
08. Sejam X e Y duas variáveis aleatórias independentes tais que σ(X) = 5 e σ(Y) = 2. Nessas condições, o desvio-
padrão da variável aleatória Z = 6X – 9Y é um número
a) impar
b) primo
c) compreendido entre 36 e 42
d) menor que 35
e) quadrado perfeito
09. Seja X uma variável aleatória tal que {
VAR(3X + 2) = 36
E(5X + 1) = 31
. Nessas condições E(X2) é um número
a) impar
b) menor que 19
c) compreendido entre 15 e 37
d) maior que 45
e) compreendido entre 35 e 45
10. Sejam X e Y duas variáveis aleatórias tais que σ(X) = 3 e σ(Y) = 5 , em que σ é o desvio-padrão.
Se a covariância entre X e Y, ou seja, cov (X , Y) = 2 , então a variância VAR( 3X + 2Y ) é um número
a) racional, não inteiro
b) múltiplo de 7
c) divisível por 5
d) menor que 200
e) quadrado perfeito
11. Se para uma variável aleatória X , E(X) = μ e VAR (X) = , então a média E [ (X + 1) ( X – 1 ) ] , é igual a
a) 𝜎2 + 𝜇2 - 1
b) 𝜎2 − 𝜇2 - 1
c) 𝜎2 + 𝜇2 - μ
d) 𝜎2 − 𝜇2 + μ
e) um
12. A média E(2X + Y) da variável aleatória bidimensional (X , Y) com a seguinte distribuição de
probabilidades: X Y 1 2 3
2 0,10 0,30 0,20 é um número
3 0,06 0,18 0,16
a) entre 5 e 6
b) maior que 8
c) racional, não inteiro
d) menor que 6
e) primo
2σ
33.
MODELOS DE DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS
DISCRETAS
I. Distribuição Geométrica
Consideremos tentativas sucessivas e independentes de um mesmo experimento aleatório, em que cada tentativa admite
evento sucesso A com probabilidade p e evento fracasso A com probabilidade q tal que p + q = 1.
Seja a variável aleatória X: “número de tentativas necessárias ao aparecimento do primeiro sucesso”. Portanto, a
variável X assume os valores: 1 , 2 , 3 , . . . , x. Explicando melhor, se
X = 1, corresponde ao sucesso na primeira tentativa e P(X = 1) = p.
X = 2, corresponde ao fracasso na 1ª. tentativa e sucesso na 2ª. tentativa e P(X = 2) = p( )AA = q . p.
X = 3, corresponde ao fracasso na 1ª. e 2ª. tentativas e sucesso na 3ª. tentativa e
P(X = 3) = p )AAA( = q . q . p =
2q . p.
X = 4, corresponde ao fracasso na 1ª. , 2ª. e 3ª. tentativas e sucesso na 4ª. tentativa e
P(X = 4) = p )AAAA( = q . q . q . p =
3q . p.
......................................................................................................................................................................................................
X = x, corresponde ao fracasso nas x – 1 primeiras tentativas e sucesso na x-ésima tentativa e
P(X = x) = P A)A A . . . AAA( =
1 -x
q . . . . q . q . q . p = p. .q 1x−
A variável aleatória discreta X assim definida, denomina-se distribuição geométrica de probabilidades
P(X = x) = qx−1 . p
Exemplo: A probabilidade de passar num determinado cruzamento da Av. Tiradentes e encontrar o semáforo aberto é 20%.
Qual a probabilidade de que seja necessário passar pelo mesmo local 5 vezes, para encontrar o semáforo aberto pela 1ª.
vez?
Solução: Seja a variável aleatória geométrica X: “número de vezes necessário para encontrar o semáforo aberto”. Portanto,
a variável X assume os valores: 1 , 2 , 3 , 4 , 5.
“Semáforo aberto” é o evento sucesso com probabilidade p = 0,20.
“Semáforo fechado” é o evento fracasso com probabilidade q = 0,80.
Portanto, p(encontrar semáforo aberto pela 1ª. vez na 5ª. passagem) =
= P(X = 5) = ( ) ( ) 8,19%. 0,0819 (0,20) . 0,80 (0,20) . 80,0
415
===
−
34.
Parâmetros da Distribuição Geométrica
a) E(X) =
+
=1x
p(x) . x = p) . (q . x
1x
1-x =
+
=
.......................................................................................................
............................................................................................................................. .................................................................................................................................................................................... .......................................................
b) VAR (X) = ( ) ( )22 E(X) - XE . Para isso, calculando
+
=
+
=
==
1x
1-x2
1x
22 )p .(q x p(x) . x )X(E =
p+2q
p2 ,
tem-se VAR(X) =
q
p2
II. Distribuição Hipergeométrica População com N elementos
r elementos com a característica
Consideremos uma população com N elementos, N - r
dos quais r tem uma uma determinada característica .
. amostra de n elementos
Retira-se dessa população, sem reposição, uma amostra de
tamanho n. Seja a variável aleatória X: “número de sucessos com a característica na amostra de tamanho n”. Nessas
condições, qual é a P(X = x sucessos) ?
Podemos retirar
=
N
n
n,N C amostras, sem reposição. E os sucessos na amostra podem ocorrer de
=
r
x
x ,r C
maneiras, e os fracassos de
=
−
−−
r - N
x n
xn ,rN C modos distintos.
Dessa forma , P(X = x)
=
−
N
n
r - N
x n
r
x
.
, r x e n x 0 , define uma distribuição chamada distribuição
hipergeométrica de probabilidades.
Exemplo: Três passagens para Vale do Silício (USA) serão sorteadas entre 10 alunos da FATEC-SP, sendo 4 alunos da
manhã e 6 alunos da noite. Supondo que um mesmo aluno possa ganhar somente uma passagem, qual a probabilidade de
2 alunos da manhã serem sorteados ?
Solução: Formalizando a Distribuição Hipergeométrica:
Variável aleatória hipergeométrica X : número de alunos da manhã na amostra de tamanho n = 3 ¨
Tamanho da população N = 10 alunos. Dessas r = 4 têm a característica manhã , e N – r = 6 não têm a referida
característica. Portanto, a variável X pode assumir: 0 , 1 , 2 , 3. Portanto,
p(sorteado 2 alunos da manhã) = P(X = 2) = p( 2 da manhã e 1 da noite ) = ....................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
35.
Parâmetros da distribuição hipergeométrica:
Prova-se que E(X) = n.p e VAR (X) = n.p (1-p)
1N
nN
−
−
, p =
N
r
III. Distribuição Binomial
A fim de encontrarmos a expressão que define essa distribuição, consideramos que:
a) São realizadas n provas independentes e do mesmo tipo;
b) Cada prova admite apenas dois resultados: evento sucesso (A) e evento fracasso ( A ), e
c) A probabilidade do evento sucesso A, em cada prova, é p e a probabilidade do evento fracasso A é
1 – p = q (p e q constantes).
Seja a variável aleatória binomial X: “número de sucessos em n provas”.
Portanto, a variável X assume os valores: 0 , 1 , 2 , 3 , . . . , n.
Determinamos a função de probabilidade da variável aleatória X, ou seja P(X = x vezes sucesso). Para uma n-úpla
particular, x vezes sucesso em n provas é:
fracasso vezes x - nsucesso vezesx
A . . . . . . . . A A A A A A A. . . . . . . . . A A A A
p . p . p . p . . . . . p . p . p . q . q . q . q . . . . . q
xp x- nq
Porém o evento “ x vezes sucesso em n provas”, pode ocorrer de várias maneiras distintas, todas com a mesma
probabilidade x- nx q . p . Esse número é dado por
x)!- (n x!
n!
C
n
x
x,n =
= (x vezes sucesso e n – x vezes fracasso).
Conclusão: P(X = x vezes sucesso) = x- nx
n
x
q . p .
é a expressão denominada distribuição binomial de probabilidades.
Exemplo: . Nos treinos para definir a largada de uma corrida de Fórmula 1, um piloto tem 40% de obter uma
marca excelente em uma única volta. Em 5 voltas independentes, qual a probabilidade de obter somente duas
marcas não excelentes ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
36.
Parâmetros da distribuição binomial
a) Média E(X)
E(X) =
=
−
=
−−
==
==
=
=
n
1x
xnx
n
1x
xnx
n
x
xnx
n
0x
n
x
n
0x
qp .
x)!- (n x!
n!
. x qp .x qp . x p(x) . x
=
=
−
=
−
=
==
n
1x
xn1 -x
1 - n
1 -x
n
1x
xn-1 -xxnx
n
1x
q p p n q p .
x)!- (n 1)! -(x
1)! - (n
p n qp .
x)!- (n 1)! -(x x
n!
. x .
Fazendo y = x – 1, tem-se:
E(X) = n p .
1n-q) (p de mentodesenvolvi
1n
0y
1 - y - ny
1 - n
y
q p
+
−
=
= n p
1) q p que tais q e p adesprobabilid das função em (isto
n todo para , 1 1-n1 1-nq) (p pois 1, a igual é
1-n
1n
1n
3-n2
1-n
2
2-n
1-n
1
1-n
1-n
0
p . . . q p q p q
=+
==+
−
−
++
+
+
= n p.Conclusão: a média da distribuição binomial E(X) = n p.
b) Variância VAR (X)
===
+=
==
n
1x
xn-x
n
x
n
1x
xn-x
n
x
2
n
0x
22 q p . x 1) -(x x q p x p(x) x )X(E =
=
p n )X(E
n
1x
xn-x
n
x
n
2x
xn-x
n
x
q p x q p 1) -x(x
=
==
+
= n p +
=
n
2x
xn-x q p .
x)!- (n 2)! -(x 1) -(x x
n! 1)-x(x
=
= n p +
=
−
n
2x
xn-2-x2 q p
x)!- (n 2)! -(x
2)! - (n
p )1n(n = n p +
=
−
n
2x
x-n2-x
2-n
2-x
2 q p p)1n(n . Fazendo: x – 2 = y
= n(n-1)
2p .
n todo para 1, 2n-1 2n-q) (p pois
1, a igual ,2n-q) (p de ansãoexp
2n
0y
2-yn-y
2n-
y
q p
==+
+
−
=
+ n p = n(n-1) 2p + n p.
Portanto, VAR (X) = )X(E 2 - ( )2)X(E = n (n – 1)
2p + n p - 2)np( = n p q.
Nota: Sempre que um experimento é realizado com repetições independentes, e estivermos interessados apenas na
dicotomia, por exemplo: defeituoso ou perfeito – dureza acima ou dureza abaixo de certo padrão – nível de ruído
em uma sistema de comunicação acima ou abaixo de um padrão preestabelecido – , estaremos potencialmente
tratando de um espaço amostral no qual podemos definir uma variável aleatória binomial, desde que as condições
de experimentação permaneçam suficientemente estáveis de modo que a probabilidade de sucesso (ou fracasso)
permaneça constante.
37.
IV. Distribuição de POISSON ou Distribuição dos Eventos Raros
É uma distribuição de grande importância como um modelo probabilístico adequado para um grande número de
fenômenos aleatórios. No contexto deste curso, trataremos dessa distribuição como uma aproximação da distribuição
binomial.
Existem inúmeras situações em que, se considerarmos um pequeno intervalo (intervalo de tempo, de comprimento, de área,
etc.), a probabilidade de ocorrer um determinado evento é muito pequena (praticamente nula). Entretanto, se levarmos
em conta um número grande desses intervalos (tendendo para o infinito), a probabilidade passa a ser considerável. Essas
situações se identificam com a distribuição binomial: P(X = x) = x- nx
n
x
q p
quando n é muito grande e a probabilidade
p de ocorrência do evento sucesso é muito pequena, permanecendo X = n p constante. A distribuição de probabilidades,
nessas condições, segue mais exatamente a chamada Distribuição de Poisson.
A binomial caracteriza-se por dois elementos: n e p, enquanto a Poisson é caracterizada por uma única quantidade:
.t = , em que {
𝜆 é a freqüência média de sucessos no fenômeno e
t, o intervalo de observação pretendido.
Por exemplo: Suponha que um determinado processo de fabricação de perfil de alumínio apareçam em média uma falha a
cada 400 m, o que equivale a 0,0025 falhas/m. Esse é o valor de . É o número esperado de sucessos por unidade de
comprimento, por unidade de tempo, por unidade de área, e assim por diante.
Agora, se queremos estudar a distribuição do número de falhas que aparecerão em comprimentos de 1500 m, então esse
número será uma variável aleatória discreta X com falhas. 3,75 500 1 0,0025 .t === Essa é a média de Poisson.
Portanto, se X é o “número de sucessos no intervalo” , a probabilidade de ocorrer X = x sucessos no intervalo, é definida
por P(X = x) = t que em ,
!x
. e x
=
−
, denominada distribuição de Poisson ou dos Eventos Raros.
Matematicamente, a Distribuição de Poisson é um caso limite da Binomial, quando o número de provas n tende a infinito e a
probabilidade p do evento sucesso em cada prova tende a zero, e a quantidade t p n == mantém-se constante.
Vejamos:
q p
x)!- (n x!
n!
lim q p lim x- nx
n
x- nx
n
x n
==
+→+→
=
( ) ( )
( )
x- nx
n
p) - (1 .p .
x!
1
.
x)- (n . 1) (x - n . . . . . 3 . 2 . 1
n . 1) - (n . 2) - (n . . . . . 1) -(x - n . x)- (n . 1) (x - n . . . . . 3 . 2 . 1
lim
+
+
+→
=
=
( ) x- nx
n n
- 1 .
n
.
!x
1) -(x - n . . . . . 2) - (n . 1) - (n . n
lim
+→
=
= =
=
( ) xnx
n n
- 1 .
n
- 1 .
!x
.
n . . . . n . n . n
1) -(x - n . . . . . 2) - (n . 1) - (n . n
lim
−
+→
=
=
!x
. e
n
- 1 .
n
- 1 .
!x
.
n
1 -x
- 1 . . . . .
n
2
- 1 .
n
1
- 1 . 1 lim
x -
1 a tende
x
-e a tende
nx
n
=
−
+→
= P(X = x)
( ) xnx
x n n
μ
- 1 .
n
μ
- 1 .
!x
μ
.
n
1) -(x -n . . .. 2). -(n . 1) -(n .n
lim
−
+→
38.
Parâmetros da distribuição de Poisson
a) Média E(X)
E(X) =
+
=
+
=
+
=
+
=
+
=
−
=
−
=
−
=
=
1x
1-x
-
1x
x
-
1x
x -
0x
x -
0 x
)!1x(
e
)!1x(
e
)!1x(
. e
!x
. e
. x p(x) . x .
Fazendo x – 1 = y :
E(X) = . e .e . . . .
!3
!2
1 e
!y
e -
e função da Maclaurin de Série
32
-
0y
y
- ==
+
+
++=
+
=
b) Variância VAR (X)
+
=
+
=
+
=
+=
==
0x
x
-
0x
x -
2
0x
22
!x
. x 1) -(x x e
!x
. e
x )x(p x )X(E =
=
=
+
=
+
=
+
=
+
=
− −
+
−
=
+
)X(E
1x
x
-
2x
x
-
0x
x
-
0x
x
)!1x(
e
)!2x(
e
!x
x
e
!x
1) -(x x
e =
+
+
+
++=+
−
+
=
− . . .
!3
!2
1 .e
)!2x(
. .e
e função da Maclaurin de Série
32
2 -
2x
2 -x
2
=
+=+ − e . . e 22 .
Portanto, VAR (X) = . - - )X(E 2222 =+=
Conclusão: E(X) = = VAR (X)
Exemplo: O número de acidentes do tipo afogamento nas grandes temporadas em uma determinada cidade litorânea é uma
Distribuição de Poisson cuja frequência média é de um a cada 50 000 habitantes. Qual a probabilidade de que em 175 000
habitantes ocorra exatamente três acidentes ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................Exercícios sobre as distribuições discretas de probabilidades
01. Suponha que 7 tentativas independentes de um determinado experimento aleatório são realizadas, e que cada tentativa
admite evento sucesso com probabilidade
1
5
. Se a variável aleatória X representa o número de sucessos, então encontre
P( 0 < X ≤ 2 ).
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
39.
02. Suponha que numa determinada região do planeta, o número de infectados por um determinado vírus é de um a cada
80 000 habitantes. Numa população de 260 000 pessoas, qual a probabilidade de haver no máximo um infectado ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
03. A probabilidade de uma bem sucedida, em cada experiência química em laboratório, é igual a 30%. Calcule a
probabilidade de que seja necessário realizar 5 experiências para obter uma bem sucedida pela 1ª. vez .
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
04. O setor de controle de qualidade de uma indústria examina lotes de 20 peças fabricados em série. Sabe-se que 30%
apresentam defeitos. Escolhendo-se 4 peças, ao acaso, sem reposição, qual a probabilidade de obter no mínimo uma com
defeito?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
05. Uma caixa contém 20 unidades de um determinado produto, sendo 8 piratas e 12 originais. Qual a probabilidade de que
a) de 10 extraídas, sem reposição, ocorram 4 piratas?
b) em 9 extraídas, com reposição, ocorra no mínimo duas piratas?
Solução:
a) É uma variável hipergeométrica em que a ¨característica ¨ é o produto ¨ pirata ¨ com N = 20 , r = 8 e n = 10.
Portanto, P(ocorrer 4 piratas, sem reposição) = P(ocorrer 4 piratas e 6 originais) =
10,20
12,64,8
C
C C
35,01%.
b) Se for com reposição, é uma variável binomial X: ¨ número de sucessos (piratas) em n = 9 ¨ tal que
p = 0,40 (sucesso) e q = 0,60 (fracasso).
Portanto, P(ocorrer no mínimo duas piratas) = P(X 2) = 1 - P(ocorrer no máximo 1 pirata) =
= 1 - P(X = 0 ou X = 1) = 1 - 0,0706 - 1 (0,60) (0,40) (0,60) (0,40) 81
9
1
90
9
0
+
= 92,94%.
40.
06. Uma caixa contém 10 bolas, sendo 6 brancas e 4 pretas. Qual a probabilidade de que a 5ª. extraída, com reposição, seja
a primeira bola preta ? Resp: 5,18%
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
07. Na corrida dos 100 m rasos, um atleta tem 70% de probabilidade de fazer em menos de 0t segundos. Se 5 tentativas
independentes forem realizadas, qual a probabilidade de conseguir, em menos de 0t segundos, pelo menos 3 vezes ?
Resp: 83,69%
............................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
08. Um setor de Controle de Qualidade de uma indústria está dimensionado de forma a poder atender, no período diário
normal, até 2 pedidos de serviço; se chegarem mais que 2 pedidos, o pessoal deve recorrer a horas extras para cumprir o
atendimento. Sabendo-se que o número de pedidos que chegam diariamente distribui-se segundo uma Poisson de média
2,5 pedidos, qual a probabilidade da necessidade de ter que fazer horas extras num certo dia? Resp: 45,62%
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
09. De um grupo de 30 estudantes, sendo 20 da Capital e 10 do interior, escolhe-se ao acaso, 7 estudantes para formar uma
comissão. Qual a probabilidade de ter uma comissão de 4 estudantes da Capital e 3 do interior ? Resp: 28,56%
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
Testes (somente uma alternativa é verdadeira)
10. Nos treinos para definir a largada de uma corrida de Fórmula 1 , um piloto tem 60% em uma única volta obter um ótimo
resultado. Em 6 tentativas (voltas), a probabilidade de obter no máximo um péssimo resultado é, aproximadamente,
a) 13,69%
b) 23,33%
c) 25,66%
d) 27,35%
e) 33,33%
41.
11. Num determinado processo de fabricação, 10% das peças são consideradas defeituosas. As peças são acondicionadas
em caixas com 4 (quatro) unidades cada uma. Se a empresa paga uma multa de R$ 20,00 por caixa em que houver alguma
peça defeituosa, então o valor esperado da multa num total de 100 caixas é igual a
a) R$ 343,90
b) R$ 687,80
c) R$ 439,90
d) R$ 630,80
e) R$ 339,90
12. Em uma determinada superfície aparecem aleatoriamente à razão de um defeito a cada 2 m
2
, e segue uma Distribuição
de Poisson. A probabilidade de que um quadrado nessa superfície com 2,4 m de lado tenha no mínimo um defeito, é
aproximadamente igual a
a) 94,39%
b) 92,42%
c) 90,36%
d) 89,44%
e) 88,32%
13. Considere que o custo de realização de um determinado experimento seja de R$ 1 600,00. Se o experimento falhar,
ocorre um custo adicional de R$ 480,00 em função da necessidade de algumas alterações antes que a próxima tentativa seja
executada. Sabe-se que a probabilidade de sucesso em cada uma das tentativas é 25%, e as provas são independentes e
os experimentos continuam até que o primeiro resultado positivo seja alcançado. O custo esperado do procedimento completo
é, em reais,
a) 1000
b) 2080
c) 6840
d) 7840
e) 8320
14. Seja o evento A: ¨ um aluno, obter uma nota maior ou igual a 6,0 numa determinada prova ¨ . Se p(A) = 0,40, então
a probabilidade desse aluno precisar realizar 6 vezes a prova para conseguir pela 1ª. vez o evento A, é
a) 0,61%
b) 3,11%
c) 4,67%
d) 7,78%
e) 10,24%
15. Na revisão tipográfica de um livro, achou-se em média 120 erros em 100 páginas. Das 800 páginas do livro, o número
esperado de páginas que não precisam ser modificadas por não apresentarem erros
a) está entre 239 a 242
b) é menor que 234
c) é maior que 245
d) está entre 236 e 239
e) é impossível de estimar
42.
VARIÁVEIS ALEATÓRIAS CONTÍNUAS
I. Integral Definida
Se f é uma função contínua no intervalo [ a , b ], então
b
a
dx f(x) = F(b) – F(a), é chamada integral definida da função
f(x) em [ a , b ] , em que F(x) é uma primitiva de f(x) no intervalo, ou seja, 'F (x) = f(x) para todo x pertencente
ao intervalo.
No contexto dessa disciplina, trataremos caso em que f é contínua e f(x) ≥ 0 em [ a . b ] . Neste caso, o valor da integral
definida
b
a
dx f(x) = F(b) – F(a) , em unidades de superfície, representa a medida da área da região do plano limitada pela
curva f , o eixo das abscissas x no intervalo [ a , b ].
f(x)
0 x
Exemplos
y
a) ∫ x dx
3
1
= ...............................................................................................
..........................................................................................................................
0 x
b) ∫ 0 dx
4
1
= ................................................................................................. y0 1 4 x
c) ∫ x22
−1
dx = .............................................................................................. y
.........................................................................................................................
0 x
43.
Nota: Integrais do tipo ∫ 𝐟(𝐱) 𝐝𝐱 , ∫ 𝐟(𝐱) 𝐝𝐱 , ∫ 𝐟(𝐱) 𝐝𝐱
+∞
−∞
𝟎
−∞
+∞
𝟏
, são chamadas de integrais
impróprias.
II. VARIÁVEIS ALEATÓRIAS CONTÍNUAS
Diz-se que uma variável X é uma variável aleatória contínua, se existir uma função f, denominada função densidade
de probabilidade (f.d.p.) de X, que satisfaça às condições:
a) real. x todo para 0, )x(f
b) 1. dx f(x)
-
=
+
c) Quaisquer que sejam a e b (reais) com a < b, tem-se: =
b
a
dx f(x) b) X a(P = F(b) - F(a)
f(x)
0 x
Como identificar, se uma dada função f , representa uma FUNÇÃO DENSIDADE DE PROBABILIDADE ?
Verificando, se a 1. dx f(x)
-
=
+
Exemplo: A função f definida por f(x) = {
3
8
x2 , se 0 ≤ x ≤ 2
0 , se x < 0 ou x > 2
, é uma função densidade de probabilidade
de uma variável aleatória contínua X ?
f(x)
0 x
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
44.
Podemos estender as definições dos parâmetros das variáveis aleatórias discretas para as variáveis aleatórias contínuas.
a) Média ou valor esperado: E(X) =
+
-
dx f(x) x = X .
b) Variância: VAR (X) = ( ) ( ) ( ) 2
X
2
X
-
22
X
222 - dx f(x) x - )E(X E(X) - )X(E ===
+
.
Exercícios sobre as distribuições contínuas de probabilidades
01. Uma variável aleatória contínua X tem função densidade de probabilidade dada por
f(x) = {
1
9
x2 , se 0 ≤ x ≤ 3
0 , se x < 0 ou x > 3
. f(x)
Pede-se: a) o gráfico da f.d.p.
b) a probabilidade P( 1 ≤ X ≤ 2 )
c) a média E(X)
d) a variância VAR(X) 0 x
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
y
02. A f.d.p. de uma variável aleatória contínua X é dada por f(x) =
contrário. se , 0
e x 1 se ,
x
1
.
Calcule a média E(X) , o desvio-padrão σ(X) e o 3º.quartil. 0 x
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
45.
03. Uma variável aleatória contínua X tem fdp dada por f(x) = {
e− x , se x ≥ 0
0 , se x < 0
f(x)
Calcule P(X ≥ 2).
.........................................................................................................................................
................................................................................................................
.........................................................................................................................................
........................................................................................................................................
0 x
.........................................................................................................................................
.........................................................................................................................................
Testes (somente uma alternativa é verdadeira)
04. Seja uma função f definida por f(x) = {
kx, se 1 ≤ x ≤ 4
0, se x < 1 ou x > 4
. Para o valor de k de modo que f(x) seja uma
função densidade de probabilidade, a variância VAR (X) é igual a
a) 0,64
b) 0,65
c) 0,66
d) 0,67
e) 0,68
05. Uma variável aleatória contínua X tem função densidade de probabilidade definida por
f(x) = {
1
4
x3, se 0 ≤ x ≤ 2
0, se x < 0 ou x > 2
. A probabilidade P( 1 ≤ X ≤ 1,5 ), em porcentagem, é um número entre
a) 12,5 a 18,5
b) 16,0 a 23,5
c) 20,5 a 25,0
d) 24,5 a 28,0
e) 26,0 a 30,5
06. Uma variável aleatória contínua T tem função densidade de probabilidade dada por
f(t) = {
3
26
t2 , se 1 ≤ t ≤ 3
0 , se t < 1 ou t > 3
. A mediana dessa distribuição com aproximação de 2 casas decimais, é
a) 2,35
b) 2,38
c) 2,40
d) 2,41
e) 2,43
47.
Principais propriedades da função de Gauss
PRIMEIRA: 1 dx f(x)
-
=
+
. Como f é contínua em todo IR e f(x) > 0, a integral representa a área da região limitada pela f
no intervalo +− x . De fato, seja t - x seja ou t
- x
==
e dx = σ dt. Substituindo:
I =
+
-
2
2t
-
dt e
2
1
. Portanto,
+
−
+
−
= dv e dt e
2
1
I 2
2v
-
2
2t
-
2 =
+
++
-
2
)2v 2(t
-
-
dt dv e
2
1
. Introduzindo
coordenadas polares
=
=
sen r t
cos r v
, o elemento de área dv dt torna-se r dr dθ . Como v e t variam entre
+− e , r varia de 0 a + , enquanto varia de 0 a 2 π . Podemos, então escrever
+
+
=
=
2
0
0
2
2r
-
0
2
2r
-
2
0
2 de -
2
1
dr e r d
2
1
I = ( ) 1. 0 - 2
2
1
d
2
1
2
0
=
=
SEGUNDA: E(X) = e VAR (X) = 2 . De fato, seja dt dx t
- x
=→=
. Portanto,
a) E(X) = =+
=
=
+
+
−
+
dt e ) t (
2
1
dxe x
2
1
dx f(x) x 2
2t
-
-
2
-x
2
1
-
-
=
1 a igual é e
curva a sob área a é
-
2
2t
-
ímpar é integrando
o pois NULO, é
-
2
2t
-
dt e
2
1
dt e t
2
+
+
+
= =+
1 . 0 .
2
=→ E(X)
b) VAR (X). Calculamos
+
+
==
-
2
-x
2
1
-
2
-
22 dx e x
2
1
dx f(x) x )X(E . Fazendo a mesma substituição feita
para E(X), tem-se )X(E 2 = dt e ) t (
2
1
-
2
2t
-
2
+
+
=
=
1 a igual é
-
2
2t
-
2
ímpar é integrando
o pois NULO, é
-
2
2t
-
-
2
2t
-
22 dt e
2
1
dt e t
2
1
2 dt e t
2
1
+
+
+
+
+
.
,dt e t
2
1
-
2
2t
-
2
+
→ aplicando Integração por Partes
=⎯⎯→⎯=
=⎯⎯ →⎯=
2
2t
-
2
2t
-
dif.
e - v dt e t dv
dt du t u
=
1 a igual é
-
2
2t
-
ímpar é função
a pois , NULO é
2
2t
-
dt e
2
1
e t
2
1
+
+
−
+
− = 0 + 1 = 1.
Com isso, 22222 ) 1 ( ) 0 ( 2 1) 0 ( )X(E +=+++= . Mas, a variância é dada por
VAR (X) = ( ) . - E(X) - )X(E 222222 =+=
48.
TERCEIRA: O gráfico da f.d.p. da distribuição normal é SIMÉTRICO em relação à reta x = μ , é o eixo de simetria da curva
de Gauss. E os limites: f(x) lim 0 f(x) lim
- x x →+→
== , ou seja o eixo das abscissas Ox é uma assíntota horizontal.
QUARTA: A f.d.p. de Gauss assume ponto de máximo relativo em
2
1
, e não tem mínimo relativo. Ainda, ela assume
pontosde inflexão nos pontos de abscissa . - x e x =+=
De fato, se f(x) =
2
- x
2
1
-
e
2
1
, então
2
-x
2
1
-
e .
- x1
-
2
1
(x)' f
dx
df
== . Assim, 0 (x)' f = implica
que 0 xseja ou 0 - x = = é um ponto crítico.
Calculando a derivada da função ( )
2
-x
2
1
-
3
e - x
2
1
- (x)' f
= , tem-se:
( )
+
==
2
-x
2
1
-
2
-x
2
1
-
32
2
e
-x
1
- - x e . 1
2
1
- (x)'' f
dx
fd
=
1 -
) -(x
e
2
1
2
2
2
-x
2
1
-
3
. Claro que )('' f = 0
2
1
- 1) - 0 ( e
2
1
3
0
3
=
, o que garante o
ponto crítico x0 = μ como abscissa do ponto de máximo relativo, e a sua ordenada é )(f =
=
2
1
e
2
1 0 .
Portanto, as coordenadas desse ponto são
2
1
, .
Quanto aos pontos de inflexão, temos: 0 1 -
) -(x
0 (x)'' f
2
2
=
→= 1
-x
2
=
→ →
=
+=
→=→=
→
- x
x
- x 1
-x
+ +− - +
c.v.c c.v.b c.v.c.
Pelo sinal da (x)'' f verifica-se que =+= - x e x são pontos em que o gráfico da f.d.p. muda de concavidade, ou
seja são abscissas de pontos de inflexão.
Cálculo de probabilidades
Por tratar-se de um modelo de distribuição contínua, a probabilidade da variável X assumir um valor exatamente x0 é nulo,
ou seja, P(X = x0) =
0x
0x
dx f(x) = 0. Assim, é indiferente escrever as probabilidades b) X P(a ou b) X a(P .
Portanto, a probabilidade
==
b
a
2
-x
2
1
-b
a
dx e
2
1
dx f(x) b) X a(P , é a área da região limitada pela curva
normal entre as retas x = a e x = b.
49.
z1 𝑧2
Entretanto, não é possível calcular a integral
1
𝜎√2𝜋
∫ e
-
1
2
(
x - 𝜇
𝜎
)
2
dx
𝑏
𝑎
analiticamente, a não ser por métodos
numéricos. Dessa forma, surge a ideia de construir uma tabela de valores dessas integrais que não dependam de μ e σ .
Assim, o problema é resolvido por meio de uma transformação linear de X para Z tal que Z
- X
=
, que conduz à
chamada distribuição normal padronizada ou distribuição normal reduzida. Essa nova variável Z é de fato, uma normal
com .
1 (Z) VAR
e 0 E(Z)
=
=
Vejamos: E(Z) = ( ) 0 ) - (
1
)E( - E(X)
1
- X E
1
- X
E =
=
=
=
e
VAR (Z) = VAR )( VAR (X) VAR
1
) - (X VAR
1
- X
22
=+
=
=
= 1. .
1
0) (
1 2
2
2
2
=
=+
Conclusão: Se X : ) , (N 2 , então Z : ) 1 , 0 (N
50.
Note que essa mudança de variável consiste, basicamente, em fazer uma translação da curva de Gauss de modo que a curva
fique simétrica em relação ao eixo das ordenadas.
De
x − μ
σ
= z tem-se x - μ = σ z e a diferencial dx = σ dz . Substituindo na integral:
= P(z1 Z z2) =
−
−
− bxa
P
f(z) =
1
√2π
e−
1
2
𝑧2
𝑧1 𝑧2
Distribuição normal padronizada (ou reduzida)
Dada a simetria da curva normal, tabelou-se apenas para os valores de z positivos, ou seja 0z z 0 . Assim,
=
0z
0
2z
2
1
-
0 dz e
2
1
)z Z 0(P é o valor tabelado, conhecido como área de uma distribuição normal padrão.
Existem tabelas de vários tipos, mas neste curso usaremos a mais simples cujos valores das integrais são aproximados com
quatro casas depois da vírgula.
=
=
=
=
dz e
2
1
dz .e
2
1
dx e
2
1
b) X a(P
2z
1z
2z
2
1
-
- b
- a
2z
2
1
-
b
a
2
-x
2
1
-
52.
Exercícios sobre as distribuições normais de probabilidades
01. A resistência de uma peça cromada a um ensaio de corrosão se distribui normalmente em torno da média 80 horas com
desvio-padrão de 10 horas. Qual a probabilidade de uma peça resistir
a) no máximo 93,4 horas ?
b) no mínimo 89,8 horas ?
c) entre 69,5 horas e 98,7 horas ?
d) entre 59,7 horas e 70,2 horas ?
e) pelo menos 62,5 horas ?
..................................................................................................................................................................................
..................................................................................................................................................................................
..................................................................................................................................................................................
a)
..............................................................................................................................
..............................................................................................................................
..............................................................................................................................
b)
..............................................................................................................................
..............................................................................................................................
..............................................................................................................................
c)
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................d)
............................................................................................................................
............................................................................................................................
............................................................................................................................
............................................................................................................................
e)
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
...........................................................................................................................................
53.
02. Considere que as notas de uma determinada disciplina se distribuem normalmente em torno da média 7,2 e desvio-
padrão de 2. Se 20,9% (dos que tiveram as melhores notas ) serão dispensados da prova final, então calcule a nota mínima
para essa dispensa?
f(x)
.............................................................................
.............................................................................
.............................................................................
..............................................................................
0 7,2 x
..............................................................................
f(z) ..............................................................................
..............................................................................
...............................................................................
..............................................................................
0 z
03. Em uma distribuição normal de média 310 e desvio-padrão 30 , qual é o 33p ( 33º. percentil ) ?
f(x) f(z)
0 310 x 0 z
..................................................................................................................................................................................
..................................................................................................................................................................................
..................................................................................................................................................................................
04. Uma variável aleatória X tem distribuição normal de média 𝜇 e desvio-padrão 𝜎 . Determine a proporção dos valores
compreendidos entre 𝜇 − 1,08 𝜎 𝑒 𝜇 + 1,08 𝜎 .
.................................................................................................................................................................................
..................................................................................................................................................................................
..................................................................................................................................................................................
..................................................................................................................................................................................
..................................................................................................................................................................................
.................................................................................................................................................................................
55.
07. Os preços de um determinado tipo de celular têm distribuição normal com valor médio de R$ 1500,00 com
desvio-padrão de R$ 250,00. Qual a probabilidade de um desses celulares custarem entre R$ 1140,00 e R$ 1295,00 ?
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
............................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
08. A durabilidade de um tipo de pneu da marca Goodfire é descrita por uma variável aleatória normal de média
60 000 km e desvio-padrão de 6 500 km.
a) Qual a probabilidade de um pneu desse tipo durar no mínimo 54 540 km? Resp: 79,95%
b) Qual a garantia, em quilômetros, que a Goodfire deve dar para que reponha no mercado no máximo 6,3% dos pneus?
Resp: 50 055 km
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
09. Uma variável aleatória X se distribui normalmente com média μ e variância σ2 . Sabe-se que tem 33% de probabilidade
para valores abaixo de 60, e 2,5% de probabilidade para valores acima de 90. Qual é a média μ e o desvio-padrão σ
nessa distribuição ? Resp: μ = 65,5 e σ = 12,5
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
57.
12. Uma variável aleatória contínua X tem distribuição normal de média 400 e desvio-padrão 50.
Determine o p14 ( 14º. percentil ).
Resp: 346
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
............................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
13. Se X é uma variável normal de média 100 e desvio-padrão 10, então qual é o valor real de k de modo que
P ( 100 - k X 100 + k ) = 95% ? Resp: 19,6
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
14. O número de pedidos para compra de certo produto que uma companhia recebe por semana tem distribuição normal com
média 125,5 unidades e desvio-padrão de 25 unidades.
a) Se em uma semana o estoque disponível é de 155 unidades, qual a probabilidade de que todos os pedidos sejam
atendidos ? Resp: 88,10%
b) Qual deveria ser o estoque E para que se tenha 95,15% de probabilidade de que todos os pedidos sejam atendidos ?
Resp: E = 167
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
58.
Testes (somente uma alternativa é verdadeira)
15. Os preços de um determinado tipo de computador têm distribuição normal com valor médio de R$ 1800,00 com
desvio-padrão de R$ 400,00. Numa determinada semana constatou-se que os preços estavam entre R$ 1200,00 e
R$ 1700,00. A probabilidade dos preços estarem acima de R$ 1500,00 é aproximadamente
a) 22,59%
b) 37,32%
c) 52,23%
d) 60,45%
e) 64,23%
16. Uma máquina de empacotar um certo produto oferece variações de peso com desvio-padrão de 20 g, e se distribui
normalmente em torno da média μ. Em quanto deve ser regulado o peso médio μ do pacote desse produto para que 11,7%
tenham no máximo 360,2 g ? É verdade que esse peso médio μ é um número
a) quadrado perfeito
b) múltiplo de 5
c) divisível por 6
d) múltiplo de 7
e) divisível por 9
17. Se uma variável X distribui normalmente com média 400 e desvio-padrão 20, então o valor de k (real) de modo que
( )k400X6,380P + = 81,9% é um número
a) maior que 42,3
b) entre 25,5 e 34,4
c) entre 30,2 e 40,4
d) menor que27,3
e) inteiro
18. Em uma distribuição normal de média 110,6 e desvio-padrão 15, o 67p (67º. percentil) é igual a
a) 108,4
b) 112,6
c) 114,2
d) 116,8
e) 117,2
19. Uma variável aleatória contínua X é normal com média μ = 7,2 e variância 𝝈𝟐. Se a proporção dos valores para
x ∈ ] −∞ ; 6,33 ] é igual a 28,1% , então σ é um número
a) maior que 1,6
b) entre 1,4 e 1,7
c) irracional
d) inteiro
e) entre 1,6 e 1,8
59.
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA
Amostras aleatórias
Seja X uma variável da população de média μ e variância σ2. Uma amostra aleatória de X de tamanho n , é
um conjunto de n variáveis aleatórias independentes n321 X,...,X,X,X , em que iX , ni1 , indica o elemento
da população obtido quando o i-ésimo elemento for escolhido ; cada uma com a mesma distribuição de probabilidades
de X. Ou seja, E( iX ) = μ e VAR( iX ) = σ2 , ni1 .
Obtida uma amostra, podemos estar interessados em qualquer característica da amostra (média, variância, etc.) . Se
for a MÉDIA da amostra ( n321 X,...,X,X,X ) , a variável )X...XXX(
n
1
X n321 ++++= , quando a
amostra assume todos os valores possíveis, é chamada DISTRIBUIÇÃO AMOSTRAL DA MÉDIA.
Se N é o número de elementos da população, e n o número de elementos da amostra, então
a) com reposição, teremos Nn amostras possíveis e
b) sem reposição, obtermos CN ,n amostras possíveis.
População X distribuição X
n amostra 1 1x
n amostra 2 2x
n amostra 3 3x
n amostra 4 4x
...... ............... .... ...
Se a população é identificada pela variável X com E(X) = μ e VAR(X) = σ2
, então
a) E(X) = ............................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
.
b) VAR (X) = .........................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.
CONCLUSÃO: E (X) = μ e σ (X) =
σ
√n
62.
Exercícios sobre a distribuição amostral da média
01. Para ilustrar o que concluímos na pág. 59, seja X uma população constituída dos elementos { 2 , 3 , 4 , 5 }.
Vamos extrair, ao acaso, com reposição, amostras de tamanho n = 2 elementos. Portanto, Nn = 42 = 16 é o
número de amostras possíveis . As possíveis amostras são :
(2 , 2) (2 ,3) (2 , 4) (2 , 5)
(3 , 2) (3 , 3) (3 , 4) (3 , 5)
(4 , 2) (4 ,3) (4 , 4) (4 , 5)
(5 , 2) (5 , 3) (5 , 4) (5 , 5)
Calculando para cada amostra sua média, obtemos a população de médias de amostras de tamanho n = 2
2,0 2,5 3,0 3,5
2,5 3,0 3,5 4,0
3,0 3,5 4,0 4,5
3,5 4,0 4,5 5,0
E a distribuição de probabilidades da variável aleatória X é :
x̅ 2,0 2,5 3,0 3,5 4,0 4,5 5,0
p( x̅ )
1
16
2
16
3
16
4
16
3
16
2
16
1
16
Confira, se E ( X ) = E( X ) e VAR ( X ) =
VAR ( X )
n
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................63.
02. Uma variável aleatória X se distribui normalmente com média 100 e desvio-padrão 10.
a) Calcule a probabilidade P( 90 ≤ X ≤ 110 )
b) Se X for a média de uma amostra de 4 elementos retirados dessa população X, então calcule P( 90 ≤ X ≤ 110 ).
c) Represente, num único gráfico, as distribuições X e X .
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
y
100 X , X
03. Uma variável aleatória X tem distribuição normal com média 10 e desvio-padrão 4. Aos participantes de um jogo é
permitido observar uma amostra de qualquer tamanho e calcular a média amostral : ganha um prêmio aquele cuja média
amostral for maior que 12. Se um participante escolher uma amostra de tamanho 16, qual a probabilidade de ele ganhar
um prêmio ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
64.
04. Uma variável aleatória X tem distribuição normal com 10. e 100 == Se X é a média amostral de X , então
qual deve ser o tamanho da amostra n para que P( 92 ≤ X ≤ 108 ) = 95% ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
05. A durabilidade de um certo tipo de componente para a mecânica de precisão é uma variável aleatória contínua X com
distribuição normal de média 5 anos e desvio-padrão de 8 meses. Para uma amostra aleatória de tamanho 25 , qual a
probabilidade da média amostral X estar entre 56 meses e 58,4 meses ? Resp: 15,25%
......................................................................................................................................................................................................
......................................................................................................................................................................................................
...........................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
06. Uma máquina de empacotar um determinado produto o faz segundo uma distribuição normal com média e desvio-
padrão = 20 g.
a) Quanto deve ser regulado o peso médio μ para que apenas 10% dos pacotes tenham menos que 500 g ?
Resp: 525,6 g
b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes escolhidos ao acaso seja inferior
a 2 kg ? Resp: 0,52%
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
66.
09. Um fabricante de baterias alega que a durabilidade do seu produto se distribui normalmente em torno da média 50 meses
com desvio-padrão de 5 meses. Para uma amostra de 100 observações, a probabilidade da média amostral ser no máximo
de 49,3 meses é
a) 6,08%
b) 7,08%
c) 8,08%
d) 9,08%
e) 10,08%
10. Suponha que a estatura X dos alunos da FATEC-SP tenham distribuição normal de média 173 cm com desvio-
padrão de 15 cm. Para uma amostra aleatória de 36 alunos, a probabilidade da média amostral X se
situar entre 169,9 cm e 177,9 cm , em porcentagem, é um número
a) entre 69 e 85
b) entre 83 e 89
c) menor que 85
d) maior que 87
e) inteiro
11. Seja X uma variável aleatória normal de média 60 e desvio-padrão 12. Para uma amostra aleatória de tamanho n = 25,
determine a probabilidade da média amostral X̅ ser no mínimo de 56,4 é igual a
a) 6,68%
b) 19,45%
c) 56,68%
d) 86,78%
e) 93,32%
12. A capacidade máxima de um elevador é de 560 kg. Se a distribuição X dos pesos dos usuários é uma normal com
𝜇 = 70 kg e 𝜎 = 10 kg, a probabilidade de 9 passageiros ultrapassarem esse limite
a) está entre 0,93 e 0,96
b) é menor que 0,97
c) está entre 0,94 e 0,97
d) é maior que 0,98
e) é igual a 0,95
67.
NOÇÕES BÁSICAS SOBRE ESTIMAÇÃO POR INTERVALOS DE CONFIANÇA
É o processo que consiste em utilizar dados amostrais para estimar os valores de parâmetros populacionais
desconhecidos. Basicamente, qualquer característica de uma população pode ser estimada a partir de uma amostra aleatória.
Entre os mais comuns, estão a média e a variância de uma população, e a proporção populacional.
Uma forma de expressar a estimação de parâmetros populacionais desconhecidos é construir um intervalo [ L1 , L2 ]
de forma que (1 - α ) seja a probabilidade do intervalo [ L1 , L2 ] conter o verdadeiro valor do parâmetro populacional. Essa
é a configuração da estimação por intervalo, e o intervalo assim construído é denominado intervalo de confiança.
O valor da probabilidade (1 - α ) que, em geral, assume valores 90% , 92% , 95% , 98% , . . . é conhecido por nível de
confiança, e o valor de α como nível de significância (é a porcentagem da incerteza desta inferência). Ou seja, α é a
probabilidade de erro na estimação por intervalo.
Assim, o intervalo de confiança conterá ou não o parâmetro, com probabilidades .α e )α - 1( É bom frisar que, é
incorreto a afirmação: “(1 - 𝛂) é a probabilidade do parâmetro cair no intervalo”.
I. Intervalo de confiança para a média da população 𝛍, quando a variância populacional 𝛔𝟐 é conhecida
Suponhamos que a distribuição amostral da média X seja normal; isto ocorrerá se a população X for normalmente
distribuída ou caso contrário, com boa aproximação, se a amostra for suficientemente grande. (TEOREMA DAS
COMBINAÇÕES LINEARES e TEOREMA DO LIMITE CENTRAL ) . Ou seja,
Distribuição da população X : N ( 2 , ) , μ - parâmetro que desejamos estimar.
Distribuição amostral da média )
n
, ( N : X
2
com
n
- X
Z
= e Z : N (0 , 1).
Portanto, retirada uma amostra simples de tamanho n, e calculada a média da amostra x, construímos um intervalo
[ L1 , L2 ] em torno de x de forma que esse intervalo contenha a verdadeira média μ com nível de confiança
igual a (1 - α ) .
Intervalo de confiança
| • |
𝐋𝟏 x 𝐋𝟐
68.
Ilustrando graficamente:
f(X̅)
0 x̅ x̅
f(�̅�)
0 z̅
Com o nível de significância α , determina-se z0 tal que 1 - 𝛼 = P ( - z0 ≤ 𝑧 ≤ + 𝑧0)
Portanto, 1 - 𝛼 = P ( - 𝑧0 ≤ 𝑧 ≤ + 𝑧0) = P (- z0 ≤
x - μ
σ
√n
≤ z0) =
............................................................................................................................. .......................
............................................................................................................ ........................................
............................................................................................................................. .......................
....................................................................................................................................................
............................................................................................................................. .......................
....................................................................................................................................................
69.
Conclusão: A expressão do intervalo de confiança para a média μ da população, ao nível de confiança 1 - 𝛼 será
1 – 𝛼 = P ( x − z0
σ
√n
≤ μ ≤ x + z0
σ
√n
)
Como essa forma de escrever leva os estudantes a interpretar de forma errada, escrevemos:
IC ( 𝝁 , 1 - 𝜶) = [ x − z0
σ
√n
; x + z0
σ
√n
]
O intervalo de confiança para a média μ é centrado na média amostral x.
Intervalo de confiança
| • |
x − z0̅
σ
√n
x 𝑥 + 𝑧0
𝜎
√𝑛
Exemplo de IC com 𝛔𝟐 conhecida: Uma máquina enche pacotes de café, segundo uma normal com um desvio-
padrão igual a 10 g. Ela estava regulada para enchê-los com 500 g em média. De repente, ela se desregulou, e deseja-se
saber qual a nova média μ. Se uma amostra de 25 pacotes apresentou uma média igual a 485 g , construa um intervalo de
confiança para a média ao nível de 95% de confiança.
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
Reafirmando: Muitas vezes, o intervalo de confiança indicado P (481,08 ≤ μ ≤ 488,92 ) = 95%, é
confundido como sendo “95% é a probabilidade do parâmetro cair dentro do intervalo”, o que constitui um erro, porque μ é
um parâmetro (número), e ele está ou não no intervalo. Por esse motivo, como supramencionado, prefere-se neste curso
indicar o intervalo de confiança :
IC (𝜇, 95%) = [ 481,08 ; 488,92 ] (gramas)
Qualquer que seja a forma de representar o IC, deve-se interpretar que:
• O intervalo [481,08 ; 488,92] contém o peso médio do pacote de café com 95% de confiança. Isto significa que, se
construíssem intervalos dessa mesma forma, para um grande número de amostras, em 95% dos casos, os intervalos
conteriam o peso médio μ. Portanto, 5% é o risco do IC não conter μ.
• Em uma amostra qualquer, a probabilidade de que o intervalo [481,08 ; 488,92] contenha o verdadeiro valor do peso
médio μ é de 95%.
70.
Distribuição
amostral da média
| | |
x
)96,1( − μ
x
)96,1( + x
amostra 1
x1 )96,1(x − 1x
x1 )96,1(x +
amostra 2
x2 )96,1(x − 2xx2 )96,1(x +
amostra 3
x3 )96,1(x − 3x
x3 )96,1(x +
amostra 4
x4 )96,1(x − 4x
x4 )96,1(x +
POPULAÇÃO
X com ......................................................................... ..........................
μ e 2
......................................................................... ..........................
amostra k
xk )96,1(x − kx
xk )96,1(x +
Nem todos os intervalos de estimação baseados nas médias de k amostras contém a verdadeira média μ. Para nível
de confiança de 95%, significa que 95% dos intervalos contém o parâmetro μ .
Graus de liberdade
“O número de graus de liberdade 𝝂 é definido como sendo o número de observações independentes da amostra
(tamanho da amostra) menos o número k dos parâmetros populacionais que devem ser estimados por meio de
observações amostrais: 𝝂 = n – k “.
71.
Uma ideia sobre o número de graus de liberdade: O termo graus de liberdade resulta do fato de que os n
desvios 𝑥1 - 𝑥 , 𝑥2 - 𝑥 , . . . , 𝑥𝑛 - 𝑥 têm soma nula, de modo que a especificação de n – 1 de
quaisquer dessas quantidades determina, automaticamente, a restante. Dessa forma, apenas n – 1 dos n
desvios 𝑥𝑖 - 𝑥 são independentes.
Tecnicamente, estão relacionados com a liberdade de variação num conjunto de escores. Se tivermos uma
amostra de 20 escores, então 19 deles têm “liberdade” de variar, enquanto um e apenas um é fixo no que diz
respeito ao valor. Portanto, em uma amostra simples de tamanho 20, por exemplo, teremos 19 graus de
liberdade.
Fazendo uma analogia, suponha uma sala de aula com 20 carteiras vazias, que logo se encherá de 20 alunos.
À medida que os estudantes vão chegando, cada um escolhe um lugar. Naturalmente, o primeiro aluno tem 20
escolhas de assentos, o segundo tem 19 escolhas, e assim por diante, até que chegue o último. Então, não há
mais escolha, e o estudante ocupa o lugar restante. Assim é que 20 alunos têm 19, ou seja n – 1 graus de
liberdade.
II. Intervalo de confiança para a média da população μ, quando a variância populacional σ2 é
desconhecida
Neste caso, estima-se o valor de σ com base na amostra disponível, adotando-se como estimativa o desvio-padrão da
amostra definido por
1n
)x - (x
s
2
i
−
=
=
( )
−
−
n
x
x
1n
1
2
i2
i . A substituição pura e simples de 𝜎 por s,
somente é justificável para grandes amostras. É comum admitir para amostras de tamanho maior que 30. Portanto, o intervalo
de confiança para μ pode ser construído com boa aproximação adotando-se s como estimativa de σ na expressão
𝑥 ± z0
σ
√n
. Quanto menor a amostra, mais necessária se torna a introdução de uma correção, a qual consiste em
usar a variável t de Student, ao invés da variável z.
Designa-se
x - μ
s
√n
= tn – 1 de modo que 𝑡𝑛 – 1 =
𝑥 - 𝜇
𝑠
√𝑛
.
𝜎
𝜎
=
𝑥 - 𝜇
𝜎
√𝑛
.
𝜎
𝑠
=
= z0 .
σ
s
é a variável t de Student com (n - 1) graus de liberdade da estatística s.
Portanto, 𝑥 ±
𝜎
√𝑛
. 𝑧0 = 𝑥 ± 𝑧0
𝜎
√𝑛
.
𝑠
𝑠
= 𝑥 ± 𝑧0 .
𝜎
𝑠
.
𝑠
√𝑛
=
𝑥 ± tn - 1
𝑠
√𝑛
. Donde, o intervalo de confiança para a média μ com 2 desconhecida ao nível de
1 - α de confiança é dado por
IC( ) - 1 , = [ ]
n
s
t x ;
n
s
t - x 1 - n1 - n +
73.
Como a f.d.p. da distribuição t depende de n : = n – 1 graus de liberdade, o gráfico da f(t) é uma família de curvas.
Por exemplo, para n = 18 , a f.d.p. f(t) =
1
√17π
Γ(9)
Γ(8,5)
(1 +
t2
17
)
− 9
.
para n = 25 , a f.d.p. f(t) =
1
√24𝜋
Γ(12,5)
Γ(12)
(1 +
t2
24
)
−
25
2
. Assim, para cada tamanho n da amostra ,
o gráfico da f(t) sofre mudanças. Conforme n cresce, a curva t tende a curva normal z. Todos os gráficos da f(t) são
simétricos em relação ao eixo das ordenadas, pois a f(t) é uma função PAR. Isto se justifica pelo fator (1 +
𝑡2
𝜈
) na
função densidade de probabilidade da distribuição t de Student : f(t) =
1 2
1) (
2t
1
2
2
1 +
−
+
+
.
Função par
Toda função f(x) que satisfaz a propriedade f(- x ) = f( x ) para todo - L ≤ x ≤ L, é chamada de FUNÇÃO
PAR. Portanto, o gráfico de uma função par é SIMÉTRICO em relação ao eixo das ordenadas Oy no
intervalo [ - L , L ] .
Exemplo: A função f(x) = 𝐱𝟐 é PAR em todo o seu domínio ℝ , pois f( - x ) = (−𝐱 )𝟐 = 𝐱𝟐 = f(x)
Mas, não é par, por ex., no intervalo [ - 2 , 5 ] . Analogamente, y = 4 𝐱𝟐 é par em todo ℝ.
Pouco podemos explorar a f.d.p. da distribuição t , mas duas coisas são de fácil compreensão :
I) o gráfico é simétrico em relação ao eixo das ordenadas Oy.
II) lim
t → +∞
f (t ) = 0 = lim
t → − ∞
f( t )
75.
Vamos ver como usamos a Tabela t, por meio dos seguintes exemplos:
a) Calcule o 99º. percentil na distribuição t com 𝜈 = 23.
f(t)
0 t
b) Na distribuição t com 13 graus de liberdade, calcule P (−1,77 ≤ t ≤ 3,37 ).
f(t)
0 t
c) Na distribuição t com 𝜈 = 17, calcule 𝑡𝛼 tal que P(t ≤ tα) = 2,5%
f(t)
0 t
Exemplo de IC para μ com 𝝈𝟐 𝐝𝐞𝐬conhecida: : Dez mensurações são feitas para a resistência X de um certo
tipo de fio que se distribui normalmente, fornecendo os valores 10321 x,...,x,x,x . Se a média amostral
x = 10,48 ohms e desvio-padrãos = 1,38 ohms, construa um intervalo de confiança para a média 𝜇 ao nível de 98% .
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
....................................................................................................................................................................................................
.. .....................................................................................................................................................................................................
.....................................................................................................................................................................................................
.....................................................................................................................................................................................................
.....................................................................................................................................................................................................
.....................................................................................................................................................................................................
.
78.
A tabela Qui-Quadrado tem as mesmas características da tabela t de Student, ou seja, para uma dada probabilidade α e
para um dado 𝜈 graus de liberdade, o corpo da tabela fornece o valor da abscissa 𝜒𝜈,𝛼
2 . Exemplifiquemos:
a) Na distribuição 𝜒2 com 𝜈 = 18 , calcule 𝜒0
2 tal que 𝑃( 𝜒2 ≤ 𝜒0
2 ) = 0,10
)(f 2
0 2
b) Qual é o valor de 𝑃( 𝜒2 ≥ 7,25 ) com 𝜈 = 15 na distribuição 𝜒2 ?
)(f 2
0 2
c) Na distribuição 𝜒2 com 12 graus de liberdade, calcule 𝑃( 3,56 ≤ 𝜒2 ≤ 8,45 ) .
)(f 2
0 2
80.
Exercícios variados sobre Estimação por Intervalos de Confiança
01. De uma distribuição normal, obteve-se a seguinte amostra:
26,5 26,2 26,6 27,0 28,2
Determine um intervalo de confiança para a média μ da população ao nível de confiança de 98% .
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
02. Foram retiradas 25 peças da produção diária de uma máquina, encontrando-se para uma certa medida uma média de
5,2 mm . Sabendo-se que as medidas têm distribuição normal com desvio-padrão σ = 1,2 mm, determine um intervalo de
confiança para a média μ da população ao nível de 95% .
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
............................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
03. Determine um intervalo de confiança que conterá com 90% de probabilidade , a verdadeira variância de uma população
normal que resultou 64 , 63 , 65 , 66 , 62 , 64 e 63 de uma amostra de 7 elementos.
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
83.
08. Feito um ensaio de corrosão com 64 peças de um lote de produção, verificou-se o tempo que a peça suportou nesse
teste, apresentou em média 200 horas. Determine um intervalo de confiança de 97% de confiança para a verdadeira
média 𝜇, sabendo-se que o desvio-padrão populacional 𝜎 = 16 horas. Resp: 34,204;66,195
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
09. Qual é o intervalo de confiança que conterá 98% da verdadeira variância de uma população normal que resultou
2s = 10 de uma amostra de 11 elementos ? Resp: [ 4,31 ; 39,06 ]
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
............................................................................................................................................................................................................................................................................................................................................................................................................
10. Em indivíduos sadios, o consumo renal de oxigênio se distribui normalmente em torno da média 12 .min/cm3 Entretanto,
um pesquisador deseja-se investigar que uma determinada moléstia tem influência no consumo renal de oxigênio. Para isso,
com base em 5 indivíduos portadores dessa moléstia, os consumos medidos em, .min/cm3 , foram:
12,9 15,0 13,6 13,9 12,6
Admitindo-se também entre os portadores da moléstia, o consumo renal de oxigênio se distribua normalmente, determine o
intervalo de confiança para o consumo médio 𝜇 ao nível de 80% . Resp: [ 12,955 ; 14,245 ]
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
84.
Testes (somente uma alternativa é verdadeira)
11. Considere as Distribuições Student e Qui-Quadrado, ambas com 10 graus de liberdade. Se 𝑥𝑇 (Student)
e 𝑥𝑄 (Qui-Quadrado) são os quintos percentis das duas distribuições, respectivamente, então 𝑥𝑇 + 𝑥𝑄 é
igual a
a) 2,128
b) 5,752
c) 16,495
d) 20,119
e) 0 (zero)
12. De uma população normal tem-se a seguinte amostra:
8 9 9 10 12 15 15 15 16 16
Qual é o intervalo de confiança que conterá 98% da verdadeira média dessa população ?
a) [ 3,14 ; 18,86 ]
b) [ 9,76 ; 15,24 ]
c) [10,11 ; 14,89 ]
d) [ 9,61 ; 15,39 ]
e) [ 8,54 ; 14,23 ]
13. Considere duas situações:
I) Na Distribuição t (Student) com 12 graus de liberdade : P( t ≤ 2,18 ) = A
II) Na Distribuição Qui-Quadrado com 8 graus de liberdade : P(𝜒2 ≤ 2,18 ) = B
É verdade que
a) A = B
b) A < B
c) A – B = 0,95
d) A + B = 0,99
e) A . B > 0,05
14. De uma população normal, foi retirada uma amostra de 9 elementos, obtendo-se um intervalo de confiança para a média
μ igual a [ 20,13 ; 30,67 ] ao nível de 90% de confiança. Com base neste intervalo de confiança, é possível afirmar
que a média amostral x̅ e o desvio-padrão amostral s são, respectivamente
a) 28,2 e 9,5
b) 28,5 e 9,2
c) 27,9 e 8,8
d) 26,3 e 8,6
e) 25,4 e 8,5
85.
TESTES DE HIPÓTESE: Introdução
Este é um dos principais tópicos da Inferência Estatística, conhecido como Testes de Hipótese, permitindo aceitar ou
rejeitar uma hipótese questionada , decisão esta que é tomada em função de valores obtidos em uma amostra. Assim,
formula-se uma hipótese quanto ao valor do parâmetro populacional desconhecido e, a seguir, baseando-se em informações
retiradas da amostra, aceita-se ou não esse valor. Tem-se, então, as duas seguintes hipóteses iniciais:
a) Hipótese Nula: H0
É aquela que será testada – é a que sugere que a afirmação é verdadeira –, e expressa uma igualdade.
b) Hipótese Alternativa: H1
É qualquer hipótese diferente da hipótese nula – que oferece uma alternativa aceitável –, caso H0 seja rejeitada. Essa
hipótese H1 é dada por uma desigualdade.
Se, após a análise do problema, a decisão é aceitar a hipótese nula H0, então admite-se que a diferença observada entre
a estatística amostral e o parâmetro populacional é devida à variação casual na amostra. Por outro lado, a decisão de rejeitar
H0 (aceitar H1) implicaria que a variação entre o dois é significativa, ou seja, é demasiado grande para ser devida apenas ao
acaso.
Exemplos: Identifique H0 e H1 , em cada caso.
a) A companhia de transportes afirma que, em média, o intervalo entre sucessivos ônibus é de 15 minutos. Uma associação
de usuários de transportes coletivos acha que a pontualidade é muito importante e pretende testar a afirmação da companhia.
H0 : .....................
(teste bilateral)
H1 : . ....................
b) Acompanhou-se a produção mensal de uma indústria durante vários anos, e constatou-se que ela obedecia a uma
distribuição normal com variância 400. Após a adoção de novas tecnologias de produção, trouxe alguns desequilíbrios
momentaneamente, e os especialistas acham que a variância aumentou, apesar de não alterar a produção média.
H0 : ......................
(teste unilateral à direita)
H1 : ......................
c) Um veterinário conseguiu ganho médio diário de 3 litros de leite por vaca com uma nova composição de ração. Um
pecuarista acredita que o ganho não é tão grande assim.
H0 : ......................
(teste unilateral à esquerda)
H1 : ......................
89.
Observação: Se a variável de interesse, além de ter variância desconhecida, não for normalmente distribuída, é preciso
utilizar procedimentos não-paramétricos para a realização do teste da média populacional. Para este curso de Estatísticana FATEC-SP, o plano de ensino não prevê os testes não-paramétricos. Portanto, uma alternativa para contornar esta
questão é, novamente, considerar um tamanho de amostra suficientemente grande. Dessa forma s2 tende a 2 , e junto
com o Teorema do Limite Central, permitimos considerar x como tendo distribuição normal, resultando em aproximações
satisfatórias do ponto de vista prático.
II. Teste para a variância populacional 2 - Procedimentos
É o mesmo roteiro apresentado para o teste da média populacional 𝜇. A diferença está em utilizar a chamada variável
Qui-Quadrado (
2χ ) com (n - 1) graus de liberdade. Os procedimentos para o teste da variância populacional 𝜎2
são:
1. Enunciar H0 :
2 = 2
0
H1 :
2 2
0
ou 2 > 2
0
ou 2 < 2
0
.
2. Fixar o nível de significância , e usar a variável Qui-Quadrado
2 com (n – 1) graus de liberdade.
3. Estabelecer a região crítica (rejeição).
4. Calcular 𝜒2
=
2
1n
−
.
2s
5. Concluir o teste.
90.
Exercícios variados sobre Testes de Hipótese
01. A associação dos proprietários de um determinado tipo de indústria está muito preocupada com o tempo perdido com
acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de 60 horas/homem por ano e desvio-padrão de
20 horas/homem. Tentou-se um programa de prevenção de acidentes, após o qual foi tomada uma amostra de 9 indústrias
e medido o número de horas/homem perdidas por acidente, encontrando-se 50. Você diria, ao nível de 4% que há evidências
de melhoria ?
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
........................................................................................................
.........................................................................................................
02. : O exame do comprimento das barras produzidas por uma siderúrgica mostrou uma média de 115 cm , após seguintes
e intensivas medições. Para testar a hipótese de que a média, num certo mês é a mesma, tomou-se aleatoriamente uma
amostra de 20 barras, obtendo-se média amostral 118 cm e desvio-padrão amostral de 20 cm. É possível aceitar que a
média continua sendo a mesma para = 5% ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
..................................................................................................................................................................................
..................................................................................................................................................................................
91.
03. Uma das maneiras de manter sob controle a qualidade de um produto é controlar a sua variância. Uma máquina de encher
pacotes de um determinado produto está regulada para enchê-los com um desvio-padrão σ = 10 g e média μ = 500 g , e
segue uma gaussiana. Colheu-se uma amostra de 16 pacotes, e observou-se um desvio-padrão s = 13 g. Com esse resultado,
ao nível de 5%, você diria que a máquina está desregulada em relação à variância?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
...........................................................................................................................................................................................................................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
04. Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros que fabrica apresenta-se em torno de
23 mg por cigarro. Um laboratório realiza 6 análises desse índice, obtendo-se: 26 , 24 , 21 , 25 , 26 e 22. Sabe-se que o
índice de nicotina se distribui normalmente com variância
2 = 4,84 (mg)
2
. Pode-se aceitar, ao nível de 5% de que o índice
médio é diferente de 23 mg por cigarro?
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
05. Em indivíduos sadios, o consumo renal de oxigênio se distribui normalmente com média 12 cm3/min. Deseja-se investigar,
com base em 5 indivíduos portadores de certa moléstia, se esta tem influência no consumo renal médio de oxigênio. Os
consumos medidos para os 5 pacientes foram: 14,6 12,9 15,0 13,6 13,9 . Ao nível de 1% de significância,
pode-se afirmar que a média da população portadores dessa moléstia é superior a 12 3cm /min. ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
92.
06. Os registros dos últimos anos de um grande vestibular em São Paulo para a área de exatas atestam para uma população
de candidatos uma nota média de corte e variância
2 = 22, e segue uma distribuição normal. Para uma nova população
de vestibulandos, os especialistas alegam que as notas de corte são menos homogêneas, apesar de não alterar a nota média
de corte. Para analisar esta suspeita, foi coletada uma amostra de 21 notas de candidatos e obteve-se uma estimativa para
a variância amostral igual a 34. Ao nível de 10%, os especialistas estão certos ?
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
............................................................................................................................................................................................................................................................................................................................................................................................................
07. Uma agência de empregos alega que os candidatos por ela alocados nos últimos meses têm salários de
R$ 3 000,00, em média. Entretanto, uma agência governamental acha que o salário não é tão alto assim. Uma amostra
aleatória de 9 pessoas daquele grupo, forneceu salário médio de R$ 2 700,00 com desvio-padrão amostral igual a R$ 500,00.
Ao nível de 2,5% , a agência governamental está com a razão ?
A alegação da agência de empregos está correta
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
08. Uma máquina automática de encher pacotes de um determinado produto enche-os segundo uma distribuição normal com
média μ e desvio-padrão = 20 g. O valor de μ pode ser fixado em um mostrador situado numa posição um pouco
inacessível dessa máquina. A máquina foi regulada para μ = 500 g. Desejamos, de meia em meia hora, colher uma
amostra de 16 pacotes e verificar se a produção está sob controle, isto é, se μ = 500 g ou não. Se uma dessas amostras
apresentar uma média x = 485 g, você pararia ou não a produção para verificar se o mostrador está ou não na posição
correta, ao nível de significância de 1,6% ? Pararia a produção – a média está alterada
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
95.
13. Considere as afirmações abaixo:
(I) O Teorema das Combinações Lineares garante que se a variável X se distribui normalmente com média e
variância 𝜎2
, então a distribuição amostral da média X também se distribui normalmente com média e
desvio-padrão
𝜎2
𝑛
para qualquer tamanho da amostra n.
(II) Na Estimação por Intervalo de Confiança, o nível de confiança é a probabilidade do parâmetro populacional cair
dentro do intervalo.
(III) Em Testes de Hipótese, o nível de significância, é a probabilidade da Hipótese Nula ser rejeitada, quando a Hipótese
Nula é falsa.
É verdade que
a) somente (I) é verdadeira
b) somente (II) é falsa
c) somente (I) e (II) são verdadeiras
d) somente (II) e (III) são falsas
e) todas as três são falsas
14. Os professores de Estatística da FATEC-SP dizem que a nota média dos alunos na prova final é de 7,4 e se distribui
segundo uma normal. Entretanto, uma associação de alunos acha que não chega a tanto, e para isso tomou-se uma amostra
de 17 alunos com suas respectivas notas e obteve média igual a 6,8 com desvio-padrão amostral de 1,6. Ao nível de 5% ,
a) rejeito a Hipótese Nula
b) a região crítica é para toda média maior que 6,72
c) a associação de alunos está correta
d) os professores dizem a verdade
e) o ponto crítico é 1,75
15. Uma agência de empregos observou o salário-hora dos candidatos por ela alocados durante vários anos, e constatou-se
que ela obedecia a uma distribuição normal com variância de R$ 50,00. Após um período de retratação da economia,
acompanhou-se o salário-hora durante 18 meses, e levantamentos apontaram para uma variância amostral igual a R$ 80,00,
apesar de não alterar o salário-hora médio. Há evidências de que a variância aumentou ao nível de 2,5% ?
É correto afirmar que
a) rejeito a Hipótese Nula
b) a região crítica é superior a 32,5
c) não rejeito a Hipótese Nula
d) o ponto crítico é inferior que 25
e) há evidências de que a variância tenha aumentado
96.
97.O problema para determinar equações de curvas que se ajustam a determinados conjuntos de dados observados é
denominado ajustamento de curvas. O próprio diagrama de dispersão, pode sugerir o tipo da curva a ser adotado.
Assim, na figura (a), poderíamos utilizar a reta y = a + b x, e na figura (b) , tentaríamos uma parábola y = a + b x + x2 .
Dessa forma, um dos principais objetivos do ajustamento é estimar uma das variáveis (variável dependente) em função
da outra variável (variável independente). Este processo de estimação é mais comumente chamado de REGRESSÃO.
Quando y é estimado em função de x, a equação é chamada equação de regressão de y sobre x e a curva correspondente
de curva de regressão de y sobre x. Analogamente, poderia o x ser estimado em função de y.
III. Método dos Mínimos Quadrados
Em geral, é possível ajustar mais de uma curva a um determinado conjunto de dados. Enfim, o que significa por ¨ melhor
reta ¨ , ¨melhor parábola ¨ ou ¨melhor curva ¨ ? Para superar este elemento subjetivo, precisamos de um critério
algebricamente definido. Considere a figura seguinte em que os pontos são
(𝒙𝟏 , 𝒚𝟏 ) , (𝒙𝟐 , 𝒚𝟐 ) , (𝒙𝟑 , 𝒚𝟑 ) , . . ., (𝒙𝒏 , 𝒚𝒏 ) .
y
curva ω
•
(x3 , y3) (xi , yi)
• • dn
di •
(x1 , y1) • (xn , yn)
• (x4 , y4) •
d1
d2
•
(x2 , y2)
0 x
Então, para cada 𝑥𝑖 observado, i = 1 , 2 , 3 , . . . , n, haverá uma diferença entre o valor 𝑦𝑖 observado e o
correspondente valor ajustado (estimado) 𝑦(𝑒𝑠𝑡)𝑖
pela curva ω . A medida dessa discrepância 𝑑𝑖 denominamos de
desvio, erro ou resíduo. Pode ser positivo, negativo ou nulo. Por isso, a soma algébrica dos 𝑑𝑖 (como vimos nas nossas
primeiras aulas) é uma pobre escolha, uma vez que permite um cancelamento parcial entre as quantidades positivas e
negativas, e pode fazer a situação parecer melhor do que é.
y •
𝑑𝑖
𝑑𝑖+1
• ω
0 x
98.
Entretanto, se considerarmos a soma dos quadrados dos desvios S = 2
n
2
3
2
2
2
1
d . . . d d d ++++ , não haverá aquele
cancelamento parcial entre quantidades positivas e negativas. E mais ainda, procuramos a curva ω que minimiza a soma
=
=
n
1i
2
i
d S , chamado método dos mínimos quadrados. Uma curva com esta propriedade denominamos curva de
regressão de mínimos quadrados. Notemos que o método dá ênfase indevida a pontos que estão bem separados da
maioria, mas este é um risco que precisa ser pesado contra a objetividade do critério e sua fácil adaptação ao programa de
computador.
IV. Regressão linear simples
Suponhamos ser a curva teórica de regressão uma reta, e que queiramos estabelecer a regressão de y em função de x.
Logo, a função que desejamos obter é da forma x. y += (populacional). Estimaremos os parâmetros e da reta
através dos pontos observados fornecidos pela amostra, obtendo-se uma estimativa x. b a y )est( += , em que a é a
estimativa de 𝛼, e b a estimativa de 𝛽.
y
x. b a y )est( +=
dn
(xi , yi)• • (xn , yn)
di
(x1 , y1) •
d1 d2
•
0 x
Observe que os valores de 𝑦(𝑒𝑠𝑡)𝑖
na reta de mínimos quadrados, correspondentes a x1 , x2 , x3 , ... , xn são:
a + b. x1 , a + b. x2 , a + b. x3 , . . . , a + b. xn , e os desvios (verticais) iguais a
d1 = a + b. x1 - y1 ,
d2 = a + b. x2 - y2 ,
d3 = a + b. x3 - y3 ,
... ..................
dn = a + b. xn
- yn .
99.
Portanto, a soma dos quadrados dos desvios é
S = 2
nn
2
22
2
11
2
n
2
3
2
2
2
1
) y- bx (a . . . ) y- bx (a ) y- bx (a d . . . d d d ++++++=++++ ou simplesmente
S = 2
n
1i
ii
n
1i
2
i
) y- x. b (a d
==
+= . Note que S é uma função de duas variáveis reais em a e b.
A condição necessária para que S(a , b) =
=
+
n
1i
2
ii ) y- x. b (a seja MÍNIMA (ou máxima) é que as duas derivadas parciais
sejam nulas, ou seja, 0.
b
S
e 0
a
S
=
=
Temos, então:
=
a
S
0)yxba(ou0)yxba(2)yxba(
a
n
1i
ii
n1i
ii
n
1i
2
ii =−+=−+=−+
===
, o que implica
0yxb1a
n
1i
i
n
1i
i
n
1n
=−+
===
ou
==
=+
n
1n
i
n
1n
i yxbn.a
=
b
S
0x)yxba(2)yxba(
b
i
n
1i
ii
n
1i
2
ii =−+=−+
==
ou 0x)yxba( i
n
1i
ii =−+
=
, o que implica
0yxxbxa
n
1i
ii
n
1i
2
i
n
1i
i =−+
===
ou
===
=+
n
1i
ii
n
1i
2
i
n
1i
i yxxbxa
Donde, as equações
+=
+=
===
==
n
1i
2
i
n
1i
i
n
1i
ii
n
1i
i
n
1i
i
x . b x . a y x
x . b n . a y
são chamadas equações normais da regressão linear.
Estas condições dão efetivamente um MÍNIMO relativo da função S. De fato,
se)-(prova 0 x 4 - x n . 2n
b a
S
-
b
S
.
a
S
x2
b a
S
x2
b
S
n22
a
S
2
n
1i
i
n
1i
2
i
2
2
2
2
2
2
n
1i
i
2
n
1i
2
i2
2
n
1i
2
2
=
=
=
==
==
=
=
=
Como S. função da relativo MÍNIMO um mrepresenta condições as que implica , 0 2.n
a
S
2
2
=
100.
Exemplo 1: Ajuste uma reta de MÍNIMOS QUADRADOS esty = a + b x aos pontos:
x - 1 1 3 4 6 8
y 1 2 3 4 4 5
Vamos montar as equações normais da Regressão Linear
+=
+=
===
==
n
1i
2
i
n
1i
i
n
1i
ii
n
1i
i
n
1i
i
x . b x . a y x
x . b n . a y
Como
====
====
127xe90yx,21x,19y
6
1i
2
i
6
1i
ii
6
1i
i
6
1i
i , então
+=
+=
b127a2190
b21a619
. Resolvendo esse
sistema de duas equações a duas variáveis em a e b, tem-se: a = 1,63 e b = 0,44 . Assim, a equação da reta que
se ajusta aos pontos dados pelo Método dos Mínimos Quadrados é esty = 1,63 + 0,44 x )8x1( − .
NOTA 1 Nos exercícios numéricos, para simplificar os cálculos, aplique a chamada Regra de Cramer nas equações normais
da Regressão Linear, e tem-se a solução do sistema :
a =
2
n
1i
i
n
1i
2
i
n
1i
ii
n
1i
i
n
1i
i
n
1i
2
i
x - x . n
y x . x - y . x
==
==== e b =
2
n
1i
i
n
1i
2
i
n
1i
i
n
1i
i
n
1i
ii
x - x . n
y . x - y x . n
==
===
NOTA 2 Uma outra maneira de calcular as estimativas: No sistema
+=
+=
===
==
n
1i
2
i
n
1i
i
n
1i
ii
n
1i
i
n
1i
i
x . b x . a y x
x . b n . a y
, dividindo por
n a 1ª. equação, ambos os membros, tem-se: y = a + b x̅ . Substituindo o valor de a = y – b x na 2ª. equação
obtemos:
∑ xi yi -
∑ xi . ∑ yi
n
= { ∑ xi
2 −
( ∑ xi )
2
n
} b . Donde, b =
Sxy
Sxx
Sxy Sxx
Substituindo em a = y – b x , tem-se o valor de ¨a¨ e a reta 𝐲𝐞𝐬𝐭 = 𝐚 + 𝐛 𝐱
101.
Exemplo 2: Ajustada pela Reta de Regressão de Mínimos Quadrados y = a + b x para os pontos:
x -1 1 2 3 4
, e mantida essa tendência, calcule a estimativa de y para x = 9.
y 1 2 1,5 2,5 2
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
V. Induções quanto aos parâmetros da reta
Os mesmos problemas de estimação e teste de hipóteses sobre parâmetros, vistos nos capítulos anteriores, podem ser
considerados no problema de REGRESSÃO, com referências aos parâmetros e da reta teórica xy += .
Evidentemente, as conclusões serão baseadas nos valores de a e b experimentalmente obtidos, que serão estimador ou
variável de teste, conforme o caso. Assim, por exemplo, um caso de muito interesse é o teste de hipóteses
=
0 : H
0 : H
1
0
,
em que a hipótese H0 é a de não haver regressão. Se H0 for rejeitada, ficará estatisticamente provada a existência de
regressão, ao nível de significância adotado. Esta abordagem, fica a cargo do aluno pesquisar nos livros de Estatística.
VI. Coeficiente de correlação linear ( de PEARSON )
Uma vez estimada a equação da reta, é importante verificar a precisão do ajustamento dessa reta aos dados reais. Uma
medida para isso é o coeficiente de correlação linear entre x e y, dado pela expressão:
( ) ( )
( ) ( ) yyxx
xy
2
i
2
i
2
i
2
i
iiii
S . S
S
y - y . n . x - x . n
y . x - yx . n
r ==
A fórmula acima é decorrência de uma medida chamada coeficiente de determinação, que é
2r . Vejamos apenas uma ideia,
como surge a expressão de r:
a) Dispersão dos iy em torno de y .
Dispersão
de pontos
em torno y
da média y
102.
b) Dispersão dos 𝑦 𝑖 em torno da reta de regressão )est(y = a + b.x)est(y = a + b.x
�̅�
Dispersão
de pontos em
torno da reta
VARIAÇÃO TOTAL = 2
i )y - (y
VARIAÇÃO NÃO EXPLICADA = 2
(est)i ) y- (y
A quantidade de desvio explicada pela reta de regressão é a diferença:
(VARIAÇÃO EXPLICADA) = (VARIAÇÃO TOTAL) - (VARIAÇÃO NÃO EXPLICADA)
A porcentagem dessa variação explicada, é o valor de
2r :
TOTAL) (VARIAÇÃO
EXPLICADA) (VARIAÇÃO
r2 = (coeficiente de determinação)
É a raiz quadrada dessa expressão é que surge o chamado coeficiente de correlação linear r. O valor de r pode ser positivo
ou negativo, ou seja 1 r 1 − ; os valores extremos –1 e +1 correspondem a correlações perfeitas, e os valores
intermediários a correlações parciais. O valor r = 0, corresponde a ausência de correlação linear entre x e y.
Exemplo 3: Considere a tabela abaixo, em que se relacionam a altura x (cm) e o peso y (kg) de 10 pessoas. Determine a reta
de regressão de mínimos quadrados de y sobre x, e calcule o coeficiente de correlação linear r .
altura x (cm) 174 161 170 180 182 164 156 168 176 175
peso y (kg) 73 66 64 94 79 72 62 64 90 81
Resp: )est(y = - 101,9 + 1,034 x e r + 0,7712
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
.....................................................................................................................................................................................................
.. ......................................................................................................................................................................................................
103.
VII. Interpretação de r
O objetivo de calcular o valor de r, foi determinar se havia algum relacionamento estatístico entre a altura (x) e o peso (y)
das pessoas. Encontramos r + 0,7712. O sinal + nos diz que existe uma correlação positiva entre os dados. Como
sabemos que r tem um limite superior + 1,00, o resultado parece sugerir que as duas variáveis estejam razoavelmente
correlacionadas. Todavia, o valor de r pode ser enganoso. Na realidade, uma medida mais significativa é o r2 (coeficiente
de determinação), que dá a porcentagem de variação em uma variável que é explicada estatisticamente pela variação na
outra variável. Por exemplo, nesse caso, com r 0,7712, o valor de r2 0,5948, significa que 59,48% da variação dos
pontos em torno das duas médias pode ser explicada pelo relacionamento entre as duas variáveis. Inversamente,
1 – r2 0,4052 ou 40,52% da variação, não pode ser explicada pelo relacionamento, e assim devemos considerá-los
como devidos a outros fatores não incluídos no estudo.
VIII. Teste do coeficiente de correlação
Um ponto importante diz respeito à interpretação de r obtido a partir de uma amostra. Vimos que, estando
necessariamente entre –1 e + 1, o valor de r por si só deve nos dar uma boa ideia do grau e do sinal da correlação linear.
Não devemos, no entanto, esquecer que em geral, o valor de r é calculado com base nos n elementos de uma amostra
aleatória e que, portanto, representa apenas uma estimativa do verdadeiro coeficiente de correlação populacional ρ. Logo,
todas as ideias anteriormente vistas referentes à estimação e testes de hipóteses aplicam-se também aqui.
Assim, quando desejamos saber se um dado valor de r, combinado com o respectivo tamanho da amostra n, permite
concluir, a um dado nível de significância 𝛼, que realmente existe correlação linear entre as variáveis, testamos as
hipóteses: {
H0 : ρ = 0 (ausência de correlação)
H1 : ρ ≠ 0
Este teste pode ser feito através da quantidade: 𝑡𝑛 - 2 = r . √
n - 2
1 - r2 que será testada como uma variável t de
Student com (n – 2) graus de liberdade.
No exemplo da página anterior, ao nível de 5% de significância, podemos concluir pela existência de correlação positiva
entre a altura (x) e o peso (y) das pessoas na população de onde foi extraída a amostra ?
Solução: Testamos as hipóteses {
H0 : ρ = 0 (ausência de correlação)
H1 : ρ > 0 (correlação positiva)
.
Como n = 10 e r = 0,7712, temos: 𝑡𝑛 - 2 = t8 = (0,7712) . √
10 - 2
0,4052
3,427. Como o valor crítico para
8 graus de liberdade e = 5% na Tabela t de Student, igual a 1,860, então com boa margem,
rejeitamos 𝐻0 : ρ = 0, e podemos concluir pela existência de correlação positiva.
104.
IX. Uma observação para séries temporais
Qualquer série de valores de uma variável colocada em função do tempo constitui o que chamamos de uma série
temporal. Para essas séries é sempre conveniente estabelecer uma escala qualquer de tempo (x) com números em
progressão aritmética, de preferência números tais que a soma dê zero, pois os cálculos serão simplificados (quando não
se usa a calculadora diretamente).
Quando n é PAR, podemos adotar: . . . , - 5 , - 3 , -1 , 1 , 3 , 5 , . . . e
quando n é ÍMPAR: . . . , - 3 , - 2 , - 1 , 0 , 1 , 2 , 3 , . . .
Exemplo 4: As importações de uma determinada matéria-prima, em toneladas, no período de 2017 a 2022 encontram-se
na tabela a seguir:
Ano (x) 2017 2018 2019 2020 2021 2022
Importação (y) 120 117 105 100 84 80
Pede-se: a) Ajustar uma reta de regressão de mínimos quadrados aos dados,
b) Determinar o coeficiente de correlação linear,
c) Estimar o valor das importações em 2027, e
d) Avaliar o ano em que deixará de haver importações.
Como n = 6 é par, associamos uma progressão aritmética de razão 2:
Ano (x)-5 -3 -1 1 3 5
Importações (y) 120 117 105 100 84 80
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
......................................................................................................................................................................................................
a) )est(y = a + b . x → ...........................................................
b) r = ..................... Com boa margem, o ajustamento é BOM !
c) O ano de 2027 corresponde a x = .............. Portanto, 𝑦(𝑒𝑠𝑡) (… . . ) = .....................
d) Para deixar de haver importações, o valor de 𝑦(𝑒𝑠𝑡) = 0, o que implica:
Conclusão: Em fevereiro de ...................., deixará de haver importações !
105.
Exercícios variados sobre Regressão Linear
01. As exportações de um determinado produto, em mil toneladas, no período de Janeiro a Maio de 2023 foram
mês (x) Janeiro Fevereiro Março Abril Maio
exportação (y)
(em mil ton.) 50 85 110 132 143
Ajustada a Reta de Regressão de Mínimos Quadrados, e mantida essa tendência de exportações, mostre que a estimativa
da exportação (em mil toneladas) triplicar a média desses 5 meses, será na segunda quinzena de Novembro de 2023.
........................................................................................................................................................................................................
........................................................................................................................................................................................................
........................................................................................................................................................................................................
........................................................................................................................................................................................................
........................................................................................................................................................................................................
........................................................................................................................................................................................................
........................................................................................................................................................................................................
........................................................................................................................................................................................................
02. Ajustada pela Reta de Regressão de Mínimos Quadrados y = a + b x para os pontos
x 2,0 2,5 3,5 4,0
, e mantida essa tendência, determine a estimativa de y para x = 8.
y 1,5 2,5 4,0 4,0
Resp: 9,5
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
03. A tabela abaixo representa as quantidades produzidas de um determinado produto e os respectivos custos totais de
produção apontados por uma indústria:
Quantidade produzida (q) 10 25 50 80 100
Custo total (c) em mil R$ 146295 540 839 1020
a) Determine a reta de regressão de c sobre q que melhor se ajusta aos dados. Resp: )est(c = 50,9651 + 9,7554.q
b) Qual o valor mais provável dos custos fixos? Resp: R$ 50 965,10
c) Qual o valor estimado do custo variável para uma produção de 150 unidades? Resp: R$ 1 463 310,00
d) Se o preço de venda é de R$ 14 500,00 por unidade, estime a quantidade mínima que se deve produzir para se ter
lucro.
Resp: q > 10,7417 → qmin = 11 unidades
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
106.
Testes (somente uma alternativa é verdadeira)
04. Os valores abaixo representam o consumo de água encanada (em 𝑚3) de uma determinada residência no
período de Julho a Novembro de 2022:
Mês
( x ) JUL AGO SET OUT NOV
Consumo (em m3) 5 8 12 15 20
( y )
Ajustada pela Reta de Regressão de Mínimos Quadrados, e mantida essa tendência de consumo, pergunta-se: Quando
ocorrerá o consumo de 35,3 m3 de água ?
a) Primeira quinzena de Junho de 2023
b) Segunda quinzena de Maio de 2023
c) Primeira quinzena de Abril de 2023
d) Segunda quinzena de Abril de 2023
e) Primeira quinzena de Março de 2023
05. Das afirmações abaixo:
(I) Tanto na Distribuição t (Student) como na Distribuição Qui-Quadrado, existe uma família de
curvas que dependem do tamanho da amostra n
(II) Na Regressão Linear, o Método dos Mínimos Quadrados consiste em fazer com que a soma
dos desvios seja mínimo
(III) Em Teste de Hipóteses, o nível de significância é a probabilidade da decisão correta para a
hipótese nula
É verdade que somente
a) (I) e (II) são falsas
b) (II) é verdadeira
c) (I) é verdadeira
d) (I) e (II) são falsas
e) (II) e (III) são verdadeiras
107.
06. Uma empresa está estudando como varia a procura de certo produto em função do preço de venda. Obteve as seguintes
informações:
preço de venda (R$)
(x) 180 176 173 167 162
saída (unidades/mês)
(y) 205 220 215 242 248
Pela Reta de Regressão de Mínimos Quadrados de y sobre x, qual deve ser o preço para uma demanda de 240
unidades/mês ?
a) mais de 170 reais
b) menos de 160 reais
c) entre 158 reais e 161 reais
d) entre 160 reais e 163 reais
e) entre 164 reais e 167 reais
07. Das afirmações abaixo:
(I) No estudo da Regressão Linear, o Método dos Mínimos Quadrados consiste em procurar a reta que minimiza a
soma dos erros.
(II) O Coeficiente de Correlação Linear entre duas variáveis permite verificar a precisão do ajustamento da reta de
regressão aos dados observados.
(III) Na Distribuição Qui-Quadrado e na Distribuição t (Student), a média e a mediana são sempre iguais.
É verdade que somente
a) (I) é falsa
b) (II) é verdadeira
c) (III) é falsa
d) (I) e (II) são verdadeiras
e) (II) e (III) são falsas
...............................................................................................................
109.
APÊNDICE B : Capa do livro GMat
Você está vendo uma amostra da versão Kindle
Esta é uma amostra. O número de páginas exibidas é limitado.
110.
REFERÊNCIAS
BARBETTA, P. A. ; REIS, M . M. ; BORNIA, A . C. Estatística para Cursos de Engenharia e Informática. 2.ed.
São Paulo: Atlas, 2008.
BUSSAB, W. de O. ; MORETTIN, P . A. Estatística Básica. 5.ed. São Paulo: Saraiva, 2002.
CASTANHEIRA, N. P. Estatística Aplicada a todos os níveis. 4.ed. Curitiba: Ibpex, 2008.
CHRISTMANN, R. U. Estatística Aplicada. São Paulo: Edgard Blücher, 1978.
COSTA NETO, P . L. de O. ; CYMBALISTA, M. Probabilidades. 2.ed. rev. e ampl. São Paulo: Edgard Blücher,
2006.
DEVORE, J . L. Probabilidade e Estatística: para Engenharia e Ciências. São Paulo: Pioneira Thompson
Learning, 2006.
DOWNING, D. ; CLARK, J. Estatística Aplicada. 2.ed. São Paulo: Saraiva, 2006.
FONSECA, J . S. da. ; MARTINS, G. de A. Curso de Estatística. 6.ed. São Paulo: Atlas, 2008.
GUERRA, M. J. ; DONAIRE, D. Estatística Indutiva. 5.ed. São Paulo: Ciência e Tecnologia, 1991.
HINES, W . W . et al. Probabilidade e Estatísica na Engenharia. 4.ed. Rio de Janeiro: LTC, 2006.
LARSON, R. ; FARBER, B. Estatística Aplicada. 2.ed. São Paulo: Pearson Prentice Hall, 2007.
MAGALHÃES, M. N. ; LIMA, A. C. P. de. Noções de Probabilidade e Estatística. São Paulo: Edusp, 2002.
MARTINS, G. de A. Estatística Geral e Aplicada. 3.ed. São Paulo: Atlas, 2006.
MEYER, P. L. Probabilidade: Aplicações à Estatística. 2.ed. Rio de Janeiro: LTC, 1983.
MOORE, D . S.et al. A prática da Estatística Empresarial: como usar dados para tomar decisões. Rio de
Janeiro: LTC, 2006.
MORETTIN, L . G. Estatística Básica – Inferência. V.2, São Paulo: Pearson Makron Books, 2005.
SCHWAAB, M. ; PINTO, J. C. Análise de Dados Experimentais I – Fundamentos de Estatística e Estimação
de Parâmetros. Rio de Janeiro: E – papers, 2007.
STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo: Harper & Row, 1981.
TOLEDO, G . L. ; OVALLE, I. I. Estatística Básica. 2.ed. São Paulo: Atlas, 2008.
TRINTINALIA, L. C. Introdução a Processos Estocásticos. 2.ed. São Paulo: Epusp, 1999.
VIEIRA, S. Estatística para a Qualidade: como avaliar com precisão a qualidade em produtos e serviços.
12ª. reimp. Rio de Janeiro: Elsevier, 1999.
São Paulo, 01 de fevereiro de 2024