Prévia do material em texto
Métodos Matemáticos Probabilidade e Estatística Mariana Silva Ribeiro de Oliveira • Unidade de Ensino: 3 • Competência da Unidade: Conhecer os elementos básicos da estatística como processos de amostragem e medidas que nos auxiliam na interpretação de dados. • Resumo: Entender os conceitos básicos da estatística, medidas de dispersão, posição, diagrama de dispersão e gráficos. • Palavras-chave: Medidas, gráficos, diagrama e coeficientes. • Título da Teleaula: Probabilidade e Estatística • Teleaula nº: 3 Contextualização https://bityli.com/IYbog Conceitos básicos A origem da palavra Estatística • Está associada à palavra latina STATUS (Estado). • Há indícios de que 3000 anos A.C. já se faziam censos na Babilônia, China e Egito. Taxação de impostos, alistamento militar, cálculo de impostos, taxas de mortalidade, demografia. População e Amostra Fonte:https://bityli.com/qmjSr População: Conjunto de indivíduos, ou objetos, que apresentam em comum determinadas características. Amostra: Parte (um subconjunto finito) representativa de uma população. Amostra População Tipos de variáveis Variável Qualitativa Quantitativa Nominal Ordinal Discreta Contínua Fases do método estatístico Análise e Interpretação dos Dados Apresentação dos Dados Apuração dos Dados ou Sumarização Coleta ou Levantamento dos Dados Planejamento Definição do Problema Processos de amostragem Fonte: Ribeiro, 2015. Probabilísticas ▪ Aleatória Simples ▪ Aleatória Sistemática ▪ Aleatória estratificada ▪ Conglomerados Não Probabilísticas ▪ Acidental ou Esmo ▪ Intencional ▪ Cotas Os elementos da população não tem a mesma probabilidade de serem selecionados, assim não há garantia da representatividade da população! Quartis • É cada um dos três valores que dividem uma distribuição de frequências em quatro partes de frequências iguais. • O primeiro quartil corresponde ao 25º percentil, o segundo à mediana e o terceiro ao 75º percentil. • A posição do quartil é dada por: 𝑃𝑄𝑖 = 𝑖(𝑛 + 1) 4 Atividade Identifique qual a população e qual a amostra da seguinte situação: Uma pesquisa com 1.000 adultos nos Estados Unidos descobriu que 17% preferem tirar férias nos meses de inverno. Atividade Uma pesquisa com 1.000 adultos nos Estados Unidos descobriu que 17% preferem tirar férias nos meses de inverno. População: coleção de todos os adultos nos Estados Unidos. Amostra: coleção dos 1.000 adultos entrevistados. Medidas de posição Medidas de posição As medidas de tendência central têm o objetivo de representar o ponto de equilíbrio ou o centro de uma distribuição. Em muitos casos, podem ser considerados valores típicos ou representativos do conjunto. As medidas mais utilizadas são: • média aritmética; • a mediana; • a moda. Média aritmética A media aritmética ( ҧ𝑥) é a medida de localização mais conhecida e utilizada, pela sua facilidade de cálculo e de compreensão aliada as suas propriedades matemáticas. Resultado da divisão da soma de todos os valores da amostra pela quantidade total de valores. ҧ𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥𝑖 Exemplo 2 - 2 - 3 - 4 - 4 - 4 - 6 - 8 - 10 - 10 - 10 - 10 - 15 - 17 ҧ𝑥 = 2 + 2 + 3+ . . +15 + 17 14 = 105 14 = 7,5 Mediana A mediana (Md), é a medida que divide um conjunto de dados ordenados em duas partes iguais: 50% dos valores ficam abaixo e 50% ficam acima da mediana. Em seguida conta-se até a metade deles: ▪ Para número ímpar de valores → mediana é o valor do meio. ▪ Para amostras com número par de unidades a mediana é a média dos dois valores centrais. Exemplo Mediana: o elemento que divide o conjunto de dados ao meio → 𝑀𝑑 n é ímpar: a posição da mediana pode ser encontrada utilizando a relação: 𝑛+1 2 n é par: a mediana será a média aritmética dos valores que ocupam as posições de ordem: 𝑛 2 𝑒 𝑛 2 + 1 2 - 2 - 3 - 4 - 4 - 4 - 6 - 8 - 10 - 10 - 10 - 10 - 15 - 17 Moda A moda (Mo) é o é o valor de maior ocorrência num conjunto de dados. É a única medida que pode não existir e, existindo, pode não ser única. Um conjunto de dados pode: ▪ não apresentar moda; ▪ apresentar uma moda; ▪ apresentar duas modas (bimodal); ▪ apresentar três modas (trimodal); ▪ apresentar mais modas (polimodal). Exemplo Calcular a moda para as idades dos candidatos à presidência de um clube desportivo: 65, 87, 49, 58, 65, 65, 67, 83, 87, 79. Observe que, Mo = 65 (aparece 3 vezes). Situação-problema Os valores abaixo representem as massas (em kg) de 10 unidades de determinado produto selecionadas aleatoriamente em uma linha de produção, em determinado momento: 7,56; 7,64; 5,81; 10,80; 10,07; 7,85; 9,29; 10,34; 10,16; 10,95. Determine o peso médio desse produto, a mediana e moda. Resolvendo Média ҧ𝑥 = 7,56 + 7,64 + 5,81 + 10,80 + 10,07 + 7,85 + 9,29 + 10,34 + 10,16 + 10,95 10 ҧ𝑥 = 90,47 10 ҧ𝑥 ≅ 9,05 Mediana Para amostras com número par de unidades a mediana é a média dos dois valores centrais 𝑀𝑑 = 9,29 + 10,07 2 𝑀𝑑 = 19,36 2 → 𝑀𝑑 = 9,68 5,81 7,56 7,64 7,85 9,29 10,07 10,16 10,34 10,80 10,95 Moda Distribuição não apresenta moda → amodal. 5,81 7,56 7,64 7,85 9,29 10,07 10,16 10,34 10,80 10,95 Medidas de dispersão DISPERSÃO Absoluta Amplitude (A) Desvio Padrão (S) Variância (s²) Relativa Coeficiente de Variação (CV) Amplitude (A) A amplitude total é a diferença entre o maior e o menor valor analisado em uma variável em ordem crescente ou decrescente. 𝐴𝑇 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 Exemplo 𝐴𝑇 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 A 80 80 80 80 80 80 B 76 77 78 79 80 81 𝐴𝑇 𝐴 = 80 − 80 = 0 𝐴𝑇 𝐵 = 81 − 76 = 5 Variância • Variância é a média aritmética dos quadrados dos desvios de cada valor em relação à média: proporciona uma mensuração da dispersão dos dados em torno da média. • É uma das medidas de dispersão mais importantes. 𝑺𝟐 = σ 𝒙 − ഥ𝒙 𝟐 𝒏 − 𝟏 Variância Amostral Desvio padrão Desvio padrão é a raiz quadrada positiva da variância, apresentando a mesma unidade dos dados e da média, permitindo avaliar melhor a dispersão. 𝑺 = 𝑺𝟐 = σ 𝒙 − ഥ𝒙 𝟐 𝒏 − 𝟏 Amostral Coeficiente de variação É a medida relativa de dispersão útil para fazer comparação em termos relativos do grau de concentração. É calculado pela relação entre o desvio padrão (s) e a média x da média de séries distintas. 𝑪𝑽 = 𝒔 ഥ𝒙 × 𝟏𝟎𝟎 Amostral Situação-problema Ana fez um levantamento sobre a idade de alguns filhos dos funcionários de uma indústria. Observe o resultado: Idade 𝒙𝒊 𝒇𝒊 8 2 12 3 13 5 𝑓𝑖 = 10 Considerando esses dados, determine a variância, desvio padrão e o coeficiente de variação. Resolvendo Idade 𝒙𝒊 𝒇𝒊 𝒙𝒊 − ഥ𝒙 𝒙𝒊 − ഥ𝒙 𝟐 𝒙𝒊 − ഥ𝒙 𝟐. 𝒇𝒊 8 2 -3,7 13,69 27,38 12 3 0,3 0,09 0,27 13 5 1,3 1,69 8,45 𝑓𝑖 = 10 𝒙𝒊 − ഥ𝒙 𝟐. 𝒇𝒊 ≅ 36,1 ഥ𝒙 = 2.8 + 3.12 + 5.13 10 = 11,7 Idade 𝒙𝒊 𝒇𝒊 𝒙𝒊 − ഥ𝒙 𝒙𝒊 − ഥ𝒙 𝟐 𝒙𝒊 − ഥ𝒙 𝟐. 𝒇𝒊 8 2 -3,7 13,69 27,38 12 3 0,3 0,09 0,27 13 5 1,3 1,69 8,45 𝑓𝑖 = 10 𝒙𝒊 − ഥ𝒙 𝟐. 𝒇𝒊 ≅ 36,1 𝑆2 = σ 𝑥 − ҧ𝑥 2 𝑛 − 1 = 36,1 10 − 1 = 4,01 𝑆 = 𝑆2 = 4,01 ≅ 2 𝑪𝑽 = 𝒔 ഥ𝒙 × 𝟏𝟎𝟎 𝐶𝑉 = 2 11,7 × 100 𝐶𝑉 = 17,1% Diagrama de dispersão Diagrama de dispersão O diagrama de dispersão é um gráfico em que pontos no espaço cartesiano XY são usados para representar simultaneamente os valores de duas variáveis quantitativas medidas em cada elemento do conjunto de dados. Coeficiente de Correlação Apesar do diagrama de dispersão nos fornecer uma ideia do tipo e extensão do relacionamento entre duas variáveis x e y, há um número que mede essa relação, chamado de coeficiente de correlação. Coeficiente de Correlação de Pearson 𝑟 = 𝑛σ𝑥𝑖 . 𝑦𝑖 − σ𝑥𝑖 . (σ 𝑦𝑖) 𝑛. σ 𝑥²𝑖 − (σ𝑥𝑖)² . 𝑛. σ 𝑦²𝑖 − (σ𝑦𝑖)² Fonte: Ribeiro, 2015. Coeficiente de determinação • As variações da variável Y são 100% explicadas pelas variações da variável X, não ocorrendo desvios em torno da função estimada.• Por outro lado, se 𝑅2 = 0 , isto quer dizer que as variações de Y são exclusivamente aleatórias e explicadas pelas variações de outros fatores que não X. • Se R2 for igual a 1, isto significa que todos os pontos observados se situam “exatamente” sobre a reta de regressão → ajuste perfeito. Atividade Ao se realizar um estudo para determinar a relação entre os salários diários recebidos (x) e as despesas diárias (y), foi realizada uma amostragem com três famílias, computando-se os seguintes valores: 𝒙𝒊 = 𝟏𝟎𝟖 𝒚𝒊 = 𝟔𝟓 𝒙𝒊. 𝒚𝒊 = 𝟐𝟑𝟗𝟏 𝒙𝒊 𝟐 = 𝟑𝟗𝟓𝟎 𝒚𝒊 𝟐 = 𝟏𝟒𝟕𝟑 Com base nesses dados, determine o coeficiente de correlação. Atividade 𝒙𝒊 = 𝟏𝟎𝟖 𝒚𝒊 = 𝟔𝟓 𝒙𝒊. 𝒚𝒊 = 𝟐𝟑𝟗𝟏 𝒙𝒊 𝟐 = 𝟑𝟗𝟓𝟎 𝒚𝒊 𝟐 = 𝟏𝟒𝟕𝟑 𝑟 = )𝑛σ𝑥𝑖 . 𝑦𝑖 − (σ𝑥𝑖)(σ𝑦𝑖 𝑛σ𝑥𝑖 2 − σ𝑥𝑖 2 𝑛σ𝑦𝑖 2 − σ𝑦𝑖 2 𝑟 = 3 ⋅ 2391 − (108)(65) (3 ⋅ 3950 − 108 2)(3 ⋅ 1473 − 65 2 = 153 186 ⋅ 194 = 0,805 Tipos de Gráficos Colunas 15 10 7 3 20 0 5 10 15 20 25 jan/08 jan/09 jan/10 jan/11 jan/12 Q u an ti d ad e d e a ci d e n te s Mês/Ano Número de Acidentes da Empresa FOGO & CIA Fonte: Dados Fictícios Plotagem do gráfico: Microsoft Excel Barras 15 10 7 3 20 0 5 10 15 20 25 jan/08 jan/09 jan/10 jan/11 jan/12 Quantidade de Acidentes M ê s/ A n o Número de Acidentes da Empresa FOGO & CIA Fonte: Dados Fictícios Plotagem do gráfico: Microsoft Excel Setor 27,3 18,2 12,75,5 36,4 Número de Acidentes da Empresa FOGO & CIA (%) jan/08 jan/09 jan/10 jan/11 jan/12 Fonte: Dados Fictícios Plotagem do gráfico: Microsoft Excel Colunas 15 10 7 3 20 0 5 10 15 20 25 jan/08 jan/09 jan/10 jan/11 jan/12 Q u an ti d ad e d e a ci d e n te s Mês/Ano Número de Acidentes da Empresa FOGO & CIA Fonte: Dados Fictícios Plotagem do gráfico: Microsoft Excel Recapitulando ✓ Conceitos básicos da estatística ✓ Tipos de amostragem ✓ Medidas de posição ✓ Medidas de dispersão ✓ Diagrama de dispersão ✓ Coeficiente de correlação e determinação ✓ Tipos de gráficos Fonte: Google Imagens. Disponível em encurtador.com.br/psGNX Acesso em: 01 fev. 2021.