CURVA NORMAL

CURVA NORMAL

OU

CURVA DE GAUSS

 

Prof. Roberto Losada Pratti

 

 

O conhecimento que você vai adquirir sobre curva normal ou curva de Gauss, além de ser tema de concursos, como no exercício do ENADE abaixo, é muito utilizado.

Por exemplo, quando uma empresa toma uma decisão, não o faz a esmo. Antes, é feita coleta e apresentação de dados. Depois, esses dados são analisados com o auxílio da curva normal.

 

Uma situação do cotidiano que você já decorou as palavras é a pesquisa eleitoral. E sempre há contestação sobre os resultados. Por isso surgiram leis para regulamentar a pesquisa. O Ibope publicou em seu site a metodologia empregada e usa termos que nada mais são do que Estatística: amostra, dados, interpretação de dados, fontes oficiais de dados, seleção probabilística de setores, amostragem, erro amostral, nível de confiança, intervalos de 95% de confiança,  etc.

 

Veja a figura. O gráfico da curva normal é uma figura em forma de sino.

 

 O gráfico não encosta no eixo das abscissas e a sua sentença matemática é complexa:                                                                                                 

                                                                                   2

f(x) =  (1/  σ √ 2 π) . e-1/2 . z

  

σ é o desvio padrão

z é a variável reduzida.

 

Criaremos uma situação, construiremos uma tabela, um histograma e um polígono de frequência similar a uma curva normal com média 2000 e desvio padrão 200. Transformaremos essa curva normal em curva normal reduzida, com média zero e desvio padrão 1.

 

É só você acompanhar e, depois, construir sozinho novamente a tabela, o gráfico e o polígono de frequência.

Os conceitos surgirão como mágica e você será esse mágico.

 

A situação é a seguinte. Em uma empresa, 20 funcionários recebem salários entre R$ 1.400,00 e R$ 1.600,00. 140 funcionários recebem salários entre R$ 1.600,00 e R$ 1.800,00, 340 funcionários recebem salários entre R$ 1.800,00 e R$ 2.000,00, 340 funcionários recebem salários entre R$ 2.000,00 e R$ 2.200,00, 140 funcionários recebem salários entre R$ 2.200,00 e R$ 2.400,00. 20 funcionários recebem salários entre R$ 2.400,00 e R$ 2.600,00.

O menor valor do intervalo é o limite inferior e o maior é o limite superior. Vamos subtrair os limites e descobrir a diferença.

1600 – 1400 = 200

1800 – 1600 = 200

2000 – 1800 = 200

2200 – 2000 = 200

2400 – 2200 = 200

2600 – 2400 = 200

O resultado, 200, é a amplitude do intervalo.

 

Construa uma tabela em que conste o salário e o número de funcionários.

 

 

Faixa salarial – R$

Nº funcionários

1400 a 1600

20

1600 a 1800

140

1800 a 2.000

340

2.000 a 2.200

340

2.200 a 2.400

140

2.400 a 2.600

20

 

Total 1000

                       

Observe a tabela.

Na primeira faixa, 1400 a 1600, há 20 funcionários, na faixa 2, 140, na faixa 3, 340, na faixa 4, 340, na faixa 5, 140 e na faixa 6, 20.

A quantidade de cada faixa é a frequência f.

Nesse intervalo, 1400 é o limite inferior e 1600 é o limite superior.

No segundo intervalo, 1600 a 1800, 1600 é o limite inferior e 1800 é o limite superior.

 

Qual a frequência relativa (fr), isto é, qual a porcentagem de funcionários em cada faixa?

A frequência relativa é obtida pela divisão da frequência da faixa pelo total de funcionários, ou seja, 1000.

Formalizando:

fr = f / ∑ f

Na faixa 1.400 – 1.600 dividimos 20 por 1000, que dá 0,02, que é a frequência relativa decimal, que multiplicando por 100 resulta a taxa em porcentagem, 2 %.

Na faixa 1.600 – 1.800 dividimos 140 por 1000, que dá 0,14, que é a frequência relativa decimal, que multiplicando por 100 resulta a taxa em porcentagem, 14%.

Na faixa 1800 - 2000 dividimos 340 por 1000, que dá 0,34, que é a frequência relativa decimal, que multiplicando por 100 resulta a taxa em porcentagem, 34 %.

Na faixa 2000 - 2200 dividimos  340  por 1000, que dá 0,34, que é a frequência relativa decimal, que multiplicando por 100 resulta a taxa em porcentagem, 34%.

Na faixa 2200 - 2400 dividimos 140 por 1000, que dá 0,14, que é a frequência relativa decimal, que multiplicando por 100 resulta a taxa em porcentagem, 14%.

Na faixa 2400 - 2600 dividimos 20 por 1000, que dá, 0,02 que é a frequência relativa decimal, que multiplicando por 100 resulta a taxa em porcentagem, 2 %.

 

Vamos completar a tabela com as frequências relativas.

 

Faixa – R$

Nº funcionários- f

Fr decimal

Fr %

1400 a 1600

20

0,02

2%

1600 a 1800

140

0,14

14%

1800 a 2.000

340

0,34

34%

2.000 a 2.200

340

0,34

34%

2.200 a 2.400

140

0,14

14%

2.400 a 2.600

20

0,02

2%

 

∑ 1000

∑ 1

∑ 100%

 

 

 

Construa um histograma, que nada mais é do que um gráfico de colunas construído no gráfico cartesiano. Na abscissa x coloque os salários e na ordenada as frequências.

Veja como fica o gráfico.

 

 

ÁREA DO HISTOGRAMA

 

Observando a tabela, qual é a soma das frequências relativas em decimal?

É só somar a coluna da frequência relativa em decimal:

0,02 + 0,14 + 0,34 + 0,34 + 0,14 + 0,02 = 1.

Observando a tabela, qual é a soma das frequências relativas em porcentagem?

É só somar a coluna da frequência relativa em procentagem:

2 + 14 + 34 + 34 + 14 + 2 = 100%.

 

Qual é a área do histograma?

Observe que a área do histograma é a soma das áreas das colunas.

Não é necessário saber as medidas, porque a área total é 100%.

A área de cada retângulo está associada à porcentagem.

A porcentagem de área é a soma das porcentagens.

0,02 + 0,14 + 0,34 + 0,34 + 0,14 + 0,02 =1

Portanto, a área do histograma é 1.

A área é 1.

 

Essa conclusão é fundamental para entender o intervalo de confiança e o nível de confiança, porque a porcentagem está associada à probabilidade.

 

PROBABILIDADE

 

A probabilidade de eventos aleatórios equiprováveis é obtida pela divisão do número de elementos do evento pelo número de elementos do espaço amostral.

 

No exemplo, se você pegar o holerite de um funcionário, qual a probabilidade de ele ganhar entre R$ 2.000,00 e R$ 2.200,00?

 

Para encontrar a probabilidade, dividimos o número de pessoas que recebem nessa faixa pelo total de funcionários, 340/1000 = 0,34 = 34 %, ou seja, é a frequência relativa, é a área da coluna.

 

Grave o resumo a seguir:

 

RESUMO: ÁREA E PROBABILIDADE

 

A área equivale à frequência relativa, à porcentagem, à probabilidade. A área total é l.

Mais adiante veremos na curva normal que o nível de confiança é essa porcentagem.

 

 

Qual é o salário médio nesse exemplo?

A média é obtida pela divisão da soma dos valores pelo número de elementos. No caso, pela soma dos salários pelo total de funcionários.

Cada faixa salarial tem uma quantidade de funcionários, a frequência. E é uma faixa salarial, não é um salário único. Por exemplo, existem 20 funcionários ganham entre 1400,00 e R$ 1600,00. Pegamos o salário médio da faixa, que é R$ 1500,00. Somamos R$ 1500,00 + R$ 1500,00 +.... e repetimos 20 vezes, ou seja 1500 x 20.

A soma dos salários será 1500 x 20 + 1700 x 140 + 1900 x 340 + 2100 x 340 + 2300 x 140 + 2500 x 20 = 2.000.000

Como são 1000 funcionários, dividimos 2000000/1000 = 2000. Portanto a média salarial é R$ 2.000,00.

O que acabamos de fazer, em estatística, é a média aritmética ponderada representada pela letra grega μ = ∑x.f/ ∑f

 

Observe que metade dos funcionários ganha até R$ 2000,00, ou seja 50%, 0,5. A outra metade, 0,5, ganha acima da média, R$ 2.000,00.

 

Qual a porcentagem de funcionários que ganha entre R$ 1800,00 e R$ 2200,00?

É só consultar a tabela que você construiu com as frequências relativas ou o gráfico: 0,34 + 0,34 = 0,68 = 68%.

 

Qual a porcentagem de funcionários que ganha entre R$ 1.600,00 e R$ 2.400,00?

0,14 + 0,34 + 0,34 + 0,14 = 0,96 = 96%

Ou,

Observe o gráfico. As 2 únicas faixas salariais que não estão são as das pontas, de 2%, ou seja 4%. Como o total é 100% (que é 1), tiramos 4% (que é 0,04).

1 – 0,04 = 0,96 = 96%.

 

Agora estamos quase chegando na curva normal. Construa um polígono de frequência sobre a curva normal. Basta traçar segmentos de reta pelos pontos médios.

Veja o gráfico.

 

 

CURVA NORMAL

 

Esse polígono de frequência é similar à curva normal com média μ = 2000 e desvio padrão σ = 200. Preste atenção nessa curva e compare com o polígono de frequência.

 

 

A frequência relativa do histograma era aproximada. As porcentagens na curva normal são obtidas matematicamente pela integral.

Integral de uma função f(x), geometricamente, é a área.

Como vimos acima, a função da curva normal é

 

onde z = 

 

Vimos que a área total do histograma é 1, então, a área da curva normal é 1.

Área total = probabilidade =  ∫f(x) = 1

 

A probabilidade de um evento é a área da “coluna”, é a porcentagem.

Olhe a curva normal no intervalo 2000 a 2200. Qual a probabilidade desse intervalo?

A probabilidade, a porcentagem, é 0,3413, 34,13%.

Qual a probabilidade no intervalo 2000 a 2400 e quantos intervalos há, ou seja, quantos desvios padrão?

Somamos 0,3413 + 0,1359 = 0,4772 = 47,72%. São 2 intervalos, ou seja, 2 desvios padrão.

 

RESUMO: INTERVALO

 

Neste exemplo, no intervalo de 2000 a 2200 a probabilidade é 0,3413 = 34,13 %. No intervalo de 2200 a 2400 a probabilidade, porcentagem, é 0,4772 = 47,72%

 

Em um intervalo, é necessário calcular a integral.

Mas calcular a área em um intervalo por integral não é prático, por isso utiliza-se uma tabela de uma curva especial, chamada curva normal reduzida, onde a variável x é transformada em uma variável z, com média μ = 0 e desvio padrão σ = 1.

 

Observe a curva normal reduzida com média 0 e desvio 1 e compare com a curva normal com média 2000 e desvio 200.

 

Na curva do exemplo original, com desvio padrão 200, no intervalo de 2000 a 2200  a diferença é 2200 – 2000  = 200. Como o desvio é 200, dividindo a diferença pelo desvio temos 200/200 = 1 desvio padrão.

 

De 2000 a 2400, 2400 - 2000 = 400. Como o desvio é 200, cabem 2 desvios: 2400 – 2000 / 200 = 400/200 = 2  desvios.

De 2000 a 2600, 2600 - 2000 = 600. Como o desvio é 200, cabem 3 desvios: 2600 – 2000 /200 = 600/200 = 3  desvios.

Generalizando, de 2000 a x, (x – 2000) / 200 é o número de desvios, que é chamado de z.

z = (x – 2000) / 200

 

Para qualquer média e desvio padrão:

z = (x – μ)  / σ

 

RESUMO: FÓRMULA DE Z

 

Dado o valor x, para obter o valor z:

z = (x – μ) / σ

 

Exemplo: Qual o valor da variável reduzida z para x = 2200,  μ  = 2000 e  σ = 200?

z = (x – μ)  / σ

z = (2200 – 2000) / 200

z = 200 / 200

z = 1

 

TABELA DA CURVA NORMAL

Existe uma tabela com a probabilidade para cada valor de z, veja no final deste link.

 

RESUMO: INTERVALO E PROBABILIDADE

 

Dado um intervalo, no exemplo de 2000 a 2200, transforma-se a variável x na variável z = 1. Olha-se na tabela para z = 1 e encontra-se a probabilidade: 0,3413, que é 34,13 %, ou aproximando, 34 %.

 

EXEMPLO

 

1) Em uma empresa, a média salarial é R$ 2.000,00 e o desvio padrão é R$ 200,00. Sabendo-se que na empresa há 1.000 funcionários:

a) Escolhendo-se ao acaso um funcionário, qual a probabilidade de ganhar entre R$ 2.000,00 e R$ 2.200,00, considerando a probabilidade um número inteiro?

De 2000 a 2200 há um desvio padrão, portanto z = 1, ou pela fórmula:

z = (x – μ)  / σ

z = (2200 – 2000) / 200

z = 200 / 200

z = 1

Observando a tabela para z = 1 encontramos a probabilidade 34,13%, ou, desprezando as casas decimais, 34%, semelhante ao exemplo do histograma.

b) Quantos funcionários ganham entre R$ 2.000,00 e R$ 2.200,00?

Como a área, a probabilidade é 34% e o número de funcionários é 1000:

1000 x 0,34 = 340 funcionários.

 

2) ENADE 2009

Uma empresa metal-mecânica produz um tipo especial de motor. A quantidade em estoque desse motor segue uma distribuição normal com média de 200 unidades e desvio-padrão de 20. O gráfico abaixo representa a distribuição normal padrão (média igual a 0 e desvio-padrão igual a 1), em que as percentagens representam as probabilidades entre os valores de desvio-padrão.

Qual é a probabilidade de, em um dado momento, o estoque da empresa apresentar mais de 220 unidades?

A) 84,13%.

B) 68,26%.

C) 34,13%.

D) 15,87%.

E) 13,60%.

 

 

PESQUISA ELEITORAL

 

Uma situação do cotidiano que você já decorou as palavras é a pesquisa eleitoral. E sempre há contestação sobre os resultados. Por isso surgiram leis para regulamentar a pesquisa. O Ibope publicou em seu site a metodologia empregada e usa termos que nada mais são do que Estatística: amostra, dados, interpretação de dados, fontes oficiais de dados, seleção probabilística de setores, amostragem, erro amostral, nível de confiança, intervalos de 95% de confiança,  etc.

 

Vamos ler o que o Ibope diz em seu site, que é uma aplicação do intervalo de confiança.

 

Guia de Leitura de Pesquisa Eleitoral - Margem de erro amostral

 

Nas pesquisas eleitorais, a margem de erro depende do tamanho da amostra e dos resultados obtidos.

A margem de erro amostral existe em toda pesquisa porque não se está entrevistando todo o universo. Como se trabalha com amostras, existe um erro amostral conhecido e calculado. Esse erro é calculado em função do tamanho da amostra e dos resultados obtidos na pesquisa.

Para um mesmo tamanho de amostra, quanto maior a homogeneidade da população pesquisada, menor será o erro amostral e vice-versa.

Ao contrário do que habitualmente se divulga, não existe um erro amostral único para a pesquisa como um todo, pois em cada informação fornecida pela pesquisa há um erro amostral correspondente.

No caso das pesquisas políticas, esses erros são geralmente desiguais para os diversos candidatos, em função da distribuição geográfica do eleitorado de cada um deles.

A margem de erro comumente divulgada refere-se a uma estimativa de erro máximo, considerando-se um modelo de amostragem aleatório simples.

Dessa forma, os resultados de uma pesquisa devem ser interpretados dentro de um intervalo que estabelece limites em torno da estimativa obtida: o chamado intervalo de confiança.

O nível de confiança da pesquisa é estabelecido de comum acordo entre o cliente e o instituto, entretanto, o mais usual é trabalhar com intervalos com 95% de confiança. Isso quer dizer que há uma possibilidade pré-fixada, de 95% de o intervalo de confiança conter o percentual que se deseja estimar.

Assim, quando se diz que o percentual dos que têm intenção de votar no candidato A é de 30%, significa que existe uma probabilidade de 95% de o percentual de eleitores que têm intenção de votar no candidato A estar compreendido no intervalo:
[30% - erro amostral; 30% + erro amostral]

Agora, considerando uma margem de erro de 3 pontos percentuais para esse candidato, o intervalo de confiança dele, com uma confiabilidade de 95%, seria o seguinte:

 [30% - 3%; 30% + 3%] = [27%; 33%]

Isso significa dizer que, considerando o mesmo modelo amostral, se 100 amostras forem tiradas da população, em 95 delas o índice deste candidato variará entre 27% e 33%.

 

Guia de Leitura de Pesquisa Eleitoral. Empate Técnico

 

A superposição dos intervalos de confiança dos candidatos determina o empate técnico

É considerado empate técnico quando a diferença entre os candidatos se encontra dentro das margens de erro das pesquisas, ou seja, quando há superposição dos respectivos intervalos de confiança dos candidatos.

Suponha que em determinada pesquisa a margem de erro seja de 3 pontos percentuais e o candidato A tenha 27% das intenções de voto e o candidato B tenha 30%.

Os intervalos de confiança construídos para cada um deles são os seguintes:

Candidato A:

[27% - 3%; 27% + 3%] = [ 24%; 30%]
Candidato B:

[30% - 3%; 30% + 3%] = [ 27%; 33%]

                  [24%; 25%; 26%;   [27%; 28%; 29%; 30%;]  [31%; 32%; 33%]
                                           

 Superposição

Existe uma superposição nos dois intervalos de confiança; portanto, pode-se dizer que existe um empate técnico entre os dois candidatos.

Na realização de uma nova pesquisa, o candidato A poderia ter 29% e o candidato B também 29%, ou o candidato A ter 30% e o candidato B 27% das intenções de voto.

Esse mesmo raciocínio também vale para dizer se uma eleição acabará ou não no primeiro turno. Por exemplo, considerando uma pesquisa cuja margem de erro é de 3 pontos percentuais e o candidato A tem 38% das intenções de voto e a soma dos demais candidatos é 35%, não se pode afirmar que a eleição acabará no primeiro turno, pois a diferença entre o índice do primeiro colocado e a soma dos demais está dentro da margem de erro da pesquisa.

Para poder afirmar que uma eleição acabará no primeiro turno, a diferença entre a intenção de voto do primeiro colocado e a soma das demais candidaturas deve ser superior à margem de erro da pesquisa.

 

TABELA DA CURVA NORMAL

 

 

© 2012 Todos os direitos reservados.

Crie um site gratuitoWebnode