Distribuições de Probabilidade Contínua – Matemática | Tuco-Tuco
Estudo da distribuição normal e suas propriedades, incluindo o cálculo de áreas sob a curva.
Distribuições Contínuas de Probabilidade
Até aqui, o estudo esteve centrado em variáveis aleatórias discretas, em que se "conta" a ocorrência de valores (0, 1, 2, …) e as probabilidades aparecem como somas. Ao migrarmos para o universo contínuo, ocorre uma mudança de paradigma:
deixa-se de contar pontos isolados;
passa-se a medir grandezas em intervalos;
somas dão lugar a áreas sob curvas (integrais).
Em distribuições contínuas, a probabilidade não é atribuída a valores isolados, mas a intervalos. O que se calcula é a área sob uma curva de densidade entre dois pontos.
Fundamentos das variáveis aleatórias contínuas
Uma variável aleatória contínua é aquela que pode assumir qualquer valor real dentro de um intervalo (ou união de intervalos). São variáveis associadas a medições:
tempo;
massa;
temperatura;
distância;
pressão;
altura.
1.1. Por que $P(X=a)=0$ em variáveis contínuas
Em distribuições contínuas, a probabilidade de a variável assumir um valor exatamente igual a $a$ é:
$P(X=a)=0$.
A razão é geométrica e conceitual:
probabilidades correspondem a áreas;
um ponto isolado tem "largura" zero;
área com base zero é zero.
Consequência prática importante:
$P(X\le a)=P(X<a)$, pois a diferença entre incluir ou excluir um único ponto é nula.
Por isso, em problemas contínuos, o foco é sempre:
$P(a\le X\le b)$,
$P(X>b)$,
$P(X<a)$,
ou seja, probabilidades em intervalos.
1.2. Função densidade de probabilidade (FDP)
A distribuição de uma variável contínua é descrita por uma função densidade de probabilidade $f(x)$.
Para que $f(x)$ seja uma FDP válida, deve satisfazer:
não negatividade: $f(x)\ge 0$ para todo $x$;
integral unitária: $\int{-\infty}^{\infty} f(x)\,dx = 1$.
1.3. Probabilidade como área
A probabilidade de $X$ cair entre $a$ e $b$ é a área sob a curva de $f(x)$ nesse intervalo:
$P(a\le X\le b)=\inta^b f(x)\,dx$.
Leitura geométrica:
a curva $f(x)$ mede "densidade" (concentração relativa de probabilidade);
a probabilidade é a área acumulada, não a altura em um ponto.
Isso explica uma confusão comum:
$f(x)$ não é uma probabilidade.
Quem é probabilidade é a integral (a área) em um intervalo.
Distribuição Uniforme Contínua: equiprobabilidade em um intervalo
A distribuição uniforme contínua representa o cenário em que todos os valores em um intervalo fechado $[a,b]$ são igualmente plausíveis.
2.1. Definição (FDP)
Se $X\sim \mathrm{Uniforme}(a,b)$, então:
$f(x)=\dfrac{1}{b-a}$ para $a < x < b$;
$f(x)=0$ para $x \le a$ ou $x \ge b$.
Geometricamente, é um retângulo:
base $b-a$;
altura $\dfrac{1}{b-a}$;
área total $=1$.
Nota: Como $P(X=a)=P(X=b)=0$, incluir ou não os extremos no suporte da função densidade não altera o cálculo de qualquer probabilidade. Para qualquer subintervalo $[c,d] \subseteq [a,b]$, temos $P(c \le X \le d) = \frac{d-c}{b-a}$.
2.2. Probabilidade em intervalos
Para qualquer subintervalo $[c,d]\subseteq[a,b]$:
$P(c\le X\le d)=\intc^d \frac{1}{b-a}\,dx=\frac{d-c}{b-a}$.
Ou seja: a probabilidade é proporcional ao comprimento do intervalo.
2.3. Média e variância
Para $X\sim \mathrm{Uniforme}(a,b)$:
$E[X]=\mu=\dfrac{a+b}{2}$;
$\mathrm{Var}(X)=\sigma^2=\dfrac{(b-a)^2}{12}$.
2.4. Exemplo
Se $X\sim \mathrm{Uniforme}(2,7)$, calcule $P(5\le X\le 7)$.
$b-a=7-2=5$;
$d-c=7-5=2$.
Logo:
$P(5\le X\le 7)=\dfrac{2}{5}=0{,}4=40\%$.
A uniforme é um ponto de partida didático, mas muitos fenômenos reais têm densidade variável. Um modelo fundamental para tempos de espera é a distribuição exponencial.
Distribuição Exponencial: tempos de espera e intervalos entre eventos
A distribuição exponencial é usada para modelar:
tempo até ocorrer um evento;
vida útil de componentes sob hipótese de taxa constante;
distância entre ocorrências em um fluxo.
Ela é adequada quando se assume uma taxa média de ocorrências constante no tempo e independência local do processo.
3.1. Definição (FDP)
Se $X\sim \mathrm{Exponencial}(\lambda)$, com $\lambda>0$, então:
$f(x)=\lambda e^{-\lambda x}$ para $x>0$;
$f(x)=0$ para $x\le 0$.
O suporte ser $x>0$ faz sentido: tempos e distâncias, em geral, não são negativos.
3.2. Função de distribuição acumulada (FDA)
A FDA é:
$F(x)=P(X\le x)=1-e^{-\lambda x}$ para $x\ge 0$.
Isso permite obter probabilidades do tipo "demorar no máximo $tquot;:
$P(X\le t)=1-e^{-\lambda t}$.
E probabilidades de cauda direita ("demorar mais que $tquot;):
$P(X>t)=1-F(t)=e^{-\lambda t}$.
3.3. Média e variância
Para $X\sim \mathrm{Exponencial}(\lambda)$:
$E[X]=\mu=\dfrac{1}{\lambda}$;
$\mathrm{Var}(X)=\sigma^2=\dfrac{1}{\lambda^2}$.
3.4. Relação conceitual com Poisson
A Poisson (discreta) costuma modelar "quantos eventos ocorrem em um intervalo". A Exponencial (contínua) modela "quanto tempo até o próximo evento".
Poisson: contagem de eventos.
Exponencial: intervalo entre eventos.
Essa dualidade aparece em processos de chegadas (ligações, atendimentos, defeitos em uma linha por unidade de tempo) quando a taxa é constante.
Distribuição Normal: a curva de Gauss
A distribuição normal é uma das mais importantes da Estatística por dois motivos centrais:
muitos fenômenos naturais e erros de medição se aproximam de uma normal;
ela é o destino matemático de somas/médias de muitas variáveis, pelo Teorema do Limite Central.
4.1. Características geométricas
A curva normal tem propriedades marcantes:
simetria em torno da média $\mu$;
formato de "sino" (maior densidade próxima ao centro);
caudas que se estendem ao infinito e se aproximam do eixo $x$ sem tocá-lo (assintóticas).
Em uma normal perfeita:
média, mediana e moda coincidem.
4.2. Parâmetros
A distribuição normal é determinada por:
média $\mu$ (posição do centro);
desvio padrão $\sigma$ (espalhamento).
Escreve-se:
$X\sim \mathcal{N}(\mu,\sigma^2)$.
4.3. Regra empírica (valores aproximados)
A concentração de probabilidade em torno de $\mu$ segue aproximadamente:
$P(\mu-\sigma\le X\le \mu+\sigma)\approx 0{,}6827$;
$P(\mu-2\sigma\le X\le \mu+2\sigma)\approx 0{,}9545$;
$P(\mu-3\sigma\le X\le \mu+3\sigma)\approx 0{,}9973$.
Isso fornece intuição imediata sobre quão "raros" são valores muito distantes da média.
Normal padrão e escore-Z
A função densidade da normal não tem uma integral elementar simples. Na prática, calcula-se probabilidades por meio de padronização e uso de tabela (ou valores tabelados).
5.1. Normal padrão
A normal padrão é o caso particular:
$Z\sim \mathcal{N}(0,1)$.
Ou seja:
média 0;
variância 1 (desvio padrão 1).
5.2. Padronização (escore-Z)
Se $X\sim \mathcal{N}(\mu,\sigma^2)$, define-se:
$Z=\dfrac{X-\mu}{\sigma}$.
Interpretação do escore-Z:
quantos desvios padrões $X$ está acima (Z positivo) ou abaixo (Z negativo) da média.
Após padronizar, probabilidades em $X$ viram probabilidades em $Z$, que podem ser lidas em tabela.
5.3. Simetria como ferramenta
A normal padrão é simétrica:
$P(Z\le -a)=P(Z\ge a)$.
E para áreas entre dois valores:
$P(a\le Z\le b)=P(Z\le b)-P(Z\le a)$.
Muitas tabelas fornecem a área acumulada $P(Z\le z)$ (ou a área entre 0 e $z$). Em qualquer caso, a simetria permite recuperar rapidamente probabilidades para $z<0$.
Aplicações: cálculo por padronização e manejo de áreas
6.1. Controle de qualidade (pesos)
Uma máquina produz sacos com pesos normalmente distribuídos:
$X\sim \mathcal{N}(50,0{,}5^2)$.
Pede-se $P(48{,}5\le X\le 49{,}5)$.
Passo 1: padronizar os limites.
Para $48{,}5$:
$z1=\dfrac{48{,}5-50}{0{,}5}=\dfrac{-1{,}5}{0{,}5}=-3$.
Para $49{,}5$:
$z_2=\dfrac{49{,}5-50}{0{,}5}=\dfrac{-0{,}5}{0{,}5}=-1$.
Logo:
$P(48{,}5\le X\le 49{,}5)=P(-3\le Z\le -1)$.
Passo 2: usar simetria.
$P(-3\le Z\le -1)=P(1\le Z\le 3)$.
Passo 3: diferença de áreas (valores tabelados usuais).
Usando valores típicos:
$P(Z\le 3)\approx 0{,}9987$;
$P(Z\le 1)\approx 0{,}8413$.
Então:
$P(1\le Z\le 3)=0{,}9987-0{,}8413=0{,}1574$.
Logo:
$P(48{,}5\le X\le 49{,}5)\approx 0{,}1574=15{,}74\%$.
6.2. Distribuição de renda (cauda direita)
Considere $X\sim \mathcal{N}(20000,1500^2)$ e calcule $P(X>22000)$.
Passo 1: padronizar.
$z=\dfrac{22000-20000}{1500}=\dfrac{2000}{1500}\approx 1{,}33$.
Passo 2: usar área acumulada.
Se a tabela fornece $P(Z\le 1{,}33)\approx 0{,}9082$, então:
$P(Z>1{,}33)=1-0{,}9082=0{,}0918$.
Logo:
$P(X>22000)\approx 9{,}18\%$.
Se a tabela fornecesse a área entre 0 e $z$ (e $z$ for positivo), bastaria lembrar que:
$P(Z>z)=0{,}5-\text{área}(0\text{ a }z)$.
Para $z$ negativo, utilize a simetria da distribuição: $P(Z>z) = P(Z<-z)$.
Roteiro de resolução para problemas de distribuições contínuas
Um procedimento consistente evita erros de interpretação e de cálculo.
Identificar o modelo
uniforme em $[a,b]$;
exponencial com taxa $\lambda$;
normal com parâmetros $\mu$ e $\sigma$.
Extrair parâmetros e suporte
confirmar intervalos e unidades;
na exponencial, lembrar que $x\ge 0$;
na normal, reconhecer que a curva é definida em $(-\infty,\infty)$.
Converter o enunciado em área/probabilidade
intervalos viram integrais (conceitualmente);
na prática, na normal, intervalos viram escores-Z.
Padronizar quando for normal
$Z=\dfrac{X-\mu}{\sigma}$.
Ler e combinar áreas corretamente
usar simetria para valores negativos;
usar complemento para caudas: $P(Z>z)=1-P(Z\le z)$.
Interpretar o resultado
verificar coerência (probabilidade entre 0 e 1);
checar se o evento é raro ou comum pela distância em desvios padrões.
O domínio das distribuições contínuas consolida a passagem da contagem para a medição e prepara o terreno para inferência estatística: estimativas, intervalos de confiança e testes, que dependem diretamente de áreas sob curvas e da padronização por escores.