1. Início
  2. Explorar
  3. Matemática
  4. Distribuições de Probabilidade Contínua

Distribuições de Probabilidade Contínua – Matemática | Tuco-Tuco

Estudo da distribuição normal e suas propriedades, incluindo o cálculo de áreas sob a curva.

Distribuições Contínuas de Probabilidade Até aqui, o estudo esteve centrado em variáveis aleatórias discretas, em que se "conta" a ocorrência de valores (0, 1, 2, …) e as probabilidades aparecem como somas. Ao migrarmos para o universo contínuo, ocorre uma mudança de paradigma: deixa-se de contar pontos isolados; passa-se a medir grandezas em intervalos; somas dão lugar a áreas sob curvas (integrais). Em distribuições contínuas, a probabilidade não é atribuída a valores isolados, mas a intervalos. O que se calcula é a área sob uma curva de densidade entre dois pontos. Fundamentos das variáveis aleatórias contínuas Uma variável aleatória contínua é aquela que pode assumir qualquer valor real dentro de um intervalo (ou união de intervalos). São variáveis associadas a medições: tempo; massa; temperatura; distância; pressão; altura. 1.1. Por que $P(X=a)=0$ em variáveis contínuas Em distribuições contínuas, a probabilidade de a variável assumir um valor exatamente igual a $a$ é: $P(X=a)=0$. A razão é geométrica e conceitual: probabilidades correspondem a áreas; um ponto isolado tem "largura" zero; área com base zero é zero. Consequência prática importante: $P(X\le a)=P(X<a)$, pois a diferença entre incluir ou excluir um único ponto é nula. Por isso, em problemas contínuos, o foco é sempre: $P(a\le X\le b)$, $P(X>b)$, $P(X<a)$, ou seja, probabilidades em intervalos. 1.2. Função densidade de probabilidade (FDP) A distribuição de uma variável contínua é descrita por uma função densidade de probabilidade $f(x)$. Para que $f(x)$ seja uma FDP válida, deve satisfazer: não negatividade: $f(x)\ge 0$ para todo $x$; integral unitária: $\int{-\infty}^{\infty} f(x)\,dx = 1$. 1.3. Probabilidade como área A probabilidade de $X$ cair entre $a$ e $b$ é a área sob a curva de $f(x)$ nesse intervalo: $P(a\le X\le b)=\inta^b f(x)\,dx$. Leitura geométrica: a curva $f(x)$ mede "densidade" (concentração relativa de probabilidade); a probabilidade é a área acumulada, não a altura em um ponto. Isso explica uma confusão comum: $f(x)$ não é uma probabilidade. Quem é probabilidade é a integral (a área) em um intervalo. Distribuição Uniforme Contínua: equiprobabilidade em um intervalo A distribuição uniforme contínua representa o cenário em que todos os valores em um intervalo fechado $[a,b]$ são igualmente plausíveis. 2.1. Definição (FDP) Se $X\sim \mathrm{Uniforme}(a,b)$, então: $f(x)=\dfrac{1}{b-a}$ para $a < x < b$; $f(x)=0$ para $x \le a$ ou $x \ge b$. Geometricamente, é um retângulo: base $b-a$; altura $\dfrac{1}{b-a}$; área total $=1$. Nota: Como $P(X=a)=P(X=b)=0$, incluir ou não os extremos no suporte da função densidade não altera o cálculo de qualquer probabilidade. Para qualquer subintervalo $[c,d] \subseteq [a,b]$, temos $P(c \le X \le d) = \frac{d-c}{b-a}$. 2.2. Probabilidade em intervalos Para qualquer subintervalo $[c,d]\subseteq[a,b]$: $P(c\le X\le d)=\intc^d \frac{1}{b-a}\,dx=\frac{d-c}{b-a}$. Ou seja: a probabilidade é proporcional ao comprimento do intervalo. 2.3. Média e variância Para $X\sim \mathrm{Uniforme}(a,b)$: $E[X]=\mu=\dfrac{a+b}{2}$; $\mathrm{Var}(X)=\sigma^2=\dfrac{(b-a)^2}{12}$. 2.4. Exemplo Se $X\sim \mathrm{Uniforme}(2,7)$, calcule $P(5\le X\le 7)$. $b-a=7-2=5$; $d-c=7-5=2$. Logo: $P(5\le X\le 7)=\dfrac{2}{5}=0{,}4=40\%$. A uniforme é um ponto de partida didático, mas muitos fenômenos reais têm densidade variável. Um modelo fundamental para tempos de espera é a distribuição exponencial. Distribuição Exponencial: tempos de espera e intervalos entre eventos A distribuição exponencial é usada para modelar: tempo até ocorrer um evento; vida útil de componentes sob hipótese de taxa constante; distância entre ocorrências em um fluxo. Ela é adequada quando se assume uma taxa média de ocorrências constante no tempo e independência local do processo. 3.1. Definição (FDP) Se $X\sim \mathrm{Exponencial}(\lambda)$, com $\lambda>0$, então: $f(x)=\lambda e^{-\lambda x}$ para $x>0$; $f(x)=0$ para $x\le 0$. O suporte ser $x>0$ faz sentido: tempos e distâncias, em geral, não são negativos. 3.2. Função de distribuição acumulada (FDA) A FDA é: $F(x)=P(X\le x)=1-e^{-\lambda x}$ para $x\ge 0$. Isso permite obter probabilidades do tipo "demorar no máximo $t
quot;: $P(X\le t)=1-e^{-\lambda t}$. E probabilidades de cauda direita ("demorar mais que $t
quot;): $P(X>t)=1-F(t)=e^{-\lambda t}$. 3.3. Média e variância Para $X\sim \mathrm{Exponencial}(\lambda)$: $E[X]=\mu=\dfrac{1}{\lambda}$; $\mathrm{Var}(X)=\sigma^2=\dfrac{1}{\lambda^2}$. 3.4. Relação conceitual com Poisson A Poisson (discreta) costuma modelar "quantos eventos ocorrem em um intervalo". A Exponencial (contínua) modela "quanto tempo até o próximo evento". Poisson: contagem de eventos. Exponencial: intervalo entre eventos. Essa dualidade aparece em processos de chegadas (ligações, atendimentos, defeitos em uma linha por unidade de tempo) quando a taxa é constante. Distribuição Normal: a curva de Gauss A distribuição normal é uma das mais importantes da Estatística por dois motivos centrais: muitos fenômenos naturais e erros de medição se aproximam de uma normal; ela é o destino matemático de somas/médias de muitas variáveis, pelo Teorema do Limite Central. 4.1. Características geométricas A curva normal tem propriedades marcantes: simetria em torno da média $\mu$; formato de "sino" (maior densidade próxima ao centro); caudas que se estendem ao infinito e se aproximam do eixo $x$ sem tocá-lo (assintóticas). Em uma normal perfeita: média, mediana e moda coincidem. 4.2. Parâmetros A distribuição normal é determinada por: média $\mu$ (posição do centro); desvio padrão $\sigma$ (espalhamento). Escreve-se: $X\sim \mathcal{N}(\mu,\sigma^2)$. 4.3. Regra empírica (valores aproximados) A concentração de probabilidade em torno de $\mu$ segue aproximadamente: $P(\mu-\sigma\le X\le \mu+\sigma)\approx 0{,}6827$; $P(\mu-2\sigma\le X\le \mu+2\sigma)\approx 0{,}9545$; $P(\mu-3\sigma\le X\le \mu+3\sigma)\approx 0{,}9973$. Isso fornece intuição imediata sobre quão "raros" são valores muito distantes da média. Normal padrão e escore-Z A função densidade da normal não tem uma integral elementar simples. Na prática, calcula-se probabilidades por meio de padronização e uso de tabela (ou valores tabelados). 5.1. Normal padrão A normal padrão é o caso particular: $Z\sim \mathcal{N}(0,1)$. Ou seja: média 0; variância 1 (desvio padrão 1). 5.2. Padronização (escore-Z) Se $X\sim \mathcal{N}(\mu,\sigma^2)$, define-se: $Z=\dfrac{X-\mu}{\sigma}$. Interpretação do escore-Z: quantos desvios padrões $X$ está acima (Z positivo) ou abaixo (Z negativo) da média. Após padronizar, probabilidades em $X$ viram probabilidades em $Z$, que podem ser lidas em tabela. 5.3. Simetria como ferramenta A normal padrão é simétrica: $P(Z\le -a)=P(Z\ge a)$. E para áreas entre dois valores: $P(a\le Z\le b)=P(Z\le b)-P(Z\le a)$. Muitas tabelas fornecem a área acumulada $P(Z\le z)$ (ou a área entre 0 e $z$). Em qualquer caso, a simetria permite recuperar rapidamente probabilidades para $z<0$. Aplicações: cálculo por padronização e manejo de áreas 6.1. Controle de qualidade (pesos) Uma máquina produz sacos com pesos normalmente distribuídos: $X\sim \mathcal{N}(50,0{,}5^2)$. Pede-se $P(48{,}5\le X\le 49{,}5)$. Passo 1: padronizar os limites. Para $48{,}5$: $z1=\dfrac{48{,}5-50}{0{,}5}=\dfrac{-1{,}5}{0{,}5}=-3$. Para $49{,}5$: $z_2=\dfrac{49{,}5-50}{0{,}5}=\dfrac{-0{,}5}{0{,}5}=-1$. Logo: $P(48{,}5\le X\le 49{,}5)=P(-3\le Z\le -1)$. Passo 2: usar simetria. $P(-3\le Z\le -1)=P(1\le Z\le 3)$. Passo 3: diferença de áreas (valores tabelados usuais). Usando valores típicos: $P(Z\le 3)\approx 0{,}9987$; $P(Z\le 1)\approx 0{,}8413$. Então: $P(1\le Z\le 3)=0{,}9987-0{,}8413=0{,}1574$. Logo: $P(48{,}5\le X\le 49{,}5)\approx 0{,}1574=15{,}74\%$. 6.2. Distribuição de renda (cauda direita) Considere $X\sim \mathcal{N}(20000,1500^2)$ e calcule $P(X>22000)$. Passo 1: padronizar. $z=\dfrac{22000-20000}{1500}=\dfrac{2000}{1500}\approx 1{,}33$. Passo 2: usar área acumulada. Se a tabela fornece $P(Z\le 1{,}33)\approx 0{,}9082$, então: $P(Z>1{,}33)=1-0{,}9082=0{,}0918$. Logo: $P(X>22000)\approx 9{,}18\%$. Se a tabela fornecesse a área entre 0 e $z$ (e $z$ for positivo), bastaria lembrar que: $P(Z>z)=0{,}5-\text{área}(0\text{ a }z)$. Para $z$ negativo, utilize a simetria da distribuição: $P(Z>z) = P(Z<-z)$. Roteiro de resolução para problemas de distribuições contínuas Um procedimento consistente evita erros de interpretação e de cálculo. Identificar o modelo uniforme em $[a,b]$; exponencial com taxa $\lambda$; normal com parâmetros $\mu$ e $\sigma$. Extrair parâmetros e suporte confirmar intervalos e unidades; na exponencial, lembrar que $x\ge 0$; na normal, reconhecer que a curva é definida em $(-\infty,\infty)$. Converter o enunciado em área/probabilidade intervalos viram integrais (conceitualmente); na prática, na normal, intervalos viram escores-Z. Padronizar quando for normal $Z=\dfrac{X-\mu}{\sigma}$. Ler e combinar áreas corretamente usar simetria para valores negativos; usar complemento para caudas: $P(Z>z)=1-P(Z\le z)$. Interpretar o resultado verificar coerência (probabilidade entre 0 e 1); checar se o evento é raro ou comum pela distância em desvios padrões. O domínio das distribuições contínuas consolida a passagem da contagem para a medição e prepara o terreno para inferência estatística: estimativas, intervalos de confiança e testes, que dependem diretamente de áreas sob curvas e da padronização por escores.