Distribuições de Probabilidade Contínua - Matemática | Tuco-Tuco
Aula de Matemática (Estatística e Probabilidade): Distribuições de Probabilidade Contínua. Estudo da distribuição normal e suas propriedades, incluindo o cálculo de áreas sob a curva. Estude gratuitamente para vestibular e ENEM no Tuco-Tuco.
Distribuições Contínuas de Probabilidade
Até aqui, o estudo esteve centrado em variáveis aleatórias discretas, em que se "conta" a ocorrência de valores (0, 1, 2, …) e as probabilidades aparecem como somas. Ao migrarmos para o universo contínuo, ocorre uma mudança de paradigma:
deixa-se de contar pontos isolados;
passa-se a medir grandezas em intervalos;
somas dão lugar a áreas sob curvas (integrais).
Em distribuições contínuas, a probabilidade não é atribuída a valores isolados, mas a intervalos. O que se calcula é a área sob uma curva de densidade entre dois pontos.
Fundamentos das variáveis aleatórias contínuas
Uma variável aleatória contínua é aquela que pode assumir qualquer valor real dentro de um intervalo (ou união de intervalos). São variáveis associadas a medições:
tempo;
massa;
temperatura;
distância;
pressão;
altura.
1.1. Por que $P(X=a)=0$ em variáveis contínuas
Em distribuições contínuas, a probabilidade de a variável assumir um valor exatamente igual a $a$ é:
$P(X=a)=0$.
A razão é geométrica e conceitual:
probabilidades correspondem a áreas;
um ponto isolado tem "largura" zero;
área com base zero é zero.
Consequência prática importante:
$P(X\le a)=P(X<a)$, pois a diferença entre incluir ou excluir um único ponto é nula.
Por isso, em problemas contínuos, o foco é sempre:
$P(a\le X\le b)$,
$P(X>b)$,
$P(X<a)$,
ou seja, probabilidades em intervalos.
1.2. Função densidade de probabilidade (FDP)
A distribuição de uma variável contínua é descrita por uma função densidade de probabilidade $f(x)$.
Para que $f(x)$ seja uma FDP válida, deve satisfazer:
não negatividade: $f(x)\ge 0$ para todo $x$;
integral unitária: $\int{-\infty}^{\infty} f(x)\,dx = 1$.
1.3. Probabilidade como área
A probabilidade de $X$ cair entre $a$ e $b$ é a área sob a curva de $f(x)$ nesse intervalo:
$P(a\le X\le b)=\inta^b f(x)\,dx$.
Leitura geométrica:
a curva $f(x)$ mede "densidade" (concentração relativa de probabilidade);
a probabilidade é a área acumulada, não a altura em um ponto.
Isso explica uma confusão comum:
$f(x)$ não é uma probabilidade.
Quem é probabilidade é a integral (a área) em um intervalo.
Distribuição Uniforme Contínua: equiprobabilidade em um intervalo
A distribuição uniforme contínua representa o cenário em que todos os valores em um intervalo fechado $[a,b]$ são igualmente plausíveis.
2.1. Definição (FDP)
Se $X\sim \mathrm{Uniforme}(a,b)$, então:
$f(x)=\dfrac{1}{b-a}$ para $a < x < b$;
$f(x)=0$ para $x \le a$ ou $x \ge b$.
Geometricamente, é um retângulo:
base $b-a$;
altura $\dfrac{1}{b-a}$;
área total $=1$.
Nota: Como $P(X=a)=P(X=b)=0$, incluir ou não os extremos no suporte da função densidade não altera o cálculo de qualquer probabilidade. Para qualquer subintervalo $[c,d] \subseteq [a,b]$, temos $P(c \le X \le d) = \frac{d-c}{b-a}$.
2.2. Probabilidade em intervalos
Para qualquer subintervalo $[c,d]\subseteq[a,b]$:
$P(c\le X\le d)=\intc^d \frac{1}{b-a}\,dx=\frac{d-c}{b-a}$.
Ou seja: a probabilidade é proporcional ao comprimento do intervalo.
2.3. Média e variância
Para $X\sim \mathrm{Uniforme}(a,b)$:
$E[X]=\mu=\dfrac{a+b}{2}$;
$\mathrm{Var}(X)=\sigma^2=\dfrac{(b-a)^2}{12}$.
2.4. Exemplo
Se $X\sim \mathrm{Uniforme}(2,7)$, calcule $P(5\le X\le 7)$.
$b-a=7-2=5$;
$d-c=7-5=2$.
Logo:
$P(5\le X\le 7)=\dfrac{2}{5}=0{,}4=40\%$.
A uniforme é um ponto de partida didático, mas muitos fenômenos reais têm densidade variável. Um modelo fundamental para tempos de espera é a distribuição exponencial.
Distribuição Exponencial: tempos de espera e intervalos entre eventos
A distribuição exponencial é usada para modelar:
tempo até ocorrer um evento;
vida útil de componentes sob hipótese de taxa constante;
distância entre ocorrências em um fluxo.
Ela é adequada quando se assume uma taxa média de ocorrências constante no tempo e independência local do processo.
3.1. Definição (FDP)
Se $X\sim \mathrm{Exponencial}(\lambda)$, com $\lambda>0$, então:
$f(x)=\lambda e^{-\lambda x}$ para $x>0$;
$f(x)=0$ para $x\le 0$.
O suporte ser $x>0$ faz sentido: tempos e distâncias, em geral, não são negativos.
3.2. Função de distribuição acumulada (FDA)
A FDA é:
$F(x)=P(X\le x)=1-e^{-\lambda x}$ para $x\ge 0$.
Isso permite obter probabilidades do tipo "demorar no máximo $tquot;:
$P(X\le t)=1-e^{-\lambda t}$.
E probabilidades de cauda direita ("demorar mais que $tquot;):
$P(X>t)=1-F(t)=e^{-\lambda t}$.
3.3. Média e variância
Para $X\sim \mathrm{Exponencial}(\lambda)$:
$E[X]=\mu=\dfrac{1}{\lambda}$;
$\mathrm{Var}(X)=\sigma^2=\dfrac{1}{\lambda^2}$.
3.4. Relação conceitual com Poisson
A Poisson (discreta) costuma modelar "quantos eventos ocorrem em um intervalo". A Exponencial (contínua) modela "quanto tempo até o próximo evento".
Poisson: contagem de eventos.
Exponencial: intervalo entre eventos.
Essa dualidade aparece em processos de chegadas (ligações, atendimentos, defeitos em uma linha por unidade de tempo) quando a taxa é constante.
Distribuição Normal: a curva de Gauss
A distribuição normal é uma das mais importantes da Estatística por dois motivos centrais:
muitos fenômenos naturais e erros de medição se aproximam de uma normal;
ela é o destino matemático de somas/médias de muitas variáveis, pelo Teorema do Limite Central.
4.1. Características geométricas
A curva normal tem propriedades marcantes:
simetria em torno da média $\mu$;
formato de "sino" (maior densidade próxima ao centro);
caudas que se estendem ao infinito e se aproximam do eixo $x$ sem tocá-lo (assintóticas).
Em uma normal perfeita:
média, mediana e moda coincidem.
4.2. Parâmetros
A distribuição normal é determinada por:
média $\mu$ (posição do centro);
desvio padrão $\sigma$ (espalhamento).
Escreve-se:
$X\sim \mathcal{N}(\mu,\sigma^2)$.
4.3. Regra empírica (valores aproximados)
A concentração de probabilidade em torno de $\mu$ segue aproximadamente:
$P(\mu-\sigma\le X\le \mu+\sigma)\approx 0{,}6827$;
$P(\mu-2\sigma\le X\le \mu+2\sigma)\approx 0{,}9545$;
$P(\mu-3\sigma\le X\le \mu+3\sigma)\approx 0{,}9973$.
Isso fornece intuição imediata sobre quão "raros" são valores muito distantes da média.
Normal padrão e escore-Z
A função densidade da normal não tem uma integral elementar simples. Na prática, calcula-se probabilidades por meio de padronização e uso de tabela (ou valores tabelados).
5.1. Normal padrão
A normal padrão é o caso particular:
$Z\sim \mathcal{N}(0,1)$.
Ou seja:
média 0;
variância 1 (desvio padrão 1).
5.2. Padronização (escore-Z)
Se $X\sim \mathcal{N}(\mu,\sigma^2)$, define-se:
$Z=\dfrac{X-\mu}{\sigma}$.
Interpretação do escore-Z:
quantos desvios padrões $X$ está acima (Z positivo) ou abaixo (Z negativo) da média.
Após padronizar, probabilidades em $X$ viram probabilidades em $Z$, que podem ser lidas em tabela.
5.3. Simetria como ferramenta
A normal padrão é simétrica:
$P(Z\le -a)=P(Z\ge a)$.
E para áreas entre dois valores:
$P(a\le Z\le b)=P(Z\le b)-P(Z\le a)$.
Muitas tabelas fornecem a área acumulada $P(Z\le z)$ (ou a área entre 0 e $z$). Em qualquer caso, a simetria permite recuperar rapidamente probabilidades para $z<0$.
Aplicações: cálculo por padronização e manejo de áreas
6.1. Controle de qualidade (pesos)
Uma máquina produz sacos com pesos normalmente distribuídos:
$X\sim \mathcal{N}(50,0{,}5^2)$.
Pede-se $P(48{,}5\le X\le 49{,}5)$.
Passo 1: padronizar os limites.
Para $48{,}5$:
$z1=\dfrac{48{,}5-50}{0{,}5}=\dfrac{-1{,}5}{0{,}5}=-3$.
Para $49{,}5$:
$z_2=\dfrac{49{,}5-50}{0{,}5}=\dfrac{-0{,}5}{0{,}5}=-1$.
Logo:
$P(48{,}5\le X\le 49{,}5)=P(-3\le Z\le -1)$.
Passo 2: usar simetria.
$P(-3\le Z\le -1)=P(1\le Z\le 3)$.
Passo 3: diferença de áreas (valores tabelados usuais).
Usando valores típicos:
$P(Z\le 3)\approx 0{,}9987$;
$P(Z\le 1)\approx 0{,}8413$.
Então:
$P(1\le Z\le 3)=0{,}9987-0{,}8413=0{,}1574$.
Logo:
$P(48{,}5\le X\le 49{,}5)\approx 0{,}1574=15{,}74\%$.
6.2. Distribuição de renda (cauda direita)
Considere $X\sim \mathcal{N}(20000,1500^2)$ e calcule $P(X>22000)$.
Passo 1: padronizar.
$z=\dfrac{22000-20000}{1500}=\dfrac{2000}{1500}\approx 1{,}33$.
Passo 2: usar área acumulada.
Se a tabela fornece $P(Z\le 1{,}33)\approx 0{,}9082$, então:
$P(Z>1{,}33)=1-0{,}9082=0{,}0918$.
Logo:
$P(X>22000)\approx 9{,}18\%$.
Se a tabela fornecesse a área entre 0 e $z$ (e $z$ for positivo), bastaria lembrar que:
$P(Z>z)=0{,}5-\text{área}(0\text{ a }z)$.
Para $z$ negativo, utilize a simetria da distribuição: $P(Z>z) = P(Z<-z)$.
Roteiro de resolução para problemas de distribuições contínuas
Um procedimento consistente evita erros de interpretação e de cálculo.
Identificar o modelo
uniforme em $[a,b]$;
exponencial com taxa $\lambda$;
normal com parâmetros $\mu$ e $\sigma$.
Extrair parâmetros e suporte
confirmar intervalos e unidades;
na exponencial, lembrar que $x\ge 0$;
na normal, reconhecer que a curva é definida em $(-\infty,\infty)$.
Converter o enunciado em área/probabilidade
intervalos viram integrais (conceitualmente);
na prática, na normal, intervalos viram escores-Z.
Padronizar quando for normal
$Z=\dfrac{X-\mu}{\sigma}$.
Ler e combinar áreas corretamente
usar simetria para valores negativos;
usar complemento para caudas: $P(Z>z)=1-P(Z\le z)$.
Interpretar o resultado
verificar coerência (probabilidade entre 0 e 1);
checar se o evento é raro ou comum pela distância em desvios padrões.
O domínio das distribuições contínuas consolida a passagem da contagem para a medição e prepara o terreno para inferência estatística: estimativas, intervalos de confiança e testes, que dependem diretamente de áreas sob curvas e da padronização por escores.
Exercícios:
Qual das alternativas abaixo é um exemplo de variável aleatória contínua?
Considere uma variável aleatória contínua X com uma função densidade de probabilidade definida no intervalo \[0, 2\] como f(x) = 0.5. Qual é a probabilidade de X estar no intervalo \[0.5, 1.5\]?
Sobre a Função Densidade de Probabilidade (FDP) de uma variável contínua, qual das afirmações é correta?
Considere uma variável aleatória contínua X com a função densidade de probabilidade dada por f(x) = 2x, definida no intervalo \[0,1\]. Qual a probabilidade de X assumir valores entre 0,3 e 0,7?
Qual das alternativas descreve corretamente uma propriedade fundamental da Função Densidade de Probabilidade (FDP) para variáveis aleatórias contínuas?
O uso de variáveis aleatórias contínuas como coeficientes de equações permite avaliar a probabilidade de fenômenos algébricos e modelagens físicas. Considere que o coeficiente $X$ de uma equação do segundo grau $t^2 + 2Xt + X + 2 = 0$ seja uma variável aleatória com distribuição uniforme contínua distribuída no intervalo $[0, 5]$. Qual é a probabilidade exata de que esta equação polinomial possua raízes reais na variável $t$?
A distribuição exponencial é o modelo estatístico de referência para descrever tempos de vida útil e falhas de sistemas, caracterizando-se analiticamente por sua taxa de risco constante. O tempo de vida de um componente eletrônico segue rigorosamente uma distribuição exponencial com média de $400\text{ horas}$. Um técnico inspeciona o componente e constata que ele já operou ininterruptamente por $200\text{ horas}$ sem falhar. Qual é a probabilidade estatística exata de que este mesmo componente opere por *pelo menos* mais $400\text{ horas}$ adicionais?
A distribuição uniforme contínua bidimensional mapeia a probabilidade geométrica como uma razão de áreas perfeitamente delimitadas. Em um experimento de simulação de Monte Carlo, um ponto é sorteado aleatoriamente e com distribuição uniforme no interior de um círculo de raio $R = 5\text{ cm}$. Qual é a probabilidade exata de que o ponto sorteado esteja geometricamente mais próximo do centro do círculo do que de sua borda (circunferência externa)?
A distribuição exponencial é amplamente utilizada em engenharia de confiabilidade e teoria das filas por mapear perfeitamente a ocorrência contínua de eventos. O tempo $T$, em dias, verificado entre falhas corretivas sucessivas em uma caldeira industrial segue uma distribuição exponencial com média de $50\text{ dias}$. Utilizando a função densidade de probabilidade (FDP) clássica do modelo, $f(t) = \lambda e^{-\lambda t}$ para $t \ge 0$, determine a probabilidade analítica de que a próxima falha ocorra em um período entre $50$ e 00\text{ dias}$ após a falha recém-consertada.
Seja uma variável aleatória $X$ com distribuição uniforme contínua no intervalo $[a,b]$. Qual é a expressão correta para a sua função densidade de probabilidade $f(x)$ dentro desse intervalo?
Uma variável aleatória $X$ segue uma distribuição uniforme contínua no intervalo $[5,15]$. Qual é a variância dessa variável?
Em uma distribuição normal padrão, quais são os valores fixos da média e do desvio padrão?
Uma fábrica produz parafusos com diâmetro seguindo uma distribuição normal de média $\mu=2{,}0$ cm e desvio padrão $\sigma=0{,}05$ cm. Se um parafuso possui diâmetro de $2{,}10$ cm, qual é o seu valor correspondente na escala $Z$?
Dada uma distribuição uniforme contínua no intervalo $[2,10]$, qual é a probabilidade de a variável aleatória $X$ ser maior que 8?
Em uma distribuição uniforme contínua no intervalo $[a,b]$, a média coincide com qual ponto geométrico?
Na distribuição normal, se soubermos que $P(0<Z<1{,}5)=0{,}4332$, qual é a probabilidade de $Z$ ser maior que {,}5$?
Uma variável aleatória X tem distribuição uniforme no intervalo [0, 20]. Qual é a probabilidade de que X esteja no intervalo de 5 a 15?
Em uma distribuição uniforme contínua no intervalo $[A,B]$, qual é a probabilidade de a variável aleatória assumir um valor que esteja na primeira metade desse intervalo?
Em uma distribuição uniforme no intervalo $[10,50]$, qual é o valor esperado (média)?
A relação linear de padronização permite transpor distâncias e dispersões entre quantis de qualquer distribuição normal. Uma variável aleatória contínua empírica X segue uma distribuição normal N(μ, σ²). Sabe-se que, na curva normal padrão Z ~ N(0,1), os escores z do primeiro e do terceiro quartis são, respectivamente, aproximadamente -0,6745 e +0,6745. Sabendo que a Amplitude Interquartílica de X (diferença absoluta entre o terceiro e o primeiro quartil) é de 26,98, determine o valor exato da variância populacional da variável X.
Uma variável aleatória contínua segue uma distribuição normal com média μ = 10 e desvio padrão σ = 2. Qual é aproximadamente a probabilidade de essa variável assumir valores no intervalo \[8, 12\]?
O domínio das propriedades de funções densidade de probabilidade (FDP) contínuas exige a integração direta e o mapeamento dos momentos estatísticos sobre o espaço amostral. A velocidade de escoamento do vento $V$ no interior de um túnel aerodinâmico é modelada por uma variável aleatória contínua com FDP dada pela equação $f(v) = k(1 - v^2)$ para $v \in [-1, 1]$, sendo $f(v) = 0$ para valores fora desse intervalo. Sabendo que o modelo possui simetria par em torno do eixo vertical (logo, a média é nula, $E[V] = 0$), calcule o valor exato da variância desta velocidade de escoamento.
O diâmetro de eixos metálicos usinados por uma indústria segue uma distribuição normal X ∼ N(μ, σ²). Sabe-se através do controle de qualidade que 15,87% dos eixos possuem diâmetro inferior a 10 mm e que 2,28% possuem diâmetro estritamente superior a 20 mm. Sabendo que, na distribuição normal padrão, P(Z < -1) ≈ 0.1587 e P(Z > 2) ≈ 0.0228, determine o valor exato da variância populacional (σ²) deste processo industrial.
O tempo T, em segundos, necessário para compilar um código em um servidor é uma variável aleatória contínua com função densidade de probabilidade dada por f(t) = c * t, para 0 ≤ t ≤ 4, e f(t) = 0 fora desse intervalo. Determine o valor da mediana do tempo de compilação T.