Distribuições de Probabilidade Contínua - Matemática

Aula de Matemática (Estatística e Probabilidade): Distribuições de Probabilidade Contínua. Estudo da distribuição normal e suas propriedades, incluindo o cálculo de áreas sob a curva. Estude gratuitamente para vestibular e ENEM no Tuco-Tuco.

Distribuições Contínuas de Probabilidade Até aqui, o estudo esteve centrado em variáveis aleatórias discretas, em que se "conta" a ocorrência de valores (0, 1, 2, …) e as probabilidades aparecem como somas. Ao migrarmos para o universo contínuo, ocorre uma mudança de paradigma: deixa-se de contar pontos isolados; passa-se a medir grandezas em intervalos; somas dão lugar a áreas sob curvas (integrais). Em distribuições contínuas, a probabilidade não é atribuída a valores isolados, mas a intervalos. O que se calcula é a área sob uma curva de densidade entre dois pontos. Fundamentos das variáveis aleatórias contínuas Uma variável aleatória contínua é aquela que pode assumir qualquer valor real dentro de um intervalo (ou união de intervalos). São variáveis associadas a medições: tempo; massa; temperatura; distância; pressão; altura. 1.1. Por que $P(X=a)=0$ em variáveis contínuas Em distribuições contínuas, a probabilidade de a variável assumir um valor exatamente igual a $a$ é: $P(X=a)=0$. A razão é geométrica e conceitual: probabilidades correspondem a áreas; um ponto isolado tem "largura" zero; área com base zero é zero. Consequência prática importante: $P(X\le a)=P(X<a)$, pois a diferença entre incluir ou excluir um único ponto é nula. Por isso, em problemas contínuos, o foco é sempre: $P(a\le X\le b)$, $P(X>b)$, $P(X<a)$, ou seja, probabilidades em intervalos. 1.2. Função densidade de probabilidade (FDP) A distribuição de uma variável contínua é descrita por uma função densidade de probabilidade $f(x)$. Para que $f(x)$ seja uma FDP válida, deve satisfazer: não negatividade: $f(x)\ge 0$ para todo $x$; integral unitária: $\int{-\infty}^{\infty} f(x)\,dx = 1$. 1.3. Probabilidade como área A probabilidade de $X$ cair entre $a$ e $b$ é a área sob a curva de $f(x)$ nesse intervalo: $P(a\le X\le b)=\inta^b f(x)\,dx$. Leitura geométrica: a curva $f(x)$ mede "densidade" (concentração relativa de probabilidade); a probabilidade é a área acumulada, não a altura em um ponto. Isso explica uma confusão comum: $f(x)$ não é uma probabilidade. Quem é probabilidade é a integral (a área) em um intervalo. Distribuição Uniforme Contínua: equiprobabilidade em um intervalo A distribuição uniforme contínua representa o cenário em que todos os valores em um intervalo fechado $[a,b]$ são igualmente plausíveis. 2.1. Definição (FDP) Se $X\sim \mathrm{Uniforme}(a,b)$, então: $f(x)=\dfrac{1}{b-a}$ para $a < x < b$; $f(x)=0$ para $x \le a$ ou $x \ge b$. Geometricamente, é um retângulo: base $b-a$; altura $\dfrac{1}{b-a}$; área total $=1$. Nota: Como $P(X=a)=P(X=b)=0$, incluir ou não os extremos no suporte da função densidade não altera o cálculo de qualquer probabilidade. Para qualquer subintervalo $[c,d] \subseteq [a,b]$, temos $P(c \le X \le d) = \frac{d-c}{b-a}$. 2.2. Probabilidade em intervalos Para qualquer subintervalo $[c,d]\subseteq[a,b]$: $P(c\le X\le d)=\intc^d \frac{1}{b-a}\,dx=\frac{d-c}{b-a}$. Ou seja: a probabilidade é proporcional ao comprimento do intervalo. 2.3. Média e variância Para $X\sim \mathrm{Uniforme}(a,b)$: $E[X]=\mu=\dfrac{a+b}{2}$; $\mathrm{Var}(X)=\sigma^2=\dfrac{(b-a)^2}{12}$. 2.4. Exemplo Se $X\sim \mathrm{Uniforme}(2,7)$, calcule $P(5\le X\le 7)$. $b-a=7-2=5$; $d-c=7-5=2$. Logo: $P(5\le X\le 7)=\dfrac{2}{5}=0{,}4=40\%$. A uniforme é um ponto de partida didático, mas muitos fenômenos reais têm densidade variável. Um modelo fundamental para tempos de espera é a distribuição exponencial. Distribuição Exponencial: tempos de espera e intervalos entre eventos A distribuição exponencial é usada para modelar: tempo até ocorrer um evento; vida útil de componentes sob hipótese de taxa constante; distância entre ocorrências em um fluxo. Ela é adequada quando se assume uma taxa média de ocorrências constante no tempo e independência local do processo. 3.1. Definição (FDP) Se $X\sim \mathrm{Exponencial}(\lambda)$, com $\lambda>0$, então: $f(x)=\lambda e^{-\lambda x}$ para $x>0$; $f(x)=0$ para $x\le 0$. O suporte ser $x>0$ faz sentido: tempos e distâncias, em geral, não são negativos. 3.2. Função de distribuição acumulada (FDA) A FDA é: $F(x)=P(X\le x)=1-e^{-\lambda x}$ para $x\ge 0$. Isso permite obter probabilidades do tipo "demorar no máximo $t

quot;: $P(X\le t)=1-e^{-\lambda t}$. E probabilidades de cauda direita ("demorar mais que $t

quot;): $P(X>t)=1-F(t)=e^{-\lambda t}$. 3.3. Média e variância Para $X\sim \mathrm{Exponencial}(\lambda)$: $E[X]=\mu=\dfrac{1}{\lambda}$; $\mathrm{Var}(X)=\sigma^2=\dfrac{1}{\lambda^2}$. 3.4. Relação conceitual com Poisson A Poisson (discreta) costuma modelar "quantos eventos ocorrem em um intervalo". A Exponencial (contínua) modela "quanto tempo até o próximo evento". Poisson: contagem de eventos. Exponencial: intervalo entre eventos. Essa dualidade aparece em processos de chegadas (ligações, atendimentos, defeitos em uma linha por unidade de tempo) quando a taxa é constante. Distribuição Normal: a curva de Gauss A distribuição normal é uma das mais importantes da Estatística por dois motivos centrais: muitos fenômenos naturais e erros de medição se aproximam de uma normal; ela é o destino matemático de somas/médias de muitas variáveis, pelo Teorema do Limite Central. 4.1. Características geométricas A curva normal tem propriedades marcantes: simetria em torno da média $\mu$; formato de "sino" (maior densidade próxima ao centro); caudas que se estendem ao infinito e se aproximam do eixo $x$ sem tocá-lo (assintóticas). Em uma normal perfeita: média, mediana e moda coincidem. 4.2. Parâmetros A distribuição normal é determinada por: média $\mu$ (posição do centro); desvio padrão $\sigma$ (espalhamento). Escreve-se: $X\sim \mathcal{N}(\mu,\sigma^2)$. 4.3. Regra empírica (valores aproximados) A concentração de probabilidade em torno de $\mu$ segue aproximadamente: $P(\mu-\sigma\le X\le \mu+\sigma)\approx 0{,}6827$; $P(\mu-2\sigma\le X\le \mu+2\sigma)\approx 0{,}9545$; $P(\mu-3\sigma\le X\le \mu+3\sigma)\approx 0{,}9973$. Isso fornece intuição imediata sobre quão "raros" são valores muito distantes da média. Normal padrão e escore-Z A função densidade da normal não tem uma integral elementar simples. Na prática, calcula-se probabilidades por meio de padronização e uso de tabela (ou valores tabelados). 5.1. Normal padrão A normal padrão é o caso particular: $Z\sim \mathcal{N}(0,1)$. Ou seja: média 0; variância 1 (desvio padrão 1). 5.2. Padronização (escore-Z) Se $X\sim \mathcal{N}(\mu,\sigma^2)$, define-se: $Z=\dfrac{X-\mu}{\sigma}$. Interpretação do escore-Z: quantos desvios padrões $X$ está acima (Z positivo) ou abaixo (Z negativo) da média. Após padronizar, probabilidades em $X$ viram probabilidades em $Z$, que podem ser lidas em tabela. 5.3. Simetria como ferramenta A normal padrão é simétrica: $P(Z\le -a)=P(Z\ge a)$. E para áreas entre dois valores: $P(a\le Z\le b)=P(Z\le b)-P(Z\le a)$. Muitas tabelas fornecem a área acumulada $P(Z\le z)$ (ou a área entre 0 e $z$). Em qualquer caso, a simetria permite recuperar rapidamente probabilidades para $z<0$. Aplicações: cálculo por padronização e manejo de áreas 6.1. Controle de qualidade (pesos) Uma máquina produz sacos com pesos normalmente distribuídos: $X\sim \mathcal{N}(50,0{,}5^2)$. Pede-se $P(48{,}5\le X\le 49{,}5)$. Passo 1: padronizar os limites. Para $48{,}5$: $z1=\dfrac{48{,}5-50}{0{,}5}=\dfrac{-1{,}5}{0{,}5}=-3$. Para $49{,}5$: $z_2=\dfrac{49{,}5-50}{0{,}5}=\dfrac{-0{,}5}{0{,}5}=-1$. Logo: $P(48{,}5\le X\le 49{,}5)=P(-3\le Z\le -1)$. Passo 2: usar simetria. $P(-3\le Z\le -1)=P(1\le Z\le 3)$. Passo 3: diferença de áreas (valores tabelados usuais). Usando valores típicos: $P(Z\le 3)\approx 0{,}9987$; $P(Z\le 1)\approx 0{,}8413$. Então: $P(1\le Z\le 3)=0{,}9987-0{,}8413=0{,}1574$. Logo: $P(48{,}5\le X\le 49{,}5)\approx 0{,}1574=15{,}74\%$. 6.2. Distribuição de renda (cauda direita) Considere $X\sim \mathcal{N}(20000,1500^2)$ e calcule $P(X>22000)$. Passo 1: padronizar. $z=\dfrac{22000-20000}{1500}=\dfrac{2000}{1500}\approx 1{,}33$. Passo 2: usar área acumulada. Se a tabela fornece $P(Z\le 1{,}33)\approx 0{,}9082$, então: $P(Z>1{,}33)=1-0{,}9082=0{,}0918$. Logo: $P(X>22000)\approx 9{,}18\%$. Se a tabela fornecesse a área entre 0 e $z$ (e $z$ for positivo), bastaria lembrar que: $P(Z>z)=0{,}5-\text{área}(0\text{ a }z)$. Para $z$ negativo, utilize a simetria da distribuição: $P(Z>z) = P(Z<-z)$. Roteiro de resolução para problemas de distribuições contínuas Um procedimento consistente evita erros de interpretação e de cálculo. Identificar o modelo uniforme em $[a,b]$; exponencial com taxa $\lambda$; normal com parâmetros $\mu$ e $\sigma$. Extrair parâmetros e suporte confirmar intervalos e unidades; na exponencial, lembrar que $x\ge 0$; na normal, reconhecer que a curva é definida em $(-\infty,\infty)$. Converter o enunciado em área/probabilidade intervalos viram integrais (conceitualmente); na prática, na normal, intervalos viram escores-Z. Padronizar quando for normal $Z=\dfrac{X-\mu}{\sigma}$. Ler e combinar áreas corretamente usar simetria para valores negativos; usar complemento para caudas: $P(Z>z)=1-P(Z\le z)$. Interpretar o resultado verificar coerência (probabilidade entre 0 e 1); checar se o evento é raro ou comum pela distância em desvios padrões. O domínio das distribuições contínuas consolida a passagem da contagem para a medição e prepara o terreno para inferência estatística: estimativas, intervalos de confiança e testes, que dependem diretamente de áreas sob curvas e da padronização por escores. Exercícios: Qual das alternativas abaixo é um exemplo de variável aleatória contínua? Considere uma variável aleatória contínua X com uma função densidade de probabilidade definida no intervalo \[0, 2\] como f(x) = 0.5. Qual é a probabilidade de X estar no intervalo \[0.5, 1.5\]? Sobre a Função Densidade de Probabilidade (FDP) de uma variável contínua, qual das afirmações é correta? Considere uma variável aleatória contínua X com a função densidade de probabilidade dada por f(x) = 2x, definida no intervalo \[0,1\]. Qual a probabilidade de X assumir valores entre 0,3 e 0,7? Qual das alternativas descreve corretamente uma propriedade fundamental da Função Densidade de Probabilidade (FDP) para variáveis aleatórias contínuas? O uso de variáveis aleatórias contínuas como coeficientes de equações permite avaliar a probabilidade de fenômenos algébricos e modelagens físicas. Considere que o coeficiente $X$ de uma equação do segundo grau $t^2 + 2Xt + X + 2 = 0$ seja uma variável aleatória com distribuição uniforme contínua distribuída no intervalo $[0, 5]$. Qual é a probabilidade exata de que esta equação polinomial possua raízes reais na variável $t$? A distribuição exponencial é o modelo estatístico de referência para descrever tempos de vida útil e falhas de sistemas, caracterizando-se analiticamente por sua taxa de risco constante. O tempo de vida de um componente eletrônico segue rigorosamente uma distribuição exponencial com média de $400\text{ horas}$. Um técnico inspeciona o componente e constata que ele já operou ininterruptamente por $200\text{ horas}$ sem falhar. Qual é a probabilidade estatística exata de que este mesmo componente opere por *pelo menos* mais $400\text{ horas}$ adicionais? A distribuição uniforme contínua bidimensional mapeia a probabilidade geométrica como uma razão de áreas perfeitamente delimitadas. Em um experimento de simulação de Monte Carlo, um ponto é sorteado aleatoriamente e com distribuição uniforme no interior de um círculo de raio $R = 5\text{ cm}$. Qual é a probabilidade exata de que o ponto sorteado esteja geometricamente mais próximo do centro do círculo do que de sua borda (circunferência externa)? A distribuição exponencial é amplamente utilizada em engenharia de confiabilidade e teoria das filas por mapear perfeitamente a ocorrência contínua de eventos. O tempo $T$, em dias, verificado entre falhas corretivas sucessivas em uma caldeira industrial segue uma distribuição exponencial com média de $50\text{ dias}$. Utilizando a função densidade de probabilidade (FDP) clássica do modelo, $f(t) = \lambda e^{-\lambda t}$ para $t \ge 0$, determine a probabilidade analítica de que a próxima falha ocorra em um período entre $50$ e 00\text{ dias}$ após a falha recém-consertada. Seja uma variável aleatória $X$ com distribuição uniforme contínua no intervalo $[a,b]$. Qual é a expressão correta para a sua função densidade de probabilidade $f(x)$ dentro desse intervalo? Uma variável aleatória $X$ segue uma distribuição uniforme contínua no intervalo $[5,15]$. Qual é a variância dessa variável? Em uma distribuição normal padrão, quais são os valores fixos da média e do desvio padrão? Uma fábrica produz parafusos com diâmetro seguindo uma distribuição normal de média $\mu=2{,}0$ cm e desvio padrão $\sigma=0{,}05$ cm. Se um parafuso possui diâmetro de $2{,}10$ cm, qual é o seu valor correspondente na escala $Z$? Dada uma distribuição uniforme contínua no intervalo $[2,10]$, qual é a probabilidade de a variável aleatória $X$ ser maior que 8? Em uma distribuição uniforme contínua no intervalo $[a,b]$, a média coincide com qual ponto geométrico? Na distribuição normal, se soubermos que $P(0<Z<1{,}5)=0{,}4332$, qual é a probabilidade de $Z$ ser maior que {,}5$? Uma variável aleatória X tem distribuição uniforme no intervalo [0, 20]. Qual é a probabilidade de que X esteja no intervalo de 5 a 15? Em uma distribuição uniforme contínua no intervalo $[A,B]$, qual é a probabilidade de a variável aleatória assumir um valor que esteja na primeira metade desse intervalo? Em uma distribuição uniforme no intervalo $[10,50]$, qual é o valor esperado (média)? A relação linear de padronização permite transpor distâncias e dispersões entre quantis de qualquer distribuição normal. Uma variável aleatória contínua empírica X segue uma distribuição normal N(μ, σ²). Sabe-se que, na curva normal padrão Z ~ N(0,1), os escores z do primeiro e do terceiro quartis são, respectivamente, aproximadamente -0,6745 e +0,6745. Sabendo que a Amplitude Interquartílica de X (diferença absoluta entre o terceiro e o primeiro quartil) é de 26,98, determine o valor exato da variância populacional da variável X. Uma variável aleatória contínua segue uma distribuição normal com média μ = 10 e desvio padrão σ = 2. Qual é aproximadamente a probabilidade de essa variável assumir valores no intervalo \[8, 12\]? O domínio das propriedades de funções densidade de probabilidade (FDP) contínuas exige a integração direta e o mapeamento dos momentos estatísticos sobre o espaço amostral. A velocidade de escoamento do vento $V$ no interior de um túnel aerodinâmico é modelada por uma variável aleatória contínua com FDP dada pela equação $f(v) = k(1 - v^2)$ para $v \in [-1, 1]$, sendo $f(v) = 0$ para valores fora desse intervalo. Sabendo que o modelo possui simetria par em torno do eixo vertical (logo, a média é nula, $E[V] = 0$), calcule o valor exato da variância desta velocidade de escoamento. O diâmetro de eixos metálicos usinados por uma indústria segue uma distribuição normal X ∼ N(μ, σ²). Sabe-se através do controle de qualidade que 15,87% dos eixos possuem diâmetro inferior a 10 mm e que 2,28% possuem diâmetro estritamente superior a 20 mm. Sabendo que, na distribuição normal padrão, P(Z < -1) ≈ 0.1587 e P(Z > 2) ≈ 0.0228, determine o valor exato da variância populacional (σ²) deste processo industrial. O tempo T, em segundos, necessário para compilar um código em um servidor é uma variável aleatória contínua com função densidade de probabilidade dada por f(t) = c * t, para 0 ≤ t ≤ 4, e f(t) = 0 fora desse intervalo. Determine o valor da mediana do tempo de compilação T.