1. Início
  2. Explorar
  3. Matemática
  4. Estatística e Probabilidade
  5. Distribuições de Probabilidade Discreta

Distribuições de Probabilidade Discreta - Matemática | Tuco-Tuco

Aula de Matemática (Estatística e Probabilidade): Distribuições de Probabilidade Discreta. Introdução às distribuições de probabilidade discreta, como a binomial e a de Poisson. Estude gratuitamente para vestibular e ENEM no Tuco-Tuco.

Distribuições de Probabilidade Discreta: teoria, modelagem e aplicações Fundamentos das variáveis aleatórias A Probabilidade, quando trabalha apenas com eventos (“sair cara”, “tirar um ás”, “a soma ser 8”), descreve condições sobre resultados. Para avançar em modelagem estatística, precisamos de uma ferramenta que transforme resultados (muitas vezes qualitativos) em números, permitindo cálculos sistemáticos de médias, dispersões e probabilidades para diferentes valores. Essa ferramenta é a variável aleatória. 1.1. Definição de variável aleatória Uma variável aleatória (v.a.) é uma função que associa a cada resultado do espaço amostral $\Omega$ um número real: $X: \Omega \to \mathbb{R}$. Interpretação: o experimento ocorre no "mundo do acaso" (em $\Omega$); a variável aleatória traduz o resultado para um número, tornando-o analisável. Exemplo: 3 lançamentos de moeda Considere lançar uma moeda honesta três vezes. Um possível resultado é $(C, K, C)$. Defina $X$ como “número de caras”. Então: $X(C,K,C)=2$. Perceba que o resultado original é uma sequência (qualitativa), mas $X$ converte isso em um número que pode ser tratado estatisticamente. 1.2. Discretas versus contínuas A primeira decisão técnica ao modelar é identificar se $X$ é discreta ou contínua. | Característica | Variável discreta | Variável contínua | |---|---|---| | Conjunto de valores possíveis | finito ou infinito enumerável (contável) | intervalo(s) de valores reais (incontável) | | Probabilidade em um valor exato | pode ser
gt;0$ (ex.: $P(X=3)$) | tipicamente $P(X=a)=0$ | | Representação típica | tabela / barras / fórmula de massa | densidade (curva) | | Exemplos | número de defeitos por peça, número de clientes por hora, número de caras em $n$ lançamentos | tempo de espera, altura, massa, pressão | Nesta aula, o foco é distribuições discretas, isto é, aquelas em que $X$ assume valores contáveis e podemos atribuir uma probabilidade a cada valor específico. Função massa de probabilidade e função distribuição acumulada Uma distribuição discreta é, essencialmente, um conjunto coerente de probabilidades atribuídas aos valores possíveis de $X$. 2.1. Função massa de probabilidade (FMP) A função massa de probabilidade (também chamada “função de probabilidade” em variáveis discretas) é: $p(x)=P(X=x)$. Ela atribui a cada valor possível $x$ uma probabilidade. Condições para ser válida Para que uma função descreva uma distribuição discreta, ela deve satisfazer: Não-negatividade: $p(x)\ge 0$ para todo $x$. Soma unitária: $\sumx p(x)=1$ (somando sobre todos os valores possíveis de $X$). Essas condições garantem consistência: probabilidades não podem ser negativas e o total de chance no universo deve ser 100%. 2.2. Formas de representar uma distribuição discreta Uma mesma distribuição pode aparecer em três formatos comuns: Tabela: lista valores $xi$ e suas probabilidades $p(xi)$. Gráfico de barras: cada valor $x$ tem uma barra com altura $p(x)$. Forma analítica: uma fórmula geral (por exemplo, Binomial, Hipergeométrica ou Poisson) para calcular $P(X=k)$. 2.3. Função distribuição acumulada (FDA) A função distribuição acumulada é definida por: $F(x)=P(X\le x)$. Para variáveis discretas, ela é uma função em “degraus”, pois acumula probabilidades em pontos isolados. Propriedades importantes: $F(x)$ é não decrescente; $0\le F(x)\le 1$; para valores muito baixos, $F(x)$ tende a 0; para valores acima do máximo (quando existe) ou suficientemente grandes, $F(x)$ tende a 1. A FDA é útil para calcular probabilidades do tipo $P(X\le a)$, $P(X<a)$ e também intervalos: $P(a< X \le b)=F(b)-F(a)$, com atenção à inclusão/exclusão dependendo do tipo de desigualdade. Medidas descritivas: esperança, variância e desvio padrão Além de calcular probabilidades pontuais, é comum resumir o comportamento de $X$ por medidas de centralidade e dispersão. 3.1. Esperança matemática (valor esperado) O valor esperado de $X$ é a média ponderada pelos pesos probabilísticos: $E[X]=\sumx x\,P(X=x)$. Interpretação correta: $E[X]$ não é “o resultado que necessariamente ocorrerá”. $E[X]$ é a média de longo prazo: se repetirmos o experimento muitas vezes, a média observada tende a $E[X]$. Exemplo conceitual rápido Se $X$ assume 0 com probabilidade 0,9 e 10 com probabilidade 0,1, então: $E[X]=0\cdot 0{,}9 + 10\cdot 0{,}1=1$. Isso não significa que “o resultado será 1” em uma realização; significa que, em média, o processo produz 1 por repetição. 3.2. Variância e desvio padrão A variância mede a dispersão de $X$ ao redor da média: $\mathrm{Var}(X)=E\big[(X-E[X])^2\big]$. Para cálculo, uma forma extremamente prática é: $\mathrm{Var}(X)=E[X^2]-(E[X])^2$, onde: $E[X^2]=\sumx x^2\,P(X=x)$. O desvio padrão é: $\sigma=\sqrt{\mathrm{Var}(X)}$. Ele retorna a medida para a mesma unidade da variável (por exemplo, “número de defeitos”, “clientes”, “caras”). 3.3. Notação: parâmetros do modelo vs estatísticas amostrais Em modelagem probabilística, costuma-se usar: $\mu=E[X]$ (média populacional/modelo) $\sigma^2=\mathrm{Var}(X)$ (variância do modelo) Em dados amostrais, aparecem: $\bar{x}$ (média amostral) $s^2$ (variância amostral) Eles não são a mesma coisa: os primeiros são “verdades do modelo”; os segundos são estimativas obtidas por amostras. O modelo de Bernoulli: o átomo das distribuições discretas O ensaio de Bernoulli é o caso mais simples e mais importante: um experimento com apenas dois resultados possíveis. 4.1. Definição Uma variável aleatória $X$ tem distribuição de Bernoulli quando: $X=1$ (sucesso) com probabilidade $p$; $X=0$ (fracasso) com probabilidade $q=1-p$. Observação conceitual: “sucesso” é apenas um rótulo para o evento de interesse, não implica algo positivo. 4.2. Esperança e variância na Bernoulli Para $X\sim \mathrm{Bernoulli}(p)$: $E[X]=p$. $\mathrm{Var}(X)=p(1-p)$. Esse resultado é fundamental porque serve de base para a distribuição Binomial. Distribuição Binomial: contagem de sucessos em $n$ ensaios independentes A Binomial modela o número de sucessos em uma sequência de ensaios de Bernoulli independentes e com probabilidade de sucesso constante. 5.1. Situação típica Você usa Binomial quando o enunciado descreve: $n$ tentativas; cada tentativa tem dois resultados (sucesso/fracasso); as tentativas são independentes; a probabilidade de sucesso é constante ($p$). Exemplos típicos: número de peças defeituosas em uma amostra com reposição (ou população muito grande); número de acertos em uma prova de múltipla escolha com chutes independentes; número de caras em $n$ lançamentos de moeda. 5.2. Fórmula da probabilidade Se $X\sim \mathrm{Binomial}(n,p)$, então: $P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}$, para $k=0,1,\dots,n$. O termo combinatório: $\binom{n}{k}=\dfrac{n!}{k!(n-k)!}$ conta quantas sequências diferentes existem com exatamente $k$ sucessos em $n$ tentativas. 5.3. Média e variância na Binomial Para $X\sim \mathrm{Binomial}(n,p)$: $E[X]=np$. $\mathrm{Var}(X)=np(1-p)$. 5.4. Exemplo completo Em uma linha de produção, 10% das ferramentas são defeituosas. Em uma amostra de $n=10$ ferramentas (modelo binomial), qual a probabilidade de exatamente $k=2$ serem defeituosas? Parâmetros: $p=0{,}10$; -p=0{,}90$; $n=10$; $k=2$. Cálculo: $\binom{10}{2}=\dfrac{10!}{2!8!}=\dfrac{10\cdot 9}{2\cdot 1}=45$. Logo: $P(X=2)=45\cdot(0{,}10)^2\cdot(0{,}90)^8$. A estrutura do cálculo é mais importante que a aproximação numérica: em avaliações, é comum manter a expressão organizada e só então aproximar. 5.5. Quando a Binomial falha Se o processo é sem reposição em população finita (como retirar cartas de um baralho, bolas de urna, itens de um lote pequeno), a independência se perde e a Binomial pode não ser adequada. Nesses casos, entra a Hipergeométrica. Distribuição Hipergeométrica: amostragem sem reposição A Hipergeométrica é o modelo clássico para contar sucessos em uma amostra retirada sem reposição de uma população finita. 6.1. Situação típica Você usa Hipergeométrica quando o enunciado descreve: população finita de tamanho $N$; dentro dela, há $N1$ itens "sucesso" e $N2$ itens "fracasso", com $N1+N2=N$; retira-se uma amostra de tamanho $n$ sem reposição; $X$ é o número de sucessos na amostra. 6.2. Fórmula Se $X\sim \mathrm{Hipergeom}(N,N1,n)$, então: $P(X=k)=\dfrac{\binom{N1}{k}\,\binom{N2}{n-k}}{\binom{N}{n}}$, com $k$ compatível com as restrições do problema. Interpretação: $\binom{N1}{k}$: formas de escolher $k$ sucessos. $\binom{N2}{n-k}$: formas de escolher $n-k$ fracassos. $\binom{N}{n}$: formas totais de escolher $n$ itens da população. 6.3. Média e variância (com correção para população finita) A média é: $E[X]=n\cdot\dfrac{N1}{N}$. A variância incorpora o fator de correção: $\mathrm{Var}(X)=n\cdot\dfrac{N1}{N}\left(1-\dfrac{N1}{N}\right)\cdot\dfrac{N-n}{N-1}$. O termo $\dfrac{N-n}{N-1}$ aparece porque, sem reposição, a variabilidade diminui em comparação ao modelo com reposição. 6.4. Exemplo passo a passo Urna com $N=10$ bolas: $N1=7$ verdes (sucessos) $N2=3$ laranjas (fracassos) Retiram-se $n=3$ bolas sem reposição. Probabilidade de obter exatamente $k=2$ verdes: $\binom{7}{2}=\dfrac{7\cdot 6}{2}=21$. $\binom{3}{1}=3$. $\binom{10}{3}=\dfrac{10\cdot 9\cdot 8}{3\cdot 2\cdot 1}=120$. Logo: $P(X=2)=\dfrac{21\cdot 3}{120}=\dfrac{63}{120}=\dfrac{21}{40}=0{,}525$. Em porcentagem: $52{,}5\%$. Distribuição de Poisson: contagem de ocorrências em intervalos A distribuição de Poisson modela a contagem de eventos raros que ocorrem de forma aleatória e independente em um contínuo (tempo, área, volume, comprimento, etc.), desde que a taxa média de ocorrência (λ) seja constante no intervalo considerado. 7.1. Parâmetro $\lambda$ O parâmetro $\lambda$ é a média esperada de ocorrências no intervalo considerado. Para $X\sim \mathrm{Poisson}(\lambda)$: $P(X=k)=\dfrac{e^{-\lambda}\lambda^k}{k!}$, para $k=0,1,2,\dots$. Uma propriedade central: $E[X]=\lambda$. $\mathrm{Var}(X)=\lambda$. Ou seja, na Poisson, média e variância coincidem. 7.2. Ajuste de escala (como usar $\lambda$ corretamente) O erro mais comum em Poisson é usar uma taxa em um intervalo diferente do pedido. Regra operacional: $\lambda$ deve corresponder ao mesmo intervalo do enunciado. Exemplo: se a taxa é “1 ligação a cada 30 minutos”: em 30 minutos, $\lambda=1$; em 1 hora (60 min), $\lambda=2$; em 2 horas, $\lambda=4$. Isso evita incoerências no modelo. 7.3. Relação com a Binomial (ideia de aproximação) A Poisson pode ser vista como limite de uma Binomial em situações de eventos raros: $n$ grande, $p$ pequeno, $np=\lambda$ constante. Essa ideia justifica o uso da Poisson como aproximação em certos contextos, mas o essencial é reconhecer quando o enunciado fornece uma taxa média em um intervalo. Síntese comparativa e escolha do modelo Escolher a distribuição correta é parte central do domínio de probabilidade discreta. Um mesmo enunciado pode induzir ao erro se você não identificar o tipo de experimento. 8.1. Quadro de decisão | Distribuição | Tipo de experimento | Parâmetros | Independência | Média e variância | |---|---|---|---|---| | Bernoulli | 1 tentativa (sim/não) | $p$ | não se aplica (uma tentativa) | $E[X]=p$, $\mathrm{Var}(X)=p(1-p)$ | | Binomial | $n$ tentativas, sucessos | $n,p$ | sim | $E[X]=np$, $\mathrm{Var}(X)=np(1-p)$ | | Hipergeométrica | amostra sem reposição | $N,N1,n$ | não | $E[X]=n\frac{N_1}{N}$, $\mathrm{Var}(X)$ com $\frac{N-n}{N-1}$ | | Poisson | contagem de eventos independentes em intervalo (taxa λ constante) | $\lambda$ | eventos independentes, taxa constante | $E[X]=\lambda$, $\mathrm{Var}(X)=\lambda$ | 8.2. Regras de identificação no enunciado Se o enunciado diz “$n$ tentativas independentes” e $p$ constante: Binomial. Se diz “sem reposição”, “lote finito”, “retira e não devolve”: Hipergeométrica. Se descreve “número de ocorrências em um intervalo” e dá uma taxa média: Poisson. Se é apenas “sucesso/fracasso” em uma única tentativa: Bernoulli. Ao dominar essas distribuições, você adquire uma linguagem de modelagem que transforma situações aleatórias em estruturas matemáticas previsíveis: probabilidades pontuais para cada valor, comportamento médio (esperança) e estabilidade do processo (variância). Esse conjunto é a base para inferência estatística, amostragem e tomada de decisão em ambientes de incerteza. Exercícios: Considere o lançamento de um dado comum de seis faces, em que cada face tem a mesma probabilidade de ocorrer. Qual é a probabilidade de obter um número par em um único lançamento? Uma variável aleatória discreta X tem os seguintes valores e probabilidades: - P(X = 1) = 0,2 - P(X = 2) = 0,3 - P(X = 3) = 0,4 - P(X = 4) = ? Sabendo que X é uma variável aleatória discreta válida, qual é o valor de P(X = 4)? Considere a variável aleatória discreta X com a seguinte função de probabilidade definida pelos valores: - P(X=1) = 0,3 - P(X=2) = 0,2 - P(X=3) = 0,5 Essa função é válida? A Distribuição Binomial é o modelo padrão para a contagem de sucessos em uma sequência de ensaios independentes de Bernoulli. Um sistema de controle aeroespacial possui $5$ componentes de redundância idênticos e independentes. A confiabilidade (probabilidade de funcionar corretamente) de cada componente individual é de $p = 2/3$. O sistema global será considerado operacional se a maioria absoluta dos seus componentes (isto é, pelo menos 3 componentes) funcionar perfeitamente. Qual é a probabilidade estatística de que o sistema opere com sucesso? A relação entre os momentos estatísticos (Esperança Matemática e Variância) permite o cálculo de valores esperados não lineares sem a necessidade de somatórios exaustivos. Considere uma variável aleatória $X$ que segue estritamente uma Distribuição Binomial decorrente de 00$ ensaios de Bernoulli independentes, cuja probabilidade isolada de sucesso é $p = 1/5$. Determine analiticamente o valor de $E[X^2]$, ou seja, o valor esperado do quadrado de $X$. As transformações afins operadas sobre variáveis aleatórias afetam a Esperança Matemática e a Variância através de propriedades algébricas distintas. Um estudante responde a um teste de múltipla escolha com 10 questões, onde cada questão possui 5 alternativas (apenas uma correta). Cada acerto confere $+1$ ponto e cada erro confere uma penalização de $-0{,}25$ pontos (um quarto de ponto negativo). Se o estudante "chutar" todas as respostas de forma aleatória e independente, calcule o valor da Variância da sua pontuação final $S$. A Distribuição Geométrica é notável por sua propriedade intrínseca de "falta de memória" (memoryless property) em processos discretos. Um atirador esportivo possui uma probabilidade constante $p = 0{,}8$ de acertar o alvo a cada disparo. Ele decide atirar de forma contínua e independente até obter o seu primeiro acerto. Dado que ele já efetuou o primeiro disparo e errou (ou seja, sabemos que ele precisará de estritamente mais de 1 disparo), qual é a probabilidade exata de que ele encerre o treinamento no seu terceiro disparo global? A modelagem de processos estocásticos em pesquisa operacional exige a combinação da Esperança Matemática com funções de lucro truncadas. Uma confeitaria avalia diariamente a venda de um bolo especial. A demanda diária $X$ segue uma Distribuição de Poisson com média de $\lambda = 3$ bolos. O custo para produzir cada bolo é de R$ 10,00 e o preço de venda é de R$ 25,00. Por ser perecível, qualquer bolo produzido e não vendido é descartado à noite com perda total. Se o gerente decidir estabelecer uma produção diária rigorosa e fixa de exatamente 3 bolos por dia, qual será o Lucro Diário Esperado ($E[L]$) em reais gerado por este modelo de operação? Uma moeda honesta é lançada 3 vezes. Qual é a probabilidade de obter exatamente 2 caras? Em uma prova com 5 questões de múltipla escolha, cada uma com 4 alternativas, um estudante escolhe respostas ao acaso. Qual é a probabilidade de ele acertar exatamente 2 questões? Considere uma variável aleatória discreta $X$. Quais são as condições fundamentais que a sua função de probabilidade $P(X=x)$ deve satisfazer para ser considerada válida? Ao calcular a probabilidade exata de um valor em uma variável aleatória contínua, como o peso exato de um objeto, qual é o resultado esperado? Se uma variável $X$ segue uma distribuição Binomial com parâmetros $n=10$ e $p=0{,}5$, qual é a probabilidade de obter exatamente 0 sucessos? A função de distribuição acumulada $F(x)$ para uma variável aleatória discreta define a probabilidade de: Qual das seguintes situações seria melhor modelada por uma distribuição de Poisson? Na fórmula da Distribuição Binomial, o termo $\binom{n}{k}$ (combinação de $n$ elementos tomados $k$ a $k$) representa: Se a variância de uma variável aleatória $X$ é igual a 0,36, qual é o seu desvio padrão? Em uma urna com 3 bolas pretas e 2 brancas, ao retirar duas bolas simultaneamente, qual é o espaço amostral para a variável $X=$ 'número de bolas pretas'? Para uma variável aleatória discreta $X$ que assume os valores {1, 2, 3} com probabilidades $P(1)=0{,}2$, $P(2)=0{,}5$ e $P(3)=0{,}3$, qual é $P(X\geq 2)$? Se um atirador tem probabilidade $p=0{,}8$ de acertar um alvo e ele dá 5 tiros independentes, qual é o valor esperado (média) de acertos? A Distribuição Hipergeométrica é o modelo adequado para experimentos de extração sem reposição de uma população finita. Um lote de inspeção contém exatamente 10 peças, das quais 4 são classificadas como defeituosas e 6 como perfeitas. Um técnico retira uma amostra aleatória de 3 peças simultaneamente (sem reposição). Se $X$ é a variável aleatória que representa o 'número de peças defeituosas na amostra', qual é o valor exato da variância de $X$? Dois servidores de banco de dados operam de forma independente. O Servidor 1 recebe requisições segundo um modelo de Poisson de taxa $\lambda_1 = 2\text{ req/min}$. O Servidor 2 recebe por um modelo de Poisson com $\lambda_2 = 3\text{ req/min}$. Sabendo que o sistema unificado (Servidor 1 + Servidor 2) recebeu *exatamente* 4 requisições em um determinado minuto, qual é a probabilidade de o Servidor 1 ter recebido exatamente 1 requisição? (Ou, equivalentemente, qual é a probabilidade de, dado o total de 4 requisições, exatamente 1 ter ido para o Servidor 1 e 3 para o Servidor 2?) A Distribuição de Poisson é amplamente utilizada para modelar o número de ocorrências de eventos raros em um intervalo fixo de tempo, comprimento, área, etc., quando tais eventos acontecem de forma independente a uma taxa média conhecida. Uma máquina de trefilação produz cabos elétricos com defeitos distribuídos segundo o modelo de Poisson, a uma taxa média de $0{,}5$ defeito por metro linear. Um inspetor de qualidade corta e analisa um segmento de exatos $4\text{ metros}$ desse cabo. Sabendo-se previamente que nesse segmento analisado existe *pelo menos um* defeito, qual é a probabilidade exata de haver *exatamente dois* defeitos?