Estatística para CNU: amostragem, inferência básica e estatísticas de localização – Administração Pública | Tuco-Tuco
População e amostra; tipos de amostragem (probabilística e não probabilística); população, amostra, parâmetro e estatística; distribuições amostrais; média, med
<h2>Estatística para o CNU (Bloco 5)</h2>
<h3>Conceitos fundamentais</h3>
<ul>
<li><strong>População</strong> — conjunto de todos os elementos sobre os quais se deseja informação;</li>
<li><strong>Amostra</strong> — subconjunto da população, selecionado segundo critérios;</li>
<li><strong>Parâmetro</strong> — característica numérica da população (μ, σ, π — em geral desconhecidos);</li>
<li><strong>Estatística</strong> — característica numérica da amostra (x̄, s, p — usadas para estimar parâmetros);</li>
<li><strong>Censo</strong> — coleta de informação de toda a população (caro e demorado);</li>
<li><strong>Variável</strong> — característica observada; pode ser <strong>qualitativa</strong> (nominal, ordinal) ou <strong>quantitativa</strong> (discreta, contínua).</li>
</ul>
<h3>Amostragem probabilística</h3>
<p>Toda unidade da população tem probabilidade conhecida e maior que zero de ser selecionada. Permite aplicar inferência estatística clássica. Tipos:</p>
<ul>
<li><strong>Aleatória Simples (AAS)</strong> — todos os elementos têm a mesma probabilidade de seleção; com ou sem reposição;</li>
<li><strong>Sistemática</strong> — escolhe-se um ponto inicial aleatório e selecionam-se elementos a cada k posições (k = N/n);</li>
<li><strong>Estratificada</strong> — divide-se a população em estratos homogêneos internamente e heterogêneos entre si; sorteia-se proporcionalmente em cada estrato. Reduz variância;</li>
<li><strong>Por conglomerados (clusters)</strong> — divide-se a população em conglomerados (preferencialmente heterogêneos internamente); sorteiam-se conglomerados inteiros; útil quando há restrições logísticas;</li>
<li><strong>Em múltiplos estágios</strong> — combinação dos anteriores em cascata (ex.: censo escolar — sorteia municípios → escolas → turmas).</li>
</ul>
<h3>Amostragem não probabilística</h3>
<p>Probabilidade de seleção desconhecida; não permite generalizar com rigor estatístico. Útil em pesquisas exploratórias e qualitativas. Tipos:</p>
<ul>
<li><strong>Por conveniência</strong> — quem está disponível;</li>
<li><strong>Por julgamento (intencional)</strong> — pesquisador escolhe casos típicos/extremos;</li>
<li><strong>Por cotas</strong> — define-se cotas (sexo, idade, classe) e seleciona até preencher;</li>
<li><strong>Bola de neve (snowball)</strong> — entrevistados indicam outros (útil para populações de difícil acesso);</li>
<li><strong>Voluntária</strong> — quem se candidata (enviesado).</li>
</ul>
<h3>Tipos de erro amostral</h3>
<ul>
<li><strong>Erro amostral</strong> (variabilidade entre amostra e população) — só existe em amostras; reduzido aumentando n;</li>
<li><strong>Erro não amostral</strong> — má formulação de questionário, viés do entrevistador, não resposta, erro de medição. Existe em censos também.</li>
</ul>
<h3>Distribuições amostrais</h3>
<p>A <strong>distribuição amostral</strong> é a distribuição de uma estatística (ex.: média amostral) ao se considerar todas as amostras possíveis de tamanho n. Para a média amostral:</p>
<ul>
<li>E(x̄) = μ (estimador não viesado da média populacional);</li>
<li>Var(x̄) = σ²/n;</li>
<li>Erro padrão: σ/√n;</li>
<li><strong>Teorema Central do Limite (TCL)</strong> — para amostras grandes (n ≥ 30), a distribuição de x̄ aproxima-se da normal, independentemente da distribuição original.</li>
</ul>
<p>Para proporções: E(p̂) = π; Var(p̂) = π(1-π)/n.</p>
<h3>Inferência estatística básica</h3>
<p>Dois grandes ramos:</p>
<ul>
<li><strong>Estimação</strong> — pontual (ex.: x̄ para μ) e intervalar (intervalo de confiança ao nível 1-α);</li>
<li><strong>Teste de hipótese</strong> — H₀ (hipótese nula) vs H₁ (alternativa); decide-se rejeitar H₀ ou não com base em valor-p e nível de significância α (geralmente 5%).</li>
</ul>
<p>Erros possíveis: <strong>Tipo I</strong> (rejeitar H₀ verdadeira; probabilidade α) e <strong>Tipo II</strong> (não rejeitar H₀ falsa; probabilidade β).</p>
<h3>Estatísticas de localização (medidas de tendência central)</h3>
<ul>
<li><strong>Média aritmética</strong> (x̄) — soma dos valores dividida por n. Sensível a outliers; só faz sentido para variáveis quantitativas;</li>
<li><strong>Mediana (Md)</strong> — valor que divide a amostra ordenada ao meio (50% abaixo, 50% acima). Para n ímpar é o valor central; para n par é a média dos dois centrais. Resistente a outliers; aplicável a variáveis quantitativas e qualitativas ordinais;</li>
<li><strong>Moda (Mo)</strong> — valor mais frequente. Pode haver mais de uma (bimodal/multimodal) ou nenhuma. Único aplicável a variáveis qualitativas nominais.</li>
</ul>
<h3>Outras medidas de localização</h3>
<ul>
<li><strong>Quartis</strong> (Q1, Q2=Md, Q3) — dividem em 4 partes iguais;</li>
<li><strong>Decis e Percentis</strong>;</li>
<li><strong>Média geométrica</strong> — para taxas de crescimento;</li>
<li><strong>Média harmônica</strong> — para taxas e velocidades médias.</li>
</ul>
<h3>Para distribuições simétricas e assimétricas</h3>
<ul>
<li>Distribuição <strong>simétrica</strong>: média ≈ mediana ≈ moda;</li>
<li><strong>Assimetria positiva</strong> (cauda à direita): média > mediana > moda (ex.: salários);</li>
<li><strong>Assimetria negativa</strong> (cauda à esquerda): média < mediana < moda.</li>
</ul>
<h3>Para a prova</h3>
<ul>
<li><strong>Parâmetro</strong> = população; <strong>estatística</strong> = amostra.</li>
<li>Probabilísticas: AAS, sistemática, estratificada, conglomerados, múltiplos estágios.</li>
<li>Não probabilísticas: conveniência, julgamento, cotas, bola de neve.</li>
<li><strong>TCL</strong>: x̄ ~ Normal para n grande, independentemente da distribuição original.</li>
<li>Erros: <strong>Tipo I</strong> (rejeitar H₀ verdadeira, α) e <strong>Tipo II</strong> (β).</li>
<li>Média sensível a outliers; mediana resistente; moda única para qualitativas nominais.</li>
<li>Assimetria <strong>positiva</strong>: média > mediana > moda.</li>
</ul>