Medidas de Tendência Central - Matemática | Tuco-Tuco
Aula de Matemática (Estatística e Probabilidade): Medidas de Tendência Central. Exploração de média, mediana e moda como medidas de centralidade de um conjunto de dados. Estude gratuitamente para vestibular e ENEM no Tuco-Tuco.
Guia Completo de Estatística: Medidas de Tendência Central
Por que existem medidas de centralidade?
Em Estatística Descritiva, raramente interessa listar dado por dado. O objetivo é resumir um conjunto de observações de forma que seja possível:
descrever o "comportamento típico" do grupo;
comparar grupos diferentes (duas turmas, dois períodos, duas regiões);
enxergar padrões e tendências sem se perder na massa de valores.
As Medidas de Tendência Central (ou medidas de centralidade) são números que tentam representar um conjunto inteiro por um valor típico, isto é, um ponto ao redor do qual os dados "se concentram". As três medidas mais cobradas são:
média (equilíbrio aritmético);
mediana (posição central no rol);
moda (valor mais frequente).
A escolha entre elas não é arbitrária: depende do tipo de variável (quantitativa ou qualitativa), do formato da distribuição (simétrica ou assimétrica) e da presença de valores extremos (outliers).
Média aritmética: o "ponto de equilíbrio"
A média aritmética é o valor que seria obtido se o total de uma grandeza fosse distribuído igualmente entre todas as observações.
2.1 Propriedade fundamental da média
Seja um conjunto de dados $x1, x2, \dots, xn$ e sua média $\bar{x}$. A média possui uma propriedade central:
A soma dos desvios em relação à média é zero:
$\sum{i=1}^{n}(xi - \bar{x}) = 0$
Interpretação: a média é como um ponto de equilíbrio; os valores acima dela "compensam" os valores abaixo dela.
2.2 Média aritmética simples
Definição:
$\bar{x} = \frac{\sum{i=1}^{n} xi}{n}$
Passo a passo:
some todos os valores;
divida pela quantidade de observações.
Exemplo (idades)
Dados: 0, 11, 12, 13, 14$.
Soma: 0+11+12+13+14 = 60$
Número de valores: $n=5$
Média: $\bar{x} = 60/5 = 12$
Logo, a idade média é 12 anos.
2.3 Média aritmética ponderada
A média simples supõe que todas as observações têm o mesmo peso. Em muitas situações, isso não é verdade (notas com pesos, preços com quantidades, médias por frequência etc.).
Definição (com pesos $pi$):
$\bar{x} = \frac{\sum{i=1}^{n} xi \cdot pi}{\sum{i=1}^{n} pi}$
Interpretação: cada valor contribui proporcionalmente ao seu peso.
Exemplo (notas com pesos)
Prova 1: $8{,}5$ (peso $3$)
Prova 2: $7{,}5$ (peso $3$)
Trabalho: $5{,}0$ (peso $2$)
Seminário: $7{,}0$ (peso $2$)
Cálculo:
$\bar{x} = \frac{(8{,}5\cdot 3) + (7{,}5\cdot 3) + (5{,}0\cdot 2) + (7{,}0\cdot 2)}{3+3+2+2}$
$\bar{x} = \frac{25{,}5 + 22{,}5 + 10 + 14}{10} = \frac{72}{10} = 7{,}2$
A média final é 7,2.
2.4 Quando a média é perigosa
A média usa toda a magnitude dos dados, o que é bom para representar o "total distribuído", mas traz um risco: ela é muito sensível a outliers.
Se um conjunto tem um valor muito alto ou muito baixo fora do padrão, a média pode se deslocar e deixar de representar o comportamento típico.
Moda: o valor mais frequente
A moda é a medida de centralidade baseada em frequência.
Definição:
A moda ($Mo$) é o valor que aparece mais vezes no conjunto.
Características importantes:
é a única medida de centralidade naturalmente aplicável a variáveis qualitativas (ex.: cor preferida, estado civil, marca mais comprada);
é pouco informativa quando quase não há repetições;
não depende do tamanho do valor, apenas de quantas vezes ocorre.
3.1 Tipos de distribuição quanto à moda
Amodal: nenhum valor se repete com frequência maior que os outros (não há moda definida).
Unimodal: existe uma única moda.
Bimodal: existem duas modas (duas frequências máximas iguais).
Multimodal: existem três ou mais modas.
Exemplos rápidos
Unimodal: $\{1, 2, 2, 3\}$ → moda $=2$
Bimodal: $\{1, 1, 2, 2, 3\}$ → modas $=1$ e $2$
Amodal: $\{1, 2, 3, 4\}$ → sem moda
3.2 Moda em dados agrupados: classe modal
Quando os dados estão agrupados em intervalos de classe, a moda não é um único valor observado, mas sim a classe que concentra a maior frequência.
Classe modal: intervalo com maior frequência absoluta.
Exemplo (pesos em uma academia)
| Peso (kg) | Frequência |
|---|---:|
| 42 ⊢ 45 | 2 |
| 45 ⊢ 49 | 4 |
| 49 ⊢ 54 | 7 |
| 54 ⊢ 60 | 6 |
| 60 ⊢ 65 | 6 |
A maior frequência é 7, então a classe modal é 49 ⊢ 54.
Observação importante: em muitos exercícios, é necessário não apenas identificar a classe modal, mas também calcular uma estimativa para o valor da moda dentro desse intervalo, utilizando fórmulas como a de Czuber. Reconhecer a classe modal é o primeiro passo, mas em contextos de vestibular e concursos, o cálculo da moda pontual para dados agrupados é frequentemente cobrado.
Mediana: a centralidade por posição
A mediana é uma medida de centralidade baseada em ordenação e posição.
Definição:
A mediana ($Md$) é o valor que divide o conjunto ao meio quando os dados estão em ordem:
50% das observações ficam abaixo (ou iguais),
50% ficam acima (ou iguais).
4.1 Rol: etapa obrigatória
Para calcular mediana, é obrigatório formar o rol:
Rol: dados ordenados (crescente ou decrescente).
Sem rol, não existe "posição central" confiável.
4.2 Caso 1: número ímpar de elementos
Se $n$ é ímpar, a mediana é o valor na posição:
$\text{posição} = \frac{n+1}{2}$
Exemplo
Rol: $\{1, 3, 5, 7, 9\}$, $n=5$.
Posição: $(5+1)/2 = 3$
3º termo: 5
Logo, $Md = 5$.
4.3 Caso 2: número par de elementos
Se $n$ é par, existem dois termos centrais. A mediana é a média desses dois termos, nas posições:
$\frac{n}{2}$ e $\frac{n}{2}+1$
Exemplo
Rol: $\{2, 4, 8, 10\}$, $n=4$.
Termos centrais: 2º e 3º → $4$ e $8$
Mediana: $(4+8)/2 = 6$
Logo, $M_d = 6$.
4.4 Por que a mediana é robusta?
A mediana depende de posição, não de magnitude. Por isso, ela é muito mais estável na presença de valores extremos.
Se você altera um valor muito alto, ele pode continuar no final do rol e não mexer na posição central.
Isso torna a mediana preferível em distribuições assimétricas ou com outliers (renda, tempo de espera, preços de imóveis, salários).
Comparação entre média, mediana e moda (e o efeito dos outliers)
5.1 Sensibilidade a valores extremos
Considere o conjunto de idades $\{4, 10, 8, 2, 6\}$.
Média: $(4+10+8+2+6)/5 = 30/5 = 6$
Agora inclua um outlier de 00$:
Conjunto: $\{4, 10, 8, 2, 6, 100\}$.
Média: $(30+100)/6 = 130/6 \approx 21{,}67$
A média foi fortemente "puxada" pelo outlier.
Já a mediana:
Rol original: $\{2, 4, 6, 8, 10\}$ → mediana $=6$
Rol com outlier: $\{2, 4, 6, 8, 10, 100\}$ → mediana é a média do 3º e 4º: $(6+8)/2 = 7$
A mediana mudou pouco.
E a moda:
Se nenhum valor se repete, pode nem existir moda.
Se existir, ela não muda por causa do tamanho do outlier, apenas se o outlier criar (ou quebrar) uma frequência máxima.
5.2 Relação entre as três medidas e simetria
Em uma distribuição perfeitamente simétrica e unimodal (ex.: formato de sino), costuma ocorrer:
$\text{média} \approx \text{mediana} \approx \text{moda}$
Em distribuições assimétricas:
assimetria à direita (cauda longa para valores altos): geralmente $\text{média} > \text{mediana} > \text{moda}$
assimetria à esquerda (cauda longa para valores baixos): geralmente $\text{média} < \text{mediana} < \text{moda}$
Essas relações são muito úteis para interpretar gráficos e tabelas e para escolher a medida mais representativa.
Quadro comparativo essencial
| Medida | Ideia central | Como calcula | Vantagem principal | Sensibilidade a outliers |
|---|---|---|---|---|
| Média | equilíbrio aritmético | soma / quantidade (ou ponderada) | usa toda a informação numérica | alta |
| Mediana | posição central no rol | termo central (ou média dos dois centrais) | robusta em assimetria | baixa |
| Moda | maior frequência | valor valor (ou categoria) mais frequente | serve para qualitativos e "popularidade" | não utiliza a magnitude (para dados qualitativos) |
Checklist mental para escolher a medida
Se os dados são qualitativos nominais (sem ordem): use a moda.
Se os dados são qualitativos ordinais (com ordem): a mediana ou a moda podem ser adequadas.
Se há outliers fortes ou distribuição muito assimétrica: pense primeiro em mediana.
Se os dados são quantitativos, sem extremos relevantes, e você quer um resumo que use toda a magnitude: média costuma ser adequada.
Se há pesos/frequências diferentes: use média ponderada.
Essas escolhas não são apenas "preferências": elas determinam se o valor central realmente representa o conjunto ou se estará distorcido por poucos valores atípicos.
Exercícios:
Considere os seguintes valores: 4, 6, 8, 10, 12. Qual é a média aritmética desses números?
Considere o conjunto de dados: 15, 20, 35, 40, 50, 55, 60. Qual é a mediana desse conjunto?
Os salários mensais (em R$) de cinco funcionários de uma empresa são: 1800, 2200, 1900, 2500 e 2000. Qual é a mediana desse conjunto de dados?
A média aritmética ponderada é frequentemente utilizada para reavaliar dados e corrigir desvios sistêmicos. Em um vestibular, a média aritmética das notas de uma sala com 40 candidatos foi $6{,}50$. Após a fase de recursos, 5 alunos dessa sala tiveram suas notas alteradas. Sabe-se que a média aritmética exclusiva das notas desses 5 alunos passou de $4{,}20$ para $7{,}40$. Qual será o novo valor exato da média aritmética global da sala inteira?
Em uma pesquisa, os seguintes números foram registrados como a quantidade de livros lidos por estudantes: 2, 3, 3, 5, 7, 3, 8, 5, 7, 3. Qual é a moda desse conjunto?
As propriedades fundamentais da média aritmética estabelecem que ela atua como o centro de gravidade (ou ponto de equilíbrio) de uma distribuição. Um conjunto de $n$ observações quantitativas possui média $\bar{x} = 15$. Sabe-se que a soma algébrica dos desvios de todas as observações, excetuando exclusivamente a última observação ($x_n$), em relação a essa média é igual a $-7$. Qual é o valor numérico exato da observação $x_n$?
O cálculo de médias baseadas em razão entre grandezas (como espaço e tempo) esconde armadilhas notórias. Um veículo de logística percorre um trajeto em linha reta entre duas cidades. Na ida, viaja com uma velocidade média de $60\text{ km/h}$. Na volta, operando sobre o exato mesmo percurso de distância, viaja a $90\text{ km/h}$. Determine a diferença absoluta entre a média aritmética simples dessas duas velocidades e a verdadeira velocidade média escalar de toda a viagem (ida e volta combinadas).
A reconstrução de proporções amostrais a partir de médias marginais e globais constitui um pilar da estatística inferencial básica. A nota média de aprovação em um concurso restrito foi de $6{,}5$ para os candidatos do gênero masculino e $8{,}0$ para os do gênero feminino. Se os dados consolidados informam que a média global de todos os candidatos aprovados unificados foi de $7{,}1$, qual é a proporção percentual estrita de mulheres em relação ao número total de aprovados?
A relação estrutural entre média e mediana permite a modelagem de cenários extremos e otimização em conjuntos numéricos. Um conjunto de dados é formado por 5 números inteiros, estritamente positivos e todos distintos entre si. Sabe-se que a mediana desse conjunto é 10 e a média aritmética é 12. Qual é o maior valor possível que o maior elemento desse conjunto pode assumir?
Considere os valores: 6, 10, 15, 9 e 20. Qual é a média aritmética desses números?
[ENEM 2022] Contexto: Uma das informações que pode auxiliar no dimensionamento do número de pediatras que devem atender em uma Unidade Básica de Saúde (UBS) é o número que representa a mediana da quantidade de crianças por família existente na região sob sua responsabilidade. O quadro mostra a distribuição das frequências do número de crianças por família na região de responsabilidade de uma UBS.
O número que representa a mediana da quantidade de crianças por família nessa região é
Em um conjunto de dados com as observações $\{12, 15, 8, 10, 25, 12, 18\}$, qual é o valor da mediana?
Um gerente precisa que a média de lucro de sua empresa nos primeiros 6 meses seja de, no mínimo, 30 mil reais. Os lucros de Janeiro a Maio foram: 21, 35, 21, 30 e 38 (em milhares). Qual o lucro mínimo necessário em Junho?
Qual das seguintes medidas de tendência central é a mais robusta, ou seja, a menos afetada pela presença de valores extremos (outliers) em um conjunto de dados pequeno?
Em uma distribuição estatística onde a Média > Mediana > Moda, como podemos caracterizar a assimetria dessa curva?
Dada a sequência de notas $\{5, 6, 6, 7, 8, 9, 10, 10\}$, como se classifica esta distribuição quanto à moda?
Ao calcular a mediana de um conjunto com $N = 50$ elementos, quais posições no Rol devem ser consideradas para o cálculo final?
Em uma prova com pesos diferentes, um aluno tirou 8,5 (peso 3), 7,5 (peso 3), 5,0 (peso 2) e 7,0 (peso 2). Qual a média final ponderada?
Se um conjunto de dados $\{10, 20, 30, 40, 50, 1000\}$ tiver seu valor extremo (1000) removido, qual medida de tendência central sofrerá a maior alteração proporcional?
O cálculo analítico da mediana em conjuntos parametrizados exige o domínio das posições no rol ordenado. Uma empresa de tecnologia possui cinco funcionários com salários dados, em Reais, pelas expressões algébricas: $x$, $x + 400$, $2x$, $2x + 500$, $3x$. Considerando que $x > 500$ e que os salários estão listados em ordem crescente, se a média salarial da empresa é matematicamente idêntica à sua mediana, determine o valor do salário do funcionário mais bem pago.
A morfologia de uma curva de distribuição afeta diretamente a posição relativa das suas medidas de centralidade. Analisando a distribuição de renda per capita de uma nação, um economista nota que a curva de frequência possui uma longa cauda estendida para a direita, caracterizando inequivocamente uma assimetria positiva. Sejam $\bar{x}$, $M_d$ e $M_o$ a média, a mediana e a moda dessa distribuição, respectivamente. Assinale a alternativa que indica a relação de ordem geometricamente esperada para esses indicadores.
A determinação da mediana em tabelas de frequência com dados contínuos agrupados em classes exige interpolação linear. Uma pesquisa sobre o tempo (em minutos) de atendimento em uma central gerou a seguinte distribuição: $0 \vdash 10$ (5 chamadas), 0 \vdash 20$ (10 chamadas), $20 \vdash 30$ (20 chamadas) e $30 \vdash 40$ (15 chamadas). Assumindo a distribuição uniforme das frequências dentro de cada classe, qual é o valor exato da mediana do tempo de atendimento?
Em uma pesquisa, os seguintes números de livros lidos por estudantes foram registrados: 3, 5, 2, 3, 4, 3, 6. Qual é a média (aproximada para duas casas decimais) e a moda desse conjunto de dados, respectivamente?
Considere um conjunto de dados onde todos os valores ocorrem com a mesma frequência absoluta igual a 2. Como essa distribuição é classificada quanto à sua moda?
Considere o conjunto {3, 3, 4, 4, 5, 5}. Qual a classificação modal correta?