1. Início
  2. Explorar
  3. Políticas Públicas
  4. Fontes de dados para políticas públicas

Fontes de dados para políticas públicas – Políticas Públicas | Tuco-Tuco

Tipos de dados, fontes primárias e secundárias, principais pesquisas do IBGE e registros administrativos.

Fontes de Dados para Políticas Públicas A qualidade das políticas públicas está diretamente relacionada à qualidade das informações que as fundamentam. Decisões sobre onde alocar recursos escassos, quais populações priorizar e como desenhar intervenções dependem criticamente da disponibilidade de dados confiáveis, atualizados e relevantes. O gestor público contemporâneo não precisa ser um estatístico ou um cientista de dados, mas deve possuir a competência de saber onde buscar dados, como interpretar suas limitações e como utilizá-los para fundamentar diagnósticos, monitorar metas e avaliar resultados. O edital do CNU valoriza essa capacidade ao cobrar o conhecimento das principais fontes de dados do país. A Distinção Fundamental: Dados Primários versus Dados Secundários Antes de explorar as fontes de dados, é essencial compreender a distinção entre dados primários e secundários, que define a natureza e as limitações da informação disponível. Dados Primários: são aqueles coletados diretamente pelo pesquisador, gestor ou equipe, com a finalidade específica de responder a uma determinada pergunta de pesquisa ou subsidiar uma decisão em particular. A coleta é planejada e executada sob medida para o problema em análise. Exemplos: um survey (levantamento amostral) aplicado a beneficiários de um programa, entrevistas em profundidade com gestores, grupos focais com usuários de um serviço, observação direta de campo. A grande vantagem dos dados primários é sua aderência precisa à questão de pesquisa: o pesquisador controla o que será perguntado, a quem e como. Em contrapartida, a coleta de dados primários é tipicamente cara, demorada e trabalhosa, exigindo planejamento amostral, logística de campo, treinamento de entrevistadores e tratamento estatístico posterior. Dados Secundários: são aqueles que já foram coletados por outra organização ou pessoa, para uma finalidade distinta, e são reutilizados pelo gestor ou pesquisador para seus próprios fins. A imensa maioria das análises e diagnósticos de políticas públicas é baseada em dados secundários. Exemplos: o Censo Demográfico do IBGE, a PNAD Contínua, os registros do CAGED (emprego formal), os dados do Censo Escolar do INEP, as informações de internações do DATASUS. A grande vantagem é o baixo custo e a rapidez de acesso: os dados frequentemente já estão disponíveis em portais públicos. As desvantagens residem no fato de que os dados podem não cobrir exatamente a população ou as variáveis de interesse, e sua qualidade e periodicidade são determinadas por terceiros. No setor público, a formulação de políticas baseia-se, predominantemente, em dados secundários provenientes das pesquisas do IBGE e dos registros administrativos dos próprios órgãos governamentais. Principais Pesquisas do IBGE e Suas Finalidades O Instituto Brasileiro de Geografia e Estatística (IBGE) é o principal produtor de dados estatísticos do país e a fonte primária de informação para a formulação de políticas públicas em praticamente todas as áreas. Censo Demográfico: é a mais completa e detalhada pesquisa do IBGE, realizada a cada dez anos. Diferentemente das pesquisas amostrais, o Censo visita todos os domicílios do território nacional, coletando informações sobre população, características dos domicílios, saneamento, trabalho, rendimento, educação, migração, fecundidade e outras características. É a única fonte de dados desagregáveis até o nível intramunicipal (setor censitário), sendo indispensável para políticas de habitação, saúde, educação, saneamento, assistência social e para a própria repartição de receitas tributárias (FPE e FPM). O último Censo foi realizado em 2022, após adiamento durante a pandemia. PNAD Contínua (Pesquisa Nacional por Amostra de Domicílios Contínua): é uma pesquisa amostral trimestral que investiga de forma contínua as características da força de trabalho (ocupação, desemprego, informalidade, rendimento) e outras informações como educação e migração. É a principal fonte para o cálculo da taxa de desemprego e para o acompanhamento conjuntural do mercado de trabalho. Além do módulo trimestral, a PNAD Contínua possui módulos anuais suplementares sobre temas como acesso à internet, TICs, habitação e trabalho infantil. POF (Pesquisa de Orçamentos Familiares): realizada aproximadamente a cada cinco anos, a POF investiga a estrutura de gastos, rendimentos e consumo das famílias brasileiras. É a fonte primária para a construção das ponderações do IPCA (Índice de Preços ao Consumidor Amplo) e para estudos sobre nutrição, segurança alimentar, hábitos de consumo e qualidade de vida. PNS (Pesquisa Nacional de Saúde): realizada em parceria com o Ministério da Saúde, investiga as condições de saúde da população, acesso e uso dos serviços de saúde, fatores de risco e proteção para doenças crônicas não transmissíveis (hipertensão, diabetes, obesidade) e estilos de vida. É um instrumento-chave para a gestão do SUS e a formulação da política de saúde. MUNIC (Pesquisa de Informações Básicas Municipais) e ESTADIC (Pesquisa de Informações Básicas Estaduais): são surveys periódicos que mapeiam a estrutura e a dinâmica da gestão pública nos municípios e estados, cobrindo áreas como recursos humanos, instrumentos de planejamento, legislação, meio ambiente, cultura, saúde e assistência social. Outras pesquisas relevantes: o Sistema Nacional de Índices de Preços ao Consumidor (SNIPC), que produz o IPCA e o INPC; a Pesquisa Industrial Mensal (PIM) e a Pesquisa Mensal de Serviços (PMS), que acompanham a conjuntura dos setores produtivos; e o Cadastro Central de Empresas (CEMPRE), que fornece um retrato da estrutura empresarial brasileira. Registros Administrativos Governamentais Diferentemente das pesquisas amostrais do IBGE, que coletam dados de uma amostra representativa da população, os registros administrativos são conjuntos de dados gerados no curso normal da operação de órgãos governamentais, abrangendo, em muitos casos, o universo completo de beneficiários, usuários ou ocorrências. São fontes de dados de baixo custo marginal e alta riqueza informacional. Cadastro Único para Programas Sociais (CadÚnico): gerido pela Secretaria de Avaliação, Gestão da Informação e Cadastro Único (SAGICAD) do Ministério do Desenvolvimento e Assistência Social, Família e Combate à Fome (MDS), o CadÚnico é o principal instrumento de identificação e caracterização socioeconômica das famílias brasileiras de baixa renda. A gestão dos programas de transferência de renda que utilizam essa base, como o Bolsa Família, é de competência da Secretaria Nacional de Renda de Cidadania (SENARC). O CadÚnico contém informações sobre composição familiar, renda, educação, trabalho e moradia de milhões de famílias. É a porta de entrada para mais de 30 programas sociais, entre eles o Bolsa Família, a Tarifa Social de Energia Elétrica e o BPC. CAGED (Cadastro Geral de Empregados e Desempregados) e RAIS (Relação Anual de Informações Sociais): estes são os tradicionais registros sobre o mercado de trabalho formal. Contudo, é fundamental conhecer a sua configuração atual e as mudanças em curso. O governo federal, por meio do eSocial (Sistema de Escrituração Digital das Obrigações Fiscais, Previdenciárias e Trabalhistas), instituído pelo Decreto nº 8.373, de 11 de dezembro de 2014, implementou um projeto de unificação da prestação de informações trabalhistas. A partir de 2020, o antigo CAGED foi substituído pelo Novo CAGED, cujos dados passaram a ser extraídos diretamente do eSocial e do sistema Empregador Web, eliminando a necessidade de uma declaração mensal em separado. De forma similar, a obrigatoriedade da declaração anual da RAIS vem sendo substituída, gradualmente, pela base de dados gerada pelo próprio eSocial. Paralelamente, no âmbito tributário e previdenciário, sistemas antigos como a GFIP (Guia de Recolhimento do FGTS e de Informações à Previdência Social) foram substituídos pela DCTFWeb (Declaração de Débitos e Créditos Tributários Federais). A informação sobre o estoque de empregos, antes prestada anualmente, passou a ser gerada de forma contínua a partir da escrituração digital. Compreender que o eSocial é a nova "espinha dorsal" dos dados trabalhistas, previdenciários e fiscais é indispensável para o gestor público moderno. SINAN (Sistema de Informação de Agravos de Notificação): base de dados do SUS que registra as notificações compulsórias de doenças e agravos (dengue, tuberculose, hanseníase, acidentes de trabalho graves, violência doméstica). É o coração do sistema de vigilância epidemiológica brasileiro. SINASC (Sistema de Informações sobre Nascidos Vivos) e SIM (Sistema de Informações sobre Mortalidade): registros universais que coletam dados sobre todos os nascimentos e óbitos ocorridos no território nacional, permitindo o cálculo de indicadores fundamentais como a taxa de mortalidade infantil, a mortalidade materna e a esperança de vida ao nascer. Censo Escolar (INEP): levantamento estatístico anual que coleta dados sobre a educação básica no país, incluindo matrículas, turmas, docentes, infraestrutura escolar, distorção idade-série, entre outros. É a base para o cálculo do Fundeb e para a aferição do Índice de Desenvolvimento da Educação Básica (IDEB). SAEB, ENEM e ENADE: sistemas de avaliação educacional geridos pelo INEP que produzem dados sobre o desempenho cognitivo de estudantes dos ensinos fundamental, médio e superior, respectivamente. O SAEB compõe o IDEB e permite análises sobre a qualidade do ensino ofertado. DATASUS: o departamento de informática do SUS centraliza e disponibiliza publicamente dezenas de bases de dados de saúde, incluindo internações hospitalares (SIH), atendimentos ambulatoriais (SIA), mortalidade (SIM), nascidos vivos (SINASC) e informações sobre estabelecimentos de saúde (CNES). É a principal fonte para o planejamento, monitoramento e avaliação de políticas de saúde no país. Dados Abertos e a Transparência Governamental A política de dados abertos (open data) parte do princípio de que dados produzidos pelo setor público devem ser publicados em formato aberto, acessível e reutilizável, respeitadas apenas as restrições legais de sigilo e privacidade. A Lei de Acesso à Informação (Lei nº 12.527/2011) e o Decreto nº 8.777/2016 (Política de Dados Abertos do Poder Executivo Federal) são os marcos normativos dessa agenda. Os principais portais e plataformas que centralizam dados abertos governamentais são: Portal dados.gov.br: o catálogo central de dados abertos do governo federal, que reúne milhares de conjuntos de dados de diferentes órgãos. Portal da Transparência: disponibiliza informações sobre a execução orçamentária e financeira da União, transferências de recursos, gastos com pessoal e benefícios sociais. Portal SICONFI: gerido pela Secretaria do Tesouro Nacional, disponibiliza os dados fiscais e contábeis de todos os entes da federação (União, Estados, DF e Municípios), permitindo comparações e análises sobre a situação fiscal dos governos. IPEADATA: plataforma de dados macroeconômicos, financeiros e sociais do IPEA, com séries históricas de longa duração e ferramentas de transformação de dados. Qualidade e Limitações dos Dados: Uma Leitura Crítica Nenhuma fonte de dados é perfeita. O gestor público deve ser capaz de ler criticamente as estatísticas, compreendendo suas limitações para não tomar decisões baseadas em premissas equivocadas. As principais limitações a serem consideradas são: Cobertura: o dado abrange todo o universo relevante ou apenas uma parcela? O Novo CAGED, por exemplo, cobre apenas o mercado de trabalho formal, deixando invisível a imensa massa de trabalhadores informais. O CadÚnico, por sua vez, só inclui quem se cadastrou, podendo excluir os mais vulneráveis e invisíveis. Periodicidade: com que frequência o dado é atualizado? O Censo ocorre a cada 10 anos, podendo ficar defasado. Já a PNADC é trimestral e os dados do eSocial são contínuos, permitindo análises conjunturais muito mais ágeis do que no passado. Desagregação geográfica: o dado está disponível para o município? Para o bairro? Para o setor censitário? A maioria dos registros administrativos permite desagregação municipal, mas poucos chegam a níveis intramunicipais, que só o Censo oferece. Comparabilidade temporal: mudanças metodológicas podem quebrar séries históricas e induzir a conclusões erradas. A transição do CAGED antigo para o Novo CAGED, por exemplo, exigiu ajustes estatísticos para manter a comparabilidade da série histórica do emprego formal. Uma alteração na forma de calcular o desemprego ou a linha de pobreza, se não for levada em conta, pode gerar falsas sensações de melhora ou piora. Subnotificação: sistemas como o SINAN subestimam a incidência de doenças porque nem todos os doentes procuram os serviços de saúde ou recebem o diagnóstico correto. Viés de seleção e de resposta: em pesquisas amostrais, a não resposta de determinados grupos (ex.: os mais pobres ou os mais ricos) pode distorcer os resultados se não for corrigida por fatores de ponderação. Big Data, Novas Fontes e o Desafio da Inovação A digitalização da sociedade está gerando um volume massivo de novos tipos de dados, frequentemente referidos como big data, que podem revolucionar a formulação e o monitoramento de políticas públicas: Dados de dispositivos móveis e GPS: padrões de mobilidade, análise de fluxos populacionais e tempos de deslocamento podem informar políticas de transporte, saneamento e resposta a desastres. Redes sociais e análise de sentimento: o monitoramento de plataformas pode capturar demandas emergentes em tempo real, avaliar a reação da população a políticas e detectar crises. Registros eletrônicos de saúde: a integração dos prontuários eletrônicos do SUS (conectados pela RNDS) tem o potencial de gerar uma massa de dados clínicos sem precedentes para a avaliação de tratamentos, gestão de serviços e vigilância. Dados fiscais e transações eletrônicas: sistemas como o SPED e a Nota Fiscal Eletrônica (NF-e) geram dados de alta frequência sobre a atividade econômica, que podem ser usados como termômetros em tempo real da economia, muito mais ágeis do que as pesquisas amostrais. O uso dessas novas fontes, contudo, impõe desafios regulatórios e técnicos enormes, especialmente no que tange à privacidade e à proteção de dados pessoais, disciplinados pela Lei Geral de Proteção de Dados (LGPD – Lei nº 13.709/2018), e à necessidade de evitar que algoritmos de análise de big data reproduzam e ampliem vieses e discriminações. Considerações Finais O conhecimento das fontes de dados não é uma habilidade acessória, mas sim um componente central da formação do gestor público. A escolha da fonte de dados errada ou a interpretação ingênua de um indicador pode levar ao fracasso de uma política cara e à perpetuação de desigualdades. A boa política pública é, antes de tudo, uma política bem informada.