cnpj.chat is a free, open-source platform that makes 60 million Brazilian company records from the Receita Federal (Brazil's federal revenue service) searchable via natural language in Portuguese. Users ask questions like "Quem sao os socios do Banco do Brasil?" and get structured data from 60M empresas, 59M estabelecimentos, 24M socios, and 40M registros Simples Nacional. The data comes from 85GB of public CSV files published by the Receita Federal. cnpj.chat processes, organizes, and indexes this data so anyone can query it without technical knowledge. Results can be exported to CSV. The entire pipeline is open source at github.com/caiopizzol/cnpj-data-pipeline. Built by Caio Pizzol (caiopizzol.com), Head of DX at SuperDoc. No API key, no rate limit, no paywall — public data with access that finally matches its name.

Dados públicos de empresas brasileiras

Pergunte sobre qualquer empresa do Brasil.

60 milhões de CNPJs da Receita Federal, processados e organizados. Com histórico de anos. Open source.

Pipeline ... | Atualizado mensalmente | 100% open source

O que está dentro

85GB de dados da Receita Federal.
Organizados para você.

Processados mensalmente, direto da fonte oficial. Sem enriquecimento inventado. Sem estimativa. Fonte única: o governo.

60M

empresas

59M

estabelecimentos

24M

sócios

40M

registros Simples Nacional

Schema

empresas

razao_social

capital_social

natureza_juridica

porte

estabelecimentos

cnpj

situacao_cadastral

cnae

uf, municipio

sócios

nome_socio

qualificacao

data_entrada

representante

simples_nacional

opcao_simples

opcao_mei

data_opcao

data_exclusao

Por que estamos construindo isso

Os dados cadastrais de empresas brasileiras são públicos.

Diz a lei. Diz a Receita Federal. Diz o portal de dados abertos.

Mas "público" virou uma palavra técnica. Significa que existe um link. Que aponta para 85 gigabytes de arquivos compactados. Que mudam de formato sem aviso.

Então surgiram as APIs. Cobrando R$0,01 por consulta. De dado que já é seu por direito.

E as plataformas de prospecção. Cobrando R$700 por mês. Pelo mesmo dado, com um filtro bonito em cima.

E 256 projetos no GitHub. Cada um tentando resolver o mesmo problema. Cada um quebrando quando a Receita muda o layout.

Nós resolvemos o pipeline uma vez. E abrimos para quem quiser.

Porque dado público sem acesso é só um arquivo num servidor.

O dado é público.
O acesso nunca foi. Até agora.

Pergunte qualquer coisa sobre empresas brasileiras. Em português.