TSE: Baixando todos os arquivos sobre candidaturas do site

Quanto tempo!

Estou carregando uma base relacional com dados de todos as candidaturas das eleições desse ano. Parece ser inútil, mas na verdade essa é primeira parte de um projeto um pouco maior. A segunda é disponibilizar essa base em forma de WEB Services REST e posteriormente expandir a base, adicionando os dados pós eleições e, enfim, adicionar dados do que os candidatos estão fazendo depois de eleitos para o povo!

Minha missão hoje era baixar os CSVs dos candidatos e salvar na minha máquina para eu carregar usando um programa Java na minha base (com JPA e as coisinhas que o povo gosta :D ).

Analisando a página e como a mesma baixava o arquivo, foi fácil descobrir a formação da URL de onde o CSV é gerado:

http://divulgacand2010.tse.jus.br/divulgacand2010/jsp/exportarDadosCandidatoCSV.action?

siglaUF={Sigla}
&cdCargoCand={cargo}
&situacao={situacao}
&ordenacao={ordem}
&campoPesquisa=”+campoPesquisa

Sigla = sigla do estado: AC, AL, AP, AM, BA, CE, DF, GO, ES, MA, MT, MS, MG, PA, PB, PR , PE, PI, RJ, RN, RS, RO, RR, SP, SC, SE, TO
cargo =
3 – Governador
4 – Vice-Governador
5 – Senador
9 – 1º Suplente Senador
10 – 2º Suplente Senador
6 – Deputado Federal
7 – Deputado Estadual

situacao =
1 – Aptos
2 – Inaptos
3 – Todos

ordem = cand.NM_CANDIDATO

campoPesquisa = uma pesquisa que você deseja fazer


Para baixar os candidatos a governadores de São Paulo, por exemplo, você usa:

http://divulgacand2010.tse.jus.br/divulgacand2010/jsp/exportarDadosCandidatoCSV.action?siglaUF=SP&cdCargoCand=3&situacao=3&ordenacao=cand.NM_CANDIDATO&campoPesquisa=

A partir daí um for de for (estado e cargo) em Java e uma busca sobre como baixar arquivos usando a tecnologia da Oracle para trazer os csvs de forma automática. O melhor foi que tudo isso foi feito em menos de meia-hora! Poupando muito tempo de ficar baixando na mão.

Agora vou passar eles pra UTF-8 e usar o meu outro programa de carga desse CSV no banco de dados. É quase uma suíte de programas para as eleições 2010 :P

3 Respostas

  1. [...] TSE: Baixando todos os arquivos sobre candidaturas do site Novembro 13th, 2010 | Tecnologia [...]

  2. Olá William,

    Como está seu projeto?
    Estou trabalhando em um projeto semelhante.
    Gostaria de trocar algumas idéias contigo.

    Abs,

    Yuri

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Sair / Alterar )

Imagem do Twitter

You are commenting using your Twitter account. Sair / Alterar )

Foto do Facebook

You are commenting using your Facebook account. Sair / Alterar )

Connecting to %s

Seguir

Obtenha todo post novo entregue na sua caixa de entrada.