Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[infra] <Possibilidade de baixar em formato parquet com o pacote R> #1694

Open
brunomioto opened this issue Dec 6, 2023 · 2 comments
Open
Assignees
Labels
enhancement New feature or request

Comments

@brunomioto
Copy link

brunomioto commented Dec 6, 2023

Sua solicitação de recurso está relacionada a um problema? Por favor descreva.
Algumas tabelas da base são bem grandes e salvar em .csv pode gerar arquivos bem grandes. O formato parquet tem muitas vantagens relacionadas à velocidade e tamanho do arquivo gerado.

Exemplo CSV:

library(basedosdados)

bare_query <- "SELECT *
FROM basedosdados.br_tse_eleicoes.detalhes_votacao_secao
WHERE ano = 2022
AND sigla_uf = \'SP\'"
basedosdados::download(query = bare_query,
                       path = "./teste.csv")
                       

Arquivo gerado: teste.csv 91.072 KB

Exemplo Parquet:

library(basedosdados)

bare_query <- "SELECT *
FROM basedosdados.br_tse_eleicoes.detalhes_votacao_secao
WHERE ano = 2022
AND sigla_uf = \'SP\'"
download_new(query = bare_query,
         path = "./teste2",
         format = "parquet")

Arquivo gerado: teste.parquet 15.334 KB

Este teste foi com uma base não tão grande. Mas com bases maiores, os ganhos podem ser ainda maiores.

Descreva a solução que você gostaria
Tenho essa funcionalidade implementada na função download() do pacote R. Gostaria de saber se posso subir.

@brunomioto brunomioto added the enhancement New feature or request label Dec 6, 2023
@gustavoalcantara
Copy link
Contributor

@brunomioto vou inserir o @pedrocava aqui que é mantenedor do pacote. Abraço!

@pedrocava
Copy link
Collaborator

Quer abrir um pull request com o seu material? Não tem uma reprex, então não sei se é exatamente a mesma coisa, mas em teoria a gente aceita formatos arbitrários já. Abre o PR que aí eu posso avaliar se a funcionalidade já existe, ou então revisar o código e adicionar!

@vncsna vncsna moved this to 📋 Backlog in Engenharia-SRE-UX Jan 13, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
Archived in project
Development

No branches or pull requests

5 participants