Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Sequencia de busca de case types #25

Open
rafapereirabr opened this issue Jan 23, 2025 · 5 comments
Open

Sequencia de busca de case types #25

rafapereirabr opened this issue Jan 23, 2025 · 5 comments
Assignees

Comments

@rafapereirabr
Copy link
Member

Veja esse caso aqui.

dados de input

São varios numeros de uma rua perto de uma escola no bairro de Vargem Grande, no sul do municipio de Sao Paulo.

library(geocodebr)
library(mapview)
library(geobr)
    
df <- data.frame(
  estado = 'sp',
  municipio = 'sao paulo',
  logradouro = 'rua ipe roxo',
  numero = 1:150,
  bairro = 'vargem grande',
  cep = '04896-360'
  )

# geometria do municipio de sao paulo
sp_muni <- geobr::read_municipality(code_muni = 3550308)

geolocalizando


campos <- geocodebr::listar_campos(
  logradouro = 'logradouro',
  numero = 'numero',
  cep = 'cep',
  localidade = 'bairro',
  municipio = 'municipio',
  estado = 'estado'
)

df_geo <- geocodebr::geocode(
  enderecos = df,
  campos_endereco = campos,
  resultado_completo = T,
  verboso = T,
  resultado_sf = T
)

mapview::mapview(df_geo, zcol='tipo_resultado') + sp_muni

Resutado geral: o geocodebr encontra dois grandes grupos:

Image

Esse primeiro grupo é onde ele acerta tudo com numeros exatos e aproximados. Dá pra ver bem como pontos seguem ao longo da rua Ipea Roxo

Image

MAS... tem esse segundo grupo. O geocodebr encontra 9 enderecos na categoria en04. Isso é, ele encontra match exato de logradouro e numero (mas sem cep ou bairro). Isso pq ele encontra no CNEFE a "RUA IPE ROXO" com o numeros exatos do Input, so que no bairro "ITAIM PAULISTA".

Image

O problema é que existem diferentes logradouros "RUA IPE ROXO" que se repetem em diferentes bairros

Mudar a ordem de busca dos tipos de caso deve resolver isso.

@rafapereirabr rafapereirabr self-assigned this Jan 23, 2025
@rafapereirabr
Copy link
Member Author

rafapereirabr commented Jan 23, 2025

ok , mudar a ordem dos casos melhora a situacao mas nao resolve 100%. O numero de resultados "estranhos" cai para 1.

É que o buraco é mais abaixo. Segundo o CNEFE, existem duas ruas com o mesmo logradouro "RUA IPEA ROXO" e o mesmo CEP "04896-360", mas em bairros completamente diferentes e até distantes si

library(mapview)
library(sfheaders)

sp_muni <- geobr::read_municipality(code_muni = 3550308)


filtered_cnefe_sp <- arrow::open_dataset( geocodebr::listar_dados_cache()[11] ) |>
    dplyr::filter(estado == 'SP') |>
    dplyr::filter(municipio == "SAO PAULO") |>
    dplyr::filter(logradouro_sem_numero == "RUA IPE ROXO") |>
    dplyr::collect()
  
a <- subset(filtered_cnefe_sp, cep == "04896-360")

table(a$logradouro_sem_numero)
#> RUA IPE ROXO 
#>          243
        
a <- sfheaders::sf_point(
  obj = a,
  x = 'lon',
  y = 'lat',
  keep = TRUE
)
sf::st_crs(a) <- 4674

mapview::mapview(a) + sp_muni
Image

@rafapereirabr
Copy link
Member Author

esse issue pode interessar ao @lgelape ;)

@dhersz
Copy link
Member

dhersz commented Jan 23, 2025

Duas observações:

  1. No mapa aí os dois logradouros supostamente seriam diferentes, um é Rua Ipê Roxo e o outro Avenida Ipê Roxo. Enfim, ainda têm o mesmo nome, mas o tipo de logradouro é diferente.
  2. É estranho numa cidade como São Paulo o CEP ser o mesmo para dois pontos tão distantes. Será que não é um erro do próprio CNEFE? Nesse caso, será que vale corrigir manualmente?

@dhersz
Copy link
Member

dhersz commented Jan 23, 2025

Pelo Google Maps, o CEP desses da Zona Sul realmente é 04896-360, mas dos da Zona Leste seria 08160-330.

@rafapereirabr
Copy link
Member Author

rafapereirabr commented Jan 23, 2025

  1. No google maps aparece "Avenida Ipea Roxo" no bairro Itaim Paulista. MAS.. no google street view dá pra ver que é "RUA" mesmo. E pelo menos um dos ceps ali seria '08140-200', o que parece coerente com o CNEFE
  2. Só vale corrigir se a gente souber a info correta, mas nao temos neh rsrsrsrs

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants