-
Notifications
You must be signed in to change notification settings - Fork 117
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
read_health_facilities() - Dados mais recentes #334
Comments
Oi @beatrizmilz , obrigado por abrir esse issue. As colunas Essa base é super importante, e está na prioridade para atualização. No entanto, essa base é um pouco "problemática". Ela é problemática porque a organização dos dados (quais colunas estão disponíveis nos dados) e o endereço de Isso é uma das razões pelas quais eu achei melhorar esperar um tempo para o formato dos dados e url se "estabilizarem" para entao eu retomar a atualização desses dados no geobr. Além disso, faz um tempo que eu sou a única pessoa que faz manutenção do pacote, e não tenho tanto tempo assim porque o geobr tem muitas bases. Enfim, acho que esse issue serve como provocação para retomarmos a atualização dessa base! Eu estou reconstruindo os scripts do geobr que baixam os dados brutos e geram os dados limpos disponibilizados no geobr. Estou transformando esses scritps em fluxos semi-automaizados com o pacote {targets}. Mas isso demora muito porque cada base do geobr tem um fluxo proprio. Até agora eu só fiz o targets da base de municipios (aqui projeto de targets). Enfim, dei um ponta-pé aqui na criação do targets para atualizar os dados de `read_health_facilities()´. Eu chequei hoje o formato dos dados na nova url e essa aqui é a nova cara da base:
Claramente, ela traz muito mais colunas do que a versão que está foi incluida no geobr em 2018. Isso em si é bom, e seria uma boa mantermos todas essas colunas, mas não há garantia de que o Min da Saúde vá manter consistencia com as colunas incluidas na base. Outra coisa que notei é que a base tem cerca de 65 mil estabelecimentos (aprox. 13% da base) que tem coordenadas |
@beatrizmilz , respondendo a sua pergunta: "existe alguma forma da comunidade ajudar a atualizar esses dados?" Em termos praticos, uma ajuda especifica para essa base seria encontrar uma maneira automatica de detectar no side dados.gov.br qual a data de criação de um arquivo. Essa info seria importante para deixar claro na documentação do geobr qual a data da ultima atualização do dado do CNES. Eu tentei usando o Screen shot abaixo do site: |
Oi Rafael! Obrigada por responder. Eu nunca usei o targets, vou dar uma olhada nos links que você enviou. Seria ótimo conseguir contribuir de alguma forma com esse pacote que eu uso tanto. sobre extrair a data, eu provavelmente consigo ajudar nisso! |
Rafael, tô explorando o site dos dados (ainda sem mexer no código do geobr). Acredito que a coluna https://dados.gov.br/api/publico/conjuntos-dados/cnes-cadastro-nacional-de-estabelecimentos-de-saude
Se for isso que precisa, posso tentar fazer um PR depois |
Sobre isso:
Eu acho que faz mais sentido deixar como 0. Acho importante manter todas as linhas. |
Excelente! é isso aqui mesmo. Ajustei o codigo pra usar no targets dessa funcao! Obrigado, @beatrizmilz . Ja te coloco tmb como contribuidora do geobr. |
Bom dia! Estou apenas passando aqui para expressar meu interesse neste assunto também. Rafael, tem uma previsão de quando uma atualização pode ocorrer? Também gostaria de agradecer pelo fantástico trabalho que você tem feito, Rafael. Sou um pesquisador afiliado a uma universidade na Europa e tenho utilizado o pacote para alguns trabalhos. |
obrigado por todo apoio e interesse, pessoal. Essa base é uma das prioridades atuais. Estou preparando uma atualização para as proximas semanas |
Oi pessoal. Acabei de atualiar a versao dev do geobr para incluir o dado mais recente disponivel sobre estabelecimentos de saúde. Infelizmente, o dado mais recente é de março de 2023. Eu tive que fazer uma mudança importante na função, que agora inclui um novo parâmetro
|
Fechando esse issue agora (obrigado a todos pela paciencia). E abrindo o issue #342 para impementar essa mudança na versão em python do {geobr} |
Olá!
Primeiro, gostaria de agradecer a equipe do IPEA pelo pacote. Eu uso bastante na minha pesquisa e no trabalho.
Recentemente, fizemos um meetup na R-Ladies São Paulo sobre pacotes de dados brasileiros. Eu como grande fã do geobr fiz uma apresentação curta sobre o pacote.
Ao final do evento, uma pesquisadora me perguntou como buscar dados de estabelecimentos de saúde.
Encontrei a função
read_health_facilities()
, e me surgiu a seguinte dúvida: a base está atualizada com estabelecimentos de saúde até 2015? Vi que tem uma coluna chamada year_update e o ano mais recente é 2018.Se os dados estão desatualizados, existe alguma forma da comunidade ajudar a atualizar esses dados?
Muito obrigada!
ps: isso pode servir de contexto.
The text was updated successfully, but these errors were encountered: