Notícias

GridDER e bdc: propostas vencedoras do Desafio Ebbe Nielsen 2022 - GBIF

Realizado anualmente pelo GBIF, o Desafio Ebbe Nielsen premia pesquisadores que desenvolvem aplicativos ou soluções inovadoras no uso de dados e ferramentas do GBIF, promovendo a ciência aberta.

Nas duas propostas empatadas em primeiro lugar, estão pesquisadores brasileiros, sendo que uma delas é liderada pelo Brasil. Ambas as equipes desenvolveram pacotes de software de código aberto contendo instruções e funções para R, ambiente de software mais frequentemente usado para acessar e trabalhar com dados mediados pelo GBIF.

O bdc é um pacote de software que integra ferramentas para a limpeza de dados, já o GridDER identifica possíveis fontes de imprecisão de dados de ocorrência de sistemas de amostragem em grid.

A equipe que desenvolveu o bdc - um kit de ferramentas para padronização, integração e limpeza de dados de biodiversidade - é dirigida por Bruno R. Ribeiro, com doutorado em ecologia e evolução pela Universidade Federal de Goiás (UFG) e atualmente trabalha como consultor ambiental. Colaboradores desse trabalho são do Instituto de Biologia Subtropical da Universidad Nacional de Misiones-CONICET, da Argentina, do Royal Botanic Gardens, Kew, no Reino Unido, da UFG e de várias outras instituições do Brasil. O bdc executa uma série de testes nas dimensões taxonômicas, espaciais e temporais dos dados de biodiversidade, abordando problemas comuns de qualidade de dados e gerando melhorias no conjunto de dados. Seus registros, figuras e relatórios permitem que os usuários interpretem e visualizem os resultados e tomem medidas para compilar e harmonizar os dados entre grupos taxonômicos, diferentes fontes ou escalas geográficas.

"Manusear dados de biodiversidade de várias fontes diferentes não é uma tarefa fácil, e a principal novidade é que o software reúne vários aspectos de limpeza de dados de biodiversidade em um único pacote”, diz Ribeiro. “Acreditamos que o bdc pode facilitar o processo de limpeza de dados adicionando melhorias para permitir o uso eficiente de dados primários de biodiversidade".

A equipe responsável pelo GridDER - Grid Detection and Evaluation in R é liderada por Xiao Feng, ecologista quantitativo e biogeógrafo que dirige o Laboratório de Biogeografia Quantitativa no Departamento de Geografia da Universidade Estadual da Flórida (FSU). Nessa equipe estão pesquisadores do Instituto de Pesquisas do Jardim Botânico do Rio de Janeiro (JBRJ) e do Departamento de Ciências Biológicas e Centro de Biologia Vegetal da Purdue University, juntamente com a FSU. O GridDER automatiza o processo de identificação de registros de ocorrências geolocalizados em sistemas de pesquisas em grid. Os curadores de dados podem aplicar o pacote para simular o grid original onde os detalhes estão faltando, enquanto os usuários podem explicar melhor as incertezas associadas às coordenadas do grid e ajustar suas análises.

"Coordenadas em grid, geralmente de amostragens de pesquisas em grid, são amplamente usadas em estudos biológicos, mas seu uso em formato agregado pode ser problemático porque as informações espaciais e ambientais associadas podem se perder", diz Feng. "Nossa equipe desenvolveu o pacote GridDER para aprimorar o uso de coordenadas em grid, combinando as coordenadas com as definições do grid original, o que preenche a incerteza das coordenadas ausentes."

bdc: A toolkit for standardizing, integrating and cleaning biodiversity data Este pacote R flexível de código aberto integra várias ferramentas disponíveis e algumas novas, permitindo aos usuários harmonizar e integrar dados padronizados de diferentes fontes enquanto implementam vários testes e operações para sinalizar, validar, documentar, limpar e corrigir aspectos de taxonomia, espaciais e temporais dos dados de biodiversidade. Sua estrutura temática e tutoriais de acompanhamento permitem que os usuários abordem diferentes dimensões dos dados, por exemplo, sinalizando e pré-filtrando registros inválidos ou não interpretáveis para remoção ou alteração, harmonizando nomes científicos de diferentes referências taxonômicas e sinalizando coordenadas geográficas suspeitas ou datas inconsistentes.

video | GitHub | CRAN tutorials | publication

Para mais informações: Ribeiro BR, Velazco SJ, Guidoni-Martins K, Tessarolo G, Jardim L, Bachman SP & Loyola R (2022) bdc: A toolkit for standardizing, integrating and cleaning biodiversity data. Methods in Ecology and Evolution 13: 1421-1428. doi:10.1111/2041-210X.13868

GridDER: Grid Detection and Evaluation in R Este pacote R de código aberto identifica registros de ocorrência cujas localizações são plotadas usando coordenadas em grid. A variação no tamanho e orientação de diferentes grids mascara a variabilidade e a precisão das coordenadas e introduz erros que podem limitar a eficácia de tais registros na pesquisa. Ao estimar o grau de heterogeneidade ambiental associado ao sistema de grid, o GridDER permite que os usuários tomem decisões informadas sobre como usar e contabilizar os registros em suas análises. Tanto os curadores quanto os usuários de dados podem se beneficiar da ferramenta: os primeiros, reconstruindo o sistema de grid original onde seus detalhes não são mais conhecidos; os últimos, sinalizando os registros para posterior curadoria ou quantificando incertezas espaciais e ambientais para melhorar sua aplicação em estudos.

video | GitHub

Saiba mais: https://www.gbif.org/news/6J94JrRZtDCPhUZMMiTALq/gridder-and-bdc-share-top-honors-in-2022-gbif-ebbe-nielsen-challenge

Daphnia galeata
Bruno Ribeiro (esquerda) and Xiao Feng (direita) coordenam as equipes vencedoras do prêmio anual do GBIF nomeado em homenagem a Ebbe Schmidt Nielsen (centro).