Data Paper (Artigos de dados)

Em um artigo de pesquisa típico, coletam-se e analisam-se dados para responder perguntas científicas. Embora alguns periódicos exijam que os dados brutos estejam disponíveis para compartilhamento, outros não, e o artigo publica apenas os resultados analisados de maneira condensada. Depois que o artigo é publicado, a coletânea de dados provavelmente é armazenada e esquecida. Ao contrário desses artigos de pesquisa tradicionais, os artigos com documentos de dados são um tipo relativamente novo de publicação que relata apenas conjuntos de dados específicos coletados até o método do trabalho. Esses documentos facilitam o compartilhamento e a reutilização do que foi pesquisado e dão crédito aos pesquisadores que os coletaram. Há também periódicos que publicam quase exclusivamente esses artigos de dados.

Este novo tipo de publicação fornece descrições completas dos conjuntos de dados. Qualquer análise adicional deles deve ser removida de tais documentos. Os autores podem gerar artigo de pesquisa regular, para relatar as descobertas de sua análise dos dados. Por exemplo, nas diretrizes do documento de dados da Ecology, a revista afirma que “a análise detalhada dos conjuntos de dados poderia, no entanto, formar o núcleo de um artigo complementar”. Em um data paper, as descrições devem ser suficientemente detalhadas para que os leitores possam entender os dados e os métodos de coleta e possam reutilizá-los. Como esses artigos são revisados ​​por pares, apenas aqueles de qualidade adequada (por exemplo, os que têm design sólido do experimento; dados coletados com métodos válidos; e conjuntos de dados completos) podem ser publicados.

Todos os data papers são de acesso aberto e não devem ter restrições para que outros pesquisadores os acessem, ou seja, impedir reuso. A publicação dá aos dados um lar permanente online que convida qualquer pesquisador interessado a usá-los para sua própria análise. Embora alguns periódicos possam hospedar seus próprios data papers, a maioria indica que eles sejam depositados em repositórios relevantes. Por exemplo, Scientific Data lista vários repositórios específicos por assuntos e tipo de dados; outros, são generalistas.

Exemplos de fontes importantes para data papers são as dissertações/teses stricto sensu da grande área da saúde que, uma vez defendidas, são arquivadas com os datasets nelas contidos. Todos sabemos que as teses não são aceitas como tal para publicação em revistas importantes; os publishers restringem entre 3000 e 5000 palavras a possibilidade de texto e admitem poucas tabelas. Normalmente os dados totais, que foram cuidadosamente colocados em planilhas ou tabelas e coletados pelo método estabelecido, ficam publicados nas teses como apêndices ou adendos, e com esta formatação são esquecidos. Os dados em tabelas individuais são chamados de datasets e de database quando formam um conjunto de datasets. Sendo somente de dados – sem conclusões ou resultados indutivos - eles podem ser manipulados cientificamente por outros autores, é claro citando a fonte que utilizaram complementarmente. A publicação com esta formatação (ou seja, a publicação terminando no método, sem resultados ou conclusões), é que é chamada de data paper. Com ele surge a oportunidade dos mestrandos/doutorandos terem suas publicações duplicadas, todas com DOIs, e cooperando efetivamente com a Ciência Aberta, assim chamada quando pode haver o compartilhamento e reuso dos dados.