Metadados

Os metadados consistem em explicações sobre a estrutura de dados. Por exemplo, o significado dos códigos ou abreviações presentes em uma data tabela, do que se trata a informação presente nas linhas e nas colunas, o que uma dada função faz. Reportar precisamente o que cada arquivo contém é de extrema importância para garantir com que outras pessoas, ou mesmo o você do futuro saiba o que foi/está sendo feito no projeto científico.

Os metadados não servem apenas para reportar o significado das variáveis em tabelas, isso por si só já seria um motivo relevante para termos metadados, mas também para facilitar a integração de bases diferentes de dados. Imagine só ter que navegar manualmente nos metadados de estudos de diferentes grupos, com dados coletados com diferentes métodos, tabelas que adotam diferentes códigos, com distantas escalas espaciais e temporais. Até seria possível, mas talvez a taxa com que perdemos espécies e habitats seja mais rápida (e está sendo) que nossa capacidade de síntese de dados. Portanto, os metadados não servem apenas para o nosso interesse próprio de organização, mas ao utilizarmos os metadados estamos contribuindo para um avanço mais rápido do processo científico.

Dada tais importâncias citadas acima, os metadados ideais devem seguir um esquema onde podem ser lidos por humanos (human-readable) e por computadores (machine-readable). Desta forma, nesta seção vamos praticar a elaboração de metadados que seguem essa característica, e que o formato foi pensado para satisfazer as especificidades dos dados ecológicos. Para tanto vamos utilizar o pacote EML.

Leituras sugeridas

Para uma introdução mais completa sobre os metadados sugiro este artigo. Para uma introdução da importância dos metadados para contruir conjuntos de dados integrados sugiro o artigo de Jones et al. (2006). Para um exemplo de base de dados online que se utiliza das potencialidades dos metadados sugiro visitar o KNB - Knowledge Network Biocomplexity.

Exemplos de metadados

Para um exemplo simples de como um metadado se parece veja aqui. Para um exemplo mais completo sugiro este arquivo. Esta introdução trazida pelo NEON (National Ecological Observatory) é muito interessante para compreender de maneira geral a importância de metadados para síntese e como eles podem ser obtidos facilmente com auxílio do pacote EML. O DataOne é uma plataforma de dados que também se utiliza dos arquivos XML para reportar as características gerais dos dados.

LS0tDQp0aXRsZTogJ01ldGFkYWRvcycNCmF1dGhvcjogIkdhYnJpZWwgTmFrYW11cmEiDQpkYXRlOiAiYHIgU3lzLkRhdGUoKWAiDQpvdXRwdXQ6IGh0bWxfZG9jdW1lbnQNCi0tLQ0KDQpgYGB7ciBlY2hvPUZBTFNFLCBpbmNsdWRlPVRSVUV9DQprbGlwcHk6OmtsaXBweSgpDQpgYGANCg0KIyBNZXRhZGFkb3MNCg0KT3MgbWV0YWRhZG9zIGNvbnNpc3RlbSBlbSBleHBsaWNhw6fDtWVzIHNvYnJlIGEgZXN0cnV0dXJhIGRlIGRhZG9zLiBQb3IgZXhlbXBsbywgbyBzaWduaWZpY2FkbyBkb3MgY8OzZGlnb3Mgb3UgYWJyZXZpYcOnw7VlcyBwcmVzZW50ZXMgZW0gdW1hIGRhdGEgdGFiZWxhLCBkbyBxdWUgc2UgdHJhdGEgYSBpbmZvcm1hw6fDo28gcHJlc2VudGUgbmFzIGxpbmhhcyBlIG5hcyBjb2x1bmFzLCBvIHF1ZSB1bWEgZGFkYSBmdW7Dp8OjbyBmYXouIFJlcG9ydGFyIHByZWNpc2FtZW50ZSBvIHF1ZSBjYWRhIGFycXVpdm8gY29udMOpbSDDqSBkZSBleHRyZW1hIGltcG9ydMOibmNpYSBwYXJhIGdhcmFudGlyIGNvbSBxdWUgb3V0cmFzIHBlc3NvYXMsIG91IG1lc21vIG8gdm9jw6ogZG8gZnV0dXJvIHNhaWJhIG8gcXVlIGZvaS9lc3TDoSBzZW5kbyBmZWl0byBubyBwcm9qZXRvIGNpZW50w61maWNvLg0KDQpPcyBtZXRhZGFkb3MgbsOjbyBzZXJ2ZW0gYXBlbmFzIHBhcmEgcmVwb3J0YXIgbyBzaWduaWZpY2FkbyBkYXMgdmFyacOhdmVpcyBlbSB0YWJlbGFzLCBpc3NvIHBvciBzaSBzw7MgasOhIHNlcmlhIHVtIG1vdGl2byByZWxldmFudGUgcGFyYSB0ZXJtb3MgbWV0YWRhZG9zLCBtYXMgdGFtYsOpbSBwYXJhIGZhY2lsaXRhciBhIGludGVncmHDp8OjbyBkZSBiYXNlcyBkaWZlcmVudGVzIGRlIGRhZG9zLiBJbWFnaW5lIHPDsyB0ZXIgcXVlIG5hdmVnYXIgbWFudWFsbWVudGUgbm9zIG1ldGFkYWRvcyBkZSBlc3R1ZG9zIGRlIGRpZmVyZW50ZXMgZ3J1cG9zLCBjb20gZGFkb3MgY29sZXRhZG9zIGNvbSBkaWZlcmVudGVzIG3DqXRvZG9zLCB0YWJlbGFzIHF1ZSBhZG90YW0gZGlmZXJlbnRlcyBjw7NkaWdvcywgY29tIGRpc3RhbnRhcyBlc2NhbGFzIGVzcGFjaWFpcyBlIHRlbXBvcmFpcy4gQXTDqSBzZXJpYSBwb3Nzw612ZWwsIG1hcyB0YWx2ZXogYSB0YXhhIGNvbSBxdWUgcGVyZGVtb3MgZXNww6ljaWVzIGUgaGFiaXRhdHMgc2VqYSBtYWlzIHLDoXBpZGEgKGUgZXN0w6Egc2VuZG8pIHF1ZSBub3NzYSBjYXBhY2lkYWRlIGRlIHPDrW50ZXNlIGRlIGRhZG9zLiBQb3J0YW50bywgb3MgbWV0YWRhZG9zIG7Do28gc2VydmVtIGFwZW5hcyBwYXJhIG8gbm9zc28gaW50ZXJlc3NlIHByw7NwcmlvIGRlIG9yZ2FuaXphw6fDo28sIG1hcyBhbyB1dGlsaXphcm1vcyBvcyBtZXRhZGFkb3MgZXN0YW1vcyBjb250cmlidWluZG8gcGFyYSB1bSBhdmFuw6dvIG1haXMgcsOhcGlkbyBkbyBwcm9jZXNzbyBjaWVudMOtZmljby4NCg0KRGFkYSB0YWlzIGltcG9ydMOibmNpYXMgY2l0YWRhcyBhY2ltYSwgb3MgbWV0YWRhZG9zIGlkZWFpcyBkZXZlbSBzZWd1aXIgdW0gZXNxdWVtYSBvbmRlIHBvZGVtIHNlciBsaWRvcyBwb3IgaHVtYW5vcyAoaHVtYW4tcmVhZGFibGUpIGUgcG9yIGNvbXB1dGFkb3JlcyAobWFjaGluZS1yZWFkYWJsZSkuIERlc3RhIGZvcm1hLCBuZXN0YSBzZcOnw6NvIHZhbW9zIHByYXRpY2FyIGEgZWxhYm9yYcOnw6NvIGRlIG1ldGFkYWRvcyBxdWUgc2VndWVtIGVzc2EgY2FyYWN0ZXLDrXN0aWNhLCBlIHF1ZSBvIGZvcm1hdG8gZm9pIHBlbnNhZG8gcGFyYSBzYXRpc2ZhemVyIGFzIGVzcGVjaWZpY2lkYWRlcyBkb3MgZGFkb3MgZWNvbMOzZ2ljb3MuIFBhcmEgdGFudG8gdmFtb3MgdXRpbGl6YXIgbyBwYWNvdGUgRU1MLiANCg0KIyMgTGVpdHVyYXMgc3VnZXJpZGFzDQoNClBhcmEgdW1hIGludHJvZHXDp8OjbyBtYWlzIGNvbXBsZXRhIHNvYnJlIG9zIG1ldGFkYWRvcyBzdWdpcm8gW2VzdGVdKGh0dHBzOi8vc2JjbHRlci5tc2kudWNzYi5lZHUvZXh0ZXJuYWwvRU1ML0VNTF9kb2N1bWVudHMvZW1sX21ldGFkYXRhX2d1aWRlLmh0bWwpIGFydGlnby4gUGFyYSB1bWEgaW50cm9kdcOnw6NvIGRhIGltcG9ydMOibmNpYSBkb3MgbWV0YWRhZG9zIHBhcmEgY29udHJ1aXIgY29uanVudG9zIGRlIGRhZG9zIGludGVncmFkb3Mgc3VnaXJvIG8gYXJ0aWdvIGRlIFtKb25lcyBldCBhbC4gKDIwMDYpXShodHRwczovL3d3dy5hbm51YWxyZXZpZXdzLm9yZy9kb2kvMTAuMTE0Ni9hbm51cmV2LmVjb2xzeXMuMzcuMDkxMzA1LjExMDAzMSkuIFBhcmEgdW0gZXhlbXBsbyBkZSBiYXNlIGRlIGRhZG9zIG9ubGluZSBxdWUgc2UgdXRpbGl6YSBkYXMgcG90ZW5jaWFsaWRhZGVzIGRvcyBtZXRhZGFkb3Mgc3VnaXJvIHZpc2l0YXIgbyBbS05CIC0gS25vd2xlZGdlIE5ldHdvcmsgQmlvY29tcGxleGl0eV0oaHR0cHM6Ly9rbmIuZWNvaW5mb3JtYXRpY3Mub3JnL2Fib3V0KS4NCg0KIyMgRXhlbXBsb3MgZGUgbWV0YWRhZG9zIA0KDQpQYXJhIHVtIGV4ZW1wbG8gc2ltcGxlcyBkZSBjb21vIHVtIG1ldGFkYWRvIHNlIHBhcmVjZSB2ZWphIFthcXVpXShodHRwczovL2dpdGh1Yi5jb20vcm9wZW5zY2kvRU1ML2Jsb2IvbWFzdGVyL2luc3QvZXhhbXBsZXMvZXhhbXBsZS1lbWwtMi4xLjEueG1sKS4gUGFyYSB1bSBleGVtcGxvIG1haXMgY29tcGxldG8gc3VnaXJvIFtlc3RlIGFycXVpdm9dKGh0dHBzOi8vZ2l0aHViLmNvbS9yb3BlbnNjaS9FTUwvYmxvYi9tYXN0ZXIvaW5zdC9leGFtcGxlcy9oZjIwNS54bWwpLg0KRXN0YSBbaW50cm9kdcOnw6NvXShodHRwczovL3d3dy5uZW9uc2NpZW5jZS5vcmcvcmVzb3VyY2VzL2xlYXJuaW5nLWh1Yi90dXRvcmlhbHMvZGMtbWV0YWRhdGEtaW1wb3J0YW5jZS1lbWwtcikgdHJhemlkYSBwZWxvIE5FT04gKE5hdGlvbmFsIEVjb2xvZ2ljYWwgT2JzZXJ2YXRvcnkpIMOpIG11aXRvIGludGVyZXNzYW50ZSBwYXJhIGNvbXByZWVuZGVyIGRlIG1hbmVpcmEgZ2VyYWwgYSBpbXBvcnTDom5jaWEgZGUgbWV0YWRhZG9zIHBhcmEgc8OtbnRlc2UgZSBjb21vIGVsZXMgcG9kZW0gc2VyIG9idGlkb3MgZmFjaWxtZW50ZSBjb20gYXV4w61saW8gZG8gcGFjb3RlIEVNTC4gTyBbRGF0YU9uZV0oaHR0cHM6Ly93d3cuZGF0YW9uZS5vcmcvKSDDqSB1bWEgcGxhdGFmb3JtYSBkZSBkYWRvcyBxdWUgdGFtYsOpbSBzZSB1dGlsaXphIGRvcyBhcnF1aXZvcyBYTUwgcGFyYSByZXBvcnRhciBhcyBjYXJhY3RlcsOtc3RpY2FzIGdlcmFpcyBkb3MgZGFkb3MuDQoNCg==