Para organizar y documentar los datos correctamente es imprescindible seguir estas pautas:
Elegir el formato adecuado
En la etapa de planificación de la investigación es importante considerar en qué formato se guardarán sus archivos. Una vez que se han seleccionado los datos, para conservarlos y garantizar un acceso abierto y usabilidad de éstos, lo conveniente es convertir los datos a formatos estándar que la mayoría de los programas sean capaces de interpretar.
Nombres de ficheros y estructura de archivo
Una estructura de ficheros bien organizada y coherente, archivos con nombres definidos, claros y significativos ayudan a encontrar la información de forma rápida y precisa. Es muy importante pensar bien la jerarquía, la estructura, nombres y versiones de los archivos, sobre todo cuando se trabaja en equipo.
Almacenar los datos de forma segura
Es importante elegir la forma adecuada de almacenar los datos de investigación con los que se está trabajando en el proyecto.
Describir los datos de investigación
La descripción de los datos debe incluir información necesaria para conocer quién creó los datos o la fuente de los datos en el caso de haber sido recolectados, la tipología y formato de los datos, datos relacionados, quién los puede utilizar, cuándo pueden utilizarse. Esta documentación debe estar accesible junto con sus datos para cuando se requiera interpretarlos. Esta descripción detallada, "metadatos", es fundamental para una correcta interpretación de los datos.
El formato y el software en el que se crean y digitalizan los datos de investigación dependen habitualmente del tipo de análisis que vaya a hacer el investigador y del hardware y software disponible en el proyecto.
Para garantizar el acceso, reutilización y la preservación a largo plazo es cuna buena práctica:
Por ello, es conveniente elegir formatos de archivos FAIR en función del tipo de datos que contiene:
Es recomendable añadir licencias de uso a los sets de datos que se generen, indicando con ello que utilización de los datos se permite. Para ello se pueden utilizar Licencias Creative Commons, Licencias Open Data Commons que son licencias específicas para datos o Public Domain Dedication and License (PDDL — “Public Domain for data/databases”) permite compartir libremente, modificar y usar este trabajo para cualquier propósito y sin ningún tipo de restricciones.
Para convertir el formato de los archivos se puede recurrir a herramientas como:
Es conveniente recopilar la siguiente información:
Para garantizar que los datos pueden ser replicados de manera sencilla y rentable es imprescindible añadir un fichero readme.txt con la información necesaria para que los datos sean comprensibles y reutilizables: descripción, metodología, coberturas, derechos de uso, privacidad.
Es necesario crear un fichero readme.txt para cada conjunto de datos y depositarlo con el resto de ficheros.
Un ejemplo de plantilla para la redacción del Readme.txt es la del repositorio de datos del Consorcio Madroño, e-cienciaDatos: Plantilla Readme.txt.
Fuente: Grup de Treball de Recerca CSUC
Herramientas para el control de versiones:
Nombre de ficheros
Pautas a seguir:
Más información ukdataservice
Herramientas para renombrar ficheros:
Además de la documentación explicativa y contextual recogida en un fichero Readme txt, es necesario describir los datos para poder identificarlos y organizarlos. Esta descripción se hace a través de los metadatos, información estructurada que ayuda a entender los datos con detalle y facilita a otros investigadores encontrarlos, utilizarlos y citarlos correctamente. Se desarrollan durante todo el ciclo de vida de los datos.
Cada área de conocimiento tiene su estándar propio y sus herramientas. Un estándar de metadatos proporciona conjuntos de elementos de metadatos, que tienen un propósito específico. A cada elemento se le da un nombre y una definición, basados en reglas, sintaxis y un vocabulario controlado.