Ir al contenido principal

Gestión y depósito de datos científicos: Depósito en e-cienciaDatos

Información sobre los datos de investigación, gestión y herramientas

e-cienciaDatos

La biblioteca de la UNED gestiona, de manera consorciada, el repositorio de datos e-cienciaDatos. El repositorio, basado en el software libre Dataverse, cuenta con el sello de calidad CoreTrustSeal y cumple los requisitos de la Comisión Europea para ser considerado como un repositorio de confianza FAIR.  

El depósito en e-cienciaDatos asegura el cumplimiento del mandato de la Ley 09/2022 de la Ciencia, la Tecnología y la Innovación (LCTI), y de diferentes programas de financiación como Horizonte Europa. 

Sobre versiones de depósito

Deposito de conjuntos de datos

Para depositar un conjunto de datos en e-cienciaDatos, es necesario enviar un correo electrónico al personal del repositorio adjuntando los siguientes archivos: 

  1. Conjunto de datos finales (limpios, anonimizados, organizados, etc.). 

  2. Archivo readme.txt según la plantilla de archivos readme de e-Ciencia Datos, disponible en inglés y español. Puede adjuntarse otra documentación si fuera necesario. 

  3. Autorización cumplimentada y firmada.

Para cualquier duda, se puede consultar el procedimiento de depósito de la guía del Consorcio Madroño, o contactar con el personal de la Biblioteca de la UNED a través del email repositoriobiblioteca@adm.uned.es 

Según la LCTI, el personal investigador cuya actividad investigadora esté financiada mayoritariamente con fondos públicos debe depositar una copia de sus publicaciones científicas en un repositorio institucional y, de manera paralela, los datos de investigación asociados a estas publicaciones deberán estar depositados en un repositorio de datos.

La Ley Orgánica 2/2023, de 22 de marzo, del Sistema Universitario (LOSU) se alinea con este mandato y, además, en el artículo 12, define datos como “aquellas fuentes primarias necesarias para validar los resultados de las investigaciones”, una definición amplia que incluye datos tales como conjuntos de datos tabulares, respuestas a entrevistas o encuestas, imágenes, grabaciones o transcripciones y, en definitiva, todas las tipologías de datos recolectados o analizados durante el proceso de investigación.   

Además, los datos deberán cumplir los principios FAIR, para asegurar que los datos sean fáciles de encontrar, accesibles, interoperables y reutilizables.

Los datos de investigación pueden ser de diferentes tipologías y formatos. Pueden incluir datos numéricos y textuales, ser cuantitativos o cualitativos, etc.

Algunos ejemplos de datos de investigación mencionados en la Estrategia Nacional de Ciencia Abierta (ENCA, 2022):

  • Resultados de experimentos
  • Mediciones
  • Observaciones resultantes del trabajo de campo
  • Resultados de encuestas
  • Grabaciones de muestras físicas
  • Documentación
  • Código
  • Configuraciones de instrumentación
  • Estadísticas
  • Imágenes

El conjunto de datos a depositar ha de ser la versión final de los datos asociados a la publicación, es decir, el conjunto incluye todos los datos que se han usado en la investigación y permite replicar los resultados.  

Para preparar el conjunto de datos es recomendable tener en cuenta las siguientes indicaciones: 

  • Limpieza de datos. Los datos han sido refinados y limpiados (si son datos tabulares se recomienda usar el formato tidy).  

  • Anonimización de datos. Si resulta necesario, los datos sensibles han sido anonimizados o pseudonimizados.  

  • Organización de los archivos. Los archivos han de estar estructurados y nombrados de manera lógica. 

  • Formatos abiertos no propietarios: TXT, CSV, PNG, etc.  

  • Documentación. Los datos deben ir acompañados de toda la documentación necesaria que facilite la interpretación y replicabilidad de los análisis. Ejemplos: archivo readme.txt, diccionario de datos, lista de entrevistas, guías de encuestas, etc. 

  • Metadatos. Para la descripción de los conjuntos de datos, los repositorios usan el esquema Dublin Core Metadata Initiative (DCMI), pero se recomienda el uso de esquemas de metadatos adicionales especializados en cada disciplina. 

Encuentra más información en la pestaña Organiza y documenta tus datos.

Los principios FAIR son una serie de principios exigidos por financiadores y agencias evaluadoras, que facilita que los datos que depositamos en el repositorio sean fáciles de encontrar, accesibles, interoperables y reutilizables. Es decir, los principios FAIR aseguran que las investigaciones sean replicables y que los datos recolectados para una investigación puedan usarse también en otros proyectos. 

Algunas de las medidas necesarias para asegurar el cumplimiento de los principios son: 

  • Fáciles de encontrar: 

  • El conjunto de datos tiene un identificador persistente, como DOI o handle.  

  • El conjunto de datos tiene los metadatos necesarios para su localización y uso.  

  • Accesibles: 

  • El conjunto de datos está depositado en un repositorio de datos. 

  • El conjunto de datos está lo más abierto posible. 

  • Los metadatos del conjunto de datos tienen una licencia CC-0. 

  • Interoperables: 

  • El conjunto de datos sigue estándares y normas. 

  • El conjunto de datos usa formatos abiertos. 

  • Reutilizables: 

  • El conjunto de datos está bien documentado, con archivos readme, diccionarios de datos, etc. 

  • El conjunto de datos tiene una licencia clara, y preferiblemente, CC-0 o CC.BY. 

El depósito en e-cienciaDatos garantiza de manera automática el cumplimiento de varias de las medidas necesarias para que nuestro conjunto de datos sea FAIR, ya que asegura la asignación de un DOI, la descripción con metadatos DCMI –incluyendo una licencia Creative Commons–, y la documentación a través de un archivo readme. Los autores deberán asegurar el uso de estándares reconocidos específicos del área, utilizar formatos abiertos, y la documentar de manera prolija el conjunto para completar el cumplimiento de los principios. 

El cumplimiento de los principios FAIR es compatible con el acceso restringido a ciertos datos de investigación, en casos de datos sensibles o embargos temporales para asegurar su explotación máxima por el equipo investigador. En líneas generales, se recomienda seguir la máxima de la Comisión Europea “tan abiertos como sea posible, tan cerrados como sea necesario”. Para garantizar el cumplimiento de los principios FAIR, los metadatos, o descripción de los datos, han de ser públicos y localizables en el repositorio, aunque los datos no sean accesibles, y la licencia ha de indicar claramente los usos permitidos y restringidos.