Ir al contenido principal

Gestión y depósito de datos científicos: Encuentra, reutiliza y cita datos

Información sobre los datos de investigación, gestión y herramientas

Portales de datos abiertos

Numerosas instituciones ponen a disposición de la ciudadanía datos a través de los llamados portales de datos, que ofrecen datos de manera transparente de temas de interés social tales como la demografía, la seguridad, o el desarrollo sostenible.

Existen portales de datos a nivel local (Ayuntamiento de Barcelona, Gobierno de la Ciudad de México), autonómico o estatal (Junta de Andalucía, datos geográficos de Baviera) y nacional (datos.gob.es)

Para encontrar más portales de datos en abiertos, puede usarse la plataforma de búsqueda de portales Dataportals.

¿Por qué citar datos?

Al igual que sucede con las publicaciones, es imprescindible citar los datos de investigación siguiendo un formato específico.  Citar correctamente permitirá:

  • Identificarlos fácilmente y atribuirlos correctamente a su creador
  • Reutilizar los datos fácilmente y, además, verificarlos
  • Hacer un seguimiento del impacto que puedan tener los datos
  • Darles una mayor difusión y visibilidad
  • Crear una estructura académica que reconozca y recompense a los productores de datos.

La Declaración Conjunta de los Principios de Citación de Datos (DC) del grupo Force11 recoge los principios y ventajas de citar los datasets

Encuentra, reutiliza y cita datos

Localizar conjuntos de datos

Algunos de las herramientas más útiles para encontrar conjuntos de datos son:

  • Re3data: es el registro multidisciplinar más grande de respositorios de datos de investigacion disponibles en la web. Gestiona el sistema DOI (Digital Object Identifier) en coordinación con Datacite y la plataforma OpenAire (https://www.openaire.eu).
  • Zenodo: repositorio de datos de la Unión Europea financiado por el proyecto OpenAIRE y por CERN.
  • B2Find de EUDAT: servicio de descubrimiento de colecciones de datos de investigación de los centros de datos de EUDAT (European Research Data Infraestructure) y otros repositorios de datos científicos. 
  • Harvard Dataverse: repositorio multidisciplinar de carácter internacional
  • ODISEA: inventario internacional de los depósitos y revistas que admiten datos de investigación a nivel mundial. Es un proyecto conjunto de varias universidades españolas.

Otros repositorios y buscadores:

  • DataCite: organización que proporciona identificadores persistentes (DOI) para datos de investigación. Su objetivo es ayudar a la comunidad científica a localizar, identificar y citar datos de investigación.
  • DataMED: buscador de datasets y repositorios en el ámbito biomédico
  • DataONE: buscador de datasets en repositorios sobre medio ambiente
  • Dyrad:  repositorio que contiene datasets asociados a publicaciones de ciencias y medicina
  • Google Dataset Search: dedicado a la búsqueda de conjuntos de datos.
  • Kaggle
  • Zenodo: buscador de datos de la Unión Europea

Citar datos

Al igual que sucede con las publicaciones, es imprescindible citar los datos de investigación siguiendo un formato específico.  Citar correctamente permitirá:

  • Identificarlos fácilmente y atribuirlos correctamente a su creador
  • Reutilizar los datos fácilmente y, además, verificarlos
  • Hacer un seguimiento del impacto que puedan tener los datos
  • Darles una mayor difusión y visibilidad
  • Crear una estructura académica que reconozca y recompense a los productores de datos.

La Declaración Conjunta de los Principios de Citación de Datos (DC) del grupo Force11 recoge los principios y ventajas de citar los datasets

undefined

Elaboración de la cita

Datacite es una organización que desarrolla métodos para localizar, identificar y citar datos y otros objetos de investigación. Para identificar los artículos de investigación utilizan principalmente DOI (Digital Object Identifier), aunque hacen uso también de otro tipo de identificadores. Así ofrece DOI Citation Formatter que construye automáticamente las citas conforme al estilo que seleccionemos. El formato más utilizado es el siguiente: 

Creator (PublicationYear): Title. Version. Publisher. ResourceType. Identifier (DOI)

  • Autor: puede ser un autor individual, colectivo o una organización.
  • Fecha de publicación: año de publicación del dataset o fecha en que fue accesible online.
  • Título: denominación del dataset.
  • Edición: etapa del procesamiento de datos, indicando si son datos en bruto o no.
  • Versión: aumenta de número según cambian los datos, fruto de revisiones y actualizaciones.
  • Editor/Productor: entidad responsable de producir y/o distribuir el dataset. El productor es la organización que patrocina la investigación; y el distribuidor es la organización que da accesibilidad al dataset para su descarga y uso.
  • Tipo de recurso: “database”, “dataset”.
  • Ubicación: URL persistente que permita acceder al conjunto o subconjunto de datos (DOI, Handle …)​.

En definitiva, los datos básicos incluidos son: la referencia bibliográfica, con los suficientes metadatos para su identificación, así como una estrategia de identificador persistente tipo Handle o DOI (Digital Object Identifier).

Ejemplos de cita

Irino, T; Tada, R (2009): Chemical and mineral compositions of sediments from ODP Site 127-797. Geological Institute, University of Tokyo   http://dx.doi.org/10.1594/PANGAEA.726855 (DATACITE)

Geofon operator (2009). GEFON event gfz2009kciu (NW Balkan Region) [Dataset]. GeoForschungsZentrum Potsdam (GFZ). http://dx.doi.org/10.1594/GFZ.GEOFON.gfz2009kciu (DATACITE)

Marbá Núria, Jordá Gabriel, Agustí Susana, Girard Coraline and Duarte Carlos M., 2014 “impacts of climate change on organisms in the mediterranean Sea [Dataset]”, . http://hdl.handle.net/10261/116098 (DIGITAL CSIC)