Ir al contenido principal

Gestión y depósito de datos científicos: Inicio

Información sobre los datos de investigación, gestión y herramientas

Presentación

En el marco de las políticas de  acceso abierto y ciencia abierta,  la comunidad científica y las instituciones impulsan la gestión y el intercambio de datos de investigación. El objetivo es que  los datos resultantes de un proyecto de investigación estén accesibles y se puedan reutilizar. En este sentido, las bibliotecas universitarias y científicas asumen un importante reto al colaborar en la gestión de los datos de investigación (RDM).

La UNED apoya todas las prácticas de ciencia abierta para crear una Universidad Open Science, lo que contempla también, además de las publicaciones en acceso abierto en eSpacioUNED, el depósito de otros resultados de investigación como los datos.

Actualmente la mayoría de las revistas científicas internacionales tiene una política que define el modo en que los autores de los artículos deben gestionar y difundir públicamente los datos de investigación que son material suplementario de los artículos.

En esta guía  te ofrecemos información  sobre qué son los datos de investigación  de un proyecto científico, cómo se generan y las herramientas disponibles para su gestión y deposito en abierto. 

Para cualquier duda contacta con apoyoinvestigacionbib@adm.uned.es

 

Ventajas de gestionar y compartir los datos

La gestión e intercambio de datos de investigación implica una serie de ventajas para la comunidad científica ya que :

  • Refuerza la investigación científica abierta al estar los datos disponibles.
  • Permite validar los resultados obtenidos.
  • Mejora métodos de recogida y medición de datos a través del escrutinio de los demás.
  • Localización, accesibilidad, comprensión y reutilización de los datos.
  • Reducción de la duplicidad  en la recogida de datos y de los costes que ello comporta.
  • Cumplimiento de los requisitos de las convocatorias de investigación.
  • Impulsa el debate científico ya que alienta la diversidad de análisis y opiniones.
  • Fomenta la innovación y los nuevos usos potenciales de los datos.
  • Promueve la colaboración entre los usuarios de datos y sus creadores.
  • Incremento del impacto y la visibilidad de la investigación.
  • Aumento de la propia reputación cuando los demás citen la obra propia.

Ciencia abierta

Los datos de investigación

Los datos de investigación (researchdata) son aquellos materiales generados o recopilados durante el transcurso de un proyecto de investigación y que sirven para validar o certificar los resultados obtenidos en dicha investigación. También pueden ser hechos, observaciones o experiencias en que se basa el argumento, la teoría o la prueba.

Los datos se convierten en información "cuando son combinados entre ellos según un método que tenga el potencial de revelar los patrones del fenómeno estudiado" ( Peset y González, 2017).  Se deben gestionar desde el inicio del ciclo de vida para asegurar su adecuado tratamiento y ordenación de cara a su consulta y reutilización. Tienen que estar bien documentados , explicar su procedencia, dónde, cómo y cuándo se recogieron, e incluir metadatos que los describan. Es necesario guardar constancia de los mismos utilizando la metodología apropiada. 

El conjunto de datos reunidos durante la ejecución de un proyecto de investigación se denomina Dataset. Adquiere valor al acompañar a la publicación (linking data: cita y enlace). Los datasets se almacenan y gestionan en repositorios interoperables en red integrados en una infraestructura global de investigación, desarrollados conforme a estándares internacionales.

undefined

Tipos de datos

Los datos de investigación presentan varios formatos y diferente naturaleza en función de las disciplinas. En el documento de buenas prácticas sobre datos de investigación realizado por la FECYT, contempla que pueden ser: 

  • Numéricos (datos cuantitativos), textuales, descriptivos o visuales (datos cualitativos)

  • Encontrarse en estado bruto o analizado, y pueden ser experimentales u observacionales

En los datos de investigación se incluyen:

  • ​cuadernos de laboratorio 
  • cuadernos de campo
  • muestras biológicas,
  • colecciones de objetos físicos,
  • programas de software o código utilizado para generar o analizar los datos
  • algoritmos
  • desarrollo de modelos
  • datos de investigación primaria (incluidos los datos en papel o en soporte informático)
  • diapositivas, diseños y muestras
  • fotografías e imágenes
  • cortes de películas o vídeos
  •  registros sonoros, entre otros.


En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, dónde se recogió y con qué (por ejemplo, instrumentos)

Los tipos de documentos asociados que puedan aportar significado a los datos son: libros de código, cuestionarios, descripciones metodológicas, informes, papers, etc.

Tipos de datos

Los datos pueden ser definidos según su forma, análisis, etc.

in ánimo de ser exhaustivos, algunas de estas clasificaciones son:

  1. Según el nivel de accesibilidad: abiertos o privados.
  2. Según su organización: datos estructurados o no estructurados.
  3. Según su origen: experimentales, observacionales, simulación, etc.
  4. Según su obtención: primarios o secundarios.
  5. Según su estado: en bruto, procesados, anonimizados, etc.
  6. Según su procesamiento computacional: números enteros, números flotantes, cadenas de textos, booleanos, etc.
  7. Según su formato de almacenamiento: JSON, CSV, PNG, WAV, etc.

Algunos ejemplos de datos de investigación podrían ser:

  • Textos (entrevistas, guías, protocolos, metodologías, etc.).
  • Datos numéricos (respuestas a test, hojas de cálculo, información geoespacial, etc.).
  • Diapositivas, diseños y muestras.
  • Fotografías e imágenes.
  • Cortes de películas o vídeos.
  • Registros sonoros.
  • Programas de software o código utilizado para generar o analizar los datos.
  • lgoritmos.
  • Desarrollo de modelos.
  • Cuadernos de laboratorio.
  • Cuadernos de campo.
  • Muestras biológicas.
  • Colecciones de objetos físicos.
Datos cuantitativos y datos cualitativos

Además, los datos pueden clasificarse en:

  • Datos categóricos o nominales. Son datos cualitativos usados para nombrar una categoría. No tienen un orden o jerarquía definida. Por ejemplo:
    • Nombre
    • Color de pelo
    • Género
    • Estado civil
  • Datos ordinales. Son datos cualitativos que se usan para ordenar valores posibles en una categoría. Se pueden ordenar y clasificar. Por ejemplo:
    • Nivel de estudios
    • Nivel de satisfacción
    • Posición en una maratón
    • Grado de dolor de un paciente
  • Datos cuantitativos discretos. Son datos numéricos que pueden tomar una serie de valores limitada y contable. Muchas veces son números enteros. Por ejemplo:
    • Número de hijos
    • Cantidad de veces que una palabra aparece en un texto
    • Número de libros prestados en la biblioteca
  • Datos cuantitativos continuos. Son datos numéricos que pueden tomar una serie de valores ilimitada y continua. Muchas veces presentan decimales. Por ejemplo:
    • Temperatura
    • Duración de un vídeo
    • Peso
Datos FAIR

Los principios FAIR son un conjunto de directrices a tener en cuenta para que los datos sean:

  • Localizables (Findable): asignando un identificador único y persistente DOI o handle, describiendo los datos con metadatos enriquecidos, incluyendo el identificador asignado e indexándolos en un recurso de búsqueda.
  • Accesibles (Accesible): usando protocolos estandarizados de comunicación que sean abiertos y gratuitos. Incluso cuando los datos no estén disponibles por motivos de privacidad, seguridad nacional o intereses comerciales deben contar con metadatos accesibles. El protocolo debe permitir procedimientos para la autentificación y la autorización. 
  • Interoperables (Interoperable): eligiendo metadatos, vocabularios, formatos  y metodologías estándar y que contengan enlaces a información relacionada mediante identificadores que permitan el intercambio entre investigadores e instituciones. 
  • Reutilizables (Re-Usable): asignando metadatos con atributos que proporcionen información contextual y metadatos de información sobre su procedencia. Deen utilizar  licencias de uso abiertas y legibles por ordenador que permitan su reutilización. 

File:FAIR data principles.jpg

Fuente: wikidata

Datos abiertos

Los datos se definen como abiertos cuando se pueden utilizar libremente, modificar y compartir por cualquiera para cualquier propósito, incluyendo la creación de un bien común en el que cualquiera puede participar. La única condición que se exige es la de citar la autoría de los mismos, y en su caso, el requerimiento de atribución y de compartirse de la misma manera en que aparecen.

Los datos abiertos se caracterizan por: 

  • Disponibilidad y acceso: la información debe estar disponible para su consulta. 
  • Reutilización y distribución: los datos deben poder reutilizarse y redistribuirse.
  • Universalidad: accesible a todo el mundo. 
  • Publicar los datos de investigación en abierto permite garantizar el acceso de forma libre y universal a los mismos, así como su correcta preservación, explotación, reproducción, difusión, visibilidad e impacto.

Con los datos abiertos se obtienen importantes beneficios como: 

  • Aportar transparencia a los procesos de investigación al facilitar la reproducción y validación de los experimentos e indagaciones realizadas. 
  • Promover y mejorar la investigación y la comprobación de la recogida y medición de datos a través del intercambio y la diversidad de análisis y opiniones.
  • Mejorar la gestión y conservación de los datos, minimizando el riesgo de pérdida, en redes de repositorios a nivel internacional.
  • Potenciar la visibilidad, repercusión y prestigio de los investigadores y sus proyectos
  • Incrementar la eficiencia, reduciendo costes, y la colaboración en la investigación para estimular la productividad científica e industrial. 
  • Garantizar el cumplimiento de los requisitos de los organismos financiadores y la inversión realizada.

Se trata de una tendencia que se enmarca dentro de los movimientos generales hacia la ciencia abierta (Open Science) y a favor de los Datos Abiertos y la transparencia del sector público y el gobierno. 

Datos restringidos

Datos abiertos: Tan abiertos como sea posible, tan cerrados como sea necesario
Los principales organismos financiadores europeos, así como cada vez más editoriales exigen el depósito de los datos de investigación asociados a publicaciones, necesarios para asegurar la replicabilidad de la investigación. Además, se recomienda el depósito en abierto para que los datos puedan ser reutilizados.

El acceso abierto a los datos puede quedar exenta de cumplimiento si los investigadores argumentan por motivos de seguridad, privacidad, confidencialidad, propiedad industrial u otra causa justificable, su imposibilidad de hacerlo. En este caso, el coordinador debe reflejarlo en el plan de gestión de datos.

Ciencia abierta es el término utilizado para describir las transiciones en curso en la forma en que se realiza la investigación, los investigadores colaboran, se comparte el conocimiento y se organiza la ciencia. Representa un nuevo enfoque del proceso científico basado en el trabajo cooperativo y nuevas formas de distribución del conocimiento utilizando tecnologías digitales y nuevas herramientas colaborativas.

Un paso clave para hacer que la ciencia sea abierta y transparente es el acceso abierto a los datos de investigación, también conocidos como datos abiertos. Compartir y utilizar datos de investigación puede aumentar el impacto, la validez, la reproducibilidad, la eficiencia y la transparencia de la investigación científica.

undefined¡