Ir al contenido principal

Gestión y depósito de datos científicos: ¿Qué son los datos de investigación?

Información sobre los datos de investigación, gestión y herramientas

Datos investigación y dataset

Los datos de investigación (researchdata) son aquellos materiales generados o recopilados durante el transcurso de un proyecto de investigación y que sirven para validar o certificar los resultados obtenidos en dicha investigación. También pueden ser hechos, observaciones o experiencias en que se basa el argumento, la teoría o la prueba.

Los datos se convierten en información "cuando son combinados entre ellos según un método que tenga el potencial de revelar los patrones del fenómeno estudiado" ( Peset y González, 2017).  Se deben gestionar desde el inicio del ciclo de vida para asegurar su adecuado tratamiento y ordenación de cara a su consulta y reutilización. Tienen que estar bien documentados , explicar su procedencia, dónde, cómo y cuándo se recogieron, e incluir metadatos que los describan. Es necesario guardar constancia de los mismos utilizando la metodología apropiada. 

El conjunto de datos reunidos durante la ejecución de un proyecto de investigación se denomina Dataset. Adquiere valor al acompañar a la publicación (linking data: cita y enlace). Los datasets se almacenan y gestionan en repositorios interoperables en red integrados en una infraestructura global de investigación, desarrollados conforme a estándares internacionales.

Peset, F y González L. (2017). Ciencia aBierta y gestión de datos de investigación. Trea

Los datos de investigación presentan varios formatos y diferente naturaleza en función de las disciplinas. En el documento de buenas prácticas sobre datos de investigación realizado por la FECYT, contempla que pueden ser: 

  • Numéricos (datos cuantitativos), textuales, descriptivos o visuales (datos cualitativos)

  • Encontrarse en estado bruto o analizado, y pueden ser experimentales u observacionales

En los datos de investigación se incluyen:

  • ​cuadernos de laboratorio 
  • cuadernos de campo
  • muestras biológicas,
  • colecciones de objetos físicos,
  • programas de software o código utilizado para generar o analizar los datos
  • algoritmos
  • desarrollo de modelos
  • datos de investigación primaria (incluidos los datos en papel o en soporte informático)
  • diapositivas, diseños y muestras
  • fotografías e imágenes
  • cortes de películas o vídeos
  •  registros sonoros, entre otros.


En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, dónde se recogió y con qué (por ejemplo, instrumentos)

Los tipos de documentos asociados que puedan aportar significado a los datos son: libros de código, cuestionarios, descripciones metodológicas, informes, papers, etc.

Los datos de investigación se caracterizan por diferentes elementos como:

  • Agrupación: son datos tratados como una unidad, un conjunto o una colección.
  • Contenido: constituyen un conjunto de valores que representan actividades como mediciones u observaciones.
  • Parentesco: los datos tienen una misma estructura y están relacionados entre sí por factores de tiempo, lugar, instrumento, objeto u observación, tema, etc. 
  • Propósito: la finalidad de estos datos será la de contribuir a cierta actividad científica para proveer evidencia, sugerir una hipótesis, refutar o confirmar una hipótesis, etc.

No se consideran datos finales de investigación los siguientes tipos:

  • Notas y ejemplares de laboratorio
  • Sets de datos parciales
  • Análisis preliminares
  • Borradores de trabajos
  • Planes para investigaciones futuras
  • Informes que han tenido un proceso de revisión por pares
  • Comunicaciones con colegas

undefined