Ayuda
Ir al contenido

Dialnet


Identifying the most important data for research in the field of infectious diseases: thinking on the basis of artificial intelligence

  • Autores: Adrian Tellez Santoyo, Carlos Lopera, Andrea Ladino Vasquez, Ferrán Seguí Fernández, Nacho Grafia, Mariana Chumbita, Tomasso Francesco Aiello, Patricia Monzó, Olivier Peyrony, Pedro Puerta Alcalde, Celia Cardozo, Nicole Garcia Pouton, Pedro Castro, Sara Fernández Méndez, José María Nicolás Arfelis, Alex Soriano, Carolina García Vidal
  • Localización: Revista Española de Quimioterapia, ISSN-e 0214-3429, Vol. 36, Nº 6, 2023, págs. 592-596
  • Idioma: inglés
  • Títulos paralelos:
    • Identificación de los datos más importantes para el desarrollo de inteligencia artificial en el campo de las enfermedades infecciosas
  • Enlaces
  • Resumen
    • español

      Objetivos. Los datos clínicos sobre los que se entrenan y prueban los algoritmos de inteligencia artificial (IA) proporcionan la base para mejorar el diagnóstico o el tratamiento de las enfermedades infecciosas (EI). Nuestro objetivo es identificar datos importantes para la investigación de las enfermedades infecciosas con el fin de priorizar los esfuerzos realizados en los programas de IA.

      Material y métodos. Se buscaron 1.000 artículos de revistas de EI de alto impacto en PubMed, seleccionando 288 de los últimos artículos en 10 revistas de primer nivel. Los clasificamos en datos estructurados o no estructurados. Las variables se homogeneizaron y agruparon en las siguientes categorías:

      epidemiología, ingreso, demografía, comorbilidades, manifestaciones clínicas, laboratorio, microbiología, otros diagnósticos, tratamiento, desenlace y otras variables no categorizables.

      Resultados. Se recogieron 4.488 variables individuales, procedentes de 288 artículos. 3670 (81,8%) variables se clasificaron como datos estructurados, mientras que 818 (18,2%) como datos no estructurados. De los datos estructurados, 2.319 (63,2%) variables se clasificaron como directas -recuperables a partir de historias clínicas electrónicas-, mientras que 1.351 (36,8%) fueron indirectas. Los datos no estructurados más frecuentes estaban relacionados con las manifestaciones clínicas y se repetían en todos los artículos. Los datos sobre demografía, comorbilidades y microbiología constituyeron el grupo más frecuente de variables.

      Conclusiones. Este artículo identificó que las variables estructuradas han constituido los datos más importantes en la investigación para generar conocimiento en el campo de la EI.

      La extracción de estos datos debería ser una prioridad cuando un centro médico pretende iniciar un programa de IA para la EI. También hemos documentado que los datos no estructurados más importantes en este campo son los relacionados con las manifestaciones clínicas. Estos datos podrían estructurarse fácilmente con el uso de historias clínicas semiestructuradas centradas en unos pocos síntomas

    • English

      Objectives. Clinical data on which artificial intelligence (AI) algorithms are trained and tested provide the basis to improve diagnosis or treatment of infectious diseases (ID). We aimed to identify important data for ID research to prioritise efforts being undertaken in AI programmes.

      Material and methods. We searched for 1,000 articles from high-impact ID journals on PubMed, selecting 288 of the latest articles from 10 top journals. We classified them into structured or unstructured data. Variables were homogenised and grouped into the following categories: epidemiology, admission, demographics, comorbidities, clinical manifestations, laboratory, microbiology, other diagnoses, treatment, outcomes and other non-categorizable variables.

      Results. 4,488 individual variables were collected, from the 288 articles. 3,670 (81.8%) variables were classified as structured data whilst 818 (18.2%) as unstructured data. From the structured data, 2,319 (63.2%) variables were classified as direct—retrievable from electronic health records—whilst 1,351 (36.8%) were indirect. The most frequent unstructured data were related to clinical manifestations and were repeated across articles. Data on demographics, comorbidities and microbiology constituted the most frequent group of variables.

      Conclusions. This article identified that structured variables have comprised the most important data in research to generate knowledge in the field of ID. Extracting these data should be a priority when a medical centre intends to start an AI programme for ID. We also documented that the most important unstructured data in this field are those related to clinical manifestations. Such data could easily undergo some structuring with the use of semi-structured medical records focusing on a few symptoms.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno