En dos artículos anteriores he tratado el tema de los datos desde la perspectiva de su variedad y la forma en que se les puede categorizar o clasificar, incluso señalando cuales son las fuentes principales de cada uno de esos datos.
Pero hoy quiero dar un paso más al considerar el tema de los datos desde otra perspectiva, como continuación de la anterior. Me refiero a las formas o al procedimiento sobre cómo se pueden obtener esos datos, teniendo en cuenta su diversidad, sus distintos orígenes y los diferentes momentos en que se producen, que insistiré hoy.
Estos datos que tienen orígenes tan diversos, y que se producen y conocen de maneras tan diferentes, no nos servirán si se quedan en el lugar donde se originaron o la fuente de producción no es capaz de remitirlos al lugar adecuado para ser tenidos en cuenta y en definitiva utilizados a través de las herramientas de salud digital.
Donde van los datos
Tienen que llegar a nuestra base de datos, para decirlo en términos coloquiales y entendibles, en realidad estoy queriendo decir que deben quedar incluidos en el “big data”, el “data lake”, el Espacio español de datos, el espacio europeo de datos, el espacio de datos de la sanidad privada o a cualquier otro que podamos inventar o imaginar, y de estos hablaremos otro día.
Lo importante, como digo, es que los datos lleguen al lugar adecuado para que les podamos dar su verdadera utilidad, ya sea para diagnosticar, tratar al paciente, para la investigación o para cualquier otro uso legal y legítimo que necesitemos de esos datos tan privilegiados en la protección y por tanto tan seguros.
Por eso después de haber tratado del inmenso número de datos existentes, de la importancia que tienen para la salud digital en toda su amplitud y de las formas en que podemos clasificar esos datos, hoy vamos a tratar de acercarnos a las formas en que hacemos llegar esos datos desde su origen hasta el lugar don los vamos a tener almacenados y desde donde los haremos útiles para los distintos objetivos que con ellos nos proponemos cumplir.
DIVERSIDAD DE DATOS Y SUS FUENTES
A efectos didácticos y teniendo en cuenta el aspecto que queremos tratar hoy, vamos a fijar una serie de premisas que nos van a situar en el entorno que es preciso definir, para comprender mejor como los datos van a “transitar” desde el lugar donde se producen o almacenan inicialmente, hasta el destino y en las condiciones que los precisamos para ese objetivo final.

En definitiva, los datos son siempre los mismos, pero debemos ser conscientes de que según el criterio con que se clasifican están en uno u otro sitio.
En primer lugar, sobre el tipo de los datos de salud digital:
- Clínicos: Son los procedentes de las historias médicas, diagnósticos, tratamientos, resultados de laboratorio, imágenes médicas y cualquier otro que tengan que ver con los aspectos clínicos del paciente en sentido amplio.
- Demográficos: Se refieren a laedad, sexo, dirección, ocupación u otros similares.
- De comportamiento: Tienen que ver con la actividad física, dieta, hábitos de sueño y otros hábitos y conductas de la persona.
- Administrativos: Relacionados con las gestiones de facturación, tiempos de atención, recursos humanos, citas, seguros. En definitiva, los relacionados con la gestión administrativa de la asistencia sanitaria.
- Poblacionales: Como son las estadísticas epidemiológicas o los datos de vigilancia sanitaria.
- Generados por el paciente: Se incluyen los datos que el paciente de forma directa aporta ya sea a través de wearables, apps de salud, encuestas de satisfacción o autoevaluación del bienestar.
- Genómicos y biomoleculares: Cada vez de mayor importancia porque tienen incidencia directa en la medicina personalizada. Se refieren a la información de ADN, secuenciación genética o biomarcadores,
- Datos de dispositivos: A través de sensores, monitores remotos, o de la atención prestada a través de telemedicina en sus diversas especialidades y procedimientos.
- Datos ambientales: Referidos, por ejemplo, a la calidad del aire, exposición a contaminantes o ubicación geográfica.
En segundo lugar, por el origen de los datos (fuentes), según de donde provienen:
- Registros electrónicos de salud: Generados en hospitales, clínicas, centros de salud y consultorios médicos durante la atención clínica.
- Dispositivos médicos conectados: Como son los monitores de glucosa, presión arterial, marcapasos, entre otros
- Encuestas y cuestionarios: Aplicados a pacientes, profesionales o población general, en formato físico o digital.
- Redes sociales y foros: Opiniones, experiencias y auto reporte de síntomas. Expresiones espontáneas de la población sobre salud, útiles para vigilancia epidemiológica y análisis de tendencias, formulados a través de las diversas redes sociales.
- Aplicaciones médicas y wearables: Generan datos en tiempo real sobre actividad física, constantes vitales, etc. Se llevan a cabo a través de relojes inteligentes, pulseras de actividad, prendas con sensores, apps de seguimiento de salud y otros.
- Sistemas de información hospitalaria (HIS): Datos administrativos, de gestión y facturación. Estadísticas de salud, registros de enfermedades, censos.
- Bases de datos administrativas y registros nacionales: información sobre gestión hospitalaria, recursos, costes.
- Muestras biológicas y análisis de laboratorio: Datos obtenidos en momentos específicos de la atención o investigación, a través de mecanismos y herramientas utilizados, fundamentalmente, para l diagnóstico y seguimiento.
- Telemedicina y consultas virtuales: Registros de videollamadas, llamadas por teléfono, chats y plataformas de atención remota.
En tercer lugar, teniendo en cuenta donde se generan los datos:
- Entornos clínicos: Hospitales, clínicas, laboratorios, farmacias y en general cualquier centro sanitario.
- Entornos domiciliarios: Hogar del paciente, mediante dispositivos personales.
- Entornos comunitarios: Centros de salud, campañas de vacunación, escuelas.
- Entornos virtuales: Plataformas de telemedicina, apps móviles, redes sociales.
Teniendo a la vista todo lo anterior y lo numerosos que son esos datos y la forma en que se generan, estamos en condiciones de ir viendo los mecanismos para acceder y disponer de ellos.
Cuadro Resumen:
A través de este cuadro resumen, aunque no sea exhaustivo, se puede comprobar como los mismos datos pueden ser clasificados con diferentes criterios, para comprender mejor los procedimientos de obtención.
| Tipo de dato | Origen/Fuente | Momento de producción | Procedimiento de obtención |
| Clínico | Hospital, consulta | Durante la atención | EHR, revisión de historias |
| Administrativo | Gestión hospitalaria | Continuo | Bases de datos, informes |
| Paciente-generado | Wearables, apps | En tiempo real, domicilio | Captura automatizada, apps |
| Genético | Laboratorio, investigación | En estudios específicos | Muestreo biológico, análisis |
| Poblacional | Encuestas, redes sociales | Campañas, estudios | Formularios, análisis digital |
OBTENCIÓN DE LOS DATOS PARA LA SALUD DIGITAL
Cuestión fundamental es entender que pretendemos ir recogiendo esa multitud de datos que precisamos desde las fuentes y lugares en que se producen y de la forma más automatizada, inteligente y directa que sea posible. Se trata, dentro de lo posible, evitar operaciones manuales o tareas repetitivas que se puedan sustituir a través del uso de herramientas digitales, incluida la IA.
Siguiendo con el desarrollo del tema, ahora toca tratar como, cuando y donde se producen esos datos.
El primer tema hace referencia a la obtención de los datos en sí misma, el cómo:
- Captura directa: Ingreso manual por profesionales de la salud o pacientes. Esta fórmula no se puede obviar, pero cada vez más se debe ir sustituyendo, dentro de lo posible, por las otras.
- Sensores automáticos: Dispositivos que registran y transmiten datos en tiempo real.
- Integración de sistemas: Interoperabilidad entre diferentes plataformas mediante estándares como HL7, FHIR, DICOM.
- Encuestas y cuestionarios digitales: Herramientas online para recolección de datos auto informados.
- Extracción de datos (data mining): Procesos automáticos para obtener información relevante de grandes volúmenes de datos.
- Procesamiento de lenguaje natural (PLN): Análisis de textos clínicos, notas médicas y publicaciones científicas.

En segundo lugar, veamos los distintos momentos, el cuándo se producen los Datos:
- En tiempo real: Monitoreo continuo (por ejemplo, ritmo cardíaco con un smartwatch). Dispositivos conectados. Telemedicina
- Durante la atención médica: En el momento de la realización de la actuación médica ya sea en consulta, hospitalización, procedimientos diagnósticos o quirúrgicos y tratamientos.
- Previo a la atención: Registro de antecedentes, prediagnóstico.
- Posterior a la atención: Seguimiento, rehabilitación, encuestas de satisfacción.
- De forma periódica: Controles rutinarios, chequeos anuales, campañas de salud pública.
En tercer lugar y no menos importante es la consideración del lugar donde se producen los datos
- En el punto de atención: hospitales, clínicas, consultas, urgencias.
- En el domicilio del paciente: mediante tele monitorización, apps y dispositivos personales.
- En la comunidad: encuestas poblacionales, redes sociales, campañas de salud pública.
- En laboratorios y centros de investigación: durante estudios clínicos, ensayos y análisis especializados.
PROCEDIMIENTOS PARA LA OBTENCION DE LOS DATOS
Cómo punto final y resumen de cuanto se ha planteado, voy a tratar de realizar un análisis final de los procedimientos que en la práctica se llevan a cabo para tener disponibles y de la manera adecuada para hacer realidad y efectiva la salud digital, todos esos datos y conseguir que cada vez sean menos los que se pierden, dada la inmensa utilidad que tienen en la práctica para la prestación de la asistencia sanitaria, con esa perspectiva de salud digital.

Captura automatizada
A través de este procedimiento conseguimos la integración de los sistemas informáticos, como son, fundamentalmente la Historia Electrónica (hoy Historia de Salud Digital), los datos facilitados por dispositivos IoT es decir el Internet de las Cosas en toda su amplitud, o por diversos sensores y por aplicaciones que cada vez son más y mejor utilizados.
Es muy importante la extracción automática de los datos de otros registros clínicos y de los registros administrativos, para completar los anteriores.
Especial importancia está adquiriendo el Procesamiento de Lenguaje Natural al que hemos dedicado un artículo anterior. Quiero hacer hincapié en este momento de la capacidad que tiene, a través de técnicas de IA, para transformar texto libre en datos estructurados, llegando a poder cumplimentar los informes clínicos tras una consulta.
Pero a través de este mecanismo se puede hacer ahorrar mucho tiempo y esfuerzo a los profesionales sanitarios. Me refiero a la capacidad de que en una consulta “escuchando” una conversación médico-paciente, enfermera-paciente o en general profesional sanitario-paciente, sea capaz, no sólo de transcribir la conversación, como un simple reconocimiento de voz que la convierte en tipografía, sino a la capacidad de que interpretando la conversación se extrae la información clínica y sanitaria relevante convirtiéndola en “datos” estructurados y utilizables en la historia de salud digital.

Encuestas y formularios electrónicos
Aplicando cuestionarios digitales para recoger la información directa de pacientes o profesionales, cuando se llevan a cabo encuestas de satisfacción de la atención recibida, o en los procedimientos de quejas y sugerencias.
También a través del uso de plataformas online para difusión y recogida masiva de datos.
Revisión de registros y bases de datos
Análisis retrospectivo de historias clínicas, informes médicos y bases de datos administrativas, a veces en soportes analógicos e incluso en papel que, a través de la IA y el Procesamiento de Lenguaje Natural, se convierten en datos en los formatos necesarios para que sean utilizables junto a los obtenidos directamente por medios digitales.
Es imprescindible la validación y aseguramiento de calidad mediante auditorías y revisiones periódicas.
Observaciones y entrevistas
Observación directa en entornos clínicos o comunitarios.
Entrevistas estructuradas, semiestructuradas o abiertas para obtener información cualitativa. Cuando se utilizan los procedimientos y soportes adecuados pueden analizar y volcar esos datos en formato digital, según ya hemos señalado.
Muestreo biológico y diagnóstico por la imagen
La obtención de muestras (sangre, tejidos, fluidos) en momentos específicos para que sean analizadas por el laboratorio, produce una información muy necesaria cuyos resultados se incluyen directamente en los datos del paciente, y permite que sean utilizados para un diagnóstico y para ver la evolución del paciente con la comparación con datos anteriores y posteriores. También se incluyen en este apartado los correspondientes a anatomía patológica y genética.
Otro tanto sucede con el diagnóstico por la imagen. La capacidad de almacenar las imágenes, su estudio e informes han supuesto un paso muy importante apoyadas por técnicas de IA. Cada vez se incluyen más modalidades del radiodiagnóstico como Radiología simple, TAC, RMN, ecografía y otras. A estas se suman otras como anatomía patológica o genética y sin duda la lista va cada día en aumento.
Datos generados en tiempo real
Monitoreo remoto de pacientes mediante dispositivos conectados que transmiten constantes vitales y otros datos del paciente en tiempo real. Esto permite el control del paciente en todo momento y que pueda ser modificado un tratamiento o detectado un proceso agudo de la enfermedad inmediatamente y sin necesidad de que ese paciente haya sido trasladado ni movido de su domicilio.
Los datos que se obtienen en el momento de la atención en un centro sanitario o a través de la telemedicina o en el seguimiento domiciliario, como se ha señalado anteriormente tienen su acceso inmediato a la historia de salud digital, que va a ser el primer repositorio de datos a utilizar. Normalmente la recogida de estos datos tiene lugar de forma automática estando inmediatamente disponibles para los profesionales sanitarios.
Consideraciones finales
Teniendo en cuenta que venimos hablando de datos sanitarios, no puedo terminar este artículo sin recordar estos aspectos fundamentales a la hora de utilizar datos personales especialmente protegidos:
Privacidad y seguridad: cumplimiento de normativas (RGPD, HIPAA), anonimización de datos, siempre que sea necesario.
Calidad y validación: protocolos de aseguramiento de calidad, auditorías, revisión de datos.
Interoperabilidad: uso de estándares (HL7, FHIR, DICOM) para integrar datos de diferentes fuentes.

