Después de ver el ingente número de datos relacionados con la salud digital que se encuentran en el mundo, no hay ninguna duda, que para entender bien lo que eso significa, los datos deben ser clasificados de diversas maneras. Eso es lo que voy a abordar en el blog de hoy.
Si estamos convencidos de que los datos son importantes, imprescindibles, no es cuestión menor hacernos a la idea de cuáles son esos datos que utilizamos, a qué se refieren, que ofrecen y de donde se pueden obtener, o de donde vienen.
La ciencia de datos en salud.

La ciencia de datos es una disciplina enfocada en analizar y procesar grandes volúmenes de información, con el objetivo de transformarla en conocimiento práctico y aplicable.
En el ámbito sanitario, la llegada del fenómeno conocido como «big data» ha marcado un antes y un después, ya que hoy contamos con fuentes de datos cada vez más extensas y complejas. Esto abre la puerta a decisiones más informadas que pueden, en última instancia, impactar de manera positiva en la calidad de vida de las personas.
El potencial de la ciencia de datos en salud es enorme, pero también enfrenta retos significativos. La fragmentación de los sistemas de información, junto con obstáculos estructurales tanto sociales como económicos, dificulta la integración y el aprovechamiento pleno de estos datos. Superar estos desafíos permitirá acceder a beneficios sustanciales, optimizando la gestión de la salud y acercando la innovación tecnológica a la realidad cotidiana.
La ciencia de datos de salud es el motor fundamental de la transformación digital del sector salud.
Mediante el análisis de grandes volúmenes de datos, se consigue mejorar la atención médica y la toma de decisiones clínicas. Mediante los registros médicos electrónicos, datos genómicos, información de seguros de salud ó datos de dispositivos médicos, se pueden extraer conocimientos valiosos.
La ciencia de datos en salud permite identificar patrones y tendencias a partir de diversos indicadores que se obtienen de los pacientes. Sus fuentes, como estamos indicando, se encuentran en sus historias clínicas digitales, patrones de antecedentes familiares y los resultados de estudios médicos, entre otros medios para obtener esa información.
Categorías de los datos:

En una primera clasificación, que de ninguna manera podemos plantear como completa o exhaustiva, sino a título de ejemplo, vamos a referirnos a los datos DESDE LA PERSPECTIVA DE LOS GRANDES TEMAS A QUE SE REFIEREN:
Datos clínicos
| Tipo de dato | Fuente principal |
| Diagnóstico médico | Historia Clínica Electrónica (HCE), informes médicos |
| Resultados de laboratorio | Sistemas de laboratorio (LIS), HCE |
| Imágenes médicas (radiografías, TAC, RMN) | PACS (sistemas de archivo de imágenes), HCE |
| Medicación prescrita | Farmacias, HCE, receta electrónica |
| Procedimientos realizados | HCE, sistemas de gestión hospitalaria |
| Evolución clínica | Notas médicas, HCE |
Datos biomédicos y genéticos
| Tipo de dato | Fuente principal |
| Perfil genético | Biobancos, laboratorios de genética |
| Biomarcadores | Estudios clínicos, laboratorios |
| Datos de secuenciación | Bases de datos genómicas, laboratorios especializados |
Datos de estilo de vida y comportamiento
| Tipo de dato | Fuente principal |
| Actividad física | Wearables (ej. Fitbit, Apple Watch), apps de fitness |
| Calidad del sueño | Wearables, apps de sueño |
| Hábitos alimenticios | Apps de nutrición, encuestas clínicas |
| Consumo de sustancias (tabaco, alcohol) | Encuestas, HCE |
| Salud mental (estado de ánimo, ansiedad) | Apps de salud mental, entrevistas clínicas |
Datos generados por el paciente
| Tipo de dato | Fuente principal |
| Autoevaluaciones | Apps móviles, portales de pacientes |
| Cuestionarios de calidad de vida | Estudios clínicos, apps |
| Datos de dispositivos personales | Glucómetros, tensiómetros, oxímetros conectados |
Datos administrativos y operativos
| Tipo de dato | Fuente principal |
| Citas médicas | Sistemas de gestión hospitalaria |
| Tiempo de espera | Sistemas de atención al paciente |
| Costes y facturación | Sistemas administrativos, aseguradoras |
| Cobertura de seguros | Aseguradoras, HCE |
Datos demográficos y sociales
| Tipo de dato | Fuente principal |
| Edad, sexo, etnia | HCE, registros civiles |
| Nivel socioeconómico | Encuestas, registros públicos |
| Ubicación geográfica | Datos de residencia, apps móviles |
| Condiciones laborales | Encuestas, registros de empleo |
Datos ambientales y contextuales
| Tipo de dato | Fuente principal |
| Calidad del aire | Estaciones meteorológicas, sensores urbanos |
| Temperatura y clima | Servicios meteorológicos |
| Exposición a contaminantes | Estudios ambientales, sensores |
| Ruido ambiental | Sensores urbanos, apps móviles |
Datos de salud pública y epidemiología
| Tipo de dato | Fuente principal |
| Incidencia de enfermedades | Registros públicos, sistemas de vigilancia epidemiológica |
| Vacunación | Registros de vacunación, HCE |
| Brotes y alertas sanitarias | Organismos de salud pública (ej. OMS, CDC, Ministerio de Sanidad) |
En esta otra clasificación, POR AREAS CLAVE, IMPORTANCIA Y FUENTE, vamos a analizar los datos este otro punto de vista. Aunque las agrupaciones en ocasiones coinciden, los resultados son diferentes, pero en todo caso nos están dando una amplia óptica del conjunto de los datos para la salud digital.
Datos clínicos
| Dato | Importancia | Fuente |
| Presión arterial | Indicador de riesgo cardiovascular | Dispositivos médicos, HCE, wearables |
| Frecuencia cardíaca | Monitorización de salud general y estrés | Wearables, monitores hospitalarios |
| Nivel de glucosa en sangre | Control de diabetes | Glucómetros, HCE |
| Saturación de oxígeno (SpO₂) | Evaluación respiratoria | Oxímetros, wearables |
| Temperatura corporal | Detección de infecciones | Termómetros, HCE |
| Índice de masa corporal (IMC) | Evaluación nutricional y riesgo metabólico | HCE, apps de salud |
| Historial de vacunación | Prevención y control epidemiológico | Registros públicos, HCE |
| Diagnóstico clínico | Base para tratamiento y seguimiento | HCE, informes médicos |
| Tratamientos previos | Evita interacciones y errores | HCE, farmacias |
| Alergias conocidas | Prevención de reacciones adversas | HCE, entrevistas clínicas |
Datos de estilo de vida
| Dato | Importancia | Fuente |
| Número de pasos diarios | Indicador de actividad física | Wearables, apps |
| Horas de sueño | Evaluación de salud mental y física | Apps de sueño, wearables |
| Consumo de tabaco/alcohol | Riesgo de enfermedades crónicas | Encuestas, HCE |
| Nivel de estrés percibido | Salud mental y cardiovascular | Apps, entrevistas clínicas |
| Hábitos alimenticios | Prevención de enfermedades metabólicas | Apps de nutrición, encuestas |
Datos genéticos
| Dato | Importancia | Fuente |
| Mutaciones genéticas específicas (ej. BRCA1/2) | Riesgo de cáncer hereditario | Laboratorios genéticos, biobancos |
| Perfil farmacogenético | Personalización de tratamientos | Estudios genéticos, HCE |
| Predisposición a enfermedades | Prevención personalizada | Biobancos, estudios clínicos |
Datos de salud mental
| Dato | Importancia | Fuente |
| Escalas de ansiedad/depresión (ej. GAD-7, PHQ-9) | Diagnóstico y seguimiento | Apps, entrevistas clínicas |
| Frecuencia de episodios emocionales | Evaluación de trastornos | Apps de salud mental |
| Uso de psicofármacos | Seguimiento terapéutico | HCE, farmacias |
Datos contextuales
| Dato | Importancia | Fuente |
| Código postal o ubicación | Determina acceso a servicios y riesgos ambientales | Registros civiles, apps |
| Calidad del aire local | Riesgo respiratorio | Sensores ambientales, servicios meteorológicos |
| Nivel de ruido ambiental | Impacto en salud mental y sueño | Sensores urbanos, apps móviles |
Datos administrativos
| Dato | Importancia | Fuente |
| Número de visitas médicas | Seguimiento de atención | Sistemas hospitalarios |
| Tiempo de espera en urgencias | Mejora de procesos | Sistemas de gestión |
| Coste por paciente | Evaluación económica | Sistemas administrativos |
| Cobertura de seguro médico | Acceso a tratamientos | Aseguradoras, HCE |

Los resultados
Volvamos al punto de partida de este Blog sobre los datos: la ciencia de datos en salud.
La automatización de procesos y la inteligencia artificial pueden analizar grandes conjuntos de datos para:
- identificar factores de riesgo,
- predecir resultados clínicos,
- facilitar la detección temprana de enfermedades,
- lograr diagnósticos más precisos,
- recomendar tratamientos más efectivos y personalizados.
Para terminar vamos a señalar cinco beneficios concretos e importantes, aunque no sean los únicos, que la ciencia de datos en salud ayuda a conseguir, según se señala en un artículo publicado por la UOC que se puede consultar en https://blogs.uoc.edu/informatica/es/beneficios-ciencia-datos-para-salud/
- Mejor calidad de servicio de los sistemas de salud.
- Medicina personalizada
- Diferencias entre pacientes en una misma enfermedad
- Reducción de costes y pruebas en los sistemas de salud
- Reducción de sesgos y desigualdades para la globalización de los modelos.
Seguiremos hablando de los datos desde otras perspectivas, relacionadas en como los podemos obtener según sus diversos orígenes, como hemos podido ver en los cuadros anteriores como fuente.
