En el ámbito de la salud, los datos abundan, procedentes de diversas fuentes: historias clínicas electrónicas, estudios poblacionales, ensayos clínicos, registros de laboratorio, sensores y wearables.
Frente a un volumen de información creciente y exponencial, una verdad persiste: no hay análisis válido sin una pregunta bien formulada ni una prueba estadística correctamente elegida.
Como sostiene Sandra Escobar Espinosa, Healthcare Lead de Conexia, en ciencia de datos aplicada a salud, la elección de la herramienta analítica no es un paso técnico, sino una decisión estratégica.

De la pregunta a la prueba: el eje invisible del análisis
Antes de comparar promedios, medir asociaciones o estimar riesgos, los equipos de datos deben preguntarse: ¿Estamos formulando correctamente la pregunta de investigación?
Porque no es lo mismo querer saber si dos tratamientos difieren en su efecto promedio —lo que justificaría una prueba t— que querer evaluar si la variabilidad en los resultados entre grupos es significativa —lo que requeriría una prueba F—.
Tampoco es igual explorar si existe una relación entre variables clínicas (como edad, nivel de glucosa y riesgo cardiovascular), donde entrarían en juego modelos de regresión, o si se busca entender qué factores influyen en la supervivencia de pacientes, lo que implicaría aplicar modelos de supervivencia.
En cada caso, la elección metodológica traduce una intención clínica o epidemiológica distinta.
Una elección errónea puede distorsionar los hallazgos, llevar a conclusiones falsas y, en última instancia, afectar decisiones médicas o de política sanitaria.
Ciencia de datos en salud: más allá de los números
El data science en salud no consiste sólo en aplicar modelos avanzados o algoritmos sofisticados. Busca interpretar preguntas clínicas con precisión estadística, de entender qué se está midiendo, en qué contexto y con qué nivel de incertidumbre.
En entornos clínicos y de salud pública, la validez de las conclusiones depende tanto de la calidad del dato como de la coherencia entre la pregunta y la prueba aplicada.
Elegir la técnica correcta puede marcar la diferencia entre detectar un efecto real o caer en una falsa alarma. O entre diseñar una intervención efectiva o desperdiciar recursos en una medida ineficaz.
Sandra Escobar Espinosa considera que elegir la herramienta analítica adecuada impacta directamente en la validez de las conclusiones… y en las decisiones basadas en datos.

Estrategia, no técnica
La elección de la prueba estadística debe asumirse como parte de la estrategia analítica y no solo como una decisión técnica.
Involucra comprender el contexto clínico, los supuestos del modelo, el tipo de variable, la naturaleza del diseño del estudio y las implicancias éticas del resultado.
Un buen científico de datos en salud no se limita a “aplicar” pruebas: dialoga con los equipos clínicos, entiende los objetivos y traduce las preguntas en modelos que devuelvan respuestas significativas y útiles.
¿Dónde está la verdadera inteligencia analítica?
En un sistema de salud cada vez más digitalizado y orientado por datos, la verdadera inteligencia analítica no está en la sofisticación de las herramientas, sino en la claridad de las preguntas y la estrategia detrás de su interpretación.
Porque en ciencia de datos para salud, elegir la prueba estadística correcta no es un acto técnico, sino un compromiso con la precisión, la validez y, en última instancia, con la salud de las personas.