Usé IA para estructurar historias clínicas durante 30 días — análisis honesto con ejemplos reales y tiempos medidos
Dra. Laura Pinzón
Durante 30 días consecutivos usé herramientas de IA en mi consulta de medicina familiar para estructurar historias clínicas. Aquí mi reporte honesto, con datos reales.
Herramientas evaluadas: 1. Claude (Anthropic) — prompts personalizados 2. GPT-4o (OpenAI) — integración vía API 3. App A (vertical de medicina, no nombro por confidencialidad) 4. App B (otra app vertical, similar)
Metodología: - Medí tiempo de documentación por consulta (antes y después) - Evalué calidad percibida de la historia clínica (escala 1-5) - Registré errores o alucinaciones detectadas
Resultados (promedio de 30 días):
| Herramienta | Tiempo promedio | Calidad (1-5) | Errores detectados |
| Sin IA (basal) | 8.2 min | 3.8 | — |
| Claude | 6.1 min | 4.4 | 2/30 |
| GPT-4o | 5.8 min | 4.1 | 4/30 |
| App A | 9.3 min | 3.2 | 1/30 |
| App B | 7.4 min | 3.6 | 3/30 |
Conclusión:
La IA sí ahorra tiempo en casos rutinarios, pero lo aumenta en casos complejos donde la estructura automática se queda corta. Las apps verticales de medicina me decepcionaron: más lentas y menos flexibles que usar un LLM directamente con buen prompting.
El riesgo real: la comodidad puede llevar a historias clínicas superficiales si no revisas el output con criterio clínico.