Un estudio reveló que la inteligencia artificial logró un 90% de precisión en diagnósticos médicos, mientras que los doctores, incluso con ayuda del chatbot, apenas alcanzaron un 76%.
Este es un estudio que claramente marca un punto de inflexión en la medicina moderna, sugiriendo que la verdadera potencia de la IA en medicina solo podrá aprovecharse cuando los profesionales aprendan a utilizarla efectivamente y superen sus sesgos naturales.
Tal cual lo dijera el ex Presidente de los Estados Unidos, Lyndon B. Johnson, «La automatización no es nuestro enemigo. La automatización puede ser el aliado de nuestra prosperidad», sin dudas nada audaz sino simplemente un hecho que en la historia de la humanidad se repite una y otra vez a lo largo de los milenios desde que el hombre descubrió la agricultura.
LA SORPRESA DE LA INVESTIGACIÓN
Lo que comenzó como un estudio para demostrar cómo la inteligencia artificial podría ayudar a los médicos en sus diagnósticos, terminó revelando algo inesperado: ChatGPT-4 no solo puede asistir a los profesionales de la salud, sino que los supera significativamente en precisión diagnóstica.
«Estaba impactado», confesó el Dr. Adam Rodman, experto en medicina interna del Beth Israel Deaconess Medical Center de Boston, quien ayudó a diseñar el estudio que sacudió los cimientos de la medicina tradicional.
NÚMEROS QUE HABLAN
Los resultados fueron contundentes:
- ChatGPT en solitario: 90% de precisión
- Médicos usando ChatGPT: 76% de precisión
- Médicos sin ChatGPT: 74% de precisión
METODOLOGÍA Y ALCANCE
El experimento, publicado en JAMA Network Open, involucró a 50 médicos, incluyendo residentes y médicos de planta, reclutados de diversos sistemas hospitalarios estadounidenses.
Los participantes analizaron seis casos clínicos basados en pacientes reales, parte de un conjunto de 105 casos utilizados por investigadores desde los años 90.
UN CASO REVELADOR
Entre los casos evaluados, se publicó uno que ejemplifica la complejidad del desafío: un paciente de 76 años con dolor severo en espalda baja, glúteos y pantorrillas después de una angioplastia coronaria.
El diagnóstico correcto era embolismo por colesterol, una condición donde fragmentos de colesterol bloquean los vasos sanguíneos.
LA EVOLUCIÓN DEL DIAGNÓSTICO COMPUTARIZADO
Esta no es la primera vez que se intenta usar computadoras para diagnósticos médicos. En los años 70, el programa INTERNIST-1 de la Universidad de Pittsburgh, que incluía más de 500 enfermedades y 3.500 síntomas, mostró resultados prometedores pero nunca se implementó ampliamente debido a su complejidad de uso.
EL FACTOR HUMANO
El Dr. Jonathan H. Chen, médico y científico computacional de Stanford y coautor del estudio, señala que la interfaz de chat es la «aplicación definitiva».
«Podemos introducir un caso completo en la computadora. Antes de un par de años, las computadoras no entendían el lenguaje», explica.
BARRERAS EN LA ADOPCIÓN
El estudio reveló dos obstáculos principales:
- Sesgo de confirmación: Los médicos tendían a ignorar las sugerencias del chatbot cuando contradecían sus diagnósticos iniciales.
- Uso subóptimo: Muchos médicos trataban al chatbot como un simple motor de búsqueda en lugar de aprovechar su capacidad de análisis integral.
IMPLICACIONES FUTURAS
Laura Zwaan, investigadora del Centro Médico Erasmus en Rotterdam, sugiere que estos resultados reflejan un patrón común de exceso de confianza cuando los profesionales creen tener razón.
Sin embargo, el Dr. Rodman enfatiza que los sistemas de IA deberían funcionar como «extensiones del médico», ofreciendo valiosas segundas opiniones.
DESAFÍOS POR RESOLVER
El estudio plantea interrogantes fundamentales sobre:
- La integración efectiva de IA en la práctica médica
- La necesidad de capacitación en el uso de herramientas de IA
- El balance entre el juicio humano y la precisión artificial
- La confianza de los médicos en las sugerencias de la IA