Exploración de datasets usando IA generativa frente a un experto humano en lenguaje R
Cargando...
Fecha
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Resumen
Este trabajo de investigación analiza el papel de la inteligencia artificial generativa en la ciencia de datos, comparando el desempeño deGPT-4 o con el de un experto humano a lo largo del ciclo de vida CRISP-DM. El trabajo se inscribe en un contexto donde el volumen de datos y la presión por automatizar tareas analíticas hacen cada vez más relevante la posibilidad de delegar parte del proceso a modelos de lenguaje de gran tamaño, sin perder rigor ni calidad en problemas reales del ámbito de la salud. La metodología se basa en tres conjuntos de datos médicos (Autistic Spectrum Disorder Screening Data for Children, Epileptic Seizure Recognition Data Sety Diabetes DataSet), en los que se ejecuta el mismo flujo de trabajo por duplicado: por un lado, mediante scriptsen R desarrollados por un experto, y por otro, a partir de indicacionesdirigidasaGPT-4o, que generan documentos R Markdown reproducibles. En ambos casos se entrenan los mismos algoritmos de aprendizaje automático y se comparan sus resultados con métricas estándar. Los resultados muestran que GPT-4 o puede igualar o incluso superar al humano en problemas con estructura más clara (autismo y epilepsia), pero ofrece un rendimiento sensiblemente inferior y más inestable en el caso de diabetes. A partir de ello, la tesis concluye que la IA generativa no sustituye al experto, aunque si puede funcionar como asistente que automatiza tareas repetitivas y acelera la experimentación, dentro de esquemas híbridos donde el control y la decisión final siguen recayendo en la persona especialista.