Exploración de datasets usando IA generativa frente a un experto humano en lenguaje R

dc.contributorCanul Reich, Juana
dc.contributor.id0000-0003-1893-1332
dc.contributor.roleasesorTesis
dc.creatorAlvarez Salaya, Jorge Fred
dc.creator.id0009-0008-7309-098X
dc.date.accessioned2026-01-14T14:24:17Z
dc.date.issued2025-12-01
dc.description.abstractEste trabajo de investigación analiza el papel de la inteligencia artificial generativa en la ciencia de datos, comparando el desempeño deGPT-4 o con el de un experto humano a lo largo del ciclo de vida CRISP-DM. El trabajo se inscribe en un contexto donde el volumen de datos y la presión por automatizar tareas analíticas hacen cada vez más relevante la posibilidad de delegar parte del proceso a modelos de lenguaje de gran tamaño, sin perder rigor ni calidad en problemas reales del ámbito de la salud. La metodología se basa en tres conjuntos de datos médicos (Autistic Spectrum Disorder Screening Data for Children, Epileptic Seizure Recognition Data Sety Diabetes DataSet), en los que se ejecuta el mismo flujo de trabajo por duplicado: por un lado, mediante scriptsen R desarrollados por un experto, y por otro, a partir de indicacionesdirigidasaGPT-4o, que generan documentos R Markdown reproducibles. En ambos casos se entrenan los mismos algoritmos de aprendizaje automático y se comparan sus resultados con métricas estándar. Los resultados muestran que GPT-4 o puede igualar o incluso superar al humano en problemas con estructura más clara (autismo y epilepsia), pero ofrece un rendimiento sensiblemente inferior y más inestable en el caso de diabetes. A partir de ello, la tesis concluye que la IA generativa no sustituye al experto, aunque si puede funcionar como asistente que automatiza tareas repetitivas y acelera la experimentación, dentro de esquemas híbridos donde el control y la decisión final siguen recayendo en la persona especialista.
dc.division9
dc.format1
dc.identifier.urihttps://ri.ujat.mx/handle/200.500.12107/84
dc.language.isospa
dc.publisher.universityUniversidad Juárez Autónoma de Tabasco.
dc.rightsinfo:eu-repo/semantics/closedAccess
dc.rights.licensehttp://creativecommons.org/licenses/by-nc-sa/4.0
dc.subjectIA generativa
dc.subjectciencia de datos
dc.subjectCRISP-DM
dc.subjectGPT-4o
dc.subjectagentes inteligentes.
dc.subject.ctiinfo:eu-repo/classification/cti/7
dc.titleExploración de datasets usando IA generativa frente a un experto humano en lenguaje R
local.Ods3

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Jorge Fred Alvarez Salaya.pdf
Tamaño:
11.56 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed to upon submission
Descripción: