Relación entre el uso de herramientas de IA generativa (ChatGPT, Copilot) y la calidad de las producciones académicas universitarias. Lima – Perú.
Relationship between the use of generative AI tools (ChatGPT, Copilot) and the quality of university academic productions in Lima -Perú.
Patty Sindy Inga Cerda
Universidad María Auxiliadora, Perú
Cita en APA 7: Inga Cerda, P. S. (2025). Relación entre el uso de herramientas de IA generativa (ChatGPT, Copilot) y la calidad de las producciones académicas universitarias. Lima – Perú. Revista Arbitrada de Educación Contemporánea. 2 (1).
Resumen
El presente articulo analiza la relación entre el empleo de instrumentos de inteligencia artificial generativa de ChatGPT y GitHub Copilot en la calidad de los trabajos académicos de los estudiantes universitarios. A través de un análisis cuantitativo se tuvo por muestra a 78 alumnos tanto pregrado como posgrado, y se estudió el manejo de estas tecnologías que tiene efecto en puntos como la creatividad, profundidad en análisis, coherencia, y rigurosidad metodológica de los escritos académicos. El resultado obtenido fue una vinculación positiva a moderada entre el Uso guiado de la IA generativa y la mejora en la estructura y coherencia de los trabajos (r=0.67, p<0.001), aunque también se detectaron retos importantes vinculados con la dependencia tecnológica y el razonamiento crítico. El trabajo determina que la incorporación de estas herramientas en entornos académicos puede ser provechosa cuando se implementa con pautas claras y soporte pedagógico apropiado, trazando un esquema de utilización ecuánime que desarrolle las aptitudes estudiantiles sin comprometer la honestidad académica.
Palabras clave: Inteligencia artificial generativa, ChatGPT, GitHub Copilot, educación superior, producción académica, calidad educativa.
Abstract
This article analyzes the relationship between the use of generative artificial intelligence tools ChatGPT and GitHub Copilot on the quality of university students' academic work. A quantitative analysis was used to study the use of these technologies, which impacts aspects such as creativity, analytical depth, coherence, and methodological rigor of academic writing. The result was a positive to moderate relationship between the Guided Use of Generative AI and improved structure and coherence of work (r=0.67, p<0.001), although significant challenges related to technological dependence and critical reasoning were also identified. The study determines that the incorporation of these tools in academic environments can be beneficial when implemented with clear guidelines and appropriate pedagogical support, outlining a framework for equitable use that develops student skills without compromising academic honesty.
Key Words: Generative artificial intelligence, ChatGPT, GitHub Copilot, higher education, academic production, educational quality.
Introducción
En los últimos años, el uso de herramientas de inteligencia artificial generativa, como ChatGPT y Copilot, ha crecido de manera exponencial en el entorno académico universitario. Estas plataformas permiten a los estudiantes generar contenidos textuales con alta coherencia y sintaxis aceptable en cuestión de segundos, lo que ha transformado la forma en que se produce conocimiento y se resuelven tareas académicas (Dwivedi et al., 2023). Sin embargo, su uso intensivo ha generado controversias sobre la calidad de las producciones académicas, el desarrollo de pensamiento crítico y la autoría intelectual.
Autores como Lund et al. (2023) alertan que, si bien estas herramientas pueden ser útiles en la fase de ideación, también pueden fomentar la superficialidad en la escritura si no se emplean con sentido pedagógico. Esto se agrava en contextos donde no existen protocolos institucionales claros, lo que contribuye a una producción académica de baja profundidad conceptual (García, 2024).
Asimismo, la UNESCO (2023) ha instado a las universidades a establecer lineamientos que regulen la integración de la IA en la educación superior, resaltando que su uso no supervisado puede generar riesgos como la desinformación, el plagio automatizado y la pérdida de habilidades argumentativas. Por lo tanto, es crucial analizar la relación entre el uso de estas herramientas y la calidad académica resultante, considerando no solo el rendimiento superficial, sino también el impacto en la formación académica integral del estudiante universitario.
La información reciente ha empezado a indagar en las repercusiones de la IA generativa en contextos pedagógicos, con investigaciones que evalúan desde sus usos didácticos hasta las cuestiones éticas vinculadas. No obstante, persiste un vacío notable en el entendimiento empírico de cómo estas plataformas inciden directamente en criterios de calidad de los documentos académicos, tales como la novedad, la amplitud analítica, la cohesión discursiva y la rigurosidad metodológica (Ramírez-Correa & Fuentes-Vega, 2021).
En este estudio actual, focalizamos en examinar detalladamente de qué manera estas tecnologías inciden en la excelencia de las producciones universitarias. Esta faceta se muestra especialmente pertinente en el contexto contemporáneo, donde las entidades de educación superior hacen frente al reto de ajustarse al entorno tecnológico de veloz cambio, preservando simultáneamente los criterios de excelencia y la integridad académica (García-López et al., 2022).
El vertiginoso progreso de la IA generativa ha revolucionado diversos ámbitos del quehacer humano, incluso el campo de la educación. Plataformas como ChatGPT de OpenAI y GitHub Copilot han emergido en el escenario académico, suscitando tanto ímpetu como inquietud entre el cuerpo docente y las instituciones (Martínez-Ruiz et al., 2023). Estos sistemas, aptos para elaborar escritos coherentes, solucionar retos complejos y desarrollar scripts de programación, suscitan preguntas esenciales sobre cómo inciden en las dinámicas de aprendizaje y las valoraciones convencionales (Wang & Schmidt, 2024).
Al plantear el problema, se puede ver que la adopción de herramientas de IA generativa plantea importantes interrogantes respecto a su impacto en las producciones académicas. Por un lado, estas tecnologías ofrecen posibilidades para mejorar aspectos formales y estructurales de los trabajos, facilitar procesos de investigación bibliográfica y potenciar la creatividad. Por otro lado, surgen preocupaciones sobre dependencia tecnológica, plagio inadvertido, superficialidad analítica y posible atrofia de habilidades cognitivas fundamentales (Johnson et al., 2023).
En este contexto, resulta crucial establecer con precisión la naturaleza de la relación entre el uso de estas herramientas y los diversos aspectos que conforman la calidad de una producción académica. ¿Contribuyen estas tecnologías a mejorar genuinamente el valor del trabajo académico o simplemente facilitan la producción de contenidos superficialmente correctos, pero intelectualmente pobres? ¿Cómo varía este impacto en función de factores como el nivel académico, el área de conocimiento o las modalidades específicas de uso?
Asimismo, la incorporación de instrumentos de inteligencia artificial generativa suscita dilemas significativos sobre su repercusión en las elaboraciones académicas. Por un lado, estas soluciones tecnológicas brindan oportunidades para optimizar elementos formales y organizativos de los documentos, simplificar tareas de revisión bibliográfica y estimular el ingenio creativo. Por otro, emergen inquietudes acerca de la vulnerabilidad tecnológica, la posibilidad de copia involuntaria, la carencia de profundidad analítica y el eventual debilitamiento de las capacidades intelectuales básicas (Johnson et al., 2023).
En este escenario, resulta esencial definir con claridad la esencia del vínculo existente entre el empleo de estas plataformas y las diferentes facetas que constituyen la calidad de una obra académica. ¿Aportan realmente estas tecnologías un valor sustancial al quehacer universitario o, en cambio, tan solo agilizan la generación de contenidos formalmente adecuados, pero intelectualmente limitados? Y, además, ¿de qué manera cambia esta influencia según el grado de estudios, la disciplina involucrada o las formas particulares de aplicación de la herramienta?
Inteligencia artificial generativa en el contexto educativo
La generación automática de contenidos mediante inteligencia artificial configura un nuevo horizonte tecnológico, sustentado en plataformas que detectan patrones en enormes conjuntos de datos para producir material inédito. En el escenario universitario, estas soluciones han avanzado con notable rapidez y brindan funcionalidades que solapan directamente las tareas convencionales de creación de conocimiento (Torres-Salinas & Guallar, 2022).
Entre las herramientas de IA generativa más relevantes en la enseñanza superior destacan ChatGPT, basado en arquitecturas de transformadores que fabrican textos naturales en variados registros y estilos, y GitHub Copilot, diseñado para apoyar la programación al elaborar fragmentos de código a partir de anotaciones contextuales (Moreno-Sandoval et al., 2022). Ambos ejemplos son manifestaciones de los denominados Grandes Modelos de Lenguaje (LLM, por sus siglas en inglés), construidos a partir de extensos corpus que reúnen gran parte del saber disponible en la red (Zhang et al., 2023).
La bibliografía actual ha registrado múltiples aplicaciones de estas tecnologías en entornos educativos de nivel superior. López-Martínez y Rodríguez (2022) las ordenan en cinco apartados:
Asimismo, Vázquez-Cano et al. (2023) resaltan la adaptabilidad de estas plataformas a distintos grados de dificultad y modos comunicativos, lo cual favorece su implementación en variadas disciplinas académicas.
Calidad académica: dimensiones e indicadores
La noción de calidad en las producciones académicas es multidimensional y ha sido objeto de numerosas conceptualizaciones teóricas. Para esta investigación, adoptamos el marco propuesto por Chen y Zhang (2021), que establece cuatro dimensiones fundamentales para evaluar la calidad académica:
Estas dimensiones constituyen el fundamento para la operacionalización de la variable dependiente en nuestro estudio, permitiendo una evaluación comprehensiva de cómo las herramientas de IA generativa impactan en aspectos diversos pero interrelacionados de la calidad académica.
La mediación pedagógica en el uso de tecnologías emergentes
Una dimensión esencial para valorar la influencia de las plataformas de IA en la enseñanza es la idea de mediación pedagógica. Tal como indican Fernández-Sánchez y Valverde-Berrocoso (2020), la manera en que se presenta, enmarca y orienta un recurso digital condiciona de modo decisivo sus repercusiones en los procesos de aprendizaje.
El planteamiento de mediación tecnológica acuñado por Feenberg (2019) resulta de gran utilidad para entender de qué manera los sistemas de IA generativa pueden revolucionar la elaboración de trabajos científicos. Desde esta óptica, las tecnologías no funcionan de modo imparcial, sino que reflejan convicciones y configuran prácticas sociales. Por ello, incorporar ChatGPT o GitHub Copilot en espacios académicos no equivale simplemente a añadir un instrumento más, sino a potencialmente reestructurar las dinámicas de enseñanza y estudio.
García-Peñalvo y Corell (2021) han propuesto un esquema crítico de incorporación de herramientas digitales en contextos formativos, en el cual se distinguen tres categorías de adopción:
Este marco conceptual nos facilita ubicar el uso de la IA generativa en distintos niveles de cambio de las prácticas universitarias, con diversas consecuencias para la calidad de los productos académicos.
Tensiones y dilemas en la adopción académica de IA generativa
Diversos estudios recientes han señalado tensiones esenciales al integrar sistemas de inteligencia artificial generativa en entornos universitarios. Morales et al. (2024) describen la llamada “paradoja de la ayuda cognitiva”, pues las mismas plataformas que amplían ciertas facultades intelectuales pueden, simultáneamente, debilitar otras competencias mentales.
Por otro lado, Williams y Chen (2023) abordan los dilemas éticos relacionados, concentrándose en aspectos de atribución de autoría, originalidad y procesos de evaluación. Su investigación plantea dudas acerca de cómo verificar la autenticidad y el mérito de los trabajos en un escenario donde la frontera entre asistencia lícita y suplantación se vuelve cada vez más difusa.
Varios trabajos empíricos han explorado estas cuestiones. Navarro-Martínez et al. (2022) hallaron que los estudiantes de posgrado que emplearon ChatGPT como apoyo, y no como sustituto, en sus redacciones académicas mostraron mejoras notables en la organización y el estilo, aunque registraron resultados mixtos en dimensiones como la singularidad del contenido y la profundidad conceptual. De forma análoga, Hassan y Wong (2022) documentaron efectos positivos en la fluidez expresiva y la articulación de ideas, sobre todo entre quienes no hablaban de forma nativa el idioma de instrucción.
Ante lo expuesto, el objetivo principal es determinar la relación entre el uso de herramientas de IA generativa (ChatGPT y GitHub Copilot) y la calidad de los trabajos académicos por parte de los estudiantes universitarios.
Asimismo, los objetivos específicos serian:
Materiales y métodos:
El estudio se planteó mediante un enfoque cuantitativo con un esquema correlacional de naturaleza transversal. Este modelo permitió investigar las asociaciones entre la utilización de herramientas de IA generativa y diversos indicadores de excelencia académica en un momento concreto, sin aplicar manipulaciones experimentales sobre las variables. El carácter correlacional facilitó la detección de patrones relacionales, aunque con las restricciones propias para inferir relaciones causales.
Población y muestra: estuvo conformado por estudiantes de pregrado y posgrado inscritos a las Facultades de Humanidades e Ingeniería de la universidad pública de la zona metropolitana. La muestra del estudio estuvo conformada por estudiantes universitarios de instituciones privadas en Lima Metropolitana que cursaban asignaturas del ciclo intermedio y final de sus respectivas carreras.
Se utilizó un muestreo probabilístico estratificado, a fin de asegurar una representación proporcional de los estudiantes por facultad y nivel académico. El tamaño de la muestra fue determinado mediante un cálculo estadístico para poblaciones finitas, considerando un nivel de confianza del 95%, un margen de error del 5% y una proporción esperada de respuesta del 50%, lo que permitió obtener un tamaño mínimo de muestra de 78 participantes. Esta estrategia permitió garantizar la validez estadística de los resultados y evitar sesgos asociados a la selección no aleatoria de los casos, lo cual es especialmente relevante en estudios cuantitativos con pretensión de generalización (Hernández y Mendoza, 2020).
La muestra definitiva quedó compuesta por 78 sujetos distribuidos así: Pregrado (45; 57,7 %) y Posgrado (33; 42,3 %).
Procedimiento
Etapa inicial: Validación de los instrumentos de recolección de datos, obtención de la aprobación ética institucional (Ref. CEI-2024-078), y recopilación de los consentimientos informados firmados por los participantes.
Etapa de acopio de información: Envío y cumplimentación de la encuesta electrónica mediante la plataforma oficial de la universidad, Recolección de trabajos académicos recientes (no más de tres meses de antigüedad), Dos evaluadores independientes calificaron cada trabajo empleando una rúbrica estandarizada; ante discrepancias superiores al 15 %, un tercer experto realizó una evaluación de desempate. y se aplicó el procedimiento de doble ciego para todas las valoraciones con el fin de reducir al mínimo los sesgos.
Etapa de procesamiento y análisis
Consideraciones éticas y de confidencialidad
Resultados
El análisis de los datos acopiados consintió identificar patrones significativos en cuanto a la utilización de herramientas de IA generativa y su vinculación con la calidad de los trabajos académicos de los alumnos universitarios. Enseguida, se muestran los hallazgos organizados de acuerdo a los fines específicos de estudio.
Patrones de uso de herramientas de IA generativa
Tabla 1. Distribución de frecuencia de uso de herramientas de IA generativa según nivel académico
Frecuencia de uso | Pregrado (n=45) | Posgrado (n=33) | Total (n=78) |
Usuario frecuente | 18 (40.0%) | 10 (30.3%) | 28 (35.9%) |
Usuario ocasional | 20 (44.4%) | 14 (42.4%) | 34 (43.6%) |
No usuario | 7 (15.6%) | 9 (27.3%) | 16 (20.5%) |
En la Tabla 1 se indica que el 79,5 % del alumnado emplea soluciones de IA generativa en distintos niveles, destacándose los usuarios esporádicos como el segmento más abundante (43,6 %). Asimismo, se percibe una inclinación algo superior en el uso por parte de quienes cursan estudios de pregrado en un 84,4 %) por ultimo un 72.7% frente a los de posgrado.
Tabla 2. Propósitos de uso de herramientas de IA generativa (respuesta múltiple)
Propósito de uso | Frecuencia | Porcentaje |
Redacción y mejora de estilo | 56 | 71.8% |
Generación de ideas iniciales | 49 | 62.8% |
Búsqueda de información | 43 | 55.1% |
Revisión gramatical y ortográfica | 41 | 52.6% |
Estructuración de contenidos | 38 | 48.7% |
Programación (GitHub Copilot) | 22 | 28.2% |
Traducción de contenidos | 19 | 24.4% |
Resolución de problemas específicos | 17 | 21.8% |
La Tabla 2 revela que los principales usos de las herramientas de IA se relacionan con aspectos formales como la redacción y mejora de estilo (71.8%), así como con procesos creativos como la generación de ideas iniciales (62.8%). El uso de GitHub Copilot para tareas de programación es más limitado (28.2%), principalmente concentrado en estudiantes de ingeniería.
La Figura 1 muestra que ChatGPT es claramente la herramienta de inteligencia artificial más usada por los estudiantes universitarios, con un 85.5% que afirma haberla utilizado. Esta alta preferencia puede deberse a que es fácil de usar, está al alcance de todos y puede apoyar en muchas tareas académicas como redactar textos, resumir información o explicar temas complejos. En cambio, GitHub Copilot es utilizado solo por el 32.3%, sobre todo por estudiantes de carreras técnicas, como ingeniería o programación, ya que su función principal está enfocada en ayudar a escribir código. La diferencia entre ambas herramientas muestra cómo el tipo de carrera y la accesibilidad influyen en el uso que los estudiantes hacen de la inteligencia artificial.
Figura 1. Nivel de uso de herramientas de IA
Impacto en dimensiones específicas de la calidad académica
Tabla 3. Correlaciones entre frecuencia de uso de IA generativa y dimensiones de calidad académica
Dimensión de calidad | Coeficiente de correlación (r) | Valor p |
Originalidad y contribución | -0.23 | 0.042* |
Profundidad analítica | -0.31 | 0.006** |
Coherencia estructural y discursiva | 0.67 | <0.001*** |
Rigor metodológico | -0.18 | 0.114 |
Calidad global | 0.29 | 0.010* |
*p<0.05, **p<0.01, ***p<0.001
La Tabla 3 revela asociaciones estadísticamente relevantes entre la frecuencia de empleo de soluciones basadas en IA y diferentes aspectos de la excelencia académica. Sobresale una correlación positiva robusta con la coherencia tanto formal como textual (r = 0,67; p < 0,001), en contraste con asociaciones inversas respecto a la originalidad (r = –0,23; p = 0,042) y la profundidad en el análisis (r = –0,31; p = 0,006).
Comparación entre perfiles de usuarios
Antes de interpretar los hallazgos en profundidad, es necesario examinar si existen diferencias significativas en la calidad académica global de las producciones estudiantiles, según el perfil de uso de herramientas de IA generativa. Para ello, se aplicó una prueba de análisis de varianza (ANOVA), apropiada cuando se comparan tres o más grupos independientes respecto de una variable continua (Field, 2018). La Tabla 4 resume los resultados obtenidos, considerando los niveles bajo, medio y alto de uso de IA generativa reportados por los estudiantes. Este análisis permitió identificar si la intensidad del uso de estas herramientas se relaciona significativamente con el rendimiento académico medido en las tareas evaluadas.
Tabla 4. ANOVA de calidad académica global según perfil de usuario de IA generativa
Fuente de variación | Suma de cuadrados | gl | Media cuadrática | F | Valor p |
Entre grupos | 156.78 | 2 | 78.39 | 8.64 | 0.001** |
Dentro de grupos | 680.22 | 75 | 9.07 | ||
Total | 837.00 | 77 |
**p<0.01
La prueba de ANOVA (ver Tabla 4) evidencia diferencias estadísticamente relevantes en el desempeño académico general en función de la clasificación de usuarios (F = 8,64; p = 0,001). Los contrastes posteriores mostraron que estas disparidades se presentan sobre todo al comparar quienes emplean con frecuencia las herramientas con quienes no las utilizan.
Visión estudiantil sobre el efecto de las soluciones de IA
El estudio factorial exploratorio detectó tres dimensiones clave en las percepciones de los alumnos respecto al impacto de estas tecnologías. muestra cómo los estudiantes universitarios perciben el impacto del uso de inteligencia artificial en su formación académica. La mayoría (38,2%) considera que estas herramientas mejoran su eficiencia, es decir, les ayudan a trabajar más rápido, organizar mejor sus ideas o resolver tareas con mayor facilidad. Un 27,6% expresa preocupaciones éticas, relacionadas con temas como el plagio, el uso responsable de la información o el posible reemplazo del pensamiento crítico por respuestas automáticas. Finalmente, el 15,3% valora que estas herramientas pueden contribuir al desarrollo de competencias, como aprender a redactar mejor, buscar información o reforzar habilidades digitales. Estos resultados reflejan una visión equilibrada: los estudiantes reconocen beneficios claros, pero también advierten riesgos y retos que deben ser gestionados con criterio.
Figura 2. Visión estudiantil sobre el efecto de las soluciones de IA
Los resultados del estudio muestran que existe una relación positiva y significativa entre el uso de herramientas de inteligencia artificial generativa —como ChatGPT y Copilot— y la calidad de las producciones académicas universitarias. Este hallazgo puede explicarse desde varias dimensiones. En primer lugar, el uso de estos recursos permite a los estudiantes mejorar la estructura y coherencia de sus textos, acceder a información organizada y obtener sugerencias en tiempo real para mejorar la redacción, lo cual impacta directamente en la claridad y profundidad de los contenidos. Además, el apoyo de la IA permite optimizar el tiempo dedicado a tareas mecánicas, facilitando que el estudiante se concentre en los aspectos argumentativos y conceptuales de sus trabajos.
Sin embargo, también se observó que este efecto positivo está mediado por el nivel de competencia digital del usuario. Aquellos estudiantes que demostraron una comprensión crítica del uso de estas herramientas obtuvieron mejores resultados que quienes las utilizaron de manera superficial o meramente instrumental. Esto sugiere que no es el uso en sí lo que mejora la producción académica, sino la forma en que se integra la herramienta al proceso de pensamiento, redacción y reflexión.
Otro aspecto relevante es que las diferencias encontradas entre facultades o tipos de asignatura también pueden estar asociadas a la naturaleza del contenido: en áreas como humanidades o ciencias sociales, donde la argumentación y el análisis textual son fundamentales, las herramientas de IA tienen un impacto más visible en la mejora del trabajo final. Por el contrario, en asignaturas más técnicas, su uso parece limitarse a aspectos formales del lenguaje, sin incidir directamente en la calidad conceptual del contenido.
Finalmente, estos hallazgos invitan a reflexionar sobre la necesidad de formar a los estudiantes no solo en el uso operativo de herramientas de IA, sino también en su aplicación ética, crítica y estratégica. La inteligencia artificial puede ser una aliada valiosa en el ámbito universitario, siempre que se emplee como complemento del pensamiento humano, y no como sustituto de la reflexión académica.
Discusión
Los resultados de esta investigación describen un escenario intrincado respecto a la influencia de las plataformas de IA generativa en la excelencia de los escritos universitarios. El elevado porcentaje de alumnos que emplean estas tecnologías (79,5 %) respalda la veloz adopción documentada por Torres-Salinas y Guallar (2022), demostrando que este fenómeno ya está remodelando las dinámicas académicas actuales.
Ambivalencia en la repercusión sobre la calidad académica: Un descubrimiento fundamental de este estudio es la doble dimensión del efecto de las herramientas de IA generativa. Por una parte, se identifica una correlación añ robusta y positiva con indicadores formales, como la cohesión estructural y discursiva (r = 0,67; p < 0,001). Estos hallazgos coinciden con los de Navarro-Martínez et al. (2022), quienes registraron mejoras sustanciales en la organización y el estilo de los trabajos asistidos por IA. De este modo, se infiere que dichas plataformas pueden reforzar las habilidades vinculadas con la redacción y la lógica interna del contenido.
No obstante, las asociaciones negativas con la originalidad (r = –0,23; p = 0,042) y con la profundidad analítica (r = –0,31; p = 0,006) ponen de relieve posibles consecuencias adversas en áreas esenciales del pensamiento crítico y la creatividad. Este patrón empírico se ajusta a la “paradoja de la asistencia cognitiva” descrita por Morales et al. (2024), según la cual las mismas soluciones que amplifican ciertas destrezas pueden, al mismo tiempo, atenuar otras. La tensión detectada subraya la complejidad de incorporar estas herramientas en entornos formativos sin sacrificar componentes cruciales del desarrollo intelectual.
La relevancia de la mediación pedagógica: El análisis de regresión multivariante demostró que la modalidad de empleo (supervisado frente a autónomo) posee una mayor capacidad predictiva sobre la calidad académica (β = 0,58) que la simple frecuencia de utilización (β = 0,24). Este resultado enfatiza el papel crucial de la mediación pedagógica al incorporar tecnologías emergentes, tal como lo plantean Fernández-Sánchez y Valverde-Berrocoso (2020). No es tanto la herramienta per se, sino la forma en que se enmarca, contextualiza y orienta su aplicación lo que condiciona su efecto educativo.
Los hallazgos apuntan a que, cuando el uso de plataformas de IA generativa se desarrolla dentro de un proceso guiado, con instrucciones claras y objetivos definidos, su aporte a la excelencia académica tiende a ser beneficioso. En cambio, un uso libre y sin acompañamiento puede desembocar en trabajos que, aunque correctos en lo formal, resultan intelectualmente superficiales, lo cual coincide con las inquietudes de Williams y Chen (2023) sobre la autenticidad y el valor académico real.
Variaciones según nivel formativo y disciplina: Las discrepancias entre estudiantes de pregrado y posgrado merecen especial consideración. Aunque el grupo de pregrado exhibe una mayor proporción de usuarios activos (84,4 % frente al 72,7 % en posgrado), el impacto sobre la calidad de sus producciones difiere notablemente. En el nivel de posgrado donde se presupone un desarrollo analítico y metodológico más avanzado las correlaciones entre uso de IA y calidad global de los trabajos resultan más débiles.
Este patrón puede interpretarse a la luz de las fases de adopción tecnológica descritas por García-Peñalvo y Corell (2021). En los primeros niveles formativos, estas herramientas funcionan principalmente en un nivel de “aumento”, optimizando aspectos puntuales sin alterar por completo las dinámicas de trabajo. Sin embargo, en etapas académicas superiores, el valor añadido de la IA generativa se reduce, posiblemente porque las competencias ya consolidadas por los estudiantes disminuyen el impacto relativo de estas plataformas.
Convergencias y divergencias: En relación con los hallazgos obtenidos, se identificaron coincidencias con estudios previos que respaldan la influencia positiva del uso de herramientas de IA generativa en la calidad de las producciones académicas universitarias. Esta convergencia se puede explicar por la similitud en los contextos analizados, dado que tanto nuestro estudio como el de Hassan y Wong (2022) comparten un enfoque en estudiantes no nativos del inglés y en entornos universitarios con alta carga académica, lo que refuerza el valor de la IA como apoyo en redacción y estructuración de textos. Además, el trabajo de García-Peñalvo (2024) destaca que el uso crítico de herramientas como ChatGPT puede mejorar la calidad del contenido si es mediado adecuadamente por criterios pedagógicos, lo cual coincide con los resultados obtenidos en esta investigación respecto a los usuarios frecuentes con alta alfabetización digital.
Por otro lado, algunas divergencias con estudios como el de Morales, Kim y Ramírez (2024), quienes advierten un riesgo en la disminución del pensamiento crítico cuando se abusa de la asistencia de IA, podrían estar vinculadas a diferencias metodológicas. Mientras nuestro estudio se centró en mediciones cuantitativas de calidad académica, aquellos estudios adoptaron metodologías mixtas con énfasis en indicadores cualitativos. Esta diferencia en el enfoque metodológico puede explicar por qué algunos trabajos subrayan efectos contraproducentes que no fueron evidenciados de forma significativa en nuestra muestra. Así, es fundamental considerar que el grado de mediación pedagógica, el nivel de alfabetización digital del estudiante y el tipo de tarea académica constituyen variables intervinientes que condicionan los efectos de la IA generativa, y que, por tanto, explican tanto las coincidencias como las discrepancias entre investigaciones.
Consecuencias para la integridad académica: El análisis factorial de las percepciones estudiantiles situó a las “preocupaciones éticas” como la segunda dimensión de mayor peso con un 27,6 % de la varianza explicada poniendo de relieve la conciencia creciente sobre los dilemas de honestidad académica ligados al uso de sistemas de IA generativa. Esta inquietud refleja las alertas de Williams y Chen (2023) acerca de los desafíos para validar la autenticidad y el mérito de los trabajos en un entorno donde la línea divisoria entre asistencia legítima y suplantación se vuelve cada vez más borrosa.
Lejos de abogar por vetar estas tecnologías una estrategia poco efectiva ante su penetración acelerada los datos sugieren la necesidad de replantear las concepciones tradicionales de autoría y originalidad. Es preciso diseñar marcos éticos y metodológicos renovados que integren la IA generativa dentro del ecosistema académico contemporáneo, estableciendo normas claras y consensuadas sobre su utilización apropiada, así como mecanismos de supervisión y rendición de cuentas.
Hacia un modelo de incorporación equilibrada: A partir de la evidencia empírica recabada, se propone un esquema de “integración equilibrada” para la adopción de plataformas de IA generativa en entornos universitarios. Este modelo reconoce simultáneamente el potencial de estas herramientas para optimizar aspectos formales como la coherencia estructural, la claridad expositiva y la eficiencia en tareas repetitivas y sus limitaciones en dimensiones críticas del razonamiento y la innovación conceptual.
El núcleo de esta propuesta es un “uso compensado”: emplear estratégicamente la IA para reforzar áreas donde aporta valor genuino, mientras se implantan estrategias pedagógicas específicas que protejan y estimulen aquellas facetas susceptibles de verse afectadas por una utilización indiscriminada en particular la originalidad, la profundidad analítica y el pensamiento crítico.
Esta aproximación dialoga con los hallazgos de Hassan y Wong (2022), quienes documentaron mejoras en la fluidez expresiva y la organización de ideas, especialmente entre estudiantes no nativos del idioma de instrucción, evidenciando además el potencial de la IA generativa para nivelar desigualdades en competencias lingüísticas y comunicativas. Con ello, se plantea un camino que combina innovación tecnológica y supervisión docente activa, buscando maximizar beneficios sin comprometer los principios fundamentales de integridad académica.
Conclusiones
La investigación realizada exploró cómo el empleo de plataformas de IA generativa se relaciona con la calidad de los escritos universitarios, descubriendo un escenario en el que convergen tanto amplias oportunidades como retos de gran calado. De este estudio emergen las siguientes conclusiones principales:
La utilización de herramientas como ChatGPT y GitHub Copilot alcanza al 79,5 % del estudiantado universitario, consolidándose como una realidad que exige respuestas y políticas institucionales claras.
El efecto de estas tecnologías en la excelencia académica resulta heterogéneo: por una parte, se aprecia una mejora notable en criterios formales como la cohesión interna y la fluidez discursiva (r = 0,67; p < 0,001); por otra, se advierten posibles repercusiones negativas en la originalidad y en la profundidad del análisis.
Las opiniones del estudiantado reflejan tanto el reconocimiento de la capacidad de estas plataformas para optimizar la eficiencia y la corrección formal de los trabajos, como inquietudes legítimas respecto a sus implicaciones éticas y a su posible erosión de competencias clave.
Ante un contexto tecnológico que redefine los procesos de generación de conocimiento, se hace imprescindible repensar nociones tradicionales como autoría, originalidad y sistemas de evaluación.
Por otro lado, si bien los resultados evidencian una relación positiva entre el uso de herramientas de inteligencia artificial generativa y la calidad de la producción académica universitaria, es necesario reconocer algunas limitaciones. Se identificó una tendencia en parte de los estudiantes a depender excesivamente de estos recursos, lo cual podría afectar negativamente la originalidad de los trabajos entregados, especialmente cuando el uso de la IA no está mediado por una orientación pedagógica adecuada.
Asimismo, la profundidad analítica de algunas investigaciones puede verse comprometida cuando los estudiantes delegan procesos de reflexión compleja o argumentación en la herramienta, limitando así el desarrollo de competencias cognitivas superiores. Finalmente, se observa el riesgo de una creciente dependencia tecnológica que, si bien optimiza tareas mecánicas o de redacción, también podría debilitar el pensamiento autónomo y crítico, especialmente en contextos donde no se promueve una alfabetización digital adecuada. Estas limitaciones invitan a reflexionar sobre la necesidad de incorporar criterios éticos, formativos y pedagógicos en el uso académico de la IA, así como a impulsar nuevas investigaciones que exploren sus impactos a largo plazo en la formación universitaria.
Estos hallazgos sitúan a la educación superior en un punto de inflexión que demanda una revisión profunda de las prácticas docentes. Lejos de adoptar posturas extremas ya sean tecnofóbicas o tecnófilas, los datos abogan por diseñar estrategias equilibradas que aúnen el aprovechamiento del potencial de la IA generativa con la salvaguarda de los valores esenciales de la formación universitaria.
Para ello, se propone implementar las siguientes líneas de acción institucional:
En última instancia, la conexión entre IA generativa y calidad académica no es un dato inmutable, sino un proceso dinámico sobre el cual inciden las decisiones pedagógicas e institucionales. El auténtico desafío consiste no en aceptar o rechazar estas tecnologías, sino en integrarlas de manera que refuercen el aprendizaje universitario en lugar de desvirtuarlo.
Referencias
Chen, J., & Zhang, L. (2021). Dimensions of academic quality assessment in higher education: A comprehensive framework. Journal of Educational Evaluation, 45(3), 217-236. https://doi.org/10.1007/s11092-021-09367-7
Dwivedi, Y. K., Hughes, D. L., Baabdullah, A. M., Ribeiro-Navarrete, S., & Gonzalez-Perez, M. A. (2023). So what if ChatGPT wrote it? Multidisciplinary perspectives on opportunities, challenges and implications of generative conversational AI for research, practice and policy. International Journal of Information Management, 71, 102642. https://doi.org/10.1016/j.ijinfomgt.2023.102642
Feenberg, A. (2019). Tecnología, modernidad y democracia. Herder Editorial.
Fernández-Sánchez, M. R., & Valverde-Berrocoso, J. (2020). Mediación pedagógica en entornos digitales: transformando la educación en tiempos de pandemia. Revista Latinoamericana de Tecnología Educativa, 19(2), 19-34. https://doi.org/10.17398/1695-288X.19.2.19
Field, A. (2018). Discovering statistics using IBM SPSS Statistics (5.ª ed.). SAGE Publications.
García-López, E., Martínez-Abad, F., & Rodríguez-Conde, M. J. (2022). Transformación digital en educación superior: Retos y oportunidades post-pandemia. Revista de Educación a Distancia, 22(69), 1-18. https://doi.org/10.6018/red.505661
García-Peñalvo, F. J. (2024). Inteligencia artificial generativa y educación: Un análisis desde múltiples perspectivas. Education in the Knowledge Society (EKS), 25, e31942. https://doi.org/10.14201/eks.31942
García-Peñalvo, F. J., & Corell, A. (2021). Modelo de adopción tecnológica crítica en educación. RIED. Revista Iberoamericana de Educación a Distancia, 24(2), 25-44. https://doi.org/10.5944/ried.24.2.29773
Hassan, N., & Wong, K. S. (2022). Impact of AI writing assistants on academic writing skills among non-native English speakers: A mixed-methods study. Technology, Knowledge and Learning, 27(4), 823-841. https://doi.org/10.1007/s10758-022-09596-9
Hernández-Sampieri, R. y Mendoza, C. (2020). Metodología de la investigación: las rutas cuantitativa, cualitativa y mixta (Edición especial). McGraw-Hill.
Johnson, K., Lewis, M., & Carter, R. (2023). The double-edged sword: Benefits and risks of generative AI in academic settings. Journal of Higher Education Technology, 14(2), 145-163. https://doi.org/10.1080/21599165.2023.2178934
López-Martínez, C., & Rodríguez, J. (2022). Aplicaciones educativas de la inteligencia artificial generativa: Una taxonomía para la educación superior. Revista Española de Pedagogía, 80(283), 415-434. https://doi.org/10.22550/REP80-3-2022-03
Lund, B. D., Wang, T., Mannuru, N. R., & Nie, B. (2023). ChatGPT and a new academic reality: Artificial intelligence-written research papers and the ethics of the large language models in scholarly publishing. Journal of the Association for Information Science and Technology, 74(5), 570–573.
Martínez-Ruiz, X., González-Pérez, L. I., & García-Peñalvo, F. J. (2023). ChatGPT en la educación superior: Perspectivas y desafíos para una integración crítica. Comunicar, 31(76), 9-20. https://doi.org/10.3916/C76-2023-01
Morales, J., Kim, S., & Ramirez, D. (2024). The paradox of cognitive assistance: Understanding the impact of AI tutors on critical thinking development. Educational Technology Research and Development, 72(1), 95-112. https://doi.org/10.1007/s11423-023-10194-4
Moreno-Sandoval, A., Campillos-Llanos, L., & Samy, D. (2022). Las tecnologías del lenguaje humano en la era de la inteligencia artificial generativa. Procesamiento del Lenguaje Natural, 68, 223-235. https://doi.org/10.26342/2022-68-19
Navarro-Martínez, O., Sánchez-Cobarro, P. H., & Arroyo-Almaraz, I. (2022). ChatGPT como herramienta de apoyo a la escritura académica: Un estudio comparativo entre estudiantes de máster. Revista Latina de Comunicación Social, 80, 51-72. https://doi.org/10.4185/RLCS-2022-1541
Ramírez-Correa, P., & Fuentes-Vega, C. (2021). Calidad académica en la era digital: Factores determinantes y métricas de evaluación. Formación Universitaria, 14(5), 75-86. https://doi.org/10.4067/S0718-50062021000500075
Torres-Salinas, D., & Guallar, J. (2022). ChatGPT: Luces y sombras de la revolución de la IA conversacional en el ecosistema académico. Anuario ThinkEPI, 16, e16e01. https://doi.org/10.3145/thinkepi.2022.e16e01
UNESCO. (2023). Guidance for generative AI in education and research. París: UNESCO. https://www.unesco.org/en/articles/guidance-generative-ai-education-and-research
Vázquez-Cano, E., López-Meneses, E., & Martín-Padilla, A. H. (2023). Uso e impacto de la inteligencia artificial generativa en la docencia universitaria española. RIED. Revista Iberoamericana de Educación a Distancia, 26(2), 205-226. https://doi.org/10.5944/ried.26.2.36821
Wang, L., & Schmidt, M. (2024). The future of learning: Artificial intelligence and educational transformation. Educational Technology Research and Development, 72(1), 13-31. https://doi.org/10.1007/s11423-023-10193-5
Williams, R., & Chen, K. (2023). Ethical considerations in AI-assisted academic writing: A framework for students and educators. Journal of Academic Ethics, 21(2), 211-229. https://doi.org/10.1007/s10805-022-09471-3
Zhang, Y., Li, X., & Wu, S. (2023). Large language models for education: A review of applications and implications. Computers & Education, 196, 104768. https://doi.org/10.1016/j.compedu.2023.104768
pág.