Raúl Marticorena-Sánchez, Antonio Canepa-Oneto, Carlos López-Nozal y José A. Barbero-Aparicio, participantes del Grupo de Innovación Docente DIGIT han publicado un artículo en la revista Expert Systems "Diferencias en la predicción del rendimiento temprano en los cursos en línea de Ciencias Sociales y STEM mediante minería de datos educativos".
Palabras clave: minería de datos educativos | analítica del aprendizaje | aprendizaje a escala | registros de aprendizaje en línea | predicción del rendimiento de los estudiantes | minería de datos supervisada
Un resumen del trabajo.
La minería de datos educativos y la analítica del aprendizaje en entornos virtuales pueden utilizarse para diagnosticar problemas de rendimiento de los estudiantes en una fase temprana. Información que resulta útil para orientar las decisiones de los profesores que gestionan la formación académica, de modo que los estudiantes puedan completar con éxito su curso. Sin embargo, los patrones de interacción de los estudiantes pueden variar en función del dominio de conocimiento. Nuestro objetivo es diseñar un marco aplicable a cursos online de Ciencias Sociales y STEM, recomendando métodos para construir modelos precisos de predicción temprana del rendimiento. Se presenta un estudio comparativo a gran escala de la precisión de múltiples clasificadores aplicados para clasificar los registros de interacción de 32.593 estudiantes de 9 cursos de Ciencias Sociales y 13 de STEM. Corroborando los resultados de otros trabajos, se observó que se obtenía una alta precisión en la predicción del rendimiento temprano basándose únicamente en los registros de los estudiantes: precisiones de 0,75 en la 10ª semana, 0,80 en la 20ª semana, 0,85 en la 30ª semana y 0,90 en la 40ª semana. Sin embargo, se observó que los índices de precisión variaban significativamente en función del algoritmo de clasificación y del dominio de conocimiento (Ciencias Sociales frente a STEM). En general, estas predicciones son menos precisas en los cursos de Ciencias Sociales que en los de STEM, especialmente al principio del curso, y se observan menos diferencias en las últimas semanas. Además, esta investigación identifica casos de valores atípicos de baja precisión en la predicción de cursos de Ciencias Sociales a lo largo del tiempo. Estos hallazgos ponen de relieve los complejos retos y las variaciones en la predicción temprana del rendimiento en diferentes ámbitos de la educación en línea.
El gráfico muestra la variabilidad de la precisión entre los clasificadores para cada dominio (SS frente a STEM) a lo largo de las distintas semanas del curso.