ISSN 0798 1015

logo

Vol. 39 (Número 53) Año 2018. Pág. 22

Análisis de variables de estudiantes en un curso bajo la metodología de proyectos formativos

Analysis of student variables in a course under the methodology of formative projects

Leidy Viviana OSORIO Jiménez 1; Jeimy Beatriz VÉLEZ-RAMOS 2; Sergio Augusto CARDONA Torres 3

Recibido: 31/05/2018 • Aprobado: 15/07/2018 • Publicado: 11/11/2018


Contenido

1. Introducción

2. Metodología

3. Resultados

4. Conclusiones

5. Referencias bibliográficas


RESUMEN:

Los sistemas adaptativos educativos utilizan modelos para identificar, a partir de la información almacenada, perfiles de los estudiantes que puedan ser utilizados para ofrecer funcionalidades personalizadas. Este trabajo presenta un análisis de las variables definidas en un modelo de estudiante de un componente adaptativo para la plataforma Moodle. El análisis permitió identificar patrones y perfilamientos de alumnos, útiles para orientar el diseño de modelos de estudiante, considerando variables que pueden presentar incidencia sobre los procesos de aprendizaje desde una perspectiva socioformativa.
Palabras clave: Modelo del estudiante, Minería de datos, Moodle, socioformación.

ABSTRACT:

Adaptive educational systems use models to identify, from the stored information, profiles of the students that can be used to offer them personalized functionalities. This paper presents an analysis of the variables defined in a student model of an adaptive component for the Moodle platform. In this way, students' patterns and profiles are identified and be useful for orienting the design of student models, considering variables with a greater impact on learning processes from a socioformative perspective.
Keywords: Student model Data mining, Moodle, socioformation.

PDF version

1. Introducción

Con la evolución de las Tecnologías de la información y las comunicaciones (TIC), surgen herramientas que dan soporte a los procesos de formación y contribuyen a mejorar la educación. Estas herramientas introducen mejoras como la adaptatividad, que busca la personalización de contenidos, actividades, navegación, entre otras, para ayudar a los estudiantes a optimizar y a hacer más efectivo su proceso de aprendizaje. Sin embargo, algunos sistemas adaptativos solo tienen en cuenta aspectos como el nivel de conocimiento (Ferreira, Salcedo, Kotz, & Barrientos, 2012). Además en el trabajo de (González, Duque, & Ovalle, 2008) consideran aspectos como el desempeño, la participación, entre otros, los cuales podrían contribuir a mejorar los sistemas adaptativos y los resultados obtenidos a partir de su uso.

Por otra parte, las plataformas de aprendizaje generan una gran cantidad de información acerca de los estudiantes y la experiencia al utilizar este tipo de entornos. Algunos de los datos obtenidos son las interacciones que realiza el estudiante en las plataformas durante su participación en: charlas, consultas, glosarios, tareas, encuestas, lección, cuestionarios, fórum, taller, diario, etc. En el caso de Moodle, una de las plataformas de gestión de cursos virtuales más utilizada, aunque es posible obtener estadísticas del uso de la plataforma, no implementa funcionalidades adicionales que apoyen el proceso de aprendizaje de los participantes. No siempre los datos generados se convierten en información relevante para el docente y el estudiante, la cual podría servir de soporte en la toma de decisiones en función de rendimiento de los estudiantes (Casales, Rojas, & Paulí, 2008). Así como, en la identificación de patrones y perfilamientos de usuarios, que orienten el diseño de los modelos de estudiante en sistemas adaptativos, con la finalidad de identificar variables con mayor incidencia sobre los procesos de aprendizaje y de esta forma desarrollar servicios de personalización más efectivos.

Algunos trabajos han explotado el potencial de los datos a través de técnicas de minería que permiten obtener información para mejorar los procesos de formación. En el trabajo realizado por Jácome (2017), se utilizó la herramienta Weka para analizar diferentes modelos didácticos y de esta manera establecer niveles de conocimiento y satisfacción de los estudiantes, entre otros aspectos. En el trabajo realizado por Martínez, Karanik, Giovannini, Báez, y Torre (2016), se utilizan técnicas de minería de clustering y reglas de asociación sobre datos generados en las asignaturas de algoritmos y estructuras de datos. En dicha investigación se consideraron variables sociales, económicas, actitudinales y culturales, las cuales fueron comparadas con las notas finales de los estudiantes, generando las variables de mayor incidencia en este estudio. Los logs generados en las plataformas virtuales también han sido analizados para obtener información relevante en procesos de formación en línea.

Hernández, Tobón & Guzmán (2015), analizaron las interacciones realizadas por estudiantes en Moodle y pudieron establecer que existe relación entre lograr un mejor desempeño académico y participar en actividades como: análisis de saberes previos, análisis de casos y coevaluación. Por otra parte, uno de los elementos esenciales en el desarrollo de tecnologías en la educación es el pedagógico. En este sentido, se vienen desarrollando nuevos enfoques y modelos educativos orientados hacia la sociedad del conocimiento, con el fin de orientar las reformas educativas y transformar los procesos de gestión del talento humano. Uno de ellos es la socioformación, un enfoque que busca el desarrollo del talento y la formación integral mediante metodologías enfocadas en resolver problemas del contexto mediante proyectos transversales, promoviendo el mejoramiento continuo y el compromiso ético (Tobón, 2017).

La formación desde la socioformación se viene soportando en plataformas de educación virtual, como Moodle, como lo expresa Tobón (2017) estos sistemas han integrado el aprendizaje adaptativo, el cual se concibe como el ajuste y la personalización del proceso de formación considerando tanto los niveles de conocimiento, como la participación, la colaboración y la resolución de problemas a partir de productos concretos por parte de los estudiantes, asignando actividades complementarias o diferenciadas en función de estos aspectos. Sin embargo, la plataforma tecnológica Moodle carece de funcionalidades de análisis de la información generada, para uso en procesos de personalización. Este análisis podría contribuir a la identificación de variables de mayor utilidad y beneficio para la formación por competencias, en entornos de aprendizaje virtual.

Con el ánimo de contribuir al desarrollo sustentable, a partir de la generación de mejoras para las plataformas de educación virtual, este trabajo presenta los resultados de la aplicación de una técnica de minería de datos en el análisis de las variables definidas en un modelo de estudiante, así como, de otras variables incorporadas en el estudio para evaluar la experiencia de los estudiantes en el proceso de formación. De esta manera fue posible identificar patrones y perfilamientos en usuarios, que orientan el diseño de los modelos de estudiante en sistemas adaptativos educativos y contribuyen al desarrollo de procesos de formación más pertinentes y efectivos. Este trabajo se ha organizado de la siguiente manera: En el apartado número dos se presenta la metodología, en el apartado número tres se describen los resultados obtenidos, en el apartado número cuatro se presentan las conclusiones y, finalmente, se presentan las referencias utilizadas para soportar el trabajo.

2. Metodología

Existen diferentes modelos para la implementación de minería de datos como SEMMA, P3TQ (Catalyst) y CRISP-DM convirtiéndose esta última en la guía más utilizada en el desarrollo de proyectos de minería de datos desde del 2007 por su nivel de detalle en la descripción de las actividades (Moine, Haedo, & Gordillo, 2011).

Para el desarrollo de este trabajo se utilizó la metodología Cross Industry Standard Process for Data Mining “CRISP – DM”, debido a que profundiza en los detalles de las tareas y actividades que se van a ejecutar en cada etapa del proceso de minería de datos, además fomenta la interoperabilidad de las diferentes herramientas durante todas las fases en el proceso de desarrollo, del mismo modo, es neutral con respecto al software de implementación ver figura No 1. Esta metodología incluye todo el proceso desde el entendimiento del negocio hasta la validación de los resultados mediante la combinación con técnicas de análisis estadísticos. Inicialmente se presenta las características de la muestra de estudiantes que hicieron parte del estudio (Moine, Haedo, & Gordillo, 2011).

Figura 1
Metodología CRISP - DM (Chapman, Clinton, & Keber, 2000)

A continuación, se detalla todo el proceso metodológico seguido en cada una de las fases propuestas:

2.1. Entendimiento del negocio

En esta fase se identificaron las variables consideradas en el modelo de usuario del componente adaptativo a utilizar. El componente adaptativo fue desarrollado en el marco del proyecto de investigación titulado “Entorno de aprendizaje virtual adaptativo soportado por un modelo de estudiante multidimensional”, cuyo objetivo principal estuvo orientado a contribuir al desarrollo de los sistemas adaptativos educativos. El modelo de estudiante incorporó las variables nivel de competencia y estilo de aprendizaje para personalizar las actividades y los contenidos de los estudiantes.

El conjunto de datos surgen de la investigación realizada por Cardona (2017), en la cual se analizó la posible incidencia en el rendimiento académico de los estudiantes, de cursos desarrollados en ambientes de aprendizaje virtual, bajo la metodología de proyectos formativos. Los objetivos de esa investigación se centraron en conocer la opinión de los estudiantes con respecto a la implementación de una metodología de evaluación de competencias. Además, se analizaron los resultados de un proceso de evaluación por competencias y la posible incidencia que puede tener la implementación de una metodología de evaluación en el rendimiento académico de los estudiantes (Cardona, 2017).

En el estudio se tuvieron en cuenta variables independientes y dependientes. Las variables dependientes se especifican como características en los sujetos que se verán modificadas por efecto de la variable independiente (Barbosa, 2010). Las variables independientes se asociaron a los aspectos de evaluación, perfil académico y datos personales, entre las que se destacan: edad, género, tipo de colegio de egreso, estrato socioeconómico y nota definitiva. Se explica más en detalle en el ítem 2.1.1. Variables consideradas para el análisis.

Las variables independientes son aquellas que al ser manipuladas producen un efecto sobre las variables dependientes. Las variables dependientes fueron: (1) rendimiento académico, que corresponde al logro del nivel de competencia, el cual se obtuvo a partir de los resultados de un proceso de evaluación, y (2) opinión del estudiante, con respecto a la metodología de evaluación de competencias que se denominará aspectos didácticos.

Del mismo modo, loa aspectos didácticos considerados fueron obtenidos del instrumento de la encuesta orientado a conocer la opinión de los estudiantes con relación a la implementación de la metodología de proyectos formativos soportada en un ambiente virtual de aprendizaje. El cuestionario se compone de preguntas de corte cuantitativo.

El conjunto de datos de este estudio correspondió a estudiantes de la institución de Administración y Mercadotecnia (EAM), en el programa de Ingeniería de Software, en cursos del área de programación de computadores bajo la metodología de proyectos formativos. El número de individuos del estudio empírico fue de 262, los estudiantes pertenecían al segundo semestre de ingeniería de software, la intervención tuvo una duración de 12 semanas académicas, durante el segundo periodo del 2016.

La selección de los sujetos se realizó mediante un muestreo aleatorio simple, por medio de la función aleatoria programada en Excel. Cada sujeto de la población tuvo igual probabilidad de ser seleccionado de forma independiente de los otros sujetos de la población. Se tuvo en cuenta como criterio de inclusión para la selección, que el estudiante no fuera repitente del curso. Para el cálculo del tamaño de la muestra se tuvo en cuenta que el nivel de confianza fue del 95%. El error máximo aceptado del 3%, la proporción p del 0.5 y q del 0.5.

La muestra aleatoria probabilística de 133 estudiantes. En dicha muestra, la distribución de género fue de 48,1% mujeres y el 51,9% hombres. El estrato socioeconómico de los estudiantes mostró que el 10.7% son de estrato muy bajo, el 30.6% de estrato bajo, el 32.2% corresponde al estrato medio, un 16% al estrato medio alto y el 10.5% al estrato alto. Con relación a la edad se encontró que los estudiantes de la muestra están entre los 18 y los 22 años. El 47.6% están entre los 18 y 19 años, e 29.3% están entre los 20 y 21 años, y el 23% entre los 22 y 23 años. La edad promedio de los estudiantes es de 20.4 años. La moda muestra que la edad que más se repite es 20 años. La desviación del 1.66, muestra poca variabilidad en la edad de los estudiantes.

2.1.1. Variables consideradas para el análisis

La segunda fase de la metodología CRISP - DM, tiene como propósito el entendimiento del negocio. Para ello, se analizaron algunas de las características y variables propuestas por Cardona (2017), así mismo, se consideraron variables adicionales que posiblemente pueden tener incidencia sobre el rendimiento académico del estudiante, ver figura No 2.

Figura 2
Variables consideradas para el análisis.(Cardona, 2017)

Las categorías aspectos de evaluación, perfil académico y datos personales fueron extraídas del componente adaptativo desarrollado en el marco del proyecto mencionado previamente.

De acuerdo a lo que se presenta en la figura No 2, del componente adaptativo se analizó:

Adicionalmente, Cardona (2017) consideró la categoría de aspectos didácticos. Los datos para esta categoría fueron tomados mediante un instrumento que incluye las características relacionadas con la metodología de proyectos formativos, tal como se presenta en la Figura No 3.

El instrumento consta de las siguientes 5 secciones:

  1. Participación: Cumplimiento de los elementos de la metodología de proyectos formativos.
  2. Coherencia de las actividades: Comprensión y participación en las actividades del proceso de evaluación.
  3. Evaluación: Contribución de las actividades del proceso de evaluación al rendimiento académico.
  4. Utilidad de los recursos: Utilidad de los recursos y las actividades de aprendizaje, ofrecidas en la plataforma Moodle.
  5. Diseño curso Moodle: Opinión sobre el diseño del curso en la Plataforma Moodle

Figura 3
Características de la categoría aspectos didácticos

La validez de constructo del instrumento utilizado se basó en un análisis factorial, para el cual se realizaron los siguientes pasos: (1) verificación de supuestos estadísticos, (2) análisis de los factores extraídos producto de la rotación de componentes y, (3) análisis de las propiedades de cada uno de los factores.

La fiabilidad del instrumento se verificó con base en las apreciaciones de 31 profesores universitarios. Cada uno de los profesores valoró la pertinencia de los ítems del instrumento, en una escala de 1 a 5. Para verificar la consistencia interna de los ítems del instrumento, se realizó un análisis de fiabilidad basado en el coeficiente alfa de Cronbach. Los ítems del instrumento tuvieron discriminación positiva para el coeficiente alfa, y por lo tanto, un alto grado de consistencia interna (Cardona, 2017). El coeficiente resultante fue 0.887, por lo que la fiabilidad puede considerarse aceptable, teniendo como referente que una encuesta de este tipo puede estar desde un 0.70 (Morales, Urosa, & Blanco, 2003), citado en (Olmos, 2008). El alfa de Cronbach en caso de eliminar algún elemento sigue teniendo discriminación positiva. Así mismo, la varianza de la escala es homogénea en caso de eliminarse algún elemento.

Los supuestos estadísticos indicaron que las correlaciones entre las variables independientes son altas. La prueba de esfericidad Bartlett mostró que el nivel de significación de p-valor = 0.0001, permite afirmar que se encontraron relaciones estadísticamente significativas entre ítems del instrumento. El índice de adecuación muestral de Kaiser-Meyer-Olkin (KMO), mostró un valor KM de 0.892, a partir de lo cual se puede aplicar el análisis factorial. Los resultados obtenidos permiten afirmar que los supuestos estadísticos se cumplen para la extracción de los factores.

El método de extracción de los componentes se realizó mediante el análisis de componentes principales. El método de extracción generó 9 factores. Se utilizaron los primeros cinco factores que explican el 70.2% de la variabilidad total. Los factores que se agruparon fueron: metodología de proyectos formativos, proceso de evaluación, diseño del curso en Moodle, adaptación de recursos y actividades de aprendizaje y proceso de aprendizaje, el trabajo de Cardona (2017) permite observar que las variables agrupadas fueron coherentes con el constructo de la investigación.

2.2. Entendimiento de datos

En la fase de entendimiento de datos de la metodología CRISP-MD, se realizó toda la preparación de la muestra de estudio. El objetivo de esta fase fue obtener los datos con la calidad necesaria para realizar el proceso de minería de datos. Esta información se extrajo de la plataforma Moodle y del instrumento aplicado a los estudiantes. Adicionalmente, se obtuvo información relacionada con el rendimiento académico, representado por la nota definitiva del estudiante en el curso.

En la fase de entendimiento de datos, se realizó la preparación de los datos siguiendo cuatro pasos:

También para los valores nulos se utilizó el valor de la media para rellenar estos campos (Pushkarev, Neumann, Varol, & Talburt, 2010)

2.3. Modelamiento

En la fase de modelamiento de la metodología CRISP-MD, se continuó con el proceso de descubrimiento de la información de valor por medio de técnicas de minería de datos. Para ello se realizó el modelamiento con la herramienta WEKA especializada en la implementación de algoritmos de minería de datos, donde se utilizó el algoritmo K-Means de la técnica de agrupación. Una técnica muy citada en los trabajos sobre agrupamiento. Además, se parte de k grupos conocidos, para este proyecto se definieron dos grupos (aprobados y reprobados) (Duda, Hart, & Stork, 2001).

Del mismo modo, este algoritmo toma cada registro y lo sitúa en el centroide más cercano, vuelve a calcular el centroide de los grupos y distribuye los objetos nuevamente, este proceso se ejecuta las veces que sea necesario hasta que ya no existan cambios en los grupos. Como  resultado se formaron dos grupos de estudiantes con características similares, se aclara que en la herramienta se configuraron dos clústeres K=2, esto fue basado en los estudiantes aprobados y reprobados de los cursos.

Además, se ejecutó el algoritmo A-Priori de la técnica de reglas de asociación de minería que permitió descubrir relaciones entre las variables de los estudiantes y el rendimiento académico; existen diferentes algoritmos como: Tertius, Apriori y PredictiveApriori. Aunque estos pueden realizar la misma tarea, para este estudio se seleccionó Apriori. El criterio de selección tuve en cuenta aquellos que buscaran grupos de elementos comunes en las transacciones y tuvieran una fácil representación e interpretación (Duda, Hart, & Stork, 2001).

A partir de la ejecución de las técnicas de minera de datos, se consideró el rendimiento académico como variable clase para determinar el perfilamiento de los diferentes tipos de estudiantes que realizaron el curso bajo la metodología de proyectos formativos. El rendimiento académico puede ser conceptualizado como la valoración cuantitativa y cualitativa del nivel de competencia alcanzado en el proceso de enseñanza-aprendizaje, dentro de un contexto de desempeño específico (Cardona, 2017).

Al rendimiento académico se asocian diversos factores que pueden tener influencia en él, generalmente se asocian factores demográficos, factores socioeconómicos, aspectos de personalidad del estudiante, formación previa del estudiante, metodologías de enseñanza, sistema de evaluación, motivación escolar, entre otros. Son diversas las investigaciones que analizan los factores que inciden en el rendimiento académico  (Acevedo 2011, Arribas 2012, Garbanzo 2013, Suárez, Fernández & Muñoz 2014 y  Villegas Barahona, 2015).

2.4. Evaluación

En la fase de evaluación de la metodología CRISP-MD se analizaron las variables de acuerdo con los resultados de las técnicas de minería de datos utilizadas y su relación con el rendimiento académico de los estudiantes,  en  cursos bajo la metodología de proyectos formativos. se realizó una validación mediante la aplicación de técnicas estadística a los datos, las cuales permitieron observar las variables con mayor relevancia tanto en la minería de datos, como estadísticamente, en el proceso de aprendizaje de un estudiante (Martínez, Karanik, Giovannini, Báez & Torre, 2016).

Se evalúo el modelo de estudiante y los algoritmos implementados con el objetivo de validar el proceso y los resultados generados, se aplicaron técnicas estadísticas al conjunto de datos iniciales con la intensión de encontrar relación con los resultados generados por el análisis factorial, las técnicas de minería de agrupación y reglas de asociación.

2.5. Despliegue

El objetivo fue explicar los resultados que se generaron en las fases anteriores; se identificaron las variables que influyeron en el rendimiento académico de los estudiantes a partir del análisis de resultados, obtenido aquellas que presentaron mayor incidencia en el proceso de minería de datos.

 

3. Resultados

A partir de la ejecución de las diferentes técnicas de minera de datos se obtuvieron clústeres y reglas de asociación relacionadas con el rendimiento académico de los estudiantes; las cuales podrían ser de utilidad y tomadas en consideración en el momento del diseño de cursos en sistemas adaptativos.

Teniendo en cuenta las variables descritas anteriormente, luego de aplicar los algoritmos de la minería de datos se obtuvieron los siguientes:

3.1. Técnica de minería: Clúster Algoritmo K-MEANS

Clúster 1 APROBADO (78%): este clúster está caracterizado por los estudiantes que aprobaron el curso con una nota superior o igual a 3, siendo el 78 % de los estudiantes del curso.

Este grupo es conformado por estudiantes hombres como mayoría, y que consideraron lo siguiente: su participación y el trabajo colaborativo en el proceso del curso bajo la metodología de proyectos formativos fue BUENA, además consideraron que la orientación en la elaboración de evidencias fue adecuada, este grupo también se caracteriza porque los estudiantes realizaron la autoevaluación y obtuvieron retroalimentación de los compañeros.

Por otra parte, la coherencia de las actividades fueron acordes con las necesidades del curso y la experiencia de los estudiantes en la plataforma fue Buena ya que se considera que el diseño del curso fue estéticamente agradable; además este grupo lo conforman estudiantes que obtuvieron una autoevaluación y coevaluación estratégica.

Se puede concluir que este grupo está conformado por estudiantes que aprobaron el curso, además su experiencia con la metodología de proyectos formativos fue buena y obtuvieron nivel de competencia autónomo y/o estratégico. 

 

Clúster 2 REPROBADO (22%): Este grupo está caracterizado por los estudiantes que reprobaron  el curso con una nota inferior a 3.

Este grupo es conformado por estudiantes mujeres como mayoría, que su experiencia en el  proceso de aprendizaje con la metodología de proyectos formativos fue regular, debido a que el trabajo colaborativo no fue el adecuado, la percepción con respecto a la orientación en la elaboración de evidencias en el curso no fue la indicada para este grupo de estudiantes. Este grupo no consideró adecuada la autoevaluación ni la retroalimentación de los compañeros. Además, consideraron como no agradable la coherencia de las actividades con las necesidades del estudiantes, su experiencia con la plataforma y su opinión con el diseño en Moodle. Por otra parte, la realización de la autoevaluación y coevaluación fue de un nivel autónomo.

Se puede concluir que este grupo está conformado por estudiantes con características similares, que reprobaron el curso y que tuvieron una experiencia regular con la metodología de proyectos formativos.

3.2. Técnica de minería: Reglas de asociación Algoritmo “APRIORI”

La implementación del algoritmo Apriori en este estudio, involucra las medidas de confianza y soporte de cada regla. Las 10 reglas generadas fueron revisadas con el objetivo de descartar los siguientes problemas:

a- Reglas Redundantes: Son reglas que poseen dos (2) o más características similares o que tienden a la deducción lógica simple.

b- Reglas Innecesarias: Son reglas que no cumplen el objetivo del trabajo de grado ya que contienen consecuentes diferentes.

c- Reglas con una confianza baja: Son aquellas reglas con medida probabilística de confianza menor del 0.65 (65%).

Se resalta que si alguna regla no cumple con todos los criterios anteriormente mencionados, la regla es descartada.

1- Heteroevaluación = “autónomo” (64) ==> estado curso=”aprobado” (64)  

Confiabilidad: (1)à (a) esta regla es redundante, debido a que un nivel de heteroevaluación autónomo indica que por lo menos el estudiante cumplió con 75% de los criterios.

Si los estudiantes presentan una Heteroevaluación en autónomo, entonces tendrán aprobado el curso. La confiabilidad de esta regla en la prueba es del 100%.

2- Repitente=”no” AutoEvaluación=”autónomo” (60) ==> estado curso=”aprobado” (60) confiabilidad: (1)

Si los estudiantes no son repitentes en un curso de formación por proyectos formativos, y tienen una AutoEvaluación autónomo; entonces tendrán aprobado el curso, la confiabilidad de esta regla en la prueba es del 100%.

3- Lugar residencia=”Armenia” autoevaluación=”autónomo” (54) ==> estado curso=”aprobado” (54) confiabilidad: (1)

Si los estudiantes residen en la ciudad de armenia, y su AutoEvaluación es autónomo; entonces tendrán aprobado el curso. La confiabilidad de esta regla en la prueba es del 100%.

4- Repitente=”no” lugar residencia=”Armenia” autoevaluación=”autónomo” (50) ==> estado curso=”aprobado” (50)confiabilidad: (1)

Si los estudiantes no son repitentes en un curso de formación por proyectos formativos, residen en la ciudad de armenia y su nivel es autónomo (nota definitiva entre 3 y 4); entonces tendrán aprobado el curso. La confiabilidad de esta regla en la prueba es del 100%.

5- Egresado colegio=”público” nivel de competencia=”autónomo” (47) ==> estado curso=”aprobado” (47) confiabilidad: (1)

Si los estudiantes son egresados de colegios públicos y su nivel es autónomo (nota definitiva entre 3 y 4); entonces tendrán aprobado el curso. La confiabilidad de esta regla en la prueba es del 100%.

6- Repitente=”no” Tipo de colegio=”público” nivel de competencia=”autónomo” (44) ==> estado curso=”aprobado” (44) confiabilidad: (1)

Si los estudiantes no son repitentes en un curso de formación por proyectos formativos, son egresados de colegios públicos y su nivel es autónomo (nota definitiva entre 3 y 4); entonces tendrán aprobado el curso. La confiabilidad de esta regla en la prueba es del 100%.

7- Heteroevaluación=”autónomo” (42) ==> estado curso=”aprobado” (42)

Confiabilidad: (1) à (a) esta regla es redundante, debido a que un nivel de heteroevaluación autónomo indica que por lo menos el estudiante cumplió con 75% de los criterios.

Si los estudiantes presentan una heteroevaluación autónoma (nota definitiva entre 3 y 4); entonces tendrán aprobado el curso. La confiabilidad de esta regla es del 100%.

8- Tipo de colegio=”público” lugar residencia=”armenia” coevaluación =”autónomo” (40 ==> estado curso=”aprobado” (40  confiabilidad: (1)

Si los estudiantes son de colegios público, residen en la ciudad de armenia y su coevaluación es autónomo; entonces tendrán aprobado el curso. La confiabilidad de esta regla en la prueba es del 100%.

9- Autoevaluación=”estratégico” (61) ==> estado curso=”aprobado” (57) confiabilidad: (0.93)

Si los estudiantes presentan una autoevaluación estratégica (nota definitiva entre 4 y 5); entonces tendrán aprobado el curso. La confiabilidad de la regla es del 93%.

10- Autoevaluación=”estratégico” coevaluación=”estratégico” (44) ==> estado curso=”aprobado” (41) confiabilidad: (0.93)

Si los estudiantes presentan una autoevaluación estratégica (nota definitiva entre 4 y 5) y una coevaluación estratégica (nota definitiva entre 4 y 5); entonces tendrán aprobado el curso. La confiabilidad de esta regla en la prueba es del 93%.

Las variables más relevantes con relación al rendimiento académico de los estudiantes según las técnicas de minería K-Means y Apriori fueron las siguientes:

Tabla 1
Variables relevantes

Variable

K-Means

Apriori

Participación en el proyecto formativo

X

X

Autoevaluación

X

X

Diseño del curso en la plataforma Moodle es estética agradable

X

X

Género

X

X

Se orientan a la elaboración de las evidencias

X

X

Retroalimentación de los compañeros

X

X

Realizó autoevaluación

X

X

Coevaluación

X

X

Coherencia de las actividades con las necesidades

X

X

Experiencia del curso en la plataforma

X

X

Trabajo colaborativo

X

X

Heteroevaluación

X

X

Lugar de residencia

X

X

Egresado colegio

X

X

Repitente

X

X

3.3. Análisis estadístico

Para realizar la validación y proponer las variables de mayor incidencia en el proceso de aprendizaje de un estudiante en un curso por proyectos formativos, se complementó el análisis de los resultados de las técnicas de minería de datos, con estadística no paramétrica. El propósito de esta estadística es identificar la posible incidencia de las variables que interviene en el estudio. En este estudio se aplicaron pruebas no paramétrica de Mann-Whitney para muestras independientes para todas las variables categóricas y no categóricas. Además, esta técnica se aplicó teniendo en cuenta que no requiere el cumplimiento de los supuestos estadísticos de normalidad e igualdad de varianzas. A continuación se presentan las hipótesis a estudiar en este trabajo:   

La primera hipótesis a estudiar fue: H1: “Existe diferencia estadísticamente significativa de los resultados del rendimiento académico en función del género”.

Figura 4
Resultado Prueba Mann-Whitney  para el género y el rendimiento académico

Inicialmente se analizó la posible incidencia de los resultados del rendimiento académico, con relación a la variable género. Los resultados de la prueba no paramétrica de Mann-Whitney generaron un p-valor = 0.002, a partir de lo cual se puede afirmar que la variable género incide en el rendimiento de los estudiantes. La prueba de rango promedio muestra que los hombres tienen un mejor rendimiento académico con relación a la mujer, en la figura No 4 se presenta el resultado de la prueba no paramétrica.

La segunda hipótesis analizó la relación de la autoevaluación con el rendimiento académico: H2: “Existe diferencia estadísticamente significativa de los resultados del rendimiento académico en función de la autoevaluación”.

Figura 5
Resultado Prueba Mann-Whitney entre autoevaluación y rendimiento académico

A continuación, se analizó la posible incidencia de la autoevaluación con el rendimiento académico. El resultado de la prueba no paramétrica generó un p-valor = 0.0023, a partir de lo cual se puede afirmar que la variable autoevaluación también tiene incidencia sobre el rendimiento académico de los estudiantes. La prueba de rango promedio muestra que los estudiantes que tienen una mejor percepción de la autoevaluación también tienen un mejor desempeño académico. En la figura No 5, se presenta los resultados de la prueba de rango promedio entre la autoevaluación y el rendimiento académico.

Adicionalmente se realizó un análisis factorial a las características consideradas en aspectos didácticos ver detalle en la Figura No 3, el cual agrupó en categorías las variables adicionales de la opinión de los estudiantes. El resultado de este estudio incluye algunas de las variables que se tuvieron en cuenta para el análisis de minera de datos. Para el análisis factorial, se verificaron los supuestos estadísticos, se realizó la extracción de las categorías mediante la rotación de componentes y finalmente se analizó cada uno de los componentes.

Los supuestos estadísticos indican una alta correlación entre las variables, la prueba de esfericidad Bartlett indica un p-valor = 0.000, por tanto, la matriz de correlaciones no es una matriz identidad. La prueba KMO presenta un valor de 0.807, por tanto, es posible realizar el análisis factorial. Finalmente, el índice de adecuación muestra de la matriz anti-imagen presenta para todos los casos, coeficientes superiores a 0.72, por tanto, la muestra es adecuada para el análisis factorial. La estructura de los componentes del análisis factorial muestra que, a través de los cuatro primeros componentes, se puede explicar el 66.4% de la variabilidad total.

Después de identificar los componentes, se realizó un análisis estadístico entre el rendimiento académico y cada componente deducido del análisis factorial, es decir: evaluación, participación, diseño del curso en Moodle y coherencia con las actividades. Estas características fueron presentadas en la Figura No 3.   

La tercera hipótesis analizó la relación de la categoría evaluación con el rendimiento académico: H3: “Existe diferencia estadísticamente significativa de los resultados del rendimiento académico en función de la evaluación”.

Figura 6
Resultado Categoría Evaluación

Dada la característica de los factores, para todos los casos se aplicó la prueba no paramétrica de Mann-Whitney para muestras independientes. Inicialmente se analizó la categoría evaluación ver figura No 3, el resultado de la prueba muestra un p-valor = 0.494, a partir de lo cual se puede decir que el factor evaluación no tiene incidencia sobre el rendimiento académico del estudiante. En la figura No 6, se presenta los resultados de la prueba de rango promedio entre la evaluación y el rendimiento académico.

La cuarta hipótesis analizó la relación de la categoría participación  con el rendimiento académico: H4: “Existe diferencia estadísticamente significativa de los resultados del rendimiento académico en función de la participación”.

Figura 7
Resultado Categoría Participación

La siguiente variable fue la participación del estudiante en las actividades de formación y cuyo p-valor= 0.132, esto permite afirmar que esta variable no tiene incidencia en el rendimiento académico de los estudiantes. En la figura No 7, la prueba de rango media, da un indicio que los estudiantes que participan en las actividades de formación podrían tener un mejor rendimiento académico.

La quinta hipótesis analizó H5: “Existe diferencia estadísticamente significativa de los resultados del rendimiento académico en función del Diseño del curso en Moodle”.

Figura 8
Resultado Categoría Diseño Moodle

Con relación al diseño del curso, la prueba no paramétrica generó un p-valor = 0,927, con lo que se indica que no existe una incidencia relevante entre la opinión de los estudiantes con respecto al diseño del curso y su rendimiento académico. En la figura No 8, se presenta la prueba de rango promedio, en la cual se identifica un indicio en el cual los estudiantes con menor rendimiento académico, son los que tienden a valorar mejor el diseño de la plataforma Moodle.

La sexta hipótesis analizó H6: “Existe diferencia estadísticamente significativa de los resultados del rendimiento académico en función de la coherencia de las actividades de aprendizaje”.

Figura 9
Resultado Categoría Coherencia con las actividades

La prueba no paramétrica generó para el factor utilidad de la plataforma Moodle un p-valor = 0.348 y para la categoría coherencia de las actividades de aprendizaje, un p-valor= 0.474, a partir de lo cual se puede afirmar que ninguna de ellas tiene incidencia en el rendimiento académico de los estudiantes. En la figura No 9, se presenta el resultado de la prueba de rango promedio para la categoría coherencia de las actividades de aprendizaje.

Con base en los anteriores resultados, fue posible identificar para este estudio las variables que inciden de forma significativa en el rendimiento académico de un estudiante, cuando se aplica la metodología de proyectos formativos. La implementación del el análisis estadístico complementario se puede observar en la hipótesis H1 y H2las variables género y autoevaluación presentan incidencia sobre el rendimiento académico.

 

4. Conclusiones

En este trabajo se implementaron técnicas de minería de datos, las cuales proporcionaron herramientas para determinar las características de mayor incidencia en el rendimiento académico de los estudiantes.

La aplicación de las técnicas de minería siguió la metodología CRISP-MD, la cual permitió realizar el análisis de un conjunto de datos de los cursos, bajo la metodología proyectos formativos en un ambiente de aprendizaje virtual adaptativo. De esta manera se obtuvieron las variables, que según el estudio realizado, fueron las de mayor incidencia en el rendimiento académico de los estudiantes en formación.

De la misma manera, los resultados de este trabajo se orientaron en primer lugar a establecer la posible relación entre el proceso de aprendizaje de un curso y el rendimiento académico de un estudiante. Los resultados generados muestran la correlación positiva entre la autoevaluación que realiza un estudiante y el rendimiento académico. A partir de lo cual se podría indicar la importancia de que los estudiantes conozcan su progreso en la formación de un curso.

En segundo lugar, el análisis estadístico complementario mostró en la hipótesis H1 que el género de los estudiantes puede tener incidencia con el rendimiento académico, para este caso de estudio bajo la metodóloga de proyectos formativos. Del mismo modo, se identificó en la hipótesis H2 que los estudiantes hombres consideraron apropiadas las actividades desarrolladas en el curso sobre la plataforma Moodle, además los recursos de aprendizajes disponibles y sugeridos en el curso fueron coherentes con las actividades y las competencias esperadas en su proceso de formación.

Por último, dado que el objetivo del artículo era establecer la posible relación entre las variables consideradas en la implementación de las técnicas de minería y la aplicación estadística al conjunto de datos iniciales. Los resultados muestran que existe diferencia estadísticamente significativa en la variable autoevaluación y el rendimiento académico, además es coherentes con los resultados de las técnicas de minerías de datos.

Como se presenta en el trabajo de Cardona (2017), el cual mostró la autoevaluación tuvo un papel fundamental para los estudiantes y su proceso de aprendizaje y afirma que los estudiantes generaron capacidades de autorregulación. Del mismo modo, Hernández, Tobón, Ortega & Ramírez (2018) presentan es su trabajo que para tener un mejor rendimiento académico en el proceso de formación, es necesario que el estudiante realice evaluaciones de sus entregas a partir de criterios definidos durante el proceso definido autoevaluación.

En aras de validar estos resultados, se debe abordar en nuevas investigaciones para obtener una mejor veracidad en los análisis realizados. Puesto que, la autoevaluación es un proceso elemental para el desarrollo del pensamiento y la construcción de la sociedad de conocimiento. Además, existen muchos sistemas de formación en línea que son basados en la autoevaluación por lo cual se debe continuar con la investigación en el tema (Hernández, Tobón & Guzmán, 2015).

Aunque en estudios previos no se han encontrado resultados de minería de datos relacionados con la autoevaluación y el rendimiento académico; en este trabajo se identifican posibles incidencias entre dichas variables. Es necesario realizar otros estudios y así poder  establecer condiciones donde se puedan tener elementos en común y poder hacer dichas comparaciones.

4.1. Trabajos Futuros

Como trabajo futuro, se propone analizar los datos de otros cursos basados en la metodología de proyectos formativos, con objetivo de aumentar la cantidad de datos y observar la correlación existente entre las variables.

Se espera un mejoramiento incremental de los perfiles con nuevas técnicas de minería de datos y poder adicionar nuevas variables al modelo.

Referencias bibliográficas

Acevedo, C. (2011). Estilos de aprendizaje, género y rendimiento académico. Revista Estilos de Aprendizaje, 4, 71–84.

Arribas, J. (2012). El rendimiento académico en función del sistema de evaluación empleado. Revista Electrónica de Investigación Y Evaluación Educativa, 18(1), 1–15.

Barbosa, H. (2010). Generador de pruebas objetivas adaptadas a las preferencias de presentación de los usuarios. Universidad de Salamanca.

Bouckaert, R., Frank, E., & Hall, M. (2010). WEKA Manual for Version 3-7-13. WEKA Manual for Version 3-7-13. New Zealand: University of Waikato 2002-2015.

Cardona, S. (2017). Metodología para la evaluación de competencias soportada en un ambiente de aprendizaje virtual adaptativo. Universidad Pontificia Bolivariana.

Casales, R., Rojas, J., & Paulí, G. (2008). Algunas experiencias didácticas en el entorno de la plataforma Moodle. Revista de Informática Educativa Y Medios Audiovisuales, 5(10), 1–10.

Chapman, P., Clinton, J., & Keber. (2000). CRISP-DM 1.0 Step by step guide. Retrieved January 1, 2010, from www.crisp-dm.org/CRISPWP-0800.pdf

Duda, R. O., Hart, P. E., & Stork, D. (2001). Wiley series in Probabilistic and Statistic. Pattern Classification, Second Edi.

Ferreira, A., Salcedo, P., Kotz, G., & Barrientos, F. (2012). La Arquitectura de ELE-TUTOR: Un Sistema Tutorial Inteligente para el Español como Lengua Extranjera. Revista Signos, 45(79), 102–131. https://doi.org/10.4067/S0718-09342012000200001

Garbanzo, G. (2013). Factores asociados al rendimiento académico en estudiantes universitarios desde el nivel socioeconómico: Un estudio en la Universidad de Costa Rica. Revista Electrónica Educare, 17(3), 57–87.

González, H. M., Duque, N. D., & Ovalle, D. A. (2008). Modelo del estudiante para sistemas adaptativos de educación virtual. Revista Avances En Sistemas E Informática, 5(1), 199–206. Retrieved from http://www.researchgate.net/

Hernández, J. S., Tobón, S., & Guzmán, C. (2015). Evaluación Socioformativa en un Posgrado en Línea. Paradigma, 36(1), 30–41. Retrieved from https://www.academia.edu/20337890/Evaluación_Socioformativa_en_un_Posgrado_en_Línea

Jácome León, J. G. (2017). Minería de datos para proponer un modelo didáctico estructural de aprendizaje en la Facultad Ciencias Administrativas y Económicas de la Universidad Técnica del Norte. Maestría en Gestión de Sistemas de Información e Inteligencia de Negocios. Universidad de las Fuerzas Armadas ESPE. Retrieved from http://repositorio.espe.edu.ec/handle/21000/12791

Martínez, D., Karanik, M., Giovannini, M., Báez, M. E., & Torre, J. (2016). Descubrimiento de perfiles de rendimiento estudiantil. Un modelo de integración de datos académicos y socioeconómicos. Campus Virtuales, 5(2), 70–83. Retrieved from https://dialnet.unirioja.es/servlet/articulo?codigo=5696008

Moine, J. Mi., Haedo, A., & Gordillo, S. (2011). Estudio comparativo de metodologías para minería de datos. XIII Workshop de Investigadores En Ciencias de La Computación, 278–281. Retrieved from http://sedici.unlp.edu.ar/handle/10915/20034

Morales, P., Urosa, B., & Blanco, A. (2003). Construcción de escalas de actitudes tipo Likert. Una guia práctica. Madrid: La muralla.

Mosqueda, J. S. H., Tobón, S. T., Carbajal, M. F. O., & Cuevas, A. M. R. (2018). Evaluación socioformativa en procesos de formación en línea mediante proyectos formativos. Educar54(1), 147-163.

Olmos, S. (2008). Evaluación Formativa y Sumativa de estudiantes universitarios: Aplicación de las Tecnologías a la Evaluación Educativa. Universidad de Salamanca.

Pushkarev, V., Neumann, H., Varol, C., & Talburt, J. R. (2010). An Overview of Open Source Data Quality Tools. University of Arkansas at Little Rock. In IKE.

Suárez, J., Fernández, R., & Muñiz, J. (2014). Self-concept , motivation , expectations , and socioeconomic level as predictors of academic performance in mathematics. Learning and Individual Differences, 30, 118–123. https://doi.org/10.1016/j.lindif.2013.10.019

Tobón, S. (2017). Conceptual analysis of the socioformation according to the knowledge society. Knowledge Society and Quality of Life (KSQL), 1(1), 9–35. Retrieved from https://goo.gl/aJeSvw

Villegas Barahona, G. (2015). Factores que influyen en el rendimiento académico de estudiantes universitarios a distancia . Visión multivariante basada en BIPLOT y STATIS. Universidad de Salamanca.

Anexos

Las variables consideradas en este estudio de investigación fueron:

Perfil Académico

Aspectos de evaluación

Del mismo modo, en el nivel receptivo la persona actúa ante los problemas con unas nociones básicas. En el nivel resolutivo: La persona actúa ante los problemas comprendiendo los procedimientos elementales, se resuelven problemas sencillos del contexto. En el nivel autónomo: La persona actúa con autonomía y criterio propio ante los problemas. En el nivel estratégico: La persona actúa ante los problemas logrando un impacto, considerando las consecuencias en las diferentes opciones de resolución de problemas en el contexto. El nivel de competencia se actualiza a medida que los estudiantes realizan actividades a través de la plataforma Moodle.

Datos Personales

Aspectos Didácticos: Resultados de los ítems del cuestionario de satisfacción.

Comprensión y participación en las actividades del proceso de evaluación

Cumplimiento de los elementos de proyectos formativos

Contribución de las actividades del proceso de evaluación al rendimiento académico.

Utilidad de los recursos y las actividades de aprendizaje en la plataforma Moodle

Opinión sobre el diseño del curso en la Plataforma Moodle


1. Ingeniera de sistemas y computación, Universidad Pontificia Bolivariana, Cl. 78b #72ª, Medellín, Colombia. lvoj90@gmail.com

2. Doctora en Tecnologías de la Información, Profesora Facultad de Ingenierías, Universidad de Cartagena, Directora CORCiEM, jeimy.velez@corciem.co

3. Doctor en Ingeniera, Grupo SINFOCI, Universidad del Quindío, Carrera 15 Calle 12 Norte, Armenia, Colombia. sergio_cardona@uniquindio.edu.co


Revista ESPACIOS. ISSN 0798 1015
Vol. 39 (Número 53) Año 2018

[Índice]

[En caso de encontrar algún error en este website favor enviar email a webmaster]

©2018. revistaESPACIOS.com • Derechos Reservados