hm10-04

Por: antivirus para la deserción.

Uno de los problemas más complejos que enfrentan las instituciones educativas actualmente es la deserción estudiantil. El problema es complejo, no es fácil determinar con claridad la suma de factores que hacen que un estudiante abandone los estudios. Solo en Colombia, en promedio la mitad de estudiantes no terminan sus estudios universitarios, esta cifra que ha venido mejorando lentamente, exige esfuerzos especiales de parte de las instituciones.

Normalmente, las instituciones ofrecen programas para que los estudiantes con dificultades busquen ayuda y apoyo,, por motivos que van desde académicos, emocionales o económicos en algunos casos. El problema de este enfoque, es que normalmente cuando una persona levanta su mano buscando ayuda, es porque el problema ya está avanzado y los esfuerzos para revertir la situación son más grandes; o peor aún, algunos estudiantes nunca manifiestan que tienen problemas por vergüenza, desconocimiento, o exceso de confianza en sí mismos. Lo lógico, sería que no fuera el estudiante el que buscara ayuda, si no la institución, la que activamente debería acercarse indagar sobre las realidades de los estudiantes para encontrar, a quienes necesitan el apoyo de forma temprana.

En este contexto, es que ha venido ganando importancia tecnologías que permiten tener alertas tempranas, utilizando Big Data e Inteligencia Artificial para predecir qué estudiantes tienen alto riesgo de deserción, estas tecnologías se categorizan con el nombre de Analítica del Aprendizaje,. Desde Antivirus para la Deserción, hemos entendido que para mejorar radicalmente los números de la permanencia estudiantil, se requiere utilizar estrategias nuevas, audaces y apoyadas en la tecnología,por esto nos propusimos construir el mejor sistema de analítica de aprendizaje y de forma open-source, para que las mismas universidades implementen estas capacidades y trabajen en redes colaborativas para mejorar este sistema de alertas.

Fue mientras desarrollamos esta visión, que nos topamos en 2020 con una convocatoria del MinTic y una red de 15 universidades (RUAV, en la que buscaban un grupo de personas capaces de implementar un sistema de alertas tempranas con las características que se mencionan anteriormente.

Nuestro primer reto, fue probar que nuestro equipo tenía las capacidades, compitiendo con otras empresas en una hackathon de 3 días.Trabajamos arduamente y de la mano de la red de universidades para construir el software, la infraestructura y en paralelo preparar y entrenar un modelo de machine learning que estuviera a la altura de las expectativas. El trabajo duro dió sus frutos y ganamos la competencia.

Gracias a este impulso, tuvimos la fuerza suficiente para construir el sistema de alertas, entrenar dos modelos para dos universidades y dejar todo disponible de forma opensource en nuestro github (https://github.com/antivirusparaladesercion, lo que permite que cualquier institución lo implemente libremente y lo mejore para el beneficio de todos.

Desarrollando este proyecto nos encontramos con retos importantes, principalmente frente al gobierno y arquitectura de datos de instituciones. Para crear un modelo de machine learning, con buen desempeño en sus predicciones el insumo principal es tener una buena cantidad de datos históricos estructurados con registros por estudiante, y su información durante su paso por la institución en los indoles académicos, psicosociales, familiares y económicos; sin embargo, normalmente las instituciones tienen muy buena información de su historial académico y muy poco de las demás categorías. Usualmente las áreas de las IES funcionan muy aisladas entre sí (silos independientes) y esto se refleja en muchas ocasiones cuando las áreas académicas, de admisiones y de bienestar usan sistemas de información y bases de datos independientes. Esto aunque funciona bien para operar las áreas, no es conveniente para entender al estudiante integralmente, y a menudo los empleados se ven obligados a hacer cruces manuales con reportes en excel, procesos lentos y repetitivos que restan oportunidad de responder a las necesidades de los estudiantes.

Un gobierno y arquitectura de datos adecuados para aprovechar al máximo las tecnologías de la 4a revolución industrial, requiere que los sistemas constantemente reporten los datos de cada estudiante a un sistema centralizado de datos (data lake), el cual se vuelve el corazón de la capacidad analítica de la institución, habilitando al instante la posibilidad de hacer analítica descriptiva, predictiva e inteligencia de negocios al servicio de mejorar integralmente la experiencia de los estudiantes por el plantel.

Estas son algunas de las variables que nos permiten construir un modelo predictivo de riesgo de deserción estudiantil.

  • Puntaje del ICFES: puntaje logrado por cada estudiante en la prueba de estado

  • Colegio donde culminó el bachillerato (código oficial)

  • Escolaridad de los padres

  • Número de hermanos

  • Promedio semestral

  • Notas parciales y finales de cada materia por cada semestre

  • Repitencia de materias “problema”

  • Sexo

  • Orientación Sexual

  • Se identifica con algun grupo etnico

  • Periodos de prueba del estudiante

  • Asistencia a programas de bienestar universitario

  • Nivel de apoyo familiar

  • Posesión de un equipo de cómputo [no/si exclusivo/ si compartido]

  • Conectividad a internet [en casa/en la universidad/ en espacio público]

  • Modalidad de estudio [presencial/virtual/mixto]

  • Lugar de residencia

  • Estrato

  • Periodos en mora de pago de sus estudios

  • Forma de pago de sus estudios universitarios

  • Ingresos mensuales del estudiante

  • Origen ingresos mensuales del estudiante

  • Ingresos mensuales del grupo familiar

  • Origen ingresos mensuales del grupo familiar

  • Historial académico

  • Indice de alineación vocacional

Una vez se identifican esos estudiantes en alto riesgo, basado en patrones y correlaciones complejas que los modelos de inteligencia artificial encuentran, podemos diseñar estrategias costo-efectivas que vayan al estudiante, Los problemas del ser humano empieza como una bola de nieve pequeña que nadie nota, y en la medida que pasa el tiempo lo notamos y alzamos la mano, cuando la bola esta muy grande y es más difícil detener; esto sin contar a los tantos que nunca alzan la mano. Si la universidad se acerca a los estudiantes uno a uno, está demostrado que estos se sentirán con mucho más sentido de pertenencia y responderán con mayor esfuerzo de sus partes en mantenerse a flote.

La identificación de los estudiantes con mayores riesgos en etapa temprana, hace que bajen los costos operativos de acompañar a estos estudiantes, y el retorno social que se obtiene por graduar a más estudiantes a la sociedad, usando las mismas instalaciones, es incalculable

Algo muy llamativo de la analítica del aprendizaje y del talento, es que puede ser aplicada para mejorar el nivel académico de todos los estudiantes, en cuanto la institución podría dirigir estrategias de enseñanza diferenciadas dependiendo del contexto del estudiante, apuntando a corregir desigualdades inherentes del sistema educativo en las etapas anteriores.

Mejorar la permanencia estudiantil en Colombia y Latinoamérica, es un problema de sociedades imperativo que las instituciones trabajen mancomunadamente por este mismo propósito. Nuestra misión, es sumar a cuantos podamos a este propósito, con una visión compartida de un sistema educativo eficiente que gradúa muchos más estudiantes, transformando las realidades de muchas vidas personales y del conjunto de la sociedad.