Eduardo Backhoff

En un país donde los retos educativos son enormes y persistentes, surgió una organización decidida a transformar la manera en que se mide el aprendizaje: Métrica Educativa, A. C. Nacida con el compromiso de innovar en los procesos de evaluación del aprendizaje por medios computacionales, esta asociación —registrada en el RENIECYT— ha impulsado, desde sus inicios, una visión rigurosa y creativa para mejorar la calidad educativa. En esta breve síntesis comparto los hitos más relevantes de su trayectoria y algunas de sus aportaciones más innovadoras.

La educación es fundamental para el desarrollo cognitivo, emocional, social y laboral de las personas, y su impacto en su vida es perdurable. Mientras que el propósito de la educación es formar a los futuros ciudadanos, el de la evaluación es verificar y coadyuvar a que este objetivo se cumpla. Sin embargo, no todos los métodos de enseñanza y de evaluación del aprendizaje son acertados. Por ello, es importante contar con evidencias que orienten la toma de decisiones educativas para asegurar que los objetivos de aprendizaje se cumplan en todos o en la gran mayoría de los estudiantes.

Durante casi un siglo, la evaluación del aprendizaje a gran escala experimentó pocos cambios sustanciales. Los instrumentos desarrollados en prácticamente todo el mundo compartían el mismo formato: se centraban en aspectos memorísticos y de baja demanda cognitiva y de respuestas cerradas o de selección —principalmente de opción múltiple—, en las que el azar juega un papel importante. Aunque desde la segunda mitad del siglo XX comenzaron a desarrollarse nuevos modelos psicométricos y cognitivos, su influencia en las evaluaciones de gran escala no se hizo notar sino hasta finales del mismo. El libro Knowing What Students Know es un excelente ejemplo donde se describen los avances de las ciencias cognitivas y de los nuevos modelos de evaluación del aprendizaje. De igual forma, Automatic Item Generation es otro ejemplo de los nuevos modelos para diseñar y desarrollar grandes bancos de ítems de manera automática.

Antecedentes de Métrica Educativa

Hace más de tres décadas, México carecía de instrumentos válidos y confiables para evaluar, a gran escala, las habilidades y conocimientos de los estudiantes. Por ello, era frecuente que las universidades recurrieran a agencias extranjeras —como el College Board—, para evaluar el logro académico de los aspirantes que deseaban ingresar a alguna carrera universitaria. En otros casos, las mismas instituciones desarrollaban sus propios instrumentos de evaluación, generalmente sin contar con el rigor técnico necesario para garantizar su calidad.

Ante la necesidad de que las instituciones de educación media superior y superior en México contaran con instrumentos válidos y confiables para sus procesos de admisión, un grupo de académicos de la Universidad Autónoma de Baja California (UABC) y de la Universidad Nacional Autónoma de México (UNAM) desarrolló, en 1991, el Examen de Habilidades y Conocimientos Básicos (EXHCOBA). Este instrumento partió de la premisa de evaluar, por un lado, las habilidades escolares básicas —razonamiento matemático y verbal— , que permiten operar cognitivamente, y por otro, los conocimientos estructurales que posibilitan la adquisición e integración de nuevos conocimientos. El EXHCOBA se enfocó en evaluar los cimientos y la estructura del conocimiento que el estudiante va construyendo a lo largo de su trayectoria escolar,1 lo que constituyó su primera gran innovación.

Con la previsión de que las evaluaciones asistidas por computadora serían una realidad en un futuro cercano, en 1994 desarrollamos el Sistema Computarizado de Exámenes (SICODEX), que se convirtió en la primera evaluación computarizada de gran escala en México, dirigida a la selección de estudiantes de nivel medio superior y superior2 (segunda innovación). Este sistema permite administrar y calificar de manera automática reactivos de selección (opción múltiple), y utiliza diversas herramientas digitales, tales como imágenes, sonido, videos y textos. Asimismo, proporciona un informe de resultados inmediato al concluir el examen. Una de sus grandes ventajas es que el sistema funciona de manera local, sin requerir una conexión permanente a Internet. Con esta plataforma informática se evaluaron cientos de miles de estudiantes de diversas instituciones educativas del país durante un periodo de dos décadas (1992 a 2012).

Con el propósito de modernizar y mejorar nuestros sistemas de evaluación, entre 2008 y 2013 desarrollamos el Examen de Competencias Básicas (Excoba) y el Generador Automático de Exámenes (GenerEx) para su aplicación3 (tercera innovación). El Excoba se diseñó con apego a los principios de las ciencias cognitivas y a una nueva óptica de evaluación del aprendizaje: la evaluación auténtica, que utiliza preguntas de respuesta construida o abierta, procurando acercarse lo más posible a la situaciones reales. En términos técnicos, se utilizaron los fundamentos de los generadores automáticos de ítems, cuyo objetivo es producir una gran cantidad de reactivos semejantes y equivalentes (isomorfos), con base en familias de preguntas. El GenerEx, por su parte, tiene la capacidad de calificar automáticamente las respuestas abiertas y de generar informes diagnósticos pormenorizados de cada estudiante.

De 2013 a la fecha, Métrica Educativa ha continuado desarrollando nuevos instrumentos con propósitos diagnósticos y de certificación en distintos ámbitos, tales como matemáticas, inglés y habilidades socioemocionales. Asimismo, el Excoba ha sido adaptado para su aplicación en poblaciones extranjeras de educación superior. Entre los desarrollos más relevantes destaca la evaluación de la comprensión lectora con base en simuladores web (cuarta innovación). Con la llegada del Covid-19, las instituciones tuvieron la necesidad de evaluar a sus estudiantes desde sus hogares; en respuesta a ello, se desarrolló una aplicación para administrar exámenes en línea a gran escala. Más recientemente, en 2025, incursionamos en el uso de la inteligencia artificial para evaluar la expresión escrita de manera auténtica, proyecto que actualmente se encuentra en una fase inicial (quinta innovación).

En fechas recientes, Métrica Educativa ha entrado en una nueva fase de su desarrollo innovador mediante una alianza estratégica con la Editorial Macmillan, a fin de diseñar el Modelo de Evaluación de Trayectorias de Aprendizaje (META) para los estudiantes de educación básica, con propósitos formativos. Este modelo contempla que, a lo largo del ciclo escolar y en una plataforma informática, los estudiantes respondan en línea tres evaluaciones cuyos contenidos se basan en los planes y programas de estudio nacionales, así como en los libros de texto de la editorial. A partir de los resultados, el sistema elabora automáticamente reportes diagnósticos para cada estudiante, otro para cada profesor con los resultados de su grupo y uno más para la institución educativa con los resultados de los distintos grupos de estudiantes. Adicionalmente, se entrega un reporte a la editorial que permite identificar tanto los contenidos que han sido correctamente adquiridos como aquellos en los que los estudiantes presentan mayores dificultades de aprendizaje (sexta innovación).4

Conclusiones

Con más de treinta años de experiencia, en Métrica Educativa hemos desarrollado innovaciones en al menos seis ámbitos: 1) la evaluación de la estructura del conocimiento que los estudiantes adquieren a lo largo de su trayectoria escolar; 2) el diseño de la primera evaluación del aprendizaje a gran escala con medios computarizados, que califica y entrega resultados de forma automática; 3) la creación y operación de un generador automático de exámenes con contenidos prácticamente inagotables; 4) el desarrollo de un simulador de páginas web para evaluar la comprensión lectora; 5) la evaluación y calificación automatizada de preguntas de respuesta abierta y semi construida, y 6) la evaluación de la expresión escrita mediante herramientas de inteligencia artificial, innovación aún en fase inicial.

Por desgracia, México se ha caracterizado en el ámbito educativo por una toma de decisiones errática y de corto plazo, frecuentemente sustentada en ocurrencias o suposiciones. Lamentablemente, la Secretaría de Educación Pública ha menospreciado la evaluación del aprendizaje a gran escala, bajo el argumento de que es una práctica neoliberal, colonialista y capitalista, promotora del individualismo y la competencia considerada indeseable. En Métrica Educativa creemos firmemente que la educación, como cualquier disciplina científica, debe fundarse en evidencias, entre las cuales destacan aquellas que proporcionan las evaluaciones del aprendizaje con distintos propósitos y alcances.

