Calidad de los subtítulos producidos por los estudiantes de un MOOC de accesibilidad del Canal Fundación ONCE, avalado por la CUED, utilizando una herramienta semiautomática. Una investigación con participación de la CUED

Calidad de los subtítulos producidos por los estudiantes de un MOOC de accesibilidad del Canal Fundación ONCE, avalado por la CUED, utilizando una herramienta semiautomática. Una investigación con participación de la CUED

En el MOOC “Materiales digitales accesibles”, curso del Canal Fundación ONCE en UNED[1] ofrecido a través de UNED Abierta, 53 estudiantes participaron en una actividad voluntaria de subtitulado. En dicha actividad, cada estudiante debía descargarse un vídeo y subtitularlo usando los conocimientos adquiridos en el curso sobre las recomendaciones de buenas prácticas de subtitulado, basadas en la norma española UNE 153010 “Subtitulado para personas sordas y personas con discapacidad auditiva” y en otras guías internacionales.

Según dichas recomendaciones:

  • Los subtítulos deben coincidir literalmente con el diálogo hablado.
  • Los subtítulos deben ocupar como máximo dos líneas, excepcionalmente tres.
  • Cada participante en el vídeo debe tener su propia línea de subtitulado.
  • En cada línea debe haber 37 caracteres como máximo.
  • La velocidad del subtitulado no debe exceder los 15 caracteres por segundo, aunque algunas investigaciones recomiendan 12 caracteres por segundo.
  • Los subtítulos deben estar sincronizados con las palabras habladas y con los sonidos con los que se corresponden.  
  • Los subtítulos deben identificar a los participantes (por ejemplo, con el nombre de cada uno entre paréntesis).
  • Los efectos de sonido que sean relevantes para la comprensión del vídeo deben describirse en los subtítulos.
  • La segmentación de los subtítulos en varias líneas debe hacerse siguiendo los siguientes criterios: 1) aprovechando las pausas y silencios del habla, así como las pausas gramaticales y signos de puntuación; 2) poniendo las conjunciones al inicio de la línea siguiente y; 3) manteniendo en la misma línea los sintagmas nominales y verbales.
  • Cada palabra debe ir en una misma línea y no separarse en varias.
  • Los puntos suspensivos no deben usarse para dividir una frase en diferentes líneas.
  • Los subtítulos deben ser correctos gramatical y ortográficamente.

Con el objetivo de evaluar la calidad de los subtítulos realizados por estos estudiantes, se hicieron dos comparaciones, tomando como referencia dos subtitulados:

  • El subtitulado hecho por una persona experta designada por FIAPAS (Confederación Española de Familias de Personas Sordas) a quien se pidió explícitamente que cumpliera la norma UNE 153010, el estándar de calidad que suelen utilizar en dicha organización.
  • El subtitulado automático generado por la herramienta de reconocimiento de voz de YouTube.

La tasa de errores cometidos en el subtitulado por minuto fue de 8.18 para la persona experta, 31.43 para los estudiantes y 35.88 para la herramienta de YouTube. Por otra parte, el porcentaje de precisión fue del 100% para la persona experta, del 96.87% para los estudiantes y del 82.92% para la herramienta de YouTube. Esa precisión se calcula según el modelo NER, utilizado en la norma UNE 153010, que considera el número de palabras en los subtítulos incluidos los signos de puntuación (N), los errores de edición (E) y los errores de reconocimiento del habla o errores específicos de la tecnología utilizada para producir los subtítulos (R). La norma UNE 153010 establece en un 98 % el umbral mínimo de calidad según este modelo de precisión. Por tanto, los estudiantes estuvieron ligeramente por debajo de dicho umbral, mientras que la herramienta de YouTube se quedó bastante por debajo, a unos 15 puntos porcentuales.

El estudio ha determinado que, con una formación básica a personas noveles en el ámbito de la accesibilidad digital, estas adquieren competencias razonables en cuanto a la realización de subtitulado accesible. También, que YouTube es una herramienta útil en el proceso de subtitulado manual, pero que necesitaría mejoras en cuanto a la puntuación, la detección de la alternancia de hablantes, la información que ofrece sobre el número de líneas y de caracteres por línea, así como en la detección de tramos de excesiva velocidad de subtítulo. En cuanto a los subtítulos generados por YouTube automáticamente, que son ampliamente utilizados en la web, se ha evidenciado que tienen una calidad muy inferior a la requerida por los estándares. Y, finalmente, el estudio ha identificado aspectos mejorables del propio curso en cuanto a sus objetivos de aprendizaje relacionados con las recomendaciones de subtitulado, que ya han sido abordados en el ámbito del control de calidad del proyecto.

Esta investigación ha sido posible gracias al Canal Fundación ONCE en UNED, una iniciativa del Real Patronato sobre Discapacidad, en colaboración con la Fundación ONCE y la UNED. Además, el MOOC del Canal que ha posibilitado esta investigación, “Materiales digitales accesibles”, está avalado por la Cátedra UNESCO de Educación a Distancia y por el Instituto Universitario de Educación a Distancia de la UNED.

Más detalles de la investigación en el artículo correspondiente:

Pérez-Martín, J., Rodriguez-Ascaso, A., & Molanes-López, E. M. (2021). Quality of the captions produced by students of an accessibility MOOC using a semi-automatic tool. Universal Access in the Information Society, 20(4), 677-690. DOI: https://doi.org/10.1007/s10209-020-00740-9


[1] https://blogs.uned.es/unedabierta/canal-fundacion-once/