El reto

TaMTAS aborda dos barreras conectadas: la lengua en la que circula la ciencia y la complejidad del propio texto científico.

La perspectiva técnica

El proyecto propone traducción y aumento textual a nivel de documento para ciencias de la vida. Los LRM tratan la traducción como razonamiento, mientras QE, APE y la adaptación de audiencias mejoran fiabilidad y acceso.

Una barrera lingüística

El dominio del inglés perjudica a investigadores no nativos y deja a las lenguas menos representadas con menos recursos y terminología.

Una barrera de comprensión

Incluso traducidos, las estructuras complejas y la terminología especializada pueden mantener la ciencia fuera del alcance del público.

Ocho objetivos, un sistema integrado.

  1. SO1

    Compilar y enriquecer corpus científicos multilingües

  2. SO2

    Avanzar la extracción e integración terminológica

  3. SO3

    Entrenar traducción a nivel de documento con LRM

  4. SO4

    Detectar errores terminológicos con estimación de calidad

  5. SO5

    Unir estimación de calidad y posedición automática

  6. SO6

    Adaptar el texto traducido a distintas audiencias

  7. SO7

    Validar con entidades colaboradoras en contextos reales

  8. SO8

    Publicar resultados reutilizables en abierto