Tecnologia i ciència

Quatre paquets tècnics connecten recursos, raonament, correcció i adaptació de públics en un flux iteratiu.

WP2 M1–M15

UOC

Corpus, terminologia i augmentació de dades

Construeix corpus paral·lels i comparables de ciències de la vida, millora TBXTools i crea bases terminològiques amb informació morfològica.

500K segments for EN–ES/CA/ET · 100K for Irish · 2,500 terms per EN/ES/CA/ET · 500 Irish terms

Tasques
  • T2.1 Corpus compilation
  • T2.2 Enhancement of TBXTools
  • T2.3 Terminological databases
  • T2.4 Term-substitution augmentation
Lliurables
  • D2.1 Corpora · M6
  • D2.2 TBXTools · M7
  • D2.3 Terminology databases · M9
  • D2.4 Augmented corpora · M15
WP3 M1–M34

BSC

Traducció automàtica sensible a la terminologia

Compara models de raonament amb LLM ajustats per instruccions i usa glossaris, autoreflexió i context documental per preservar termes.

5 languages · ≥3 scientific genres · ≥20 BLEU · ≤0.4 TER

Tasques
  • T3.1 Domain datasets
  • T3.2 Reasoning capabilities
  • T3.3 Emerging terminology
  • T3.4 Comparative experiments
Lliurables
  • D3.1 Instruction and CoT data · M18
  • D3.2 LRM model · M24
  • D3.3 Benchmark results · M33
WP4 M4–M33

University of Surrey

Estimació de qualitat i postedició automàtica

Detecta, explica i corregeix errors terminològics. QE i APE s'entrenen conjuntament i s'integren amb el model de traducció.

≥80% F1 terminology-span detection · ≥15% human-rated terminology accuracy improvement

Tasques
  • T4.1 Baselines and seed data
  • T4.2 QE-adapted decoding
  • T4.3 Joint QE and APE
  • T4.4 API and integration
Lliurables
  • D4.1 QE-integrated LRM · M18
  • D4.2 QE-adapted decoding · M24
  • D4.3 Joint QE/APE · M33
  • D4.4 Integrated API · M33
WP5 M16–M28

University of Tartu

Augmentació textual posterior a la traducció

Reescriu contingut ja traduït per a públics experts i no experts mitjançant simplificació, suport terminològic, resums i explicacions.

2 use cases · scientific dissemination and public outreach · ≥75% positive user feedback

Tasques
  • T5.1 Augmentation strategies
  • T5.2 Audience-aware implementation
Lliurables
  • D5.1 Augmentation framework · M19
  • D5.2 Implemented strategies · M28