El Tagaligner és un programa que segmenta i alinea frases amb la seua traducció corresponent, contingudes en dos fitxers escrits en algun llenguatge de marques, i genera una memòria de traducció TMX per a us en traduccions assistides per computador.
El Tagaligner utilitza l'estructura dels llocs web i dels llenguatges basats en XML
per a millorar els resultats dels alineadors geomètrics clàssics. L'alineador ha sigut
provat amb pàgines XHTML preprocessades amb el programa tidy
i utilitzant codificació ISO-8859-1 i UTF8, encara que pot funcionar per a altres fitxers i codificacions.
El desenvolupament inicial el va dur a terme Enrique Sánchez Villamil, amb l'ajuda de Sergio Ortiz-Rojas, Susana Santos-Antón i Mikel L. Forcada (membres del grup d'investigació Transducens, del Departament de Llenguatges i Sistemes Informàtics a la Universitat d'Alacant, Espanya).
Des de Novembre de 2007, Miquel Simon va reprendre el projecte, ja que va estat aturat durant molt de temps. S'hi van incorporar millores importants al projecte fins a juliol de 2008.
Des de setembre de 2008, el projecte ha estat représ per Miquel Esplà, també membre, durant aquesta etapa, del grup Transducens. Des d'aleshores, TagAligner ha sigut reescrit i redissenyat. Ara està compost per dos paquets, la llibreria LibTagAligner i la pròpia aplicació, TagAligner. El fitxer de configuració ha sigut millorat i ampliat, i el seu format ha estat modificat. Des d'aleshores, s'ha començat a llançar versions estables de l'aplicació.
El programa va ser originat amb el projecte "Traductors d'estats finits basats en bitextos recollits de la xarxa" (2004-2006), fundat pel difunt Ministeri de Ciència i Tecnologia d'Espanya, a través de la beca TIC2003-08681-C02.
Avui anunciem la primera publicació de la versió 2.0 del Tag-Aligner. Després d'un periode de desenvolupament, s'han inclòs algunes característiques que milloren el funcionament de l'alineador.
La principal novetat d'aquesta versió es la creació d'un fitxer de configuració XML. En aquest fitxer podem definir els valors per a diferents paràmetres que s'utilitzen durant el procés d'alineament.
Ara l'alineador pot processar qualsevol fitxer en un format basat en XML, més enllà d'XHTML. Al fitxer de configuració es pot definir el conjunt d'etiquetes que l'alineador deuria tenir en compte. Això permetrà alinear documents de diferents tipus: XHTML, XML, OpenOffice.org, DocBook, o qualsevol altre basat en XML.
Altre paràmetres com els costos d'edició també s'estableixen al fitxer de configuració. D'aquesta forma es poden adequar a les necessitats de cada cas.
El resultat obtingut dels tests executats son, al menys, tan bons com ho eren a la versió de partida, am l'adició dels experiments amb els nous formats.
In aquesta publicació s'han solventant importants problemes en la manipulació de memòria dinàmica. Si esteu utilitzant l'Tag Aligner 2.0rc1, vos recomanem que la canvieu per aquesta nova versió.
Ja teniu disponible la nova versió de Tag Aligner, la 2.1rc1. En aquesta versió s'ha desenvolupat un treball per tal de: corregir diversos errors funcionals de l'aplicació, transformar el codi amb els contenidors proporcionats per l'STL de C++ i per optimitzar els càlculs i, per tant, reduir els costos de computació.
A més, s'ha desenvolupat una important tasca en l'eliminació de codi redundant i la incorporació al disseny de classes de l'herència, cosa per la qual resulta molt més fàcil afegir funcionalitats i nous tipus d'aliniadors al disseny actual.
Finalment, cal destacar que a partir d'ara caldrà indicar l'emplaçament del fitxer de configuració en cada execució mitjançant l'opció -c. En cas contrari es suposarà que existeix un fitxer anomenat config.xml en el directori actual, el qual conté els paràmetres de configuració.
Solventats petits errors en l'aliniament.
En aquesta nova versió comptem amb algunes novetats:
A banda de tot aixó, aquesta es la primera versió de Tag Aligner que ha estat sotmesa a proves d'unitat, d'estrés i d'integració.
En aquesta nova versió de TagAligner s'han realitzat alguns canvis importants. Per a la versió 3.0 del projecte TagAligner, el fitxer de configuració ha sigut modificat per a donar una major capacitat de configuració a l'aplicació i, al mateix temps, fer-lo més compatible amb altres aplicacions. Per aquest motiu, a partir d'aquesta versió, la compatibilitat amb fitxers de configuració més antics no serà suportada. Aquestes són les dues coses més importants modificades en el fitxer de configuració:
L'última versió del tagaligner es pot descarregar de la web de SourceForgeckage sf.net/projects/tag-aligner/. Podeu accedir al repositori SVN del projecte per a obtenir un esbós del l'estat del desenvolupament.
./configure
make
make install
(o l'script make-install
)tagaligner
opció fitxer_esquerra
llengua_esquerra fitxer_dret llengua_dreta
[fitxer_eixida]
Opcions:
-ad
: alineador en 2 passos amb comparació de la distància d'alineament del text-l
: alineador en 2 passos amb comparació de longitud de text-direct
: alineador 2-1 que alinea les frases de text i les etiquetes alhora (per defecte)Aquesta aplicació es distribueix sota la GNU General Public License .
El tagaligner necessita la teua ajuda. Contacta [mlforcada, miquelsi]
at
users.sourceforge.net
.
Última actualització: juny 2008 |