La maggior parte delle applicazioni per memoria di traduzione attualmente in commercio comprendono, tra i vari strumenti, un allineatore. Gli allineatori vengono impiegati per produrre file di memoria di traduzione (per es. nel formato TMX secondo gli standard del mercato) a partire da traduzioni precedenti e dai loro corrispondenti file di origine. Il file così ottenuto può essere successivamente impiegato all’interno di un’applicazione di memoria di traduzione, la quale fornisce facile accesso alle coppie di segmenti di origine e di destinazione nel file di memoria di traduzione.
Nonostante sia ovvio il vantaggio di allineare i testi di traduzioni precedenti, un grande svantaggio è rappresentato dal fatto che generalmente tali strumenti non allineano in modo intelligente. Quando i testi di partenza e di arrivo hanno un numero diverso di segmenti ( per esempio perché ad un certo punto, il traduttore ha unito due frasi per formarne una sola nella traduzione), si ottiene come risultato un file di memoria di traduzione non allineato. Gli allineatori forniscono solitamente un’interfaccia attraverso la quale tali allineamenti posso essere corretti manualmente. Questo processo può richiedere molto tempo, tuttavia, è conveniente impiegarlo solo quando la traduzione precedente è utile, come per esempio quando il testo originale di partenza è stato modificato ed è necessaria una sua nuova traduzione.
Bitext2tmx
Lanciato sul mercato nel gennaio 2006, bitext2tmx è un’applicazione Java in grado di allineare due file di testo base. Fornisce un’interfaccia utente chiara dal punto di vista grafico e funzioni auto-esplicative per dividere ed unire le celle ecc. Bitext2tmx viene distribuito sotto Licenza Pubblica GNU ed è frutto del lavoro di Susana Santos, con il sostegno di altri membri del team associato a Mikel L. Forcada.
La schermata in basso mostra bitext2tmx impiegato per allineare il testo originale in inglese della Licenza Pubblica GNU con la traduzione tedesca di Katja Lachmann e Peter Gerwinski.
LF Aligner
Sviluppato dal traduttore ungherese András Farkas. Scritto principalmente in Perl; utilizza anche altre utility open-source come hunalign e pdftotext.
LF Aligner è uno strumento di linea di comando, ma interattivo. Promette una segmentazione “intelligente”a livello di frase.
Heartsome TMX Editor
Come bitext2tmx ( vedere sopra), il modesto e forse erroneamente chiamato “TMX Editor” di Heartsome è anch’esso una utility di Java. Si tratta di un’applicazione commerciale, anche se del tutto accessibile a livello di prezzo ( attualmente, US$68 / 60 per l’edizione personale). Il TMX Editor è in grado di allineare file nei seguenti formati: RTF, HTML, XML, Plain Text, JavaScript,’PO, e tutti i file OpenOffice.org, ed offre una gamma di funzioni volte ad agevolare il processo di allineamento e ridurre il grado diintervento manuale.
Stingray Document Aligner
Uno strumento di allineamento prodotto da Maxprograms, l’azienda responsabile dell’applicazione per memoria di traduzione Swordfish e frutto del lavoro di Rodolfo Raya, ex programmatore di Heartsome. Stingray può allineare i file in un’ampia gamma di formati file. Attualmente costa 70 €, ed è anche disponibile una versione di prova per 30 giorni totalmente funzionamente.
Uno strumento per la “mappatura geometrica e l’allineamento”. Funziona con Java e os, con licenza GPL. (Grazie al contributo di Patrick Hall).
PlusTools (funziona con Crossover Linux)
L’utility PlusTools, associata all’applicazione per memoria di traduzione Wordfast, comprende uno strumento di allineamento e funziona bene con Linux con l’aiuto di Crossover Office.
Wordfisher aligner(funziona con Crossover Linux)
Anche Wordfisher dispone di una propria utility di allineamento, considerata da alcuni superiore rispetto a quelle offerte da altri strumenti CAT in commercio più cari.
aligner.py
Un semplice codice Python per creare un file TMX a partire da due testi. Scritto da Dmitri Gabinski.
bligner.py
Un semplice codice Phyton per creare un file TMX a partire da due testi. Scritto da Didier Briel.
Altre risorse
Linux e UNIX sono molto diffusi nel mondo accademico tanto che gli elaboratori centrali (mainframe) delle università sono stati impiegati come piattaforme per progetti di linguistica computazionale. Questi progetti hanno dato vita ad una serie di strumenti di allineamento e corpora multilingue, alcuni dei quali accessibili pubblicamente.
Corpora Multilingue: Risorse disponibili
Elenco delle risorse e dei collegamenti relativi a: Corpora Paralleli, Corpora Multilingue, Progetti, Strumenti di Corpora Paralleli (strumenti di concordanza paralleli, allineatori di frasi, allineatori di parole)
deli.cio.us/patfm/alignment
Collegamenti ad ulteriori risorse di allineamento. (Grazie ancora a Patrick Hall).
Gabriella dice
Mi sto occupando del confronto di diverse versioni di traduzione dello stesso testo originale. Ci sono allineatori di testo che possano allineare più versioni (e non sono 2 alla volta)? Grazie.