Parallel corpora are rich sources of translation resources. This document presents a methodology for the extraction of bilingual nominals (terminology candidates) from parallel corpora, using translation patterns. The patterns proposed in this work specify the order changes that occur during translation and that are intrinsic to the involved languages syntaxes. These patterns are described in a domain specific language named PDL (Pattern Description Language), and are extremely efficient for the detection of nominal phrases.
Los corpora paralelos son fuentes ricas en recursos de traducción. Este
documento presenta una metodología para la extracción de sintagmas nominales bilingües
(candidatos terminológicos) a partir de corpora paralelos, utilizando reglas
de traducción.
Los modelos propuestos en este trabajo especifican las alteraciones en el orden de
las palabras que se producen durante la traducción y que son intrínsecos a la sintaxis
de las lenguas implicadas. Estas reglas se describen en un lenguaje de dominio
específico llamado PDL (Pattern Description Language) y son sumamente eficientes
para la detección de sintagmas nominales.