Please use this identifier to cite or link to this item: https://hdl.handle.net/10216/119701
Author(s): Bacquelaine, Françoise
Title: Systèmes de traduction automatique et levée d'ambiguïté: étude comparée de systèmes de TABR, TAS et TAN
Issue Date: 2018
Abstract: Machine Translation (MT) has been a lively field of research eversince the invention of the computer. Rule-Based Machine Translation (RBMT) wasthe first option back in the 1940s-1950s; Statistical Machine Translation (SMT)appeared a few decades later and Neural Machine Translation (NMT) in the 21stcentury. This distinction is not strict since most MT systems are now hybrid, butnatural language ambiguity is a well-known pitfall, be it in human or machinetranslation.Two types of ambiguity can arise when using the rather common Englishword issue: "grammatical ambiguity" (noun or verb?), on the one hand, and"homographic and polysemic ambiguity (one word form with different sensesin the source language)" (Hutchins 2005: 17), on the other hand. The scope ofthis research is limited to three senses of the noun issue (1. An important topic orproblem for debate or discussion; 2. The action of supplying or distributing an itemfor use, sale, or official; 3. (formal or law) Children of one's own) and two sensesof the verb to issue (1. [WITH OBJECT] Supply or distribute (something) for useor sale; 2. [NO OBJECT] (issue from) Come, go, or flow out from). A sample ofsentences containing at least one example of usage was selected from the BritishNational Corpus in order to test and compare four English-French MT systems:SYSTRAN (free online RBMT), Google Translate (free online SMT), MT@EC(restricted access SMT) and free online Neural Machine Translation by LISA(University of Montreal). The outputs were compared to a human translation modelbased on translation memories (parallel corpora) in order to evaluate weaknessesand strengths of each system, compare the results and find out possible ways ofimproving MT output through hybridisation.Research results in cases like these are not just useful for theoreticallinguistics but can also be used to heighten awareness in human translators anddemonstrate that translators who are trained in computational linguistics can alsowork together with experts in artificial intelligence and machine translation.
Description: FR: La traduction automatique (TA) est un domaine en pleine effervescencedepuis l'invention de l'ordinateur. L'aventure a commencé par la traduction à basede règles (TABR) dans les années 1940-1950. La traduction automatique statistique(TAS) s'est imposée quelques décennies plus tard et la traduction automatiqueneuronale (TAN) a vu le jour au XXIe siècle. Cette distinction n'est pas strictepuisque la plupart des systèmes de TA sont aujourd'hui hybrides, mais l'ambiguïtéreste un piège bien connu, tant dans le cadre de la traduction humaine que de latraduction automatique.Le mot anglais courant issue soulève deux types d'ambiguïté : « ambiguïtégrammaticale » (nom ou verbe ?) et « ambiguïté homographique et polysémique »lorsqu'un mot a plusieurs sens dans la langue source (Hutchins 2005 : 17). Cetterecherche se limite à trois sens du nom issue et à deux sens du verbe. Un échantillonde phrases comportant au moins une occurrence du mot issue dans un de ces cinqsens a été sélectionné dans le British National Corpus afin de comparer quatresystèmes de traduction automatique anglais-français : SYSTRAN (TABR, accèsgratuit en ligne), Google Translate (TAS, accès gratuit en ligne), MT@EC (TAS,accès limité) et le système de TAN de LISA (Université de Montréal). Les résultatsont été comparés à un modèle de traduction humaine fondé sur des mémoires detraduction afin d'évaluer les faiblesses et les atouts de chaque système de TA, decomparer leurs performances et de proposer des possibilités d'amélioration grâce àl'hybridation des systèmes.
Subject: Humanidades
Humanities
URI: https://hdl.handle.net/10216/119701
Source: A linguística em diálogo: volume comemorativo dos 40 anos do Centro de Linguística da Universidade do Porto
Document Type: Capítulo ou Parte de Livro
Rights: openAccess
Appears in Collections:FLUP - Capítulo ou Parte de Livro

Files in This Item:
File Description SizeFormat 
275183.pdf377.72 kBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.