CYBER SECURITE

Avantages et inconvénients de Google Traduction

Google Translate (GT) est le logiciel de traduction numéro un au monde. Il prend en charge 103 langues, 10 000 paires de langues et traite environ 500 millions de demandes de traduction chaque jour. Les experts affirment que le système neuronal de GT sera bientôt capable de traiter non seulement des textes mais aussi des fichiers audio et vidéo. Il faut donc s’attendre à des progrès rapides dans le développement de la traduction automatique.Les premiers pas dans cette direction ont déjà été faits, et nous voyons maintenant des algorithmes capables d’analyser la vidéo et l’audio activement développés.

En 2016, les développeurs de Google ont introduit Neural Machine Translation System (GNMT). Basé sur un réseau de neurones artificiels, il visait à améliorer considérablement la qualité de la traduction. Avec son aide, les étudiants pourront localiser et acheter des devoirs en ligne beaucoup plus rapidement qu’auparavant. Trois ans se sont écoulés depuis, et nous pouvons maintenant évaluer son efficacité. La qualité de la traduction s’est-elle vraiment améliorée et que faut-il d’autre pour l’améliorer encore ?

Comment fonctionne l’algorithme de GT ?

Google Translate

Le modèle neuronal de la traduction automatique repose sur des méthodes de traduction standard. Avant l’avènement des réseaux de neurones, la traduction se faisait généralement mot à mot. Le système a simplement traduit des mots et des phrases séparés, en tenant compte des règles de grammaire de base. Par conséquent, la qualité de la traduction laissait beaucoup à désirer.

Dans un système neuronal moderne, le plus petit élément n’est pas un mot mais ses fragments. Grâce à cela, la puissance de calcul de la machine se concentre non pas sur les formes des mots mais sur le contexte et le sens de la phrase. Le logiciel traduit la phrase entière en tenant compte du contexte. Il ne stocke pas des centaines de variantes de traduction dans sa mémoire. Au lieu de cela, il opère sur la sémantique du texte et divise les phrases en segments de dictionnaire.

GNMT

À ce jour, GNMT utilise environ 32 000 fragments de ce type. En utilisant des décodeurs spéciaux, il détermine la signification de chaque segment dans le texte. Ensuite, il calcule le nombre maximum de significations possibles et d’options de traduction. La dernière étape consiste à combiner les segments traduits avec la grammaire. Selon les développeurs, cette approche permet d’assurer une vitesse et une précision de traduction élevées sans consommer une puissance de calcul excessive.

En raison des caractéristiques sémantiques et grammaticales des langues, une traduction correcte nécessite des algorithmes logiciels complètement différents qui sont implémentés sous forme de modules et de dictionnaires séparés dans certains programmes. Un réseau de neurones peut fonctionner avec de nombreuses paires de langues, y compris celles qui n’ont pas été impliquées dans le processus d’apprentissage initial. Par exemple, si un système a été formé pour traduire entre l’anglais et le japonais , et l’anglais et le coréen , il peut facilement traduire du japonais vers le coréen sans utiliser l’anglais comme langue intermédiaire.

Au cours des dernières années, l’intelligence artificielle (IA) s’est tellement développée qu’elle est devenue capable de traduire depuis et vers des langues pour lesquelles elle n’a pas été conçue à l’origine. Cela est devenu possible grâce au fait que l’IA a commencé à utiliser son propre langage artificiel, qui agit comme une langue intermédiaire dans le processus de traduction. Ce langage informatique universel, qui s’appelait Interlingua, est absolument inadapté à la communication entre les personnes.

traduction zéro coup.

La méthode de traduction mise en œuvre par les développeurs de Google est appelée traduction zéro coup. Il s’agit d’une technologie plus sophistiquée qui s’appuie sur un langage artificiel intermédiaire. Ce domaine de recherche se développe très rapidement et de tels systèmes deviendront le principal moyen de traduction automatique dans un avenir proche. La fonction d’auto-apprentissage du système permet à un réseau de neurones de traduire avec précision même l’argot, le jargon et les néologismes qui ne sont pas disponibles dans les dictionnaires populaires. De plus, un réseau de neurones peut fonctionner avec des lettres dont les mots sont composés. Il est nécessaire lors de la translittération des noms propres d’un ABC à un autre.

A lire : google trad

Paires de langues

Le système GNMT a amélioré la traduction des deux paires de langues les plus utilisées – espagnol-anglais et français-anglais. En conséquence, la précision de la traduction est passée à 85 %. En 2017, Google a mené des enquêtes à grande échelle auprès des utilisateurs réguliers de GT. Il leur a été demandé d’évaluer trois options de traduction : statistiques automatiques, neurales et humaines. Les résultats ont été impressionnants : la traduction reposant sur des réseaux de neurones s’est avérée presque parfaite dans certaines paires de langues. Vous trouverez ci-dessous un tableau dans lequel le système en 6 points d’évaluation de la qualité de la traduction est utilisé. Le score maximum est 6, tandis que 0 est le minimum.

 

Modèle statistique Réseau neuronal Traduction humaine
Anglais espagnol 4 885 5 428 5 550
Anglais français 4 932 5 295 5 496
Anglais-Chinois 4 035 4 594 4 987
Espagnol Anglais 4 872 5 187 5 372
Français anglais 5 046 5 343 5 404
Chinois-anglais 3 694 4 263 4 636

Comme vous pouvez le voir, la qualité de la traduction dans les paires anglais-espagnol et français-anglais est très proche de la traduction faite par un humain. Ce n’est pas surprenant puisque ces paires de langues ont été utilisées pour l’apprentissage en profondeur des algorithmes GT. Avec d’autres paires de langues, la situation n’est pas aussi bonne, mais des recherches à grande échelle sont toujours en cours. Néanmoins, si la traduction neuronale fonctionne assez bien avec des langues structurellement similaires, alors avec des systèmes linguistiques radicalement différents, par exemple le japonais-finnois, la traduction informatique est nettement inférieure.

Quels sont les inconvénients de Google Traduction ?

Les avantages pratiques de la GT et des technologies similaires sont difficiles à sous-estimer. Cependant, quelque chose manque encore à cette approche de la machine. Cela peut être décrit en un mot : compréhension. C’est-à-dire que la traduction informatique n’est jamais centrée sur la compréhension automatique. Les développeurs de logiciels ont toujours essayé d’améliorer les méthodes de décryptage ou, en d’autres termes, ont tenté de faire face à la tâche de traduction en utilisant les pouvoirs analytiques de la machine sans.

Il convient de noter que l’objectif principal des développeurs de GNMT n’était pas d’obtenir une précision de traduction maximale. Compte tenu du niveau actuel de développement technologique, tout traducteur informatique devra travailler avec des constructions linguistiques complexes, ce qui réduira considérablement sa vitesse. Par conséquent, les développeurs de GNMT ont essayé de trouver un équilibre entre précision et rapidité de traduction.

Utilisons GT pour traduire la phrase suivante en français :

Avantages et inconvénients de Google Traduction

Dans leur maison, chaque membre de la famille a des affaires personnelles. Il y a sa grosse voiture et sa petite voiture, ses pantoufles et ses pantoufles, et ses livres et les siens.

Voici ce que GT a proposé :

Avantages et inconvénients de Google Traduction

Dans leur maison, chaque membre de la famille a des objets personnels. Il y a sa grosse voiture et sa petite voiture, ses pantoufles et ses pantoufles, ses livres et les siens.

Si on utilise à nouveau le traducteur français-anglais, on obtient cette phrase :

Dans leur maison, chaque membre de la famille a des effets personnels. Il y a sa grosse voiture et sa petite voiture, ses chaussons et ses chaussons, ses livres et les siens.

Le problème est qu’en français et dans d’autres langues romanes, les noms ont des genres, et des pronoms comme « lui » et « elle » font référence au genre des choses et non à leurs propriétaires. GT n’a pas compris le sens et a traduit la phrase en conséquence. Il est clair pour toute personne que la phrase concerne une famille dans laquelle chaque membre a des effets personnels. Par exemple, GT a utilisé le mot « sa » pour les deux voitures et « ses » pour les deux types de pantoufles. Ainsi, nous ne pouvons rien dire sur la taille de la voiture de chaque membre de la famille. En conséquence, la traduction faite par GT n’a pas réussi à transmettre le sens original.

Le logiciel a simplement ignoré les informations les plus vitales de la phrase. Les gens comprennent ces subtilités, mais GT ne traite que des lignes composées de mots et de lettres. Il traite rapidement des morceaux de texte sans en comprendre le sens. Par conséquent, un système de traduction reposant sur une technologie d’IA avancée peut être inexact et même erroné.

L’effet Eliza

Pour toute machine, appareil informatique ou logiciel, les mots comptent. Cependant, les machines ne peuvent jamais comprendre le sens profond de ces mots. Dans les années 1960, un appareil mécanique appelé Eliza a été conçu. Il a manipulé un ensemble de réponses à des questions, créant ainsi une impression de phrases intelligentes. Depuis lors, la question de savoir si une machine peut penser comme un humain s’appelle l’ effet Eliza .

Pendant des décennies, les développeurs de logiciels et les chercheurs en intelligence artificielle ont été influencés par l’effet Eliza. La plupart des utilisateurs de GT supposent que ce logiciel est capable, au moins parfois, de comprendre le sens des mots. Cependant, ce n’est pas vrai – GT contourne simplement la question de la compréhension du langage. Bien sûr, GT peut parfois proposer des phrases qui sonnent plutôt bien.

Il peut même arriver qu’un paragraphe ou deux soient parfaitement traduits, et cela crée l’illusion que GT comprend le sens du texte. Cependant, il ne faut pas oublier que GT ne peut pas penser comme un humain et n’est capable de traiter les textes que d’une certaine manière. Un programme informatique n’a ni mémoire, ni imagination, ni compréhension du sens caché des mots avec lesquels il peut fonctionner aussi rapidement.

Cependant, il n’y a aucune raison de penser que les appareils informatiques ne pourront plus penser comme les humains à l’avenir. Peut-être pourront-ils même faire d’excellentes traductions entre plusieurs langues différentes. Il est fort probable qu’ils réussiront à traduire des blagues, des jeux de mots, des romans, des poèmes et des essais. Après tout, la technologie moderne se développe très rapidement.

Tamila McDonald

Tamila McDonald a travaillé comme conseillère monétaire pour l’armée au cours des 13 dernières années. Elle a enseigné des cours monétaires privés sur tous les sujets, de la notation de crédit à la couverture d’assurance-vie, ainsi que sur tous les différents éléments de la gestion économique. Mme. McDonald est un conseiller monétaire accrédité par l’AFCPE et aide ses clients à atteindre leurs objectifs monétaires à court et à long terme.