Facebook innove avec la première IA qui traduit 100 langues sans dépendre de l'anglais

Written by @ange, 2022-03-21, Last update: 2024-04-27

Présentation du premier modèle d’IA qui traduit 100 langues sans dépendre de l’anglais.

<br> * Facebook AI présente M2M-100, le premier modèle de traduction
automatique multilingue (MMT) qui peut traduire entre n’importe quelle
paire de 100 langues sans s’appuyer sur des données en anglais. C’est
open source ici . * Lors
de la traduction, par exemple, du chinois vers le français, la plupart
des modèles multilingues centrés sur l’anglais s’entraînent du chinois
vers l’anglais et de l’anglais vers le français, car les données de
formation en anglais sont les plus largement disponibles. Le model de
Facebook modèle s’entraine directement sur des données chinoises vers
françaises pour mieux préserver le sens. Il surpasse les systèmes
centrés sur l’anglais de 10 points sur la métrique BLEU largement
utilisée pour évaluer les traductions automatiques. * M2M-100 est
formé sur un total de 2 200 instructions linguistiques, soit 10 fois
plus que les meilleurs modèles multilingues centrés sur l’anglais. Le
déploiement de M2M-100 améliorera la qualité des traductions pour des
milliards de personnes, en particulier celles qui parlent des langues à
faibles ressources. * Cette étape importante est l’aboutissement
d’années de travail fondamental de Facebook AI dans la traduction
automatique. Aujourd’hui, nous partageons des détails sur la façon dont
nous avons construit un ensemble de données et un modèle de formation
MMT plus diversifiés pour 100 langues. Nous publions également le modèle, la formation et la configuration d’évaluation pour aider d’autres chercheurs à reproduire et à faire progresser les modèles multilingues.

Briser les barrières linguistiques grâce à la traduction automatique (TA) est l’un des moyens les plus importants de rassembler les gens, de fournir des informations faisant autorité sur COVID-19 et de les protéger des contenus préjudiciables. Aujourd’hui, nous générons en moyenne 20 milliards de traductions chaque jour sur Facebook News Feed, grâce à nos récents développements dans la traduction automatique à faibles ressources et aux avancées récentes pour évaluer la qualité de la traduction.

Les systèmes de TA typiques nécessitent la création de modèles d’IA distincts pour chaque langue et chaque tâche, mais cette approche ne s’adapte pas efficacement sur Facebook, où les gens publient du contenu dans plus de 160 langues sur des milliards de publications. Les systèmes multilingues avancés peuvent traiter plusieurs langues à la fois, mais compromettent la précision en s’appuyant sur des données en anglais pour
combler le fossé entre les langues source et cible. Nous avons besoin d’un modèle de traduction automatique multilingue (MMT) capable de traduire n’importe quelle langue pour mieux servir notre communauté, dont près des deux tiers utilisent une langue autre que l’anglais.

Au terme de nombreuses années de recherche en TA sur Facebook, nous sommes ravis d’annoncer une étape importante : le premier modèle unique massivement MMT qui peut directement traduire 100 × 100 langues dans n’importe quelle direction sans se fier uniquement aux données centrées sur l’anglais. Notre modèle multilingue unique fonctionne aussi bien que les modèles bilingues traditionnels et a obtenu une amélioration de 10 points BLEU par rapport aux modèles multilingues centrés sur l’anglais. En utilisant de nouvelles stratégies d’exploration pour créer des données de traduction, nous avons construit le premier ensemble de données véritablement « plusieurs-à-plusieurs » avec 7,5 milliards de phrases pour 100 langues. Nous avons utilisé plusieurs techniques de mise à l’échelle pour construire un modèle universel avec 15 milliards de paramètres, qui capture les informations des langues apparentées et reflète un script plus diversifié de langues et de morphologie. Nous sommes en train d’ouvrir ce travail

La suite c’est par ici

About the blog

Tech News

Des informations sur la tech

About the author

ANGE ANGE

Passionnée de tech

From the same author


Ca y est le nouveau decodeur H.266-VVC est dehors
Ca y est le nouveau decodeur H.266-VVC est dehors

Après avoir consacré plusieurs années à ses recherches et à sa normalisation Fraunhofer HHI célèbre la publication et l'adoption officielle de la nouvelle norme mondiale de codage vidéo H. 266 / Codage vidéo polyvalent (VVC).

Ennio Morricone meurt à 91 ans
Ennio Morricone meurt à 91 ans

Reconnu pour avoir marqué les westerns spaghetti de Sergio Leone, le lauréat d'un Oscar a également produit les sons et la musique de Ennio Morricone, le lauréat d'un Oscar dont les partitions obsédantes et inventives ont habilement accentué la tension frémissante et sans dialogue des westerns spaghetti dirigés par Sergio Leone, est décédé. Il avait 91 ans.

Le secret de la production de la PS
Le secret de la production de la PS

L'arme secrète de la PlayStation: une usine presque entièrement automatisée. La PlayStation de Sony a gagné des centaines de millions de fans à travers le monde depuis son lancement en 1994.

David Greader nous parle de la force du travail dans son nouveau livre
David Greader nous parle de la force du travail dans son nou

Le nouveau livre de l'anthropologue David Graeber accuse l'économie mondiale de créer des emplois insignifiants qui tuent l'esprit humain.

Le processeur ARM ça te dit quelque chose?
Le processeur ARM ça te dit quelque chose?

Les processeurs ARM ont longtemps dominé le monde mobile, presque tous les téléphones et tablettes Apple et Android utilisent un modèle de processeur ARM

La police de Chicago bloque l’accès à ses données
La police de Chicago bloque l’accès à ses données

Alors que Chicago chancelait cette semaine d'un week jeunes enfants, le surintendant de la police David Brown a doublé son approche pour endiguer la violence lors d'une conférence de presse lundi.

Ils sont devenus riche grâce à la science
Ils sont devenus riche grâce à la science

Un jeu de poker de longue date avec un groupe d'étudiants en médecine du sud-ouest de l'Université du Texas à Dallas a réuni Gaurab Chakrabarti et Sean Hunt. Wenly Ruan, partenaire du laboratoire de dissection de Chakrabarti et petite amie de Hunt (aujourd'hui épouse), était le lien.

Reddit utilise DRM pour les empreintes digitales
Reddit utilise DRM pour les empreintes digitales

Pourquoi Reddit voulait-il utiliser DRM? Ce pop Pour le savoir, analyser son code souce paraisait etre la meilleure soultion.

Les rencontres en ligne peuvent ils aboutir à un mariage?
Les rencontres en ligne peuvent ils aboutir à un mariage?

Une conséquence fascinante d'Internet est à quel point il a rapproché le problème de la recherche de âme sœur, et à quel point les hypothèses du problème du mariage stable

Linux Mint abandonne les packages Ubuntu Snap
Linux Mint abandonne les packages Ubuntu Snap

Le Linux Mint projet a fait des menaces pour empêcher activement Ubuntu Snap packages d'installer le système de gestion package APT sans le consentement de l'utilisateur

Les causes de la plainte du MIT et Harvard contre les nouveaux règlements de l'ICE
Les causes de la plainte du MIT et Harvard contre les nouvea

Ce matin, en réponse, le MIT et Harvard ont déposé conjointement une plainte contre ICE et le département américain de la Sécurité intérieure devant un tribunal fédéral du Massachusetts.

Un blogueur rationaliste controversé est devenu une mascotte et un martyr dans une lutte contre le New York Times
Un blogueur rationaliste controversé est devenu une mascotte

Un blogueur rationaliste controversé est devenu une mascotte et un martyr dans une lutte contre le New York Times

Les tests de développement des logiciels
Les tests de développement des logiciels

L'importance des tests dans le développement de logiciels modernes est  vraiment difficile à surestimer.

Disfonctionnement des authentifications à deux point de Google
Disfonctionnement des authentifications à deux point de Goog

Il y a quelques jours, Amos, a connu un événement d'extraction de mot de passe par des pirates informatiques et, par conséquent, a été laissé de sa poche par quelques centaines d'euros.

Testons un peu de quoi notre ordinateur est capable
Testons un peu de quoi notre ordinateur est capable

Voyons à quel point vous connaissez les ordinateurs! Tous ces programmesont un nombre variable en eux.

On the same topic


Le choix d'un Mac devient de plus en plus compliqué
Le choix d'un Mac devient de plus en plus compliqué

Lors de la conférence mondiale des développeurs de cette année, Apple a annoncé son intention de passer des processeurs Intel aux Mac alimentés par ses propres puces Apple Silicon à partir de la fin de 2020.

La défaillance de L' AirPod
La défaillance de L' AirPod

La première génération des AirPods était généralement considérée comme un produit parfait. **"_Apple à son meilleur

GPT-3 d'OpenAI une innovation dans le monde de la robotique
GPT-3 d'OpenAI une innovation dans le monde de la robotique

OpenAI, une société de recherche à but non lucratif sur l'intelligence artificielle soutenue par Peter

Le secteur du transport aérien innove
Le secteur du transport aérien innove

L'idée de «mobilité aérienne urbaine» est assez bien ancrée dans l'esprit de la plupart des gens. Ce sont des voitures volantes futuristes qui sillonnent une ville, décollant peut-être d'un jardin

Le tout premier avion à décollage automatique vient de terminer les tests de roulage
Le tout premier avion à décollage automatique vient de termi

Le tout premier avion à décollage automatique vient de terminer les tests de roulage

Rite Aid a déployé des systèmes de reconnaissance faciale dans des magasins
Rite Aid a déployé des systèmes de reconnaissance faciale da

Rite Aid a déployé des systèmes de reconnaissance faciale dans des magasins

Assemblage du plus grand projet de fusion nucleaire
Assemblage du plus grand projet de fusion nucleaire

Assemblage du plus grand projet de fusion nucleaire

Les astronautes de la NASA dans la capsule SpaceX font leur premier atterrissage sur l'eau
Les astronautes de la NASA dans la capsule SpaceX font leur

Les astronautes de la NASA dans la capsule SpaceX font leur premier atterrissage sur l'eau

Tesla va bientôt activer la plus grande machine de coulée monocoque au monde
Tesla va bientôt activer la plus grande machine de coulée mo

Tesla va bientôt activer la plus grande machine de coulée monocoque au monde

Mise à jour l'iMac 27 pouces
Mise à jour l'iMac 27 pouces

Le bureau ultime offre désormais des performances beaucoup plus rapides, des SSD sur toute la gamme,

Facebook licencie un employé recueillant des preuves de traitement de faveur
Facebook licencie un employé recueillant des preuves de trai

Facebook licencie un employé recueillant des preuves de traitement de faveur

Un problème technique a vu près de 16 000 cas de Covid-19 non signalés en Angleterre
Un problème technique a vu près de 16 000 cas de Covid-19 no

Un problème technique a vu près de 16 000 cas de Covid-19 non signalés en Angleterre

NVIDIA annonce la sortie du JETSON NANO 2 GO
NVIDIA annonce la sortie du JETSON NANO 2 GO

NVIDIA annonce la sortie du JETSON NANO 2 GO

L'Inde met sur pied le premier test Covid-19 sur papier
L'Inde met sur pied le premier test Covid-19 sur papier

L'Inde met sur pied le premier test Covid-19 sur papier

La DDR5-4800 de 64 Go de SK Hynix arrive
La DDR5-4800 de 64 Go de SK Hynix arrive

La DDR5-4800 de 64 Go de SK Hynix va bientôt sortir


Copyright © 2020 | Powered By | Yaknema SARL