Written by @ange, 2022-03-21, Last update: 2024-04-27
<br>
* Facebook AI présente M2M-100, le premier modèle de traduction
automatique multilingue (MMT) qui peut traduire entre n’importe quelle
paire de 100 langues sans s’appuyer sur des données en anglais. C’est
open source ici .
* Lors
de la traduction, par exemple, du chinois vers le français, la plupart
des modèles multilingues centrés sur l’anglais s’entraînent du chinois
vers l’anglais et de l’anglais vers le français, car les données de
formation en anglais sont les plus largement disponibles. Le model de
Facebook modèle s’entraine directement sur des données chinoises vers
françaises pour mieux préserver le sens. Il surpasse les systèmes
centrés sur l’anglais de 10 points sur la métrique BLEU largement
utilisée pour évaluer les traductions automatiques.
* M2M-100 est
formé sur un total de 2 200 instructions linguistiques, soit 10 fois
plus que les meilleurs modèles multilingues centrés sur l’anglais. Le
déploiement de M2M-100 améliorera la qualité des traductions pour des
milliards de personnes, en particulier celles qui parlent des langues à
faibles ressources.
* Cette étape importante est l’aboutissement
d’années de travail fondamental de Facebook AI dans la traduction
automatique. Aujourd’hui, nous partageons des détails sur la façon dont
nous avons construit un ensemble de données et un modèle de formation
MMT plus diversifiés pour 100 langues. Nous publions également le modèle, la formation et la configuration d’évaluation pour aider d’autres chercheurs à reproduire et à faire progresser les modèles multilingues.
Briser les barrières linguistiques grâce à la traduction automatique (TA) est l’un des moyens les plus importants de rassembler les gens, de fournir des informations faisant autorité sur COVID-19 et de les protéger des contenus préjudiciables. Aujourd’hui, nous générons en moyenne 20 milliards de traductions chaque jour sur Facebook News Feed, grâce à nos récents développements dans la traduction automatique à faibles ressources et aux avancées récentes pour évaluer la qualité de la traduction.
Les systèmes de TA typiques nécessitent la création de modèles d’IA distincts pour chaque langue et chaque tâche, mais cette approche ne s’adapte pas efficacement sur Facebook, où les gens publient du contenu dans plus de 160 langues sur des milliards de publications. Les systèmes multilingues avancés peuvent traiter plusieurs langues à la fois, mais compromettent la précision en s’appuyant sur des données en anglais pour
combler le fossé entre les langues source et cible. Nous avons besoin d’un modèle de traduction automatique multilingue (MMT) capable de traduire n’importe quelle langue pour mieux servir notre communauté, dont près des deux tiers utilisent une langue autre que l’anglais.
Au terme de nombreuses années de recherche en TA sur Facebook, nous sommes ravis d’annoncer une étape importante : le premier modèle unique massivement MMT qui peut directement traduire 100 × 100 langues dans n’importe quelle direction sans se fier uniquement aux données centrées sur l’anglais. Notre modèle multilingue unique fonctionne aussi bien que les modèles bilingues traditionnels et a obtenu une amélioration de 10 points BLEU par rapport aux modèles multilingues centrés sur l’anglais. En utilisant de nouvelles stratégies d’exploration pour créer des données de traduction, nous avons construit le premier ensemble de données véritablement « plusieurs-à-plusieurs » avec 7,5 milliards de phrases pour 100 langues. Nous avons utilisé plusieurs techniques de mise à l’échelle pour construire un modèle universel avec 15 milliards de paramètres, qui capture les informations des langues apparentées et reflète un script plus diversifié de langues et de morphologie. Nous sommes en train d’ouvrir ce travail
La suite c’est par ici
Après avoir consacré plusieurs années à ses recherches et à sa normalisation Fraunhofer HHI célèbre la publication et l'adoption officielle de la nouvelle norme mondiale de codage vidéo H. 266 / Codage vidéo polyvalent (VVC).
Reconnu pour avoir marqué les westerns spaghetti de Sergio Leone, le lauréat d'un Oscar a également produit les sons et la musique de Ennio Morricone, le lauréat d'un Oscar dont les partitions obsédantes et inventives ont habilement accentué la tension frémissante et sans dialogue des westerns spaghetti dirigés par Sergio Leone, est décédé. Il avait 91 ans.
L'arme secrète de la PlayStation: une usine presque entièrement automatisée. La PlayStation de Sony a gagné des centaines de millions de fans à travers le monde depuis son lancement en 1994.
Le nouveau livre de l'anthropologue David Graeber accuse l'économie mondiale de créer des emplois insignifiants qui tuent l'esprit humain.
Les processeurs ARM ont longtemps dominé le monde mobile, presque tous les téléphones et tablettes Apple et Android utilisent un modèle de processeur ARM
Alors que Chicago chancelait cette semaine d'un week jeunes enfants, le surintendant de la police David Brown a doublé son approche pour endiguer la violence lors d'une conférence de presse lundi.
Un jeu de poker de longue date avec un groupe d'étudiants en médecine du sud-ouest de l'Université du Texas à Dallas a réuni Gaurab Chakrabarti et Sean Hunt. Wenly Ruan, partenaire du laboratoire de dissection de Chakrabarti et petite amie de Hunt (aujourd'hui épouse), était le lien.
Pourquoi Reddit voulait-il utiliser DRM? Ce pop Pour le savoir, analyser son code souce paraisait etre la meilleure soultion.
Une conséquence fascinante d'Internet est à quel point il a rapproché le problème de la recherche de âme sœur, et à quel point les hypothèses du problème du mariage stable
Le Linux Mint projet a fait des menaces pour empêcher activement Ubuntu Snap packages d'installer le système de gestion package APT sans le consentement de l'utilisateur
Ce matin, en réponse, le MIT et Harvard ont déposé conjointement une plainte contre ICE et le département américain de la Sécurité intérieure devant un tribunal fédéral du Massachusetts.
Un blogueur rationaliste controversé est devenu une mascotte et un martyr dans une lutte contre le New York Times
L'importance des tests dans le développement de logiciels modernes est vraiment difficile à surestimer.
Il y a quelques jours, Amos, a connu un événement d'extraction de mot de passe par des pirates informatiques et, par conséquent, a été laissé de sa poche par quelques centaines d'euros.
Voyons à quel point vous connaissez les ordinateurs! Tous ces programmesont un nombre variable en eux.
Lors de la conférence mondiale des développeurs de cette année, Apple a annoncé son intention de passer des processeurs Intel aux Mac alimentés par ses propres puces Apple Silicon à partir de la fin de 2020.
La première génération des AirPods était généralement considérée comme un produit parfait. **"_Apple à son meilleur
OpenAI, une société de recherche à but non lucratif sur l'intelligence artificielle soutenue par Peter
L'idée de «mobilité aérienne urbaine» est assez bien ancrée dans l'esprit de la plupart des gens. Ce sont des voitures volantes futuristes qui sillonnent une ville, décollant peut-être d'un jardin
Le tout premier avion à décollage automatique vient de terminer les tests de roulage
Rite Aid a déployé des systèmes de reconnaissance faciale dans des magasins
Assemblage du plus grand projet de fusion nucleaire
Les astronautes de la NASA dans la capsule SpaceX font leur premier atterrissage sur l'eau
Tesla va bientôt activer la plus grande machine de coulée monocoque au monde
Le bureau ultime offre désormais des performances beaucoup plus rapides, des SSD sur toute la gamme,
Facebook licencie un employé recueillant des preuves de traitement de faveur
Un problème technique a vu près de 16 000 cas de Covid-19 non signalés en Angleterre
NVIDIA annonce la sortie du JETSON NANO 2 GO
L'Inde met sur pied le premier test Covid-19 sur papier
La DDR5-4800 de 64 Go de SK Hynix va bientôt sortir
Copyright © 2020 | Powered By | Yaknema SARL