No Language Left Behind

No Language Left Behind

Humna hiikkaa AI’tiin hammachiisa fiduu

Humna hiikkaa AI’tiin hammachiisa fiduu

Suursagalee daawwadhu
Suursagalee daawwadhu

Waa’ee No Language

Left Behind

No Language Left Behind (NLLB) gosni isaa kan jalqabaa ta’ee, pirojektii argannoo AI kan modeelota hiikkaawwan keeddeebi'amoo qulqullina qaban kallattiin Astuuriyaan, Lugaandaa, Urduu fi kanneen biroo dabalatee afaanota 200'tiin dhiyeessuu danda'an banaa kan godhudha. Filannoolee afaan isaanii ilaalcha keessa osoo hin galchiin, bakka kamittuu, carraa qabiyyee marsaariitii afaan dhalootaa isaaniitiin argachuu fi qooduu, akkasumas nama kamuu waliin haasa’uu namootaaf kennuu kan kaayyeffatedha.

Waa’ee No Language Left Behind

No Language Left Behind (NLLB) gosni isaa kan jalqabaa ta’ee, pirojektii argannoo AI kan modeelota hiikkaawwan keeddeebi'amoo qulqullina qaban kallattiin Astuuriyaan, Lugaandaa, Urduu fi kanneen biroo dabalatee afaanota 200'tiin dhiyeessuu danda'an banaa kan godhudha. Filannoolee afaan isaanii ilaalcha keessa osoo hin galchiin, bakka kamittuu, carraa qabiyyee marsaariitii afaan dhalootaa isaaniitiin argachuu fi qooduu, akkasumas nama kamuu waliin haasa’uu namootaaf kennuu kan kaayyeffatedha.

appilikeeshinii addunyaa-qabatamaatiif qorannoo ai

Hiikkaa afaanota madda-gadaanaatiif Facebook fi Instagram irratti Maloota AI raawwachiisuu

Namoota walitti fiduu irratti kutannoo qabna. Kanaafidha Facebook fi Instagram irratti hiikkaawwan afaanota madda-gadaanaa fooyyessuuf kan nuti qorannoo NLLB keenya irraa maloota fi barnoota modeeliingii fayyadamaa jirruuf. Maloota fi barnoota kana sirnoota hiikkaa oomishaa keenya irratti raawwachiisuutiin, namootni afaan filataniin ykn afaan dhalootaa isaaniitiin walitti dhufeenya caalaatti dhuga qabeessa, caalaatti hiika qabu uumuu danda’u. Fuulduratti, barnoota keenya NLLB irraa gara appilikeeshinoota Meta dabalataatti babal’isuuf abdii qabna.

APPILIKEESHINII ADDUNYAA-QABATAMAA

Metaverse hammataaf ijaaruu

Metaverse hiikamaa: sadarkaa idil-addunyaatti namoota bakka tokkotti fiduu

Yeroo metaverse’f ijaarrutti, hiikkaa barreeffamaa AR/VR yeroo-qabatamaa afaanota dhibbatti lakkaa’aman keessatti walfudhachiisuun dhimma dursi kennamuufiidha. Akeekni keenya ulaagaa ida'uu haaraa qopheessuudha—bakka guyyaa tokko namni hunduu qabiyyee, meeshaalee fi muuxannoolee addunyaa-abjaataa argachuu danda'u, afaan metaverse keessa jiru kamiinuu dandeettii nama kamuu waliin waliigaluu kan qabu. Akkasumammoo yeroo keessa, sadarkaa idil-addunyaattii namoota walitti fiduu.

APPILIKEESHINII ADDUNYAA-QABATAMAA

Wikipedia nama hundumaaf hiikuu

Odeeffannoon afaanota dabalataan akka argamu gochuu irratti gulaaltota tola oolan gargaaruu

Teknoloojiin modeelii NLLB-200 duuba jiru, amma karaa meeshaa Hiikkaa Qabiyyee Dhaabbata Wikimedia kan argamu, gulaaltotni Wikipedia yeroo odeeffannoo gara afaan dhalootaa isaaniitti fi afaan filatanitti hiikan isaan deeggaraa jira. Gulaaltotni Wikipedia afaanota bakka bu’ummaa gadaanaa qaban kan akka Afaan Lugaandaa fi Afaan Ayislaandiitiin barruulee as bahan ga’umsa olaanaan hiikuu fi gulaaluuf teknoloojii fayyadamaa jiru. Kun dubbistoota Wikipedia guutuu addunyaa irra jiraniif beekumsi dabalataa afaanota dabalataatiin akka argamu gochuuf gargaara. Modeeliin NLLB-200 madda-banaa qorattootni fi hawaasotni gulaalli Wikipedia fedha qaban hojii keenya irratti akka ijaaran akkasuma ni gargaara.

Tech itti bari

Seenaawwan Hiikkaatiin Himaman:

kitaabotni guutuu addunyaa irra jiran afaanota dhibbatti lakkaa’amanitti hiikamaniiru

Seenaawwan Hiikkaatiin Himaman:

kitaabotni guutuu addunyaa irra jiran afaanota dhibbatti lakkaa’amanitti hiikamaniiru

Humna hiikkaa AI Seenaawwan Hiikkaatiin Himamaniin itti bari, daadessa keenya pirojektii No Language Left Behind irraa guddina AI yeroo dhiyoo fayyadamu. Daadessi kun kitaabota afaanota jalqabaa isaanii kan akka Afaan Indooneeshiyaa, Somaalii fi Burmiis irraa gara afaanota dabalataatti dubbistootaaf hiika—ji'oota ittaanan keessa dhibbatti kan lakkaa'aman ni argamu. Karaa inisheetiivii kanaa, NLLB-200 modeelii AI jalqabaa barreeffama sadarkaa kanaan hiikuu danda’u ta’a.

Ganda Rooz

Suu Neeyiin Chaaniitiin

Qonnaan bulaan ganda roozii qofa oomishan keessa jiraata. Ija midhaanii haaraa ta’e kan saanduqa mana lafa jalaa isaa keessaa arge yeroo dhaabu maaltu ta’a?

Waayessaa Dubbisi
Arba Mana Koo keessa jiru

Piruum Kuntaarootiin

Yeroo ilmoon arbaa gara mana isaaniitti fiigdu, Botom xiyyeeffannaa argattu irratti hinaaffaa qabdi. Botom arbicha manaa baasuu dandeessii, ykn uumama nama mararu waliin hiriyyaa taatii?

Waayessaa Dubbisi
Maalan Ta’uu Danda’a?

Nabilaa Adaaniitiin

Mucaan dubaraa yeroo guddattu maal ta'uu akka dandeessu yaaduuf ramaddii hojii mana barumsaatiin kaka'umsa gonfatte. Abjuun ishee maal akka taatuuf ishee kakaasa?

Waayessaa Dubbisi
Saamid bosona keessatti

Mohaammed Umariitiin

Samaad bineeldota jaallata ture. Abjuun isaa guyyaa tokko guutuu bosona keessatti dabarsuu fi muka jala rafuu ture. Saamad hiriyyoota dinqisiisoo fi argannoowwan ajaa'ibaa bakka raawwatetti hojii raajii kana irratti isa hordofi. Bosona keessa seenuun baay'ee gammachiisaa ta'ee hin beeku.

Waayessaa Dubbisi
Ilma mootii fi Qeerransa

Wulaan Muliyaa Piraatiwiitiin

Ilmi mootii bosona keessatti bade. Qeerransi isa hordofaa jira. Maal godha?

Waayessaa Dubbisi

The Tech

Hiikkaan maashinii ibsameera

Modeeliin NLLB madda-banaa akkamitti kallattiin afaanota 200 hiika?

SADARKAA 1

Ijaarsa tuuta daataa ofumaa

Sadarkaa 1: Ijaarsa tuuta daataa ofumaa

Daataan leenjii kan himoota afaan naqaa fi afaan bahaa barbaadamu qabu walitti qabama

Dogoggori Uumamee Jira
Suur-sagalee kana taphachiisuuf rakkinni nu mudatee jira.

SADARKAA 2

Leenjii

Sadarkaa 2: Leenjii

Qajeelfamoota leenjii kumaatamaaf daataa leenjii walsimataa erga uumnee booda, daataan kun sarara ujummoo leenjii modeelii keenyaa keessa galchama. Modeelotni kunniin qaamota lama irraa tolfamu: lakkaddeessituu, kun hima naqaa gara bakka bu'insa vekterii keessootti kan geeddaru yeroo ta’u, lakkaddaa diigduu, kunimmoo bakka bu’insa vekterii keessoo fudhatee hima bahaa sirriitti kan maddisiisudha. Hiikkaawwan fakkeenyaa miliyoonota irratti shaakaluutiin, modeelotni hiikkaawwan caalaatti sirrii ta’an maddisiisuu baru.

Dogoggori Uumamee Jira
Suur-sagalee kana taphachiisuuf rakkinni nu mudatee jira.

SADARKAA 3

Madaallii

Sadarkaa 3: Madaallii

Dhumarratti, qulqullinni hiikkaa nu quubsuu isaa mirkaneeffachuuf, modeelii keenya tuuta hiikkaawwan himaa namaatiin hiikamaniin walbira qabnee madaalla. Kun karaa fayyadama tarreewwan summaa'ummaa kan nuti afaanota deeggaraman hundaaf ijaarruutiin jechoota arrabsoo fi qabiyyee mufachiisoo biroo adda baasuu fi calaluu hammata. Bu’aan isaa modeelii daran leenji’aa kan afaan kallattiin hiikuu danda’udha.

Dogoggori Uumamee Jira
Suur-sagalee kana taphachiisuuf rakkinni nu mudatee jira.

SADARKAA 1

Ijaarsa tuuta daataa ofumaa

SADARKAA 2

Leenjii

SADARKAA 3

Madaallii

Sadarkaa 1: Ijaarsa tuuta daataa ofumaa

Daataan leenjii kan himoota afaan naqaa fi afaan bahaa barbaadamu qabu walitti qabama

Dogoggori Uumamee Jira
Suur-sagalee kana taphachiisuuf rakkinni nu mudatee jira.

Sadarkaa 2: Leenjii

Qajeelfamoota leenjii kumaatamaaf daataa leenjii walsimataa erga uumnee booda, daataan kun sarara ujummoo leenjii modeelii keenyaa keessa galchama. Modeelotni kunniin qaamota lama irraa tolfamu: lakkaddeessituu, kun hima naqaa gara bakka bu'insa vekterii keessootti kan geeddaru yeroo ta’u, lakkaddaa diigduu, kunimmoo bakka bu’insa vekterii keessoo fudhatee hima bahaa sirriitti kan maddisiisudha. Hiikkaawwan fakkeenyaa miliyoonota irratti shaakaluutiin, modeelotni hiikkaawwan caalaatti sirrii ta’an maddisiisuu baru.

Dogoggori Uumamee Jira
Suur-sagalee kana taphachiisuuf rakkinni nu mudatee jira.

Sadarkaa 3: Madaallii

Dhumarratti, qulqullinni hiikkaa nu quubsuu isaa mirkaneeffachuuf, modeelii keenya tuuta hiikkaawwan himaa namaatiin hiikamaniin walbira qabnee madaalla. Kun karaa fayyadama tarreewwan summaa'ummaa kan nuti afaanota deeggaraman hundaaf ijaarruutiin jechoota arrabsoo fi qabiyyee mufachiisoo biroo adda baasuu fi calaluu hammata. Bu’aan isaa modeelii daran leenji’aa kan afaan kallattiin hiikuu danda’udha.

Dogoggori Uumamee Jira
Suur-sagalee kana taphachiisuuf rakkinni nu mudatee jira.

Argannoowwan

Saayinsii argannicha duuba jiru

Modeelotni hiikkaa maashinii (MT) har’aa baay’een isaanii afaanota galtee giddugaleessaa hanga olaanaa qabaniif hojjetu—kunis afaanota galtee gadaanaa qaban baay’ee isaanii duubatti dhiisa. Qorattootni Meta AI argannoowwan AI barbaachisoo sadiitiin dhimma kana furaa jiru.

Afaanota galtee-gadaanaatiif ijaarsa tuuta daataa battalaa

Yaadrimee

MT hojii barnootaa hordoffiin irratti godhamudha, kana jechuunis modeelichi daataa irraa baratu isa barbaachisa jechuudha. Hiikkaawwan fakkeenyaa kuufama daataa madda-banaa irraa yeroo baay’ee itti fayyadamamu. Falli keenya himoota kuufamoota garagaraa kan sanadoota aftokkeetiin cimdeessuutiin cimdiiwwan hiikkaa battalumatti ijaaruudha.

Danqaa

Modeelotni LASER adeemsa uumaa tuuta daataa kanaatiif oolan jalqabatti afaanota galtee giddugaleessaa hanga olaanaa qaban deeggaru, kunis afaanota madda gadaanaa qabaniif cimdiiwwan hiikkaa sirrii ta’an oomishuun akka hin danda’amne godha.

Argannoo

Qajeelfama leenjii barsiisaa-barataa irratti investii gochuutiin kana furre, kunis 1) haguuggii afaanii LASER gara afaanota 200’tti dheeressuu, fi 2) afaanota madda gadaanaatiifis dabalatee daataa hammaan baay’ee ta’e oomishuu dandeessise.

Afaanota 200 modeelii gochuu

Yaadrimee

Sirnootni MT afbaay’ee sirnoota aflamee olitti fooyya’aniiru. Kunis dandeettii "dabarsa" cimdiiwwan afaanii kan daataa leenjii baay’ee qaban irraa gara afaanota biroo maddawwan leenjii muraasa qabanitti gochuu waan dandeessisaniifidha.

Danqaa

Modeeliin walfakkaataan afaanota ulaagaalee walfakkaatoo qaban kan baay'inni isaaanii yeroodhaa gara yerootti dabalaa dhufe bakka bu'uu waan qabaniif, cimdiiwwan afaanii dhibbatti lakkaa'aman bakka tokkotti waliin leenjisuun miidhaa qaba. Itti ta'uu humnaan olii fiduu waan danda'uuf yeroo hangi tuuta daataa wal hin madaalletti kun rakkoo uuma.

Argannoo

Modeelota Makaa-Ogeessotaa Isparsii kan dandeettii qoodamaa fi addaa qabu uumnee waan jirruuf afaanotni madda gadaanaa kan daataa baay’ee hin qabne battalumatti gara dandeettii qoodamaatti deemuu danda’u. Sirnoota baramoo fooyya'ee waliin yeroo walitti dhufan, kun itti ta'uu humnaa olii ni hambisa. Dabalataan, barnoota ofiin-to'atoo fi karaa gosoota hiikkaa duubaa baay'eetiin daballii daataa hangaan hedduu fayyadamneerra.

Qulqullina hiikkaa madaaluu

Yaadrimee

Hiikkaan modeelii keenyaatiin oomishame sadarkaalee qulqullinaa keenya guutuu isaa beekuuf, isa madaaluu qabna.

Danqaa

Modeelotni hiikkaa maashinii haaluma barameetiin himoota maashiniitiin hiikaman kan namootaan hiikaman bukkee qabuutiin madaalamu, ta’ullee afaanota baay’eetiif, daataan hiikkaa amansiisaa ta’e hin argamu. Kanaafuu madaalliin dogoggora irraa bilisa ta’e hin danda’amu.

Argannoo

Amma afaanota 200 haguuguuf, uwwisa FOLRES, irkataa madaallii namaan hiikamee, 2x’tiin dheeressineerra. Karaa safartuuwwan ofumaa fi deeggarsa madaallii namaa, qulqullina hiikkaawwan keenyaa bal’inaan lakkaa’uu dandeenya.
Qajeelcha fi biloogii keenya dubbisuutiin, akkasumas pirojektii kana fuulduratti akka tarkaanfachiisnu nu gargaaruuf modeelicha buufachuutiin, waa’ee saayinsii NLLB duuba jiruu bal’inaan bari.

Qajeelcha fi biloogii keenya dubbisuutiin, akkasumas pirojektii kana fuulduratti akka tarkaanfachiisnu nu gargaaruuf modeelicha buufachuutiin, waa’ee saayinsii NLLB duuba jiruu bal’inaan bari.

Imala

Taateewwan murteessoo qorannoo
Taateewwan murteessoo qorannoo

Afaanota madda-gadaanaatiif argamuu dhabuu daataa irraa kaasee hamma qulqullina fi sirrina hiikkaatti, Meta AI danqaawwan industirii karaarraa hedduu milkaa’inaan jifachaa teknoloojii Hiikkaa Maashinii olaansaa jira. Yeroo humna hiikkaa AI’tiin hammachiisa finnutti, imalli keenya ittuma fufa.

Afaanota madda-gadaanaatiif argamuu dhabuu daataa irraa kaasee hamma qulqullina fi sirrina hiikkaatti, Meta AI danqaawwan industirii karaarraa hedduu milkaa’inaan jifachaa teknoloojii Hiikkaa Maashinii olaansaa jira. Yeroo humna hiikkaa AI’tiin hammachiisa finnutti, imalli keenya ittuma fufa.

# afaanota gadhiisamaniin taateewwan murteessoo modeela ta’an ilaali

Afaanota < 50

Afaanota 50-99

Afaanota 100

Afaanota 200

LASER (Bakka bu'insa hima agnoostikii-afaanii)

2018

Aloolli milkaa'inaa bakka bu'insa hima afbaay'ee jumlaa jalqabaa hawaasa NLP'tiif banamaatti qoodame. Lakkaddeessitichi himoota afaan 50'n hiika walfakkaataa qaban battalumatti cimdeessuuf idaatii uuma.

Lakkaddeessituuwwan Daataa

WMT-19

2019

Sirna jabaa ijaaruu gargaaruuf, hiikkaa-duubaa bal’inaan fakkeenya fudhatame, modeeliingii sarara wacaa fi tooftaalee qulqulleessa daataa fayyadamuutiin, WMT 2019 irratti modeelotni FB AI modeelota kanneen biroo hunda caalanii ture.

Modeelii

Flores V1

2019

Afaan 2 irraa eegalee, adeemsa madaallii haqaa fi cimaa beeksisuuf, Afaan Ingilizii fi afaanota galteewwan gadaanaa qaban gidduutti MT'f tuuta daataa ka'umsa godhannaa.

Tuuta daataa Madaallii

WikiMatrix

2019

Afaanota hedduu irratti cuunfaa guddaa himoota walmaddii: Modeelota hiikkaa fooyya’oo ijaaruudhaaf, cimdii afaanotaa 1,620’tiin cuunfaa Bitext himoota Wikipedia miliyoona 135.

Ijaarsa Daataa

M2M-100

2020

Daataa Afaan Ingilizii irratti osoo hin hundaa’iin cimdii afaanota 100 kamuu gidduutti kallattiin hiikuuf, modeelii hiikkaa maashinii afbaay’ee tokkicha, kan jalqabaa. Qajeelfamoota afaaanii 2,200 irratti leenji’eera— modeelota afbaay’ee kanaan duraa olitti 10x.

Modeelii

CCMatrix

2020

Modeelota hiikkaa fooyya’oo kan afaanota dabalataa, addattimmoo afaanota galtee-gadaanaan hojjetu ijaaruuf, tuuta daataa guddaa qulqullina-olaanaa, bitexts marsaariitii irratti hundaa’e: Himoota walmaddii biliyoona 4.5 cimdiiwwan afaanii 576’tiin.

Ijaarsa Daataa

LASER 2

2020

Himoota afaan 100'n hiika walfakkaataa qaban battalumatti cimdeessuuf idaatii uuma.

Lakkaddeessituuwwan Daataa

WMT-21

2021

Yeroo jalqabaatiif, afaanota galteewwan gadaanaa fi olaanaa qaban lamaaniifuu hiikkaa filatamaa dhiyeessuutiin, cimdiiwwan afaanii 14 keessaa 10 irratti modeelota aflamee filatamoo addatti leenji’an caalee modeelii afbaay’ee qeenxee WMT 2021 injifate.

Modeelii

FLORES-101

2021

FLORES-101 gosni isaa kan jalqabaa ta'ee, tuuta daataa madaallii baay'ee gara baay'ee kan afaanota 101 haguugu yoo ta'u, kunis qorattootni modeelota hiikkaa afbaay'ee kan akka M2M-100 ariitiin akka yaalaniifi fooyyessan isaan dandeessisa.

Tuuta daataa Madaallii

NLLB-200

2022

Modeeliin NLLB afaanota 200 hiika.

Modeelii

FLORES-200

2021

Babal’inni tuuta daataa madaallii FLORES amma afaanota 200 haguuga

Tuuta daataa Madaallii

NLLB-Data-200

2022

Afaanota 200’tiif daataa leenjii ijaarame fi gadhiisame

Tuuta daataa Madaallii

LASER 3

2022

Himoota afaan 200'n hiika walfakkaataa qaban battalumatti cimdeessuuf idaatii uuma.

Lakkaddeessituuwwan Daataa

Afaanota < 50

Afaanota 50-100

Afaanota 100

Afaanota 200

LASER (Bakka bu'insa hima agnoostikii-afaanii)

2018

Aloolli milkaa'inaa bakka bu'insa hima afbaay'ee jumlaa jalqabaa hawaasa NLP'tiif banamaatti qoodame. Lakkaddeessitichi himoota afaan 50'n hiika walfakkaataa qaban battalumatti cimdeessuuf idaatii uuma.

Lakkaddeessituuwwan Daataa

WMT-19

2019

Sirna jabaa ijaaruu gargaaruuf, hiikkaa-duubaa bal’inaan fakkeenya fudhatame, modeeliingii sarara wacaa fi tooftaalee qulqulleessa daataa fayyadamuutiin, WMT 2019 irratti modeelotni FB AI modeelota kanneen biroo hunda caalanii ture.

Modeelii

Flores V1

2019

Afaan 2 irraa eegalee, adeemsa madaallii haqaa fi cimaa beeksisuuf, Afaan Ingilizii fi afaanota galteewwan gadaanaa qaban gidduutti MT'f tuuta daataa ka'umsa godhannaa.

Tuuta daataa Madaallii

WikiMatrix

2019

Afaanota hedduu irratti cuunfaa guddaa himoota walmaddii: Modeelota hiikkaa fooyya’oo ijaaruudhaaf, cimdii afaanotaa 1,620’tiin cuunfaa Bitext himoota Wikipedia miliyoona 135.

Ijaarsa Daataa

M2M-100

2020

Daataa Afaan Ingilizii irratti osoo hin hundaa’iin cimdii afaanota 100 kamuu gidduutti kallattiin hiikuuf, modeelii hiikkaa maashinii afbaay’ee tokkicha, kan jalqabaa. Qajeelfamoota afaaanii 2,200 irratti leenji’eera— modeelota afbaay’ee kanaan duraa olitti 10x.

Modeelii

CCMatrix

2020

Modeelota hiikkaa fooyya’oo kan afaanota dabalataa, addattimmoo afaanota galtee-gadaanaan hojjetu ijaaruuf, tuuta daataa guddaa qulqullina-olaanaa, bitexts marsaariitii irratti hundaa’e: Himoota walmaddii biliyoona 4.5 cimdiiwwan afaanii 576’tiin.

Ijaarsa Daataa

LASER 2

2020

Himoota afaan 100'n hiika walfakkaataa qaban battalumatti cimdeessuuf idaatii uuma.

Lakkaddeessituuwwan Daataa

WMT-21

2021

Yeroo jalqabaatiif, afaanota galteewwan gadaanaa fi olaanaa qaban lamaaniifuu hiikkaa filatamaa dhiyeessuutiin, cimdiiwwan afaanii 14 keessaa 10 irratti modeelota aflamee filatamoo addatti leenji’an caalee modeelii afbaay’ee qeenxee WMT 2021 injifate.

Modeelii

FLORES-101

2021

FLORES-101 gosni isaa kan jalqabaa ta'ee, tuuta daataa madaallii baay'ee gara baay'ee kan afaanota 101 haguugu yoo ta'u, kunis qorattootni modeelota hiikkaa afbaay'ee kan akka M2M-100 ariitiin akka yaalaniifi fooyyessan isaan dandeessisa.

Tuuta daataa Madaallii

NLLB-200

2022

Modeeliin NLLB afaanota 200 hiika.

Modeelii

FLORES-200

2021

Babal’inni tuuta daataa madaallii FLORES amma afaanota 200 haguuga

Tuuta daataa Madaallii

NLLB-Data-200

2022

Afaanota 200’tiif daataa leenjii ijaarame fi gadhiisame

Tuuta daataa Madaallii

LASER 3

2022

Himoota afaan 200'n hiika walfakkaataa qaban battalumatti cimdeessuuf idaatii uuma.

Lakkaddeessituuwwan Daataa

From Assamese, Balinese and Estonian…to Icelandic, Igbo and more. 200 languages and counting…

Have a look at the full list of languages our NLLB-200 model supports—with 150 low-resource languages included. More will be added to this list as we, and our community, continue on this journey of inclusiveness through AI translation.

Full list of supported languages

Acehnese (Latin script)

Arabic (Iraqi/Mesopotamian)

Arabic (Yemen)

Arabic (Tunisia)

Afrikaans

Arabic (Jordan)

Akan

Amharic

Arabic (Lebanon)

Arabic (MSA)

Arabic (Modern Standard Arabic)

Arabic (Saudi Arabia)

Arabic (Morocco)

Arabic (Egypt)

Assamese

Asturian

Awadhi

Aymara

Crimean Tatar

Welsh

Danish

German

French

Friulian

Fulfulde

Dinka(Rek)

Dyula

Dzongkha

Greek

English

Esperanto

Estonian

Basque

Ewe

Faroese

Iranian Persian

Icelandic

Italian

Javanese

Japanese

Kabyle

Kachin | Jinghpo

Kamba

Kannada

Kashmiri (Arabic script)

Kashmiri (Devanagari script)

Georgian

Kanuri (Arabic script)

Kanuri (Latin script)

Kazakh

Kabiye

Thai

Khmer

Kikuyu

South Azerbaijani

North Azerbaijani

Bashkir

Bambara

Balinese

Belarusian

Bemba

Bengali

Bhojpuri

Banjar (Latin script)

Tibetan

Bosnian

Buginese

Bulgarian

Catalan

Cebuano

Czech

Chokwe

Central Kurdish

Fijian

Finnish

Fon

Scottish Gaelic

Irish

Galician

Guarani

Gujarati

Haitian Creole

Hausa

Hebrew

Hindi

Chhattisgarhi

Croatian

Hugarian

Armenian

Igobo

IIocano

Indonesian

Kinyarwanda

Kyrgyz

Kimbundu

Konga

Korean

Kurdish (Kurmanji)

Lao

Latvian (Standard)

Ligurian

Limburgish

Lingala

Lithuanian

Lombard

Latgalian

Luxembourgish

Luba-Kasai

Ganda

Dholuo

Mizo

Full list of supported languages

Acehnese (Latin script)

Arabic (Iraqi/Mesopotamian)

Arabic (Yemen)

Arabic (Tunisia)

Afrikaans

Arabic (Jordan)

Akan

Amharic

Arabic (Lebanon)

Arabic (MSA)

Arabic (Modern Standard Arabic)

Arabic (Saudi Arabia)

Arabic (Morocco)

Arabic (Egypt)

Assamese

Asturian

Awadhi

Aymara

Crimean Tatar

Welsh

Danish

German

French

Friulian

Fulfulde

Dinka(Rek)

Dyula

Dzongkha

Greek

English

Esperanto

Estonian

Basque

Ewe

Faroese

Iranian Persian

Icelandic

Italian

Javanese

Japanese

Kabyle

Kachin | Jinghpo

Kamba

Kannada

Kashmiri (Arabic script)

Kashmiri (Devanagari script)

Georgian

Kanuri (Arabic script)

Kanuri (Latin script)

Kazakh

Kabiye

Thai

Khmer

Kikuyu

South Azerbaijani

North Azerbaijani

Bashkir

Bambara

Balinese

Belarusian

Bemba

Bengali

Bhojpuri

Banjar (Latin script)

Tibetan

Bosnian

Buginese

Bulgarian

Catalan

Cebuano

Czech

Chokwe

Central Kurdish

Fijian

Finnish

Fon

Scottish Gaelic

Irish

Galician

Guarani

Gujarati

Haitian Creole

Hausa

Hebrew

Hindi

Chhattisgarhi

Croatian

Hugarian

Armenian

Igobo

IIocano

Indonesian

Kinyarwanda

Kyrgyz

Kimbundu

Konga

Korean

Kurdish (Kurmanji)

Lao

Latvian (Standard)

Ligurian

Limburgish

Lingala

Lithuanian

Lombard

Latgalian

Luxembourgish

Luba-Kasai

Ganda

Dholuo

Mizo

Afaanotni 200 modeelii NLLB-200’tiin hiikamaniiru, kunis modeelii kanaan duraa keenya 2x dha

Modeeliin dhumaa keenyi modeelii ammayyaa kanaan duraa caalaa fooyya’insa raawwii +44% BLEU qaba

Afaanotni 75 kanaan dura sirnoota hiikkaa daldalaatiin hin deeggaramne ture

Himoota walmaddii biliyoona 18, modeelii kanaan duraa kan ta’e modeelii M2M-100’n olitti daataa leenjii dabalataa 2.5x

Modeelii hiikkaa maashinii madda-banaa guddaa 54B, modeelii kanaan duraa M2M-100 olitti baay’ina ulaagaalee 5x daran guddaa

Kallattiiwwan hiikkaa 40,000 modeelii qeenxeen deeggarame—dandeettii irkataa kanaan duraa 4x ol

Guddinni qorannoo NLLB irraa hiikkaawwan biliyoona 25 ol ta’an kan guyyuun Maddisa Oduu Facebook, Instagram, fi hujeeffanoo keenya biroo irratti dhiyaatan deeggara

Afaanotni 200 modeelii NLLB-200’tiin hiikamaniiru, kunis modeelii kanaan duraa keenya 2x dha

Modeeliin dhumaa keenyi modeelii ammayyaa kanaan duraa caalaa fooyya’insa raawwii +44% BLEU qaba

Afaanotni 75 kanaan dura sirnoota hiikkaa daldalaatiin hin deeggaramne ture

Himoota walmaddii biliyoona 18, modeelii kanaan duraa kan ta’e modeelii M2M-100’n olitti daataa leenjii dabalataa 2.5x

Modeelii hiikkaa maashinii madda-banaa guddaa 54B, modeelii kanaan duraa M2M-100 olitti baay’ina ulaagaalee 5x daran guddaa

Kallattiiwwan hiikkaa 40,000 modeelii qeenxeen deeggarame—dandeettii irkataa kanaan duraa 4x ol

Guddinni qorannoo NLLB irraa hiikkaawwan biliyoona 25 ol ta’an kan guyyuun Maddisa Oduu Facebook, Instagram, fi hujeeffanoo keenya biroo irratti dhiyaatan deeggara

Bal’inaan Bari

Waliin, No Language Left Behind fuulduratti haa tarkaanfachiisnu.

Waa'ee NLLB dabalataan waanti barattu ni jira, akkasumas inumaayyuu isaan waanti raawwatamu baay'eetu jira. Ibsa bal’aatiif qajeelcha fi biloogii keenya dubbisi, akkasumas pirojektii kana fuulduratti akka tarkaanfachiisnu nu gargaaruuf modeelicha buufadhu. Afaanota 200 irra geenyurree, reefu eegaluu keenyadha. Daandii hiikkaa fi hammachiisaa barbaachisaa kana yeroo itti fufnutti, nutti makami akkasumas nu waliin ijaari.