Երեքշաբթի, 7 մայիսի, 2024 թ

աշխատասեղան v4.2.1

Root NationՆորություններՏՏ նորություններՄետայի ելույթը AI-ն ճանաչում է ավելի քան 4 խոսակցական լեզու

Մետայի ելույթը AI-ն ճանաչում է ավելի քան 4 խոսակցական լեզու

-

Meta ստեղծել է AI լեզվի մոդել, որը ChatGPT կլոն չէ: Ընկերության Massively Multilingual Speech (MMS) նախագիծը կարող է ճանաչել ավելի քան 4 խոսակցական լեզու և վերարտադրել խոսքը (տեքստից-խոսք) ավելի քան 000 լեզուներով: Ինչպես իր հրապարակայնորեն հայտարարված AI նախագծերի մեծ մասը, Meta-ն այսօր MMS-ին հասանելի է դարձնում՝ օգնելու պահպանել լեզվական բազմազանությունը և խրախուսել հետազոտողներին զարգացնել այն: «Այսօր մենք հրապարակայնորեն կիսում ենք մեր մոդելները և ծածկագիրը, որպեսզի հետազոտական ​​համայնքի մյուս անդամները կարողանան հիմնվել մեր աշխատանքի վրա», - գրել է ընկերությունը: «Այս աշխատանքի շնորհիվ մենք հույս ունենք փոքր ներդրում ունենալ աշխարհի անհավատալի լեզվական բազմազանության պահպանման գործում»։

Meta

Խոսքի ճանաչման և տեքստից խոսքի մոդելները սովորաբար պահանջում են ուսուցում հազարավոր ժամեր ձայնագրությունների վերաբերյալ՝ ուղեկցող տառադարձման պիտակներով: Բայց այն լեզուների համար, որոնք լայնորեն չեն խոսում արդյունաբերական երկրներում, որոնցից շատերը մոտակա տասնամյակների ընթացքում անհետացման վտանգի տակ են, «այդ տվյալները պարզապես գոյություն չունեն», - ասում է Մետան:

Մետան աուդիո տվյալների հավաքագրման ոչ ավանդական մոտեցում է ցուցաբերել՝ լսել է թարգմանված կրոնական տեքստերի աուդիո ձայնագրությունները: «Մենք դիմեցինք կրոնական տեքստերին, ինչպիսիք են Աստվածաշունչը, որոնք թարգմանվել են բազմաթիվ տարբեր լեզուներով, և որոնց թարգմանությունները լայնորեն ուսումնասիրվել են տեքստի վրա հիմնված թարգմանչական հետազոտությունների համար», - ասացին ընկերությունը: «Այս թարգմանություններում կան հանրությանը հասանելի ձայնագրություններ, որտեղ մարդիկ կարդում են այս տեքստերը տարբեր լեզուներով»: Աստվածաշնչից և նմանատիպ տեքստերից չնշված գրառումներ ներառելով՝ Meta-ի հետազոտողները մոդելին հասանելի լեզուների թիվը հասցրին ավելի քան 4-ի:

«Չնայած աուդիո ձայնագրությունների բովանդակությունը կրոնական է, մեր վերլուծությունը ցույց է տալիս, որ դա չի ազդում մոդելի կողմից ավելի կրոնական խոսքի արտադրության վրա»,- գրում է Մետան։ «Մենք կարծում ենք, որ դա պայմանավորված է նրանով, որ մենք օգտագործում ենք կապի ժամանակային դասակարգման (CTC) մոտեցում, որը շատ ավելի սահմանափակ է, համեմատած մեծ լեզվական մոդելների (LLM) կամ խոսքի ճանաչման հաջորդականության մոդելների հետ»: Բացի այդ, չնայած այն հանգամանքին, որ կրոնական տեքստերի մեծ մասը կարդացել են տղամարդիկ, դա չի հանգեցրել տղամարդու կողմնակալության. համակարգը հավասարապես լավ է ճանաչում և՛ կանացի, և՛ տղամարդու ձայները:

Տվյալներն ավելի օգտագործելի դարձնելու համար հավասարեցման մոդել պատրաստելուց հետո Meta-ն օգտագործեց wav2vec 2.0-ը՝ ընկերության «ինքնակառավարվող լեզվի ներկայացման ուսուցման» մոդելը, որը կարող է սովորել չպիտակավորված տվյալների վրա: Տվյալների ոչ ավանդական աղբյուրների և ինքնակառավարվող խոսքի մոդելի համադրությունը հանգեցրեց տպավորիչ արդյունքների: «Մեր արդյունքները ցույց են տալիս, որ զանգվածային բազմալեզու հեռարձակման մոդելները լավ են աշխատում՝ համեմատած առկա մոդելների հետ և 10 անգամ ավելի շատ լեզուներ են ընդգրկում»: Մասնավորապես, Meta-ն MMS-ը համեմատել է OpenAI-ի Whisper-ի հետ, և արդյունքները գերազանցել են սպասելիքները։ «Մենք պարզեցինք, որ Massively Multilingual Speech տվյալների վրա ուսուցանված մոդելները ունեն բառային սխալների կես տոկոսը, սակայն Massively Multilingual Speech-ն ընդգրկում է 11 անգամ ավելի շատ լեզուներ»:

Meta-ն զգուշացնում է, որ իր նոր մոդելները կատարյալ չեն։ «Օրինակ, կա որոշակի ռիսկ, որ խոսքից տեքստ մոդելը կարող է սխալ թարգմանել առանձին բառեր կամ արտահայտություններ»,- գրում է ընկերությունը։ «Կախված արդյունքից, դա կարող է հանգեցնել վիրավորական և/կամ ոչ ճշգրիտ խոսքի: Մենք շարունակում ենք հավատալ, որ AI համայնքի շրջանակներում համագործակցությունը կարևոր է AI տեխնոլոգիաների պատասխանատու զարգացման համար»:

Meta

Այժմ, երբ Meta-ն թողարկել է MMS բաց կոդով հետազոտության համար, այն հույս ունի հակադարձել աշխարհում լեզուների թիվը մինչև 100-ի կամ ավելի քիչ կրճատելու միտումը, որոնցից շատերն ապահովված են հիմնական տեխնոլոգիաներով: Նա տեսնում է մի աշխարհ, որտեղ օժանդակ տեխնոլոգիաները, TTS և նույնիսկ VR/AR տեխնոլոգիաները թույլ են տալիս բոլորին խոսել և սովորել իրենց մայրենի լեզվով: «Մենք պատկերացնում ենք մի աշխարհ, որտեղ տեխնոլոգիան հակառակ ազդեցությունն է ունենում՝ խրախուսելով մարդկանց պահպանել իրենց լեզուն, քանի որ նրանք կարող են մուտք գործել տեղեկատվություն և օգտագործել տեխնոլոգիաներ՝ խոսելով իրենց մայրենի լեզվով»:

Կարդացեք նաև.

ԱղբյուրEngadget
Գրանցվել
Տեղեկացնել մասին
հյուր

0 մեկնաբանություններ
Ներկառուցված ակնարկներ
Դիտել բոլոր մեկնաբանությունները
Բաժանորդագրվեք թարմացումների համար