Meta-ն արհեստական ինտելեկտի վրա հիմնված նոր գեներատոր է ստեղծել

Արհեստական ինտելեկտի (AI) տեքստից պատկեր գեներատորները վերջին ամիսներին դարձել են վերնագրեր, սակայն հետազոտողներն արդեն անցել են հաջորդ սահմանին՝ AI-ով աշխատող տեքստից վիդեո գեներատորներ: Meta-ի հետազոտողները հրապարակայնորեն ներկայացրել են նման նոր գեներատոր, հաղորդում է The Verge-ը։

Meta-ի մեքենայական ուսուցման ինժեներական թիմը ներկայացրել նոր համակարգ, որը կոչվում է Make-A-Video: Այս AI մոդելը թույլ է տալիս օգտվողներին մուտքագրել տեսարանի մոտավոր նկարագրությունը, և այն ստեղծում է կարճ տեսանյութ, որը համապատասխանում է նրանց տեքստին: Տեսանյութերը ակնհայտորեն արհեստական են՝ մշուշոտ առարկաներով և աղավաղված անիմացիաներով, բայց դեռևս նշանակալի ձեռքբերում են արհեստական ինտելեկտի բովանդակության ստեղծման ոլորտում։

- Գովազդ -

Իր գրառման մեջ Facebook Meta-ի գործադիր տնօրեն Մարկ Ցուկերբերգը նկարագրել է աշխատանքը որպես «զարմանալի առաջընթաց»՝ հավելելով. «Տեսանյութ ստեղծելը շատ ավելի դժվար է, քան լուսանկարները, քանի որ յուրաքանչյուր պիքսելը ճիշտ արտադրելուց բացի, համակարգը պետք է նաև կանխատեսի, թե ինչպես են դրանք փոխվելու ժամանակի ընթացքում»:

Հոլովակները տևում են ոչ ավելի, քան հինգ վայրկյան և ձայն չեն պարունակում, բայց ընդգրկում են հուշումների հսկայական շրջանակ: Թեև պարզ է, որ տեսանյութը ստեղծվել է համակարգչային տեխնիկայով, նման AI մոդելների որակը մոտ ապագայում արագորեն կբարելավվի: Ընդամենը մի քանի տարվա ընթացքում AI պատկերների գեներատորները գրեթե անհասկանալի նկարներ ստեղծելուց անցել են ֆոտոռեալիստական բովանդակության: Եվ թեև տեսանյութում առաջընթացը կարող է ավելի դանդաղ լինել՝ հաշվի առնելով թեմայի գրեթե անսահման բարդությունը, անխափան վիդեո ստեղծման մրցանակը շատ կազմակերպությունների և ընկերությունների կխրախուսի զգալի ռեսուրսներ ներդնել նախագծում:

Ընկերությունն ասում է, որ նախատեսում է թողարկել համակարգի ցուցադրական տարբերակը, սակայն չի հայտնել, թե երբ և ինչպես այն կներդրվի: Մոդելը նկարագրող հոդվածում Meta-ի հետազոտողները նշում են, որ Make-A-Video-ն ուսուցանվում է պատկեր-վերնագիր զույգերով, ինչպես նաև չպիտակավորված տեսանյութերի վրա:

Ուսուցման բովանդակությունը ստացվել է տվյալների երկու հավաքածուից՝ WebVid-10M և HD-VILA-100M, որոնք միասին պարունակում են միլիոնավոր տեսանյութեր և ընդգրկում են հարյուր հազարավոր ժամերի տեսագրություններ: Ի դեպ, սա ներառում է ֆոնդային կադրերը:

Հետազոտողները նշում են, որ մոդելն ունի բազմաթիվ տեխնիկական սահմանափակումներ, բացի մշուշոտ շրջանակներից և ցրված անիմացիաներից: Make-A-Video-ն թողարկում է 16 կադր վիդեո 64×64 պիքսել լուծաչափով, որոնք այնուհետև չափափոխվում են՝ օգտագործելով առանձին AI մոդելի 768×768 պիքսել:

Դուք կարող եք օգնել Ուկրաինային պայքարել ռուս զավթիչների դեմ։ Դա անելու լավագույն միջոցը Ուկրաինայի զինված ուժերին միջոցների նվիրաբերումն է Savelife կամ պաշտոնական էջի միջոցով NBU.

- Գովազդ -

Հետաքրքիր է նաև.

Մետան ցուցադրեց AI-ն՝ նկարագրության հիման վրա տեսանյութեր ստեղծելու համար