Երկուշաբթի, 13 մայիսի, 2024 թ

աշխատասեղան v4.2.1

Root NationՆորություններՏՏ նորություններԻնչպես ֆիլմերում. Google-ի նոր լուսանկարների մշակման արհեստական ​​ինտելեկտը իրականություն է դարձնում դրանց մասշտաբը և բարելավումը

Ինչպես ֆիլմերում. Google-ի նոր լուսանկարների մշակման արհեստական ​​ինտելեկտը իրականություն է դարձնում դրանց մասշտաբը և բարելավումը

-

Դուք հավանաբար տեսել եք ֆանտաստիկ ֆիլմեր կամ հեռուստաշոուներ, որտեղ գլխավոր հերոսը խնդրում է մեծացնել պատկերը և բարելավել արդյունքը՝ ցույց տալ դեմք, պետհամարանիշ կամ որևէ այլ հիմնական դետալ: Google-ի նորագույն արհեստական ​​ինտելեկտի (AI) համակարգերը, որոնք հիմնված են այսպես կոչված դիֆուզիոն մոդելներ, կարողանում են կատարել այս հնարքը։

Դա բարդ գործընթաց է տիրապետելու համար, քանի որ այն, ըստ էության, մանրամասներ է ավելացնում պատկերին, որը տեսախցիկը ի սկզբանե չէր ֆիքսել՝ օգտագործելով այլ, նմանատիպ պատկերների վրա հիմնված գերխելացի գուշակություններ:

Google

Google-ում այս տեխնիկան կոչվում է բնական պատկերի սինթեզ, իսկ կոնկրետ այս դեպքում՝ պատկերի գերբարձր լուծաչափը: Դուք սկսում եք փոքր, պիքսելացված լուսանկարից և ավարտում եք ինչ-որ սուր, պարզ և բնական բան: Հնարավոր է, որ այն հենց օրիգինալը չէ, բայց բավական մոտ է մարդու աչքին իրական երևալու համար:

Google-ը այս աշխատանքի համար երկու նոր AI գործիք է ներկայացրել։ Առաջինը կոչվում է SR3 կամ Super-Resolution via Repeated Refinement, և այն աշխատում է պատկերի վրա աղմուկ ավելացնելով և այնուհետև հեռացնելով: Պատկերների մեծ տվյալների բազայի և մեքենայական ուսուցման որոշ մոգության վրա հիմնված մի շարք հավանական հաշվարկների միջոցով SR3-ը կարող է պատկերացնել, թե ինչ տեսք ունի ցածր լուծաչափով պիքսելային պատկերի գերբարձր լուծաչափով տարբերակը:

Երկրորդ գործիքը CDM-ն է կամ Cascaded Diffusion Models-ը: Google-ը դրանք նկարագրում է որպես «խողովակաշարեր», որոնց երկայնքով դիֆուզիոն մոդելները, ներառյալ SR3-ը, կարող են ուղղորդվել բարձրորակ պատկերի մեծացման համար: Այն պահանջում է կատարելագործման մոդելներ և դրանք դարձնում ավելի մեծ պատկերներ:

Google

Օգտագործելով կատարելագործման տարբեր մոդելներ տարբեր լուծաչափերով՝ CDM մոտեցումն ի վիճակի է գերազանցել պատկերի ընդլայնման այլընտրանքային մեթոդներին, ըստ Google-ի: AI-ի նոր շարժիչը փորձարկվել է ImageNet-ի վրա՝ ուսումնական պատկերների հսկա տվյալների բազայում, որը սովորաբար օգտագործվում է տեսողական օբյեկտների ճանաչման հետազոտության համար:

SR3-ի և CDM-ի վերջնական արդյունքները տպավորիչ են: 50 կամավորների մասնակցությամբ ստանդարտ թեստի ժամանակ SR3-ի կողմից ստեղծված մարդկային դեմքերի պատկերները մոտ 50%-ում շփոթվել են իրական լուսանկարների հետ, և հաշվի առնելով, որ իդեալական ալգորիթմը պետք է հասնի 50%-ի, դա տպավորիչ է: Արժե կրկնել, որ այս ուժեղացված պատկերները բնօրինակների ճշգրիտ համընկնում չեն, դրանք մանրակրկիտ հաշվարկված սիմուլյացիաներ են՝ հիմնված հավանականության մաթեմատիկայի վրա:

Google

Google-ը շատ ավելին է խոստանում իր նոր արհեստական ​​ինտելեկտի շարժիչներից և հարակից տեխնոլոգիաներից՝ ոչ միայն դեմքերի և այլ բնական օբյեկտների պատկերները մեծացնելու առումով, այլ նաև հավանական մոդելավորման այլ ոլորտներում:

Կարդացեք նաև.

Աղբյուրգիտական
Գրանցվել
Տեղեկացնել մասին
հյուր

0 մեկնաբանություններ
Ներկառուցված ակնարկներ
Դիտել բոլոր մեկնաբանությունները
Բաժանորդագրվեք թարմացումների համար