Չորեքշաբթի, 8 մայիսի, 2024 թ

աշխատասեղան v4.2.1

Root NationՀոդվածներՏեխնոլոգիաներԻնչ է Gemini. Ամեն ինչ Google-ի նոր AI մոդելի մասին

Ինչ է Gemini. Ամեն ինչ Google-ի նոր AI մոդելի մասին

-

Google-ը հենց նոր թողարկեց իր ամենահզոր AI մոդելը երբևէ կոչված Երկվորյակ. Ի՞նչ է նա և ի՞նչ կարող է անել: Ամեն ինչի մասին մեր հոդվածում:

Google-ը տարիներ շարունակ մշակում է սեփական AI գործիքները։ OpenAI-ից ChatGPT-3-ի հրապարակային թողարկումով, ընկերությունը, որը ղեկավարում է աշխարհի ամենահայտնի որոնողական համակարգը, նույնպես ստեղծել է նմանատիպ գործիք՝ Bard-ը: Բայց այս գործիքը դեռևս պարտվեց մրցակիցներին, ինչը Google-ը չէր կարող թույլ տալ: Ուստի զարմանալի չէ, որ աշխարհը վերջերս տեսավ Gemini՝ Google-ի լեզվի նոր մոդելը, որի մասին մենք տեղեկացանք շնորհանդեսի ժամանակ։

Այն նախատեսված է ոչ միայն հսկայի նախկին LLM-ի (Large Language Model) բարելավման համար, այլ նաև առաջարկելու բոլորովին նոր հնարավորություններ տեքստի մշակման, գրաֆիկայի և ձայնի ոլորտում:

Այսպիսով, եկեք ավելի սերտ նայենք Google Gemini լեզվի նոր մոդելին:

Հետաքրքիր է նաև. OpenAI Project Q*. ինչ է դա և ինչու է նախագիծը մտահոգիչ

Ի՞նչ է Google Gemini-ն:

Սա Google-ի արհեստական ​​ինտելեկտի նոր և հզոր մոդել է, որը կարող է հասկանալ ոչ միայն տեքստը, այլև պատկերները, տեսանյութերը և ձայնը։ Այս մուլտիմոդալ մոդելը նկարագրվում է որպես մաթեմատիկայի, ֆիզիկայի և այլ ոլորտներում բարդ առաջադրանքներ կատարելու, ինչպես նաև ծրագրավորման տարբեր լեզուներով բարձրորակ կոդ հասկանալու և առաջացնելու ունակություն:

Google Gemini

Gemini-ն այժմ հասանելի է Google Bard-ի և Google Pixel 8-ի հետ ինտեգրվելու միջոցով և աստիճանաբար կներառվի Google-ի այլ ծառայություններում:

«Gemini»-ն Google-ի թիմերի, ներառյալ Google Research-ի մեր գործընկերների հսկայական համատեղ ջանքերի արդյունքն է», — ասել է Google DeepMind-ի գործադիր տնօրեն և համահիմնադիր Դենիս Հասաբիսը: «Այն կառուցվել է ի սկզբանե բազմամոդալ լինելու համար, ինչը նշանակում է, որ այն կարող է ընդհանրացնել և անխափան հասկանալ, գործել և համատեղել տարբեր տեսակի տեղեկատվություն, ներառյալ տեքստը, ծածկագիրը, աուդիո, պատկերները և տեսանյութերը»:

- Գովազդ -

Հետաքրքիր է նաև. Այն ամենը, ինչ մենք անվանում ենք AI, իրականում արհեստական ​​բանականություն չէ: Ահա թե ինչ պետք է իմանաք

Ո՞վ է ստեղծել մոդելը:

Google Gemini

Ինչպես հավանաբար արդեն կռահեցիք, Gemini-ն ստեղծվել է Google-ի և Alphabet-ի՝ Google-ի մայր ընկերության կողմից և հանդիսանում է ընկերության ամենաառաջադեմ AI մոդելը մինչ օրս: Google-ի DeepMind ստորաբաժանումը նույնպես զգալի ներդրում է ունեցել դրա զարգացման գործում։ Դեռ հայտնի չէ, թե քանի աշխատակից է մասնակցել մշակմանը և ինչ միջոցներ են հատկացվել դրա համար, սակայն իմանալով Google-ի հնարավորությունները՝ կարող ենք վստահ լինել, որ շատ մեծ գումար կա։

Հետաքրքիր է նաև. Windows 12. Ո՞րն է լինելու նոր ՕՀ-ը

հնարավորություններ

Ինչպես նշեցի վերևում, այն մուլտիմոդալ մոդել է, ինչը նշանակում է, որ այն կարող է հասկանալ, գործել և համատեղել տարբեր տեսակի տվյալներ, ներառյալ տեքստը, կոդը, աուդիո, պատկերները և տեսանյութերը: Այն ապահովում է ավելի լավ հասկանալու, մտածելու և կոդավորման հմտություններ՝ համեմատած նախորդ AI համակարգերի հետ:

Google Gemini

Մոդելի հիմնական հնարավորություններն են.

  • Բնական լեզվի մշակում այնպիսի խնդիրների համար, ինչպիսիք են թարգմանությունը, ամփոփումը և երկխոսությունը
  • Մաթեմատիկական մտածողություն և խնդիրների լուծում
  • Կոդ և փաստաթղթեր ստեղծելու ունակություն
  • Հասկանալով պատկերներ, աուդիո և վիդեո
  • Multitasking տարբեր տիրույթներում

Ինչպես տեսնում եք, հնարավորությունները գերազանցում են մյուս մոդելներին:

Լեզվի ընկալման, մաթեմատիկական մտածողության և կոդավորման թեստերում Gemini Ultra-ն գերազանցել է այնպիսի մոդելներին, ինչպիսին է GPT-4-ը: Մասնավորապես, այն առաջին մոդելն է, որը գերազանցում է մարդկային մակարդակի կատարումը Massive Multitask Language Understanding (MMLU) թեստի վրա՝ հասնելով ավելի քան 90% ճշգրտության:

Լեզվի մոդելային մեծ ուսումնասիրության 32 ակադեմիական թեստերում Երկվորյակները գերազանցեցին GPT-4-ին: 30 դեպքում Google-ի լեզվի նոր մոդելն ավելի լավն է եղել, քան մրցակիցը։ Սա ցույց է տալիս մոդելի կարողությունը լիովին հասկանալու լեզուն:

Կարդացեք նաև. Human Brain Project. Մարդու ուղեղը նմանակելու փորձ

Տարբեր վարկածներ կա՞ն։

Google-ը նկարագրում է այս AI-ն որպես ճկուն մոդել, որը կարող է աշխատել ցանկացած սարքի վրա՝ սկսած Google տվյալների կենտրոններից մինչև շարժական սարքեր: Այս մասշտաբայնության հասնելու համար Երկվորյակը գալիս է երեք տարբերակով՝ Nano, Pro և Ultra:

Google Gemini

Եկեք ավելի մանրամասն խոսենք Երկվորյակների տարբեր տարբերակների մասին։

  • Երկվորյակ ՆանոՆախատեսված է սմարթֆոնների, մասնավորապես՝ Google Pixel 8-ի վրա աշխատելու համար: Այն նախատեսված է արհեստական ​​ինտելեկտի կողմից արդյունավետ մշակում պահանջող առաջադրանքներն իրականացնելու համար՝ առանց արտաքին սերվերներին միանալու, օրինակ՝ չաթի ծրագրերում պատասխաններ առաջարկելու կամ տեքստի ամփոփում: Այս կոմպակտ սարքի մոդելն ունի մոտ 6 միլիարդ պարամետր:
  • Երկվորյակ Pro: աշխատում է Google տվյալների կենտրոններում: Pro-ն նախատեսված է Bard AI չաթբոտի վերջին տարբերակի հետ աշխատելու համար: Այն ի վիճակի է ապահովել արագ արձագանքման ժամանակներ և հասկանալ բարդ հարցումները: Միջին չափի մոդելն ունի մոտավորապես 100 միլիարդ պարամետր և հանդիսանում է Բարդի խոսակցական AI-ի առանցքը: Pro-ն հասանելի կլինի Google Cloud-ի միջոցով:
  • Երկվորյակ ՈւլտրաԹեև Ultra տարբերակը դեռ լայնորեն հասանելի չէ, Google-ը այն նկարագրում է որպես իր լավագույն կատարողական մոդելը, որը գերազանցում է «ներկայիս նորագույնը 30 լայնորեն օգտագործվող ակադեմիական թեստերից, որոնք օգտագործվում են լայնալեզու մոդելների (LLM) հետազոտության մեջ: « Որպես ամենամեծ և հզոր տարբերակ՝ Ultra-ն կստանա ավելի քան 32 տրիլիոն պարամետր։ Այն տեղակայվելու է տվյալների կենտրոններում։ Ultra-ն հարմարեցված է կորպորատիվ օգտագործման համար: Տարբերակը նախատեսված է շատ բարդ առաջադրանքներ կատարելու համար։ Google-ը նախատեսում է թողարկել այն ընթացիկ թեստավորման փուլի ավարտից հետո։ Այսինքն՝ ամենահզոր տարբերակը դեռ հասանելի չէ օգտատերերին։

Հետաքրքիր է նաև. Google Bard AI. Այն ամենը, ինչ դուք պետք է իմանաք

- Գովազդ -

Ինչպե՞ս մուտք գործել Երկվորյակ:

AI-ն Nano և Pro տարբերակներում այժմ հասանելի են Google-ի արտադրանքներում, ինչպիսիք են համապատասխանաբար Google Pixel 8 սմարթֆոնները և Bard չաթբոտը: Google-ը նախատեսում է ի վերջո ինտեգրել այն իր որոնման համակարգին, գովազդին, Gmail էլփոստի ծառայությանը, Chrome բրաուզերին և այլ ծառայություններին:

Մշակողները և ձեռնարկությունների հաճախորդները կկարողանան մուտք գործել Pro Gemini API-ի միջոցով Google AI Studio-ում և Google Cloud Vertex AI-ում՝ սկսած 13 թվականի դեկտեմբերի 2023-ից: Մշակողները Android Նանո տարբերակի մոդելը հասանելի կլինի AICore-ի միջոցով, որը հասանելի կլինի վաղ նախադիտման ժամանակ:

Կարդացեք նաև. Samsung Galaxy Flip5 ընդդեմ Motorola Razr 40 Ultra: Երկու Յոկոզունների ճակատամարտ

Երկվորյակներ Google Bard-ում. ի՞նչ կփոխվի:

Շնորհանդեսի ընթացքում տրամադրված տեղեկատվության համաձայն, մոդելը թույլ կտա Google Bard-ին ավելի լավ կարգավորել ավելի բարդ խնդիրները, ինչպես նշված է.

«Մենք նախագծել ենք Gemini-ն այնպես, որ մոդելը, բնականաբար, բազմամոդալ լինի և ի սկզբանե նախապես վերապատրաստված լինի բազմաթիվ եղանակների վրա: Այնուհետև մենք կատարելագործեցինք այն՝ ավելացնելով ավելի շատ մուլտիմոդալ տվյալներ՝ արդյունավետությունը բարելավելու համար: Արդյունքում, Երկվորյակները հեշտությամբ հասկանում և շատ ավելի լավ եզրակացություններ են անում, քան նախորդ մուլտիմոդալ մոդելները, և պարծենում է ժամանակակից հնարավորություններով գրեթե բոլոր ոլորտներում:

Երկվորյակի արտասովոր մուլտիմոդալ հնարավորությունները օգնում են ձեզ հասկանալ բարդ տեքստային և տեսողական տեղեկատվությունը: Դրանք հատկապես օգտակար են, երբ խոսքը վերաբերում է հսկայական տվյալների հավաքածուներից կոնկրետ տեղեկատվության արդյունահանմանը: Հարյուր հազարավոր փաստաթղթերից տեղեկատվության էությունը կարդալու, զտելու և վերլուծելու միջոցով այս մոդելի արտասովոր ունակությունը, անկասկած, կնպաստի նոր, կայծակնային արագ հայտնագործություններին տարբեր ոլորտներում՝ գիտությունից մինչև ֆինանսներ»:

Շնորհանդեսի ընթացքում ցուցադրվել է համալիր ուսումնասիրության օրինակ, որը պարունակում է ավելի քան 200 հազար գրառում, որոնցից մի քանիսը պետք է թարմացվեին նոր տվյալների համաձայն։ Ինչպես կարող էիք կռահել, դա ձեռքով անելը շատ ժամանակատար կլիներ, ուստի հետազոտության հեղինակները Gemini-ի միջոցով պատրաստեցին կոդը, որն ընդունում էր մուտքագրումը և կատարում անհրաժեշտ թարմացումները: Մեկ այլ, ավելի իրական օրինակ է Google-ի լեզվի մոդելի օգտագործումը մաթեմատիկայի կամ ֆիզիկայի խնդիրները բացատրելու համար:

Google Gemini

Այստեղ մուտքագրված տվյալները դպրոցի դասի հանձնարարության լուսանկար/սկանն էին: Համակարգը կարողացել է մշակել այնտեղ պահված գրաֆիկան ու տեքստը, ապա նշել, թե տնային առաջադրանքների որ մասերն են ճիշտ կատարվել, և որոնք ավելի մեծ ուշադրության կարիք ունեն: Ներկայացումը ցույց տվեց, որ օգտատերը կարող է բազմիցս խնդրել Երկվորյակներին բացատրել առաջադրանքը, և յուրաքանչյուր հաջորդ փորձ պետք է բացատրվի ավելի պարզ լեզվով: Թե որքան ճշգրիտ և ճիշտ կլինի Երկվորյակները, իհարկե, կստուգեն հետաքրքրվողները, սակայն ուղղակի լուսանկարներից տեքստը կարդալու և մշակելու ունակությունը տպավորիչ է։ Ինչպես ավելացվել է շնորհանդեսի ժամանակ.

"Երկվորյակներին սովորեցրել են միաժամանակ ճանաչել և հասկանալ տեքստը, պատկերները, ձայները և այլն: Դրա շնորհիվ նա ավելի լավ է հասկանում տեղեկատվության նրբությունները և կարող է պատասխանել բարդ հարցերի։ Այն հատկապես արդյունավետ է մաթեմատիկայի և ֆիզիկայի հետ կապված թեմաները բացատրելու համար, ուստի այն կարող է ծառայել որպես տնային աշխատանքների անձնական օգնական:".

Երկվորյակները Google Pixel սմարթֆոններում

Google-ը նաև պարծենում էր, որ Gemini-ն «սովորում է» նոր TPUv5 չիպսեթների վրա և նախատեսում է 2024 թվականի սկզբին ներկայացնել Gemini Ultra-ն, որը կօգտագործի Bard Advanced-ը՝ հսկայի խոսքի մոդելի սպառողական տարբերակի նոր տարբերակը: Gemini Ultra-ն ներկայումս փորձարկման փուլում է և արդեն հասանելի է անվտանգության մասնագետների համար:

Google Gemini

Վերջին կարևոր տեղեկությունը Gemini-ի ներդրումն է Google Pixel 8 սմարթֆոններում, որը թույլ կտա, ի թիվս այլ բաների, արագ պատասխաններ ստեղծել մեսենջերներում Gboard հավելվածի միջոցով։ Առաջինը WhatsApp-ն է, սակայն հաջորդ տարի նման լուծումներ կհայտնվեն հաղորդակցության հետ կապված այլ հավելվածներում։ Այնուամենայնիվ, սա միայն սկիզբն է, քանի որ Google-ը հայտարարել է բազմաթիվ նոր AI գործիքներ Pixel 8 սմարթֆոնների համար, և դրանք ապագայում հասանելի կլինեն որոշ այլ սարքերում: Android. Սակայն սրանք հետագա պլաններ են, և այս պահին մանրամասներ չեն հաղորդվում:

Ինչո՞վ է Gemini-ն տարբերվում արհեստական ​​ինտելեկտի այլ մոդելներից, օրինակ՝ GPT-4-ից:

Google-ի նոր Gemini մոդելը, թվում է, թե մինչ օրս AI-ի ամենամեծ և առաջադեմ մոդելներից մեկն է, թեև Ultra մոդելի թողարկումը հաստատ դա կորոշի: Համեմատած այլ հայտնի մոդելների հետ, որոնք ներկայումս օգտագործում են AI չաթ-բոտեր, Gemini-ն առանձնանում է իր մուլտիմոդալ հատկանիշով, մինչդեռ GPT-4-ի նման այլ մոդելները հիմնվում են հավելումների և ինտեգրման վրա՝ իսկապես մուլտիմոդալ լինելու համար:

Մտահոգություններ ճշգրտության և անաչառության վերաբերյալ

Չնայած Երկվորյակը մեծ թռիչք է արհեստական ​​ինտելեկտի կարողությունների զարգացման գործում, այն ունի նույն թերությունները, ինչ մյուս հիմնական լեզվական մոդելները: Սա առաջին հերթին կեղծ տեղեկություններ ստեղծելու հնարավորությունն է։ Կողմնակալությունները հիմնված են նաև նոր լեզվական մոդելի համար հասանելի վերապատրաստման տվյալների վրա: Հարկ է նշել նաև իրական աշխարհի սահմանափակ ըմբռնումը։ Google-ը խոստովանում է, որ Երկվորյակների նոր մոդելը կարող է սխալներ թույլ տալ, փաստեր ներկայացնել, որոնք հիմնված չեն ապացույցների վրա և հակասում են ողջախոհությանը։

Google Gemini

Ավելի շատ թեստեր են անհրաժեշտ, հատկապես Gemini Ultra-ի համար, որն ունի նոր հնարավորություններ, որոնք դեռ ամբողջությամբ չեն ուսումնասիրվել: Google-ը պարտավորվում է ուշադիր գնահատել Երկվորյակներին՝ նվազագույնի հասցնելու հնարավոր վնասը:

Հետաքրքիր է նաև. Ամեն ինչի մասին Microsoft Կոպիլոտը. ապագա՞, թե՞ սխալ ճանապարհ:

Ապագան Երկվորյակների հետ է

Google-ի կողմից Gemini-ի գործարկումը սկիզբ դրեց AI-ի զարգացման նոր դարաշրջանին: Իր լավագույն կատարողականությամբ՝ համեմատած նախորդ մոդելների և մարդկային հիմքերի հետ՝ Gemini-ն մատնանշում է արհեստական ​​ինտելեկտի ապագա հնարավորությունները, սակայն դեռևս կարիք ունի ավելի շատ հետազոտությունների՝ որոշակի թերությունները վերացնելու համար:

Ապագայում կարող եք ակնկալել, որ Երկվորյակները Google-ի արտադրանքներում ավելի օգտակար և խելացի գործառույթներ կապահովեն: Առաջ գնալով, ընկերությունը նախատեսում է շարունակել ընդլայնել Gemini-ն անգլերենից դուրս և հիմնվել իր հիմնական մոդելի մեթոդաբանության վրա:

Մենք կարող ենք միայն դիտել և հուսալ, որ Google-ը գիտի, թե ինչ է անում:

Կարդացեք նաև. 

Yuri Svitlyk
Yuri Svitlyk
Կարպատյան լեռների որդի, մաթեմատիկայի չճանաչված հանճար, «փաստաբան».Microsoft, գործնական ալտրուիստ, ձախ-աջ
- Գովազդ -
Գրանցվել
Տեղեկացնել մասին
հյուր

0 մեկնաբանություններ
Ներկառուցված ակնարկներ
Դիտել բոլոր մեկնաբանությունները
Բաժանորդագրվեք թարմացումների համար