Google-ը հենց նոր թողարկեց իր ամենահզոր AI մոդելը երբևէ կոչված Երկվորյակ. Ի՞նչ է նա և ի՞նչ կարող է անել: Ամեն ինչի մասին մեր հոդվածում:
Google-ը տարիներ շարունակ մշակում է սեփական AI գործիքները։ OpenAI-ից ChatGPT-3-ի հրապարակային թողարկումով, ընկերությունը, որը ղեկավարում է աշխարհի ամենահայտնի որոնողական համակարգը, նույնպես ստեղծել է նմանատիպ գործիք՝ Bard-ը: Բայց այս գործիքը դեռևս պարտվեց մրցակիցներին, ինչը Google-ը չէր կարող թույլ տալ: Ուստի զարմանալի չէ, որ աշխարհը վերջերս տեսավ Gemini՝ Google-ի լեզվի նոր մոդելը, որի մասին մենք տեղեկացանք շնորհանդեսի ժամանակ։
Այն նախատեսված է ոչ միայն հսկայի նախկին LLM-ի (Large Language Model) բարելավման համար, այլ նաև առաջարկելու բոլորովին նոր հնարավորություններ տեքստի մշակման, գրաֆիկայի և ձայնի ոլորտում:
Այսպիսով, եկեք ավելի սերտ նայենք Google Gemini լեզվի նոր մոդելին:
Հետաքրքիր է նաև. OpenAI Project Q*. ինչ է դա և ինչու է նախագիծը մտահոգիչ
Ի՞նչ է Google Gemini-ն:
Սա Google-ի արհեստական ինտելեկտի նոր և հզոր մոդել է, որը կարող է հասկանալ ոչ միայն տեքստը, այլև պատկերները, տեսանյութերը և ձայնը։ Այս մուլտիմոդալ մոդելը նկարագրվում է որպես մաթեմատիկայի, ֆիզիկայի և այլ ոլորտներում բարդ առաջադրանքներ կատարելու, ինչպես նաև ծրագրավորման տարբեր լեզուներով բարձրորակ կոդ հասկանալու և առաջացնելու ունակություն:
Gemini-ն այժմ հասանելի է Google Bard-ի և Google Pixel 8-ի հետ ինտեգրվելու միջոցով և աստիճանաբար կներառվի Google-ի այլ ծառայություններում:
«Gemini»-ն Google-ի թիմերի, ներառյալ Google Research-ի մեր գործընկերների հսկայական համատեղ ջանքերի արդյունքն է», — ասել է Google DeepMind-ի գործադիր տնօրեն և համահիմնադիր Դենիս Հասաբիսը: «Այն կառուցվել է ի սկզբանե բազմամոդալ լինելու համար, ինչը նշանակում է, որ այն կարող է ընդհանրացնել և անխափան հասկանալ, գործել և համատեղել տարբեր տեսակի տեղեկատվություն, ներառյալ տեքստը, ծածկագիրը, աուդիո, պատկերները և տեսանյութերը»:
Հետաքրքիր է նաև. Այն ամենը, ինչ մենք անվանում ենք AI, իրականում արհեստական բանականություն չէ: Ահա թե ինչ պետք է իմանաք
Ո՞վ է ստեղծել մոդելը:
Ինչպես հավանաբար արդեն կռահեցիք, Gemini-ն ստեղծվել է Google-ի և Alphabet-ի՝ Google-ի մայր ընկերության կողմից և հանդիսանում է ընկերության ամենաառաջադեմ AI մոդելը մինչ օրս: Google-ի DeepMind ստորաբաժանումը նույնպես զգալի ներդրում է ունեցել դրա զարգացման գործում։ Դեռ հայտնի չէ, թե քանի աշխատակից է մասնակցել մշակմանը և ինչ միջոցներ են հատկացվել դրա համար, սակայն իմանալով Google-ի հնարավորությունները՝ կարող ենք վստահ լինել, որ շատ մեծ գումար կա։
Հետաքրքիր է նաև. Windows 12. Ո՞րն է լինելու նոր ՕՀ-ը
հնարավորություններ
Ինչպես նշեցի վերևում, այն մուլտիմոդալ մոդել է, ինչը նշանակում է, որ այն կարող է հասկանալ, գործել և համատեղել տարբեր տեսակի տվյալներ, ներառյալ տեքստը, կոդը, աուդիո, պատկերները և տեսանյութերը: Այն ապահովում է ավելի լավ հասկանալու, մտածելու և կոդավորման հմտություններ՝ համեմատած նախորդ AI համակարգերի հետ:
Մոդելի հիմնական հնարավորություններն են.
- Բնական լեզվի մշակում այնպիսի խնդիրների համար, ինչպիսիք են թարգմանությունը, ամփոփումը և երկխոսությունը
- Մաթեմատիկական մտածողություն և խնդիրների լուծում
- Կոդ և փաստաթղթեր ստեղծելու ունակություն
- Հասկանալով պատկերներ, աուդիո և վիդեո
- Multitasking տարբեր տիրույթներում
Ինչպես տեսնում եք, հնարավորությունները գերազանցում են մյուս մոդելներին:
Լեզվի ընկալման, մաթեմատիկական մտածողության և կոդավորման թեստերում Gemini Ultra-ն գերազանցել է այնպիսի մոդելներին, ինչպիսին է GPT-4-ը: Մասնավորապես, այն առաջին մոդելն է, որը գերազանցում է մարդկային մակարդակի կատարումը Massive Multitask Language Understanding (MMLU) թեստի վրա՝ հասնելով ավելի քան 90% ճշգրտության:
Լեզվի մոդելային մեծ ուսումնասիրության 32 ակադեմիական թեստերում Երկվորյակները գերազանցեցին GPT-4-ին: 30 դեպքում Google-ի լեզվի նոր մոդելն ավելի լավն է եղել, քան մրցակիցը։ Սա ցույց է տալիս մոդելի կարողությունը լիովին հասկանալու լեզուն:
Կարդացեք նաև. Human Brain Project. Մարդու ուղեղը նմանակելու փորձ
Տարբեր վարկածներ կա՞ն։
Google-ը նկարագրում է այս AI-ն որպես ճկուն մոդել, որը կարող է աշխատել ցանկացած սարքի վրա՝ սկսած Google տվյալների կենտրոններից մինչև շարժական սարքեր: Այս մասշտաբայնության հասնելու համար Երկվորյակը գալիս է երեք տարբերակով՝ Nano, Pro և Ultra:
Եկեք ավելի մանրամասն խոսենք Երկվորյակների տարբեր տարբերակների մասին։
- Երկվորյակ ՆանոՆախատեսված է սմարթֆոնների, մասնավորապես՝ Google Pixel 8-ի վրա աշխատելու համար: Այն նախատեսված է արհեստական ինտելեկտի կողմից արդյունավետ մշակում պահանջող առաջադրանքներն իրականացնելու համար՝ առանց արտաքին սերվերներին միանալու, օրինակ՝ չաթի ծրագրերում պատասխաններ առաջարկելու կամ տեքստի ամփոփում: Այս կոմպակտ սարքի մոդելն ունի մոտ 6 միլիարդ պարամետր:
- Երկվորյակ Pro: աշխատում է Google տվյալների կենտրոններում: Pro-ն նախատեսված է Bard AI չաթբոտի վերջին տարբերակի հետ աշխատելու համար: Այն ի վիճակի է ապահովել արագ արձագանքման ժամանակներ և հասկանալ բարդ հարցումները: Միջին չափի մոդելն ունի մոտավորապես 100 միլիարդ պարամետր և հանդիսանում է Բարդի խոսակցական AI-ի առանցքը: Pro-ն հասանելի կլինի Google Cloud-ի միջոցով:
- Երկվորյակ ՈւլտրաԹեև Ultra տարբերակը դեռ լայնորեն հասանելի չէ, Google-ը այն նկարագրում է որպես իր լավագույն կատարողական մոդելը, որը գերազանցում է «ներկայիս նորագույնը 30 լայնորեն օգտագործվող ակադեմիական թեստերից, որոնք օգտագործվում են լայնալեզու մոդելների (LLM) հետազոտության մեջ: « Որպես ամենամեծ և հզոր տարբերակ՝ Ultra-ն կստանա ավելի քան 32 տրիլիոն պարամետր։ Այն տեղակայվելու է տվյալների կենտրոններում։ Ultra-ն հարմարեցված է կորպորատիվ օգտագործման համար: Տարբերակը նախատեսված է շատ բարդ առաջադրանքներ կատարելու համար։ Google-ը նախատեսում է թողարկել այն ընթացիկ թեստավորման փուլի ավարտից հետո։ Այսինքն՝ ամենահզոր տարբերակը դեռ հասանելի չէ օգտատերերին։
Հետաքրքիր է նաև. Google Bard AI. Այն ամենը, ինչ դուք պետք է իմանաք
Ինչպե՞ս մուտք գործել Երկվորյակ:
AI-ն Nano և Pro տարբերակներում այժմ հասանելի են Google-ի արտադրանքներում, ինչպիսիք են համապատասխանաբար Google Pixel 8 սմարթֆոնները և Bard չաթբոտը: Google-ը նախատեսում է ի վերջո ինտեգրել այն իր որոնման համակարգին, գովազդին, Gmail էլփոստի ծառայությանը, Chrome բրաուզերին և այլ ծառայություններին:
Մշակողները և ձեռնարկությունների հաճախորդները կկարողանան մուտք գործել Pro Gemini API-ի միջոցով Google AI Studio-ում և Google Cloud Vertex AI-ում՝ սկսած 13 թվականի դեկտեմբերի 2023-ից: Մշակողները Android Նանո տարբերակի մոդելը հասանելի կլինի AICore-ի միջոցով, որը հասանելի կլինի վաղ նախադիտման ժամանակ:
Կարդացեք նաև. Samsung Galaxy Flip5 ընդդեմ Motorola Razr 40 Ultra: Երկու Յոկոզունների ճակատամարտ
Երկվորյակներ Google Bard-ում. ի՞նչ կփոխվի:
Շնորհանդեսի ընթացքում տրամադրված տեղեկատվության համաձայն, մոդելը թույլ կտա Google Bard-ին ավելի լավ կարգավորել ավելի բարդ խնդիրները, ինչպես նշված է.
«Մենք նախագծել ենք Gemini-ն այնպես, որ մոդելը, բնականաբար, բազմամոդալ լինի և ի սկզբանե նախապես վերապատրաստված լինի բազմաթիվ եղանակների վրա: Այնուհետև մենք կատարելագործեցինք այն՝ ավելացնելով ավելի շատ մուլտիմոդալ տվյալներ՝ արդյունավետությունը բարելավելու համար: Արդյունքում, Երկվորյակները հեշտությամբ հասկանում և շատ ավելի լավ եզրակացություններ են անում, քան նախորդ մուլտիմոդալ մոդելները, և պարծենում է ժամանակակից հնարավորություններով գրեթե բոլոր ոլորտներում:
Երկվորյակի արտասովոր մուլտիմոդալ հնարավորությունները օգնում են ձեզ հասկանալ բարդ տեքստային և տեսողական տեղեկատվությունը: Դրանք հատկապես օգտակար են, երբ խոսքը վերաբերում է հսկայական տվյալների հավաքածուներից կոնկրետ տեղեկատվության արդյունահանմանը: Հարյուր հազարավոր փաստաթղթերից տեղեկատվության էությունը կարդալու, զտելու և վերլուծելու միջոցով այս մոդելի արտասովոր ունակությունը, անկասկած, կնպաստի նոր, կայծակնային արագ հայտնագործություններին տարբեր ոլորտներում՝ գիտությունից մինչև ֆինանսներ»:
Շնորհանդեսի ընթացքում ցուցադրվել է համալիր ուսումնասիրության օրինակ, որը պարունակում է ավելի քան 200 հազար գրառում, որոնցից մի քանիսը պետք է թարմացվեին նոր տվյալների համաձայն։ Ինչպես կարող էիք կռահել, դա ձեռքով անելը շատ ժամանակատար կլիներ, ուստի հետազոտության հեղինակները Gemini-ի միջոցով պատրաստեցին կոդը, որն ընդունում էր մուտքագրումը և կատարում անհրաժեշտ թարմացումները: Մեկ այլ, ավելի իրական օրինակ է Google-ի լեզվի մոդելի օգտագործումը մաթեմատիկայի կամ ֆիզիկայի խնդիրները բացատրելու համար:
Այստեղ մուտքագրված տվյալները դպրոցի դասի հանձնարարության լուսանկար/սկանն էին: Համակարգը կարողացել է մշակել այնտեղ պահված գրաֆիկան ու տեքստը, ապա նշել, թե տնային առաջադրանքների որ մասերն են ճիշտ կատարվել, և որոնք ավելի մեծ ուշադրության կարիք ունեն: Ներկայացումը ցույց տվեց, որ օգտատերը կարող է բազմիցս խնդրել Երկվորյակներին բացատրել առաջադրանքը, և յուրաքանչյուր հաջորդ փորձ պետք է բացատրվի ավելի պարզ լեզվով: Թե որքան ճշգրիտ և ճիշտ կլինի Երկվորյակները, իհարկե, կստուգեն հետաքրքրվողները, սակայն ուղղակի լուսանկարներից տեքստը կարդալու և մշակելու ունակությունը տպավորիչ է։ Ինչպես ավելացվել է շնորհանդեսի ժամանակ.
"Երկվորյակներին սովորեցրել են միաժամանակ ճանաչել և հասկանալ տեքստը, պատկերները, ձայները և այլն: Դրա շնորհիվ նա ավելի լավ է հասկանում տեղեկատվության նրբությունները և կարող է պատասխանել բարդ հարցերի։ Այն հատկապես արդյունավետ է մաթեմատիկայի և ֆիզիկայի հետ կապված թեմաները բացատրելու համար, ուստի այն կարող է ծառայել որպես տնային աշխատանքների անձնական օգնական:".
Երկվորյակները Google Pixel սմարթֆոններում
Google-ը նաև պարծենում էր, որ Gemini-ն «սովորում է» նոր TPUv5 չիպսեթների վրա և նախատեսում է 2024 թվականի սկզբին ներկայացնել Gemini Ultra-ն, որը կօգտագործի Bard Advanced-ը՝ հսկայի խոսքի մոդելի սպառողական տարբերակի նոր տարբերակը: Gemini Ultra-ն ներկայումս փորձարկման փուլում է և արդեն հասանելի է անվտանգության մասնագետների համար:
Վերջին կարևոր տեղեկությունը Gemini-ի ներդրումն է Google Pixel 8 սմարթֆոններում, որը թույլ կտա, ի թիվս այլ բաների, արագ պատասխաններ ստեղծել մեսենջերներում Gboard հավելվածի միջոցով։ Առաջինը WhatsApp-ն է, սակայն հաջորդ տարի նման լուծումներ կհայտնվեն հաղորդակցության հետ կապված այլ հավելվածներում։ Այնուամենայնիվ, սա միայն սկիզբն է, քանի որ Google-ը հայտարարել է բազմաթիվ նոր AI գործիքներ Pixel 8 սմարթֆոնների համար, և դրանք ապագայում հասանելի կլինեն որոշ այլ սարքերում: Android. Սակայն սրանք հետագա պլաններ են, և այս պահին մանրամասներ չեն հաղորդվում:
Ինչո՞վ է Gemini-ն տարբերվում արհեստական ինտելեկտի այլ մոդելներից, օրինակ՝ GPT-4-ից:
Google-ի նոր Gemini մոդելը, թվում է, թե մինչ օրս AI-ի ամենամեծ և առաջադեմ մոդելներից մեկն է, թեև Ultra մոդելի թողարկումը հաստատ դա կորոշի: Համեմատած այլ հայտնի մոդելների հետ, որոնք ներկայումս օգտագործում են AI չաթ-բոտեր, Gemini-ն առանձնանում է իր մուլտիմոդալ հատկանիշով, մինչդեռ GPT-4-ի նման այլ մոդելները հիմնվում են հավելումների և ինտեգրման վրա՝ իսկապես մուլտիմոդալ լինելու համար:
Մտահոգություններ ճշգրտության և անաչառության վերաբերյալ
Չնայած Երկվորյակը մեծ թռիչք է արհեստական ինտելեկտի կարողությունների զարգացման գործում, այն ունի նույն թերությունները, ինչ մյուս հիմնական լեզվական մոդելները: Սա առաջին հերթին կեղծ տեղեկություններ ստեղծելու հնարավորությունն է։ Կողմնակալությունները հիմնված են նաև նոր լեզվական մոդելի համար հասանելի վերապատրաստման տվյալների վրա: Հարկ է նշել նաև իրական աշխարհի սահմանափակ ըմբռնումը։ Google-ը խոստովանում է, որ Երկվորյակների նոր մոդելը կարող է սխալներ թույլ տալ, փաստեր ներկայացնել, որոնք հիմնված չեն ապացույցների վրա և հակասում են ողջախոհությանը։
Ավելի շատ թեստեր են անհրաժեշտ, հատկապես Gemini Ultra-ի համար, որն ունի նոր հնարավորություններ, որոնք դեռ ամբողջությամբ չեն ուսումնասիրվել: Google-ը պարտավորվում է ուշադիր գնահատել Երկվորյակներին՝ նվազագույնի հասցնելու հնարավոր վնասը:
Հետաքրքիր է նաև. Ամեն ինչի մասին Microsoft Կոպիլոտը. ապագա՞, թե՞ սխալ ճանապարհ:
Ապագան Երկվորյակների հետ է
Google-ի կողմից Gemini-ի գործարկումը սկիզբ դրեց AI-ի զարգացման նոր դարաշրջանին: Իր լավագույն կատարողականությամբ՝ համեմատած նախորդ մոդելների և մարդկային հիմքերի հետ՝ Gemini-ն մատնանշում է արհեստական ինտելեկտի ապագա հնարավորությունները, սակայն դեռևս կարիք ունի ավելի շատ հետազոտությունների՝ որոշակի թերությունները վերացնելու համար:
Ապագայում կարող եք ակնկալել, որ Երկվորյակները Google-ի արտադրանքներում ավելի օգտակար և խելացի գործառույթներ կապահովեն: Առաջ գնալով, ընկերությունը նախատեսում է շարունակել ընդլայնել Gemini-ն անգլերենից դուրս և հիմնվել իր հիմնական մոդելի մեթոդաբանության վրա:
Մենք կարող ենք միայն դիտել և հուսալ, որ Google-ը գիտի, թե ինչ է անում:
Կարդացեք նաև.