Škoda Karoq
Կատեգորիաներ: ՏՏ նորություններ

AI ընկերությունները հավաքում են տվյալներ զանգվածային լրատվության միջոցների կայքերից՝ հակառակ ուղղակի արգելքների

Perplexity-ն, որն իր արտադրանքը նկարագրում է որպես «արհեստական ​​ինտելեկտով անվճար որոնման համակարգ», վերջին օրերին հայտնվել է քննադատության թիրախում: Կարճ ժամանակ անց այն բանից հետո, երբ Forbes-ը մեղադրեց նրան իր հոդվածը գողանալու և բազմաթիվ հարթակներում վերահրատարակելու մեջ, Wired-ը հայտնեց, որ Perplexity-ն անտեսում է Robot Exclusion Protocol-ը կամ robots.txt-ը և հեռացնում է իր հոդվածները իր կայքից և Condé Nast-ի այլ հրապարակումներից: The Shortcut տեխնոլոգիական կայքը նաև մեղադրել է AI ընկերությանը իր հոդվածները հեռացնելու մեջ: Այժմ Reuters-ը բացահայտել է, որ Perplexity-ն արհեստական ​​ինտելեկտի միակ ընկերությունը չէ, որը շրջանցում է robots.txt ֆայլերը և քերծում կայքերը բովանդակության համար, որն այնուհետև օգտագործում է իր տեխնոլոգիան մարզելու համար:

Reuters-ը հայտնել է, որ տեսել է TollBit-ի հրատարակիչներին ուղղված նամակը, որը նրանց կապում է AI ընկերությունների հետ, որպեսզի նրանք կարողանան լիցենզավորման պայմանագրեր կնքել՝ զգուշացնելով, որ «Տարբեր աղբյուրներից (ոչ միայն մեկ ընկերության) AI գործակալները որոշել են շրջանցել: robots.txt արձանագրությունը կայքերից բովանդակություն ստանալու համար»: Robots.txt ֆայլը պարունակում է հրահանգներ որոնման ռոբոտների համար, թե որ էջերը նրանք կարող են և որոնք չեն կարող մուտք գործել: Վեբ մշակողները օգտագործում են այս արձանագրությունը 1994 թվականից, սակայն դրան հավատարիմ մնալը լիովին կամավոր է:

TollBit-ի նամակում ոչ մի ընկերություն չի նշվում, սակայն Business Insider-ը ասում է, որ իմացել է, որ OpenAI-ը և Anthropic-ը, համապատասխանաբար ChatGPT և Claude չաթ-բոտեր արտադրողները, նույնպես շրջանցում են robots.txt ազդանշանները: Երկու ընկերություններն էլ նախկինում ասել են, որ հարգում են «մի սողալ» հրահանգները, որոնք կայքերը տեղադրում են իրենց robots.txt ֆայլերում:

Իր հետաքննության ընթացքում Wired-ը պարզել է, որ Amazon-ի սերվերի վրա գտնվող մեքենան «միանշանակ շահագործվում է Perplexity-ի կողմից», շրջանցում է իր կայքի robots.txt հրահանգները: Հաստատելու համար, որ Perplexity-ն մաքրում է իր բովանդակությունը, Wired-ը տրամադրեց ընկերության գործիքների վերնագրերն իր հոդվածներից կամ կարճ խորհուրդներ, որոնք նկարագրում էին նրանց պատմությունները: Հաղորդվում է, որ գործիքը տվել է արդյունքներ, որոնք ճշգրտորեն վերափոխում են նրա հոդվածները «նվազագույն վերագրումներով»: Եվ երբեմն այն նույնիսկ ստեղծում էր հոդվածների ոչ ճշգրիտ ամփոփագրեր. Wired-ն ասում է, որ չաթբոտը կեղծ պնդում էր, թե հաղորդում է Կալիֆորնիայի կոնկրետ ոստիկանի մասին, ով հանցագործություն է կատարել մեկ դեպքում:

Fast Company-ին տված հարցազրույցում Perplexity-ի գործադիր տնօրեն Արավինդ Սրինիվասն ասել է հրապարակմանը, որ իր ընկերությունը «չի անտեսում ռոբոտների բացառման արձանագրությունը, այնուհետև ստում է դրա մասին»: Այնուամենայնիվ, դա չի նշանակում, որ այն չի շահում բոտերից, որոնք անտեսում են արձանագրությունը։ Սրինիվասը բացատրեց, որ ընկերությունն օգտագործում է երրորդ կողմի որոնման բոտեր, բացի իր սեփականից, և որ Wired-ի կողմից նույնականացված բոտը դրանցից մեկն է: Երբ Fast Company-ն հարցրեց, թե արդյոք Perplexity-ն ասել է սողացող մատակարարին դադարեցնել Wired կայքը սողալը, նա ասաց. «Դա բարդ է»:

Սրինիվասը պաշտպանել է իր ընկերության գործելակերպը՝ հրապարակմանը ասելով, որ բոտերի բացառման արձանագրությունը «իրավական հիմք չէ» և առաջարկելով, որ հրատարակիչները և իր նման ընկերությունները կարող են նոր տեսակի հարաբերություններ հաստատել: Նա նաև ակնարկել է, որ Wired-ը միտումնավոր ակնարկներ է օգտագործել, որպեսզի Perplexity չաթբոտը այդպես վարվի, այնպես որ սովորական օգտատերերը նույն արդյունքները չեն ստանա: Գործիքի ստեղծած ոչ ճշգրիտ բացահայտումների վերաբերյալ Սրինիվասն ասաց. «Մենք երբեք չենք ասել, որ Perplexity չաթբոտը ճշգրիտ չէ. «Մենք երբեք չենք ասել, որ երբեք հալյուցինացիաներ չենք ունեցել»:

Կարդացեք նաև.

Կիսվել
Julia Alexandrova

Սուրճագործ. Լուսանկարիչ. Ես գրում եմ գիտության և տիեզերքի մասին: Կարծում եմ, որ մեզ համար դեռ վաղ է այլմոլորակայինների հետ հանդիպելը: Հետևում եմ ռոբոտաշինության զարգացմանը, ամեն դեպքում...

Թողնել գրառում

Ձեր էլփոստի հասցեն չի հրապարակվելու. Պահանջվող դաշտերը նշված են աստղանիշով*