Chińska odpowiedź na ChatGPT zalewa swoje pierwsze wiersze

0
84

Chińska cenzura wymaga od Baidu i innych firm internetowych blokowania dostępu do niektórych stron internetowych i unikania tematów drażliwych politycznie. Słowa lub wyrażenia, które powinny zostać zablokowane, mogą być szybko aktualizowane w odpowiedzi na protesty lub podczas specjalnych wydarzeń.

Ale Jeffrey Ding, adiunkt na Uniwersytecie Georgetown, który bada chińską branżę technologiczną, mówi, że obawy związane z cenzurą nie spowalniają rozwoju dużych modeli językowych w Chinach. Zauważa, że ​​Baidu od pewnego czasu udostępnił model języka Ernie, który stanowi podstawę jego nowego bota, za pośrednictwem interfejsu API, a inne firmy oferowały podobne modele.

Baidu nie podał szczegółów danych treningowych Erniego Bota, ale najprawdopodobniej zostały one zeskrobane z chińskiego internetu. Oznacza to, że surowiec bota został już w dużej mierze wyselekcjonowany przez chińskie zasady cenzury, które na przykład mają na celu ograniczenie krytyki rządu.

Cenzura może również wpływać na chińskie chatboty w bardziej subtelny sposób. Akademicki projekt badawczy z 2021 r., który trenował algorytmy w chińskojęzycznej wersji Wikipedii, która jest zablokowana w Chinach, oraz Baidu’s Baike, encyklopedii crowdsourcingowej podlegającej rządowej cenzurze, wykazał, że użycie ocenzurowanych danych szkoleniowych znacząco zmieniło znaczenie, jakie oprogramowanie AI przypisuje do różnych słów.

Algorytm przeszkolony na chińskojęzycznej Wikipedii skojarzył słowa „demokracja” bliżej z pozytywnymi słowami, takimi jak „stabilność”. Algorytm przeszkolony na ocenzurowanym materiale Baike reprezentował „demokrację” bliższą „chaosowi”, bardziej zgodną z polityką chińskiego rządu. Ale ponieważ chatboty, takie jak ChatGPT, mogą być niezwykle elastyczne i remiksować materiał w swoich danych szkoleniowych, Baidu prawdopodobnie musiało wprowadzić dodatkowe zabezpieczenia

Pomimo mieszanego odbioru, Ernie Bot wydaje się być zdolnym konkurentem dla ChatGPT. Bot jest obecnie dostępny tylko dla ograniczonej liczby użytkowników, z których niektórzy twierdzą, że są pod wrażeniem. ChatGPT nie jest dostępny w Chinach, chociaż jest w stanie rozmawiać po chińsku.

Lei Li, profesor na Uniwersytecie Kalifornijskim w Sant Barbara, który specjalizuje się w sztucznej inteligencji i wcześniej pracował nad technologią wykorzystaną do zbudowania części uczenia maszynowego stojącego za Ernie botem, zwraca uwagę, że Baidu pracuje nad podstawową technologią od około dekady. Z kolei Microsoft licencjonował podstawową technologię nowego chatbota Binga i niektóre nadchodzące funkcje generowania tekstu dla pakietu Office od OpenAI, w które zainwestował miliardy dolarów w zamian za wyłączne prawa do swoich dzieł.

Li mówi również, że jest pod wrażeniem niektórych możliwości Ernie Bota, w tym jego zdolności do generowania historii i raportów biznesowych. Dodaje, że problem halucynacji jest wyzwaniem dla wszystkich tego typu modeli językowych. „W tym miejscu naukowcy wciąż mają wiele do zrobienia” – mówi.

Jeden z plakatów WeChat porównywał demonstrowane możliwości chińskiego bota z możliwościami ChatGPT i stwierdził, że lepiej radzi sobie z chińskimi idiomami, aw niektórych przypadkach jest dokładniejszy. Na przykład ChatGPT błędnie twierdził, że dom przodków autora science fiction Liu Cixina, który napisał Problem trzech ciał, to Hubei, podczas gdy Ernie Bot poprawnie odpowiedział Henan. ChatGPT jest zablokowany w Chinach, ale wiele osób znalazło sposoby na uzyskanie do niego dostępu.

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj