Големите езикови модели се провалят в базова математика

„9.11 и 9.9, кое е по-голямо?“ Въпроси, толкова прости като този, объркват големи езикови модели, включително GPT-4o на OpenAI, Kimi, създаден от Moonshot, и Doubao на ByteDance, според публикация на местната медия Yicai. Чатботовете от китайските Baidu и Tencent генерират правилния отговор, въпреки че използват различни методи, като първият сравнява дробни части, след като заключи, че целите части са еднакви, а вторият, Hunyuan на Tencent, заключава, че 9,9 е по-голямото число, като изчислява, че 9,11 минус 9,9 е отрицателно. ChatGPT и Kimi, които дадоха грешен отговор на първата подкана, бяха правилни, след като потребителите поясниха: „по отношение на числена стойност“. Задвижваните от изкуствен интелект чатботове се захранват с интернет данни и са обучени да чатят с хората по естествен начин, така че да могат да изпълняват текстови задачи, базирани на знания. [Yicai, in Chinese]

Свързани

Нашия източник е Българо-Китайска Търговско-промишлена палaта

Scroll to Top