


4 февруари — Китайската компания за изкуствен интелект MiniMax отвори своя пълномодален модел MiniCPM-o4.5, предназначен да позволи естествено взаимодействие в реално време чрез гледане, слушане и говорене едновременно. Изданието бележи преминаване от традиционната парадигма на AI с въпроси и отговори към непрекъснат, проактивен диалог.
При демонстрации на живо MiniCPM-o4.5 може да поеме инициативата, без да бъде подканен. Когато въздушният фритюрник приключи с готвенето и издаде звуков сигнал, моделът проактивно съобщава, че нагряването е приключило. Докато пазарувате в супермаркет, той непрекъснато проследява смяната на рафтовете и отговаря на запитвания за цени в реално време. В асансьорите той разпознава промените на пода и предупреждава потребителите при достигане на местоназначението им.
Тези възможности произтичат от преработена архитектура. Екипът за първи път въведе пълен дуплекс, мултимодален стрийминг механизъм в реално време, позволяващ видео и аудио входовете да се обработват непрекъснато, докато изходите се генерират паралелно – без блокиране. Моделът извършва семантична преценка при приблизително 1 Hz, като автономно решава кога да влезе в разговор, вместо да разчита на откриване на тишина. Това позволява естествени прекъсвания и проактивни реакции.

MiniCPM-o4.5 е естествен модел с 9 милиарда параметъра. MiniMax набляга на фокуса върху edge AI, преследвайки тясно интегриран хардуерно-софтуерен подход в сътрудничество с производителите на чипове. Моделът ще бъде доставен заедно с първия хардуерен AI продукт на компанията – платката за разработка „Pinea Pi“, планирана за пускане по-късно тази година – предлагайки plug-and-play решение, насочено към ускоряване на разработката и внедряването на крайно базиран интелигентен хардуер.
Източник: QbitAI
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта



