


SkyReels-V4 на Kunlun Tech се класира на 1-во място в световен мащаб в категорията „текст към видео (с аудио)“ в бенчмарка за изкуствен анализ, надминавайки модели, включително Kling 3.0, Google Veo 3.1 и OpenAI Sora 2. Преди това моделът беше класиран на второ място след премиерата си през февруари.
Най-новото надграждане въвежда две ключови технически подобрения. Първо, рамката за обучение за подсилване с пълна модалност интегрира модел на семантично възнаграждение с обучение по учебна програма, позволявайки на системата да генерира 15-секундни 1080p видеоклипове, като същевременно поддържа логическа съгласуваност в прогресията на сцената.
Второ, моделът добавя ключови кадри и базирани на решетка визуални референтни възможности, което позволява на потребителите да качват до девет изображения. Това позволява по-голяма последователност във външния вид на героите и стила на сцената в генерираните последователности.
След издигането си до върха на класацията, SkyReels-V4 отвори API достъп, поддържайки текст към видео, изображение към видео, мултимодално генериране, както и редактиране и възстановяване на видео.
Източник: QbitAI
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта



