新闻动态

豆包开源视频天生模子 VideoWorld:独创免言语模子

作者:[db:作者] 时间:2025/02/11 点击:

IT之家 2 月 10 日新闻,豆包年夜模子团队结合北京交通年夜学、中国迷信技巧年夜学独特开辟的视频天生试验模子“VideoWorld”本日开源。差别于 Sora 、DALL-E 、Midjourney 等主流多模态模子,VideoWorld 在业界初次实现无需依附言语模子,即可认知天下。据先容,现有模子年夜多依附言语或标签数据进修常识,很少波及纯视觉旌旗灯号的进修。但是,言语并不克不及捕获实在天下中的全部常识。比方折纸、打领结等庞杂义务,难以经由过程言语清楚表白。而 VideoWorld 去失落言语模子,实现了同一履行懂得跟推理义务。同时,它基于一种潜伏静态模子,可高效紧缩视频帧间的变更信息,明显晋升常识进修效力跟后果。在不依附任何强化进修搜寻或嘉奖函数机制条件下,VideoWorld 到达了专业 5 段 9x9 围棋程度,并可能在多种情况中,履行呆板人义务。IT之家附有关地点如下:论文链接:https://arxiv.org/abs/2501.09781代码链接:https://github.com/bytedance/VideoWorld名目主页:https://maverickren.github.io/VideoWorld.github.io

澳门棋牌电子游戏_澳门棋牌官网入口

客服热线:400-123-4567

邮箱:[email protected]
地址:广东省广州市天河区88号

首页
电话
短信
联系