近期开云体育,即梦AI在官方酬酢媒体上发布了一条新功能上线预报片。视频自满,选拔了全新的多模态视频生成模子OmniHuman,用户仅需输入一张图片和一段音频,就不错生成一条活泼的AI视频,有望大幅擢升AI短片的制作着力和质地。
图片来自即梦AI视频号骨子截图
OmniHuman技巧主页信息自满,该模子为字节卓著自研的闭源模子,可扶植肖像、半身以及全身等不同尺寸的图片输入,并凭证输入的音频,在视频中让东谈主物生成与之匹配的作为,包括演讲、唱歌、乐器演奏以及迁移。关于东谈主物视频生成中常见的手势崩坏,也比拟现存要道赢得了权贵的改善。此外,对动漫、3D卡通等非真东谈主图片输入的扶植后果也较为出色,生成的视频能保抓特定作风和原有的通顺情状。
凭证技巧主页展示的演示后果来看,OmniHuman的生成后果还是具有较高的当然度。为防患该项技巧被不当诈欺,字节卓著技巧团队在主页中格外标注称,OmniHuman将不会对外提供下载。
即梦AI关系庄重东谈主自满,该模子当今已具备较好的发扬,但在生成影视着实级别的视频上仍存在一定的擢起飞间。由其扶植的多模态视频生成功能会在即梦上以小界限内测的面孔进行调优调度,并逐步绽放。该庄重东谈主同期示意,即梦还会对这一功能建造严格的安全审核机制,何况对输出的视频标注水印以作教导,从而确保AI浮现正面、积极的作用,助力视频创作家更好地兑现思象力的抒发。
丹丹 小风开云体育