复旦百度联手突破！音频直接生成4k一小时长视频-pg电子平台

时间：2024-10-21 10:15 作者：顾雨柔

复旦大学与百度携手推出全新ai模型——hallo2，该模型已正式在github开源。hallo2能够生成长达数小时、分辨率为4k的人物动画，相较于前代模型，实现了显著提升。

hallo2模型基于latent diffusion models构建，引入了数据增强方法，如patch-drop和高斯噪声，有效提升了长时间视频的视觉一致性和时间连贯性。同时，该模型还结合了向量量化生成对抗网络和时间对齐技术，确保了高分辨率视频的质量和流畅性。

hallo2还创新性地将可调整的语义文本标签的肖像表情作为条件输入，提高了生成内容的可控性和多样性。据项目页面介绍，hallo2是首个实现4k分辨率并生成长达1小时音频驱动人像图像动画的方法，且可通过文本提示进行增强。

附hallo2项目地址。

更多>同类内容

10-21

10-21

10-21

10-21

10-21

10-21

10-20

10-20

10-20

10-20

10-20

10-20

10-20

10-20

10-20

推荐图文

复旦百度联手突破！音频直接生成4k一小时长	辛巴与叶柯激烈交锋：谁有权评价伍佰引热议
20日短剧热度王：《消失的厨神》夺冠，6373	《漫威蜘蛛侠2》pc版确认：无额外剧情dlc

推荐内容

点击排行

微信扫一扫
加微信拉群
电动汽车群
科技数码群