V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  xuxin123122  ›  全部回复第 1 页 / 共 3 页
回复总数  44
1  2  3  
23 小时 5 分钟前
回复了 shoushen 创建的主题 程序员 建议大家在分享自己项目的时候详细讲讲技术原理
哈哈哈哈同意!
@BrightStarKeeper 目前还没支持 正在考虑 主要视频驱动模型需要适配
@woscaizi 我们群里有不少人成功了~ 不是 phd 的项目 是 side project 做着玩哈哈 欢迎一起贡献
今天准备出个部署包~ 大家多多支持!!!!点点 star 冲 1K !!!!
今天准备出个部署包!!!!!希望大家多多点 star 支持
@blackgloves 谢谢多提意见大佬
@McGrady222 哈哈 我觉得还不错 但是还有优化空间 感觉 fasterliveportrait 这个模型的参数比较敏感(毕竟是预测 keypoints 的)

可以看看 preview 视频,后面再出个详细的
视频演示: https://www.bilibili.com/video/BV1d6VB6iE15/?vd_source=4820076c616e58ceb357c528a571ff11
@McGrady222 这个模式也可以的 我就是在 4090 验证的 我看起来显存就 2GB 左右吧
@Xhack 取决于用什么模型啦 还有选择的资产 如果选择的是视频资产 其实那个视频会反复播放(主要是人的呼吸感)

如果使用高性能的模型比如 flashtalking(diffusion-based 模型),整个人都会动哦。你可以看一下 github 主页的演示视频: https://github.com/datascale-ai/opentalking
@aero99 哈哈 M4Pro 你想不想研究下 mac 部署呀 理论上应该可行的
@dsd2077 哈哈 反正我没投过钱 是有人帮我们刷了吗
@humbass 感觉拿衣服的视频可能是提前录下来的? 不过回复评论那个应该是可以做的~很有意思 我研究一下
@humbass 这个是啥意思? 目前是对话
@Atukey 应该不是的~ 如果 TTS(text to speech, ASR)和 STT (speech to text)用 api 的话,用 3G 显存部署个视频驱动模型就能跑啦。

只是我还没借到除了 3090 4090 的设备 所以没测试~

我们最近搞了个全线路本地部署的方案,大概占用显存 8G 左右,快要上线啦
大家可以看看视频里的效果:

https://www.bilibili.com/video/BV1t7L86TEGt/
5 月 19 日
回复了 xuxin123122 创建的主题 推广 [开源免费] 实时数字人 OpenTalking 项目演示
目前最少的 quicktalk 显存 6Gb 差不多就能跑~
5 月 19 日
回复了 xuxin123122 创建的主题 推广 [开源免费] 实时数字人 OpenTalking 项目演示
我们准备了教程 你也可以 vibe coding 一波~

https://i.imgur.com/rYUKqk4.png
1  2  3  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4601 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 36ms · UTC 09:56 · PVG 17:56 · LAX 02:56 · JFK 05:56
♥ Do have faith in what you're doing.