V2EX › xuxin123122 的所有回复 › 第 1 页 / 共 3 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

1 2 3

❮

❯

23 小时 5 分钟前

回复了 shoushen 创建的主题 › 程序员 › 建议大家在分享自己项目的时候详细讲讲技术原理

哈哈哈哈同意！

23 小时 6 分钟前

回复了 xuxin123122 创建的主题 › 推广 › [开源] OpenTalking：整合 LLM、流式 TTS 与 WebRTC 的实时数字人编排框架

@BrightStarKeeper 目前还没支持正在考虑主要视频驱动模型需要适配

5 天前

回复了 xuxin123122 创建的主题 › 推广 › [实时数字人开源项目] 重磅更新！实时数字人支持视频克隆模式！

@woscaizi 我们群里有不少人成功了~ 不是 phd 的项目是 side project 做着玩哈哈欢迎一起贡献

7 天前

回复了 xuxin123122 创建的主题 › 推广 › [开源实时数字人 OpenTalking] 重磅支持视频“卡卡西”(克隆)模式！

今天准备出个部署包~ 大家多多支持！！！！点点 star 冲 1K ！！！！

7 天前

回复了 xuxin123122 创建的主题 › 推广 › [实时数字人开源项目] 重磅更新！实时数字人支持视频克隆模式！

今天准备出个部署包！！！！！希望大家多多点 star 支持

7 天前

回复了 xuxin123122 创建的主题 › 推广 › [实时数字人开源项目] 重磅更新！实时数字人支持视频克隆模式！

@blackgloves 谢谢多提意见大佬

7 天前

回复了 xuxin123122 创建的主题 › 推广 › [开源实时数字人 OpenTalking] 重磅支持视频“卡卡西”(克隆)模式！

@McGrady222 哈哈我觉得还不错但是还有优化空间感觉 fasterliveportrait 这个模型的参数比较敏感(毕竟是预测 keypoints 的)

可以看看 preview 视频，后面再出个详细的
视频演示: https://www.bilibili.com/video/BV1d6VB6iE15/?vd_source=4820076c616e58ceb357c528a571ff11

7 天前

回复了 xuxin123122 创建的主题 › 推广 › [开源实时数字人 OpenTalking] 重磅支持视频“卡卡西”(克隆)模式！

@McGrady222 这个模式也可以的我就是在 4090 验证的我看起来显存就 2GB 左右吧

8 天前

回复了 xuxin123122 创建的主题 › 推广 › 开源实时数字人 OpenTalking 本地化部署演示！

@Xhack 取决于用什么模型啦还有选择的资产如果选择的是视频资产其实那个视频会反复播放（主要是人的呼吸感）

如果使用高性能的模型比如 flashtalking(diffusion-based 模型)，整个人都会动哦。你可以看一下 github 主页的演示视频： https://github.com/datascale-ai/opentalking

8 天前

回复了 xuxin123122 创建的主题 › 推广 › 我的实时数字人开源项目被知乎官方推荐了，纪念一下哈哈！

@aero99 哈哈 M4Pro 你想不想研究下 mac 部署呀理论上应该可行的

5 月 30 日

回复了 xuxin123122 创建的主题 › 推广 › 我的实时数字人开源项目被知乎官方推荐了，纪念一下哈哈！

@dsd2077 哈哈反正我没投过钱是有人帮我们刷了吗

5 月 29 日

回复了 xuxin123122 创建的主题 › 推广 › [开源免费] 实时数字人 OpenTalking 项目演示 -- 新闻主播数字人

@humbass 感觉拿衣服的视频可能是提前录下来的？不过回复评论那个应该是可以做的~很有意思我研究一下

5 月 28 日

回复了 xuxin123122 创建的主题 › 推广 › [开源免费] 实时数字人 OpenTalking 项目演示 -- 新闻主播数字人

@humbass 这个是啥意思？目前是对话

5 月 28 日

回复了 xuxin123122 创建的主题 › 推广 › 开源实时数字人项目持续迭代中.....2GB 显存部署方案已完成.....目标支持消费级卡全链路本地部署~

@wsbqdyhm https://www.bilibili.com/video/BV1u5GR6vE8b/?vd_source=4820076c616e58ceb357c528a571ff11 看看这里！

5 月 25 日

回复了 xuxin123122 创建的主题 › 推广 › [开源免费] 实时数字人 OpenTalking 项目演示 -- 新闻主播数字人

@Atukey 应该不是的~ 如果 TTS(text to speech, ASR)和 STT (speech to text)用 api 的话，用 3G 显存部署个视频驱动模型就能跑啦。

只是我还没借到除了 3090 4090 的设备所以没测试~

我们最近搞了个全线路本地部署的方案，大概占用显存 8G 左右，快要上线啦

5 月 21 日

回复了 xuxin123122 创建的主题 › 推广 › [开源] OpenTalking 进展同步： Avatar 资产预热、本地语音链路和实时数字人体验继续优化

大家可以看看视频里的效果:

https://www.bilibili.com/video/BV1t7L86TEGt/

5 月 21 日

回复了 xuxin123122 创建的主题 › 推广 › [开源] OpenTalking 进展同步： Avatar 资产预热、本地语音链路和实时数字人体验继续优化

https://i.imgur.com/sVZeS3Q.png

5 月 21 日

回复了 xuxin123122 创建的主题 › 推广 › [开源] OpenTalking 进展同步： Avatar 资产预热、本地语音链路和实时数字人体验继续优化

https://i.imgur.com/D37LB1n.png

5 月 19 日

回复了 xuxin123122 创建的主题 › 推广 › [开源免费] 实时数字人 OpenTalking 项目演示

目前最少的 quicktalk 显存 6Gb 差不多就能跑~

5 月 19 日

回复了 xuxin123122 创建的主题 › 推广 › [开源免费] 实时数字人 OpenTalking 项目演示

我们准备了教程你也可以 vibe coding 一波~

https://i.imgur.com/rYUKqk4.png

1 2 3

❮

❯