首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
›
reinforcement
NVIDIA Shanghai LLM Reinforcement Learning Algorithm Engineer
酷工作
•
zoe1016aaa
•
4 天前
Reinforcement Learning 的核心基础概念及实现
2
Python
•
lufficc
•
2017 年 5 月 3 日
• 最后回复来自
aphorism
5
关于
·
帮助文档
·
自助推广系统
·
博客
·
API
·
FAQ
·
Solana
·
3178 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms ·
UTC 13:42
·
PVG 21:42
·
LAX 06:42
·
JFK 09:42
♥ Do have faith in what you're doing.
❯