字节的开源项目参与了Qwen的训练?

内地明星 1 0

关于林俊旸离开阿里这事 大家都在聊人事和八卦 但我刚听完《晚点》今天最新的播客 听到个有点意思的细节[doge] 播客中透露: Qwen团队在训练中其实使用了 字节开源的强化学习框架veRL[抠鼻R] 重点是: 用了这个框架后 Qwen 的模型效果有了非常明显的提升 “相当于通过控制变量,确定了核心问题是Infra需要优化” 这个细节其实一针见血地解释了 为什么林俊旸一直坚持要搞垂直整合 非要自己在 Qwen 内部组建 Infra团队 而不愿意完全依赖集团通用的 PAI[微笑R] 因为对于一个追求极致效果的技术 Leader 来说 他需要的不是大厂的正确 而是最锋利的刀[暗中观察R] 在大厂的这堵墙里 由于门户之见或流程僵化 通常很难直接使用竞对的技术栈 但俊旸的逻辑是纯粹的实用主义: 只要你的工具好用 哪怕你是字节出的 我也拿来用 技术本无界[叹气R] 好东西就是好东西啊 #互联网大厂[话题]# #ai[话题]# #大模型[话题]# #互联网[话题]# #人工智能[话题]# #AI[话题]# #机器学习[话题]# #深度学习[话题]# #计算机[话题]# #算法[话题]#