大模型与强化学习实习生
职位描述
1. 参与视觉语言模型(VLM)、视觉语言动作模型(VLA)的研发与落地,探索智能座舱内外、具身智能场景中的多模态感知、行为理解与决策能力;2. 跟踪并复现 VLM、VLA、世界模型(World Model)、具身智能强化学习(RL)、模仿学习(Imitation Learning)前沿论文与开源项目,推动技术创新;3. 参与算法设计、模型训练、评估与优化,输出技术调研报告,推动前沿研究成果向实际产品转化;4. 参与数据闭环建设,包括数据采集、处理、标注、训练与评估,支撑多模态智能系统的持续迭代。
职位要求
1. 计算机科学、人工智能、自动化、电子信息等相关专业硕士及以上学历;2. 具备扎实的机器学习、深度学习与计算机视觉基础,对多模态大模型、具身智能等方向有浓厚兴趣;3. 熟练掌握 Python,熟悉 PyTorch、TensorFlow 等主流深度学习框架,具备模型训练、微调与优化经验;4. 熟悉 VLM、VLA、世界模型、具身智能强化学习等相关技术方向中的至少一个,并具备较强的论文阅读与复现能力;5. 具备良好的工程能力与代码规范意识,能够独立完成模型开发、实验设计与性能分析;6. 具备良好的沟通协作能力和学习能力,乐于探索前沿技术并推动技术落地。加分项1. 具有 VLM、RL、VLA、World Model、Embodied AI、SLAM、3D视觉、空间智能等相关项目或实习经历;2. 熟悉多模态大模型训练、微调、评估及部署全流程;3. 具备强化学习(RL)、奖励模型设计(Reward Design)、模仿学习等相关经验;4. 在 CVPR、ICCV、ECCV、NeurIPS、ICLR、CoRL 等顶级会议发表论文,或有高质量开源项目、算法竞赛经历;5. 具备良好的英文读写能力,能够高效阅读前沿论文并输出技术文档。
投递