创建提醒
向我发送相似的招聘

智能辅助驾驶强化学习算法工程师

Premium Full-time Simulation Prediction
智能辅助驾驶强化学习算法工程师
上海
社招
全职
数字技术 - 算法
硕士及以上
5-7 年
职位描述
负责智能辅助驾驶端到端模型的强化学习训练框架设计与优化,包括但不限于 PPO、GRPO、DPO、Offline RL、RLHF 等技术路线。负责智能辅助驾驶训练数据体系建设,包括数据版本管理、数据质量评估、场景覆盖分析、长尾场景挖掘和数据迭代策略设计。负责智能辅助驾驶奖励模型(Reward Model)和评测体系建设,设计兼顾安全性、舒适性、效率和规则遵守的奖励函数体系。负责智能辅助驾驶模型训练闭环建设,包括数据挖掘、数据生产、训练、评测、回灌和迭代优化。负责大规模分布式训练任务开发与优化,提升训练效率、资源利用率和模型收敛效果。探索 Diffusion、Autoregressive、World Model、RL 等前沿技术在智能辅助驾驶中的应用,并推动落地。跟踪学术界和工业界最新进展,推动先进算法在业务中的快速验证和落地。
职位要求
计算机、人工智能、自动化、机器人等相关专业硕士及以上学历。扎实的机器学习和深度学习基础,熟悉 Transformer、Diffusion、LLM 等主流模型架构。熟悉强化学习基础理论,包括:MDP、Policy Gradient、Actor-Critic、Offline RL熟悉智能辅助驾驶训练链路,包括:数据构建数据清洗数据版本管理模型训练模型评测闭环迭代具备良好的工程能力,能够独立完成算法设计、实验验证和线上部署。加分项有端到端(E2E Driving)经验。有 Planning、Behavior、Trajectory Prediction 或 Closed-loop Simulation 经验。有 CARLA、闭环仿真或真实车辆部署经验。
投递