创建提醒
向我发送相似的招聘

数据闭环平台研发工程师

Premium Full-time
数据闭环平台研发工程师
北京
社招
全职
数字技术
学历要求不限
3-5 年
职位描述
我们正在寻找一位优秀的数据闭环平台研发工程师,加入智能辅助驾驶技术团队,参与构建支撑智能辅助驾驶持续进化的“数据飞轮”。你将负责数据全链路数据流的构建,打造面向海量数据处理与大模型训练的AI基础设施,参与从数据采集、清洗、标注到训练、仿真的全链路自动化流水线的设计与落地,为算法的高效迭代提供坚实的数据平台支撑。工作职责- 负责数据闭环平台的架构设计与系统研发,支撑算法的规模化迭代- 搭建可支撑PB级数据(涵盖传感器数据、标注数据、仿真场景等)的分布式存储与计算架构- 构建高可用、易扩展、低延迟的服务架构,保障数据从采集、处理到模型训练、评测的端到端高效流转- 参与云边端协同架构方案的设计与实现- 负责设计与完善数据闭环工具链,包括但不限于数据清洗、数据标注、数据脱敏、数据编解码、自动打标等模块的开发- 针对标注数据、场景数据,设计并落地数据清洗(去噪、去重、异常过滤)、解析、切片、抽帧、送标的全流程自动化pipeline- 优化数据处理pipeline的吞吐量与延迟,目标支撑日均百万场景数据处理能力- 推动工具链部署落地,保障工具链的高可用性
职位要求
任职要求- 本科及以上学历,计算机科学、软件工程、自动化、电子信息等相关理工科专业- 3年及以上工作经验,有智能辅助驾驶数据体系相关经验者优先- 良好的编程习惯,精通Python、C++- 擅于使用harness enginnering 提升工作效率- 熟悉分布式计算相关技术,了解Ray、Spark等系统的原理和适用场景- 掌握分布式存储系统,对Elasticsearch、HDFS、MongoDB等有使用经验- 熟悉MySQL、Redis、Doris、ClickHouse等数据库的使用场景加分项- 有大厂/独角兽企业数据工厂搭建、量产项目经验- 有定制数据格式的经验(如自定义传感器数据封装格式、私有标注格式)- 有NN模型开发、部署经验- 熟悉数据自动打标原理及开发流程体系- 熟悉OLAP系统- 熟悉AIGC在数据方向的应用- 熟悉智能辅助驾驶数据闭环、模型训练、模型评测流程
投递