Create Alert
Email me similar jobs

数据研发高级工程师

Premium Remote Friendly Full-time
数据研发高级工程师
广州
全职
通用智能板块
职位描述
岗位定位聚焦自动驾驶领域大数据基础设施搭建、数据价值挖掘与平台优化,兼顾底层架构构建与业务落地支撑,核心是搭建高效、稳定的智能数据底座,支撑生产链路监控管理、算法训练、业务运营分析、车端业务需求,同时兼顾数据治理降本相关业务,要求具备较强的技术攻坚能力与综合协同能力。职位描述1、 数据资产体系建设:a.分层建设统一通用数据资产:构建感知数据资产体系,实现基础数据标准化供给;b.生产系统监控指标体系建设:快速输出生产流程监控数据,保障生产流程安全高效;c.产品运营监控指标体系建设:快速输出运营监控数据,保障业务运营便捷高效;2、 生产研发流程的数据支持:如日志埋点、车联网数据、内部与外部数据的采集、数据同步、数据清洗与标准化、数据模型设计、离线数据处理、实时数据处理、数据服务化、数据可视化等;支持自动驾驶、智能座舱、海外数据采集、机器人数据采集等业务的开展。3、 数据治理:a.数据安全生产规范:制定及推广数据标准(如研发规范、质量规范、保障规范)和治理流程,确保数据准确性、完整性和一致性。b.元数据管理:负责元数据管理、数据质量检查、数据分级管理,提升数据易用性及稳定性。c.计算存储成本管理:通过数据生命周期管理能力建设,数据内容挖掘,识别并删除无效数据,降低数据生产成本。4、 新技术跟踪与落地:负责多模态湖仓体系前沿技术跟踪、工具链选型测试与落地,参与资源与性能调优,推动智能数据底座落地。
职位要求
1、学历与经验:计算机、软件工程、数据科学或相关专业本科及以上学历(硕士优先),5年以上大数据相关经验。有大型互联网公司、自动驾驶企业或物理AI领域项目经验者优先。2、数据相关经验:精通数据仓库研发,精通大数据技术栈/Hadoop生态体系,具备PB级数据ETL&建模经验,计算节点开发与调优经验。熟悉 Paimon/Iceberg等新的计算引擎,了解其内部原理(事务ACID、Schema Evolution、Time Travel等)。有多模态湖仓建模、大规模近实时数仓、元数据管理相关实际经验者优先。3、 编程与技术能力:精通Python/SQL 至少一种。能编写高性能、可维护的分布式数据处理代码;深入理解Flink、Spark、Kafka等大数据框架组件原理,有性能调优经验。4、向量数据能力:了解Lance(或Arrow、Parquet向量扩展)等高效列存格式,了解ANN索引构建、向量同步、标量+向量混合查询等关键技术者优先。5、 架构与业务理解:熟悉多模态湖仓技术体系。具备良好的自动驾驶业务理解力,能打通感知、规控、场景理解等环节的数据需求,建设高效、可扩展的多模态湖仓数据基础能力。6、综合能力:具备系统性思维、主动推进能力与问题解决能力,逻辑严密、思路清晰;有较强的学习能力、创新精神,良好的沟通能力与跨团队(算法、平台、业务)协作能力,责任心强。
投递