Create Alert
Email me similar jobs

顶尖应届-大模型训练框架研发工程师-基础技术平台

Premium Full-time C++
顶尖应届-大模型训练框架研发工程师-基础技术平台
北京
校招
正式
软件研发类
27届未来星
职位描述
1、基于 PyTorch、DeepSpeed、Megatron-LM 等,设计、优化大模型训练框架,提升效率、稳定性与扩展性,支撑大规模高效训练与部署。2、攻克分布式通信、内存显存优化、数据加载加速等关键技术,保障高效稳定训练,降低资源消耗。3、开展性能评估与调优,构建监控体系,实时定位瓶颈并提出优化方案,确保跨硬件最优性能。
职位要求
1、硕士及以上学历,计算机、软件工程、数学等相关专业,具备扎实计算机理论基础和丰富编程经验;2、熟悉 C++ / Python,掌握至少一种深度学习框架(如 PyTorch),理解Transformer系统深度学习原理算法;3、熟悉 GPU 和其他加速硬件的使用,有基本的性能调优经验,有CUDA优化、Triton经验优先;4、了解大模型训练框架,熟悉分布式训练原理和技术,能针对大模型训练性能瓶颈进行优化优先;5、有良好团队协作与沟通能力,有强烈的上进心和自我驱动,学习适应能力强,乐观自信,能挑战自我不断追求卓越。
投递
Similar jobs