算子开发工程师
职位描述
1. 设计并优化CUDA算子/ DSP算子,针对公司自研芯片架构,开发高性能异构计算算子,支撑大模型推理、实时图像处理等关键业务。2. 搭建和完善算子测试验证平台,保证算子的工程化落地。
职位要求
学历背景:1.重点大学硕士/,计算机/电子/数学/AI方向核心技术栈:1.精通 C/C++ 与 Python,掌握Linux开发环境及性能剖析工具(gprof/perf)。2.深入理解GPU架构(SM/Tensor Core/Memory Hierarchy)及CUDA编程模型(Kernel/Thread Hierarchy/Stream)。3.具备高性能计算基础:并行算法、缓存优化、向量化指令集(AVX/NEON)。实操经验(至少满足1项):4.有CUDA/OpenCL算子开发优化经验。熟悉深度学习框架底层(PyTorch CUDA Extension/TensorFlow XLA)。5.参与过异构计算项目(GPU+FPGA/ASIC/DSP协同计算)。
投递