创建提醒
向我发送相似的招聘

大模型推理部署平台后端研发工程师

Premium Full-time
大模型推理部署平台后端研发工程师
武汉
社招
全职
职位 ID:A32259
职位描述
1. 负责大模型平台推理部署的架构设计,包括模型部署、推理优化、模型服务高可用、可观测性等;2. 与业务团队进行沟通和合作,更快落地业务大模型推理部署需求,并持续优化推理性能;3. 跟踪业内最新的大模型推理部署技术,持续完善推理部署功能和使用体验;
职位要求
1. 计算机、人工智能等相关专业本科及以上,5年及以上工作经验;2. 熟练掌握Linux环境下的Go/Python等语言开发和最佳实践, 有解决复杂问题的能;3. 熟悉Kubernetes架构和生态,熟悉Docker/Operator等云原生技术,有云原生系统开发经验;4. 有服务端开发经验,熟悉常用组件MySQL、Redis、Nacos、Prometheus等;5. [加分项]有万级QPS服务端架构设计、分布式架构设计、服务稳定性监控设计经验;6. [加分项]熟悉常用的推理框架TensorFlow、Triton、TGI、vLLM、SGLang等;
投递
相似的工作