Create Alert
Email me similar jobs

开放平台运维研发工程师

Premium Full-time Linux Kafka Redis Apache Kafka Python
开放平台运维研发工程师
北京、上海
社招
全职
互联网 / 电子 / 网游 - 研发
职位描述
- 负责开放平台核心业务系统的稳定性保障,覆盖支付交易、计费结算、账号认证等关键链路。- 建设监控告警体系,推动核心链路指标打点和报警覆盖,提升问题发现和定位效率。- 推动 SLO/SLI 体系落地,量化各业务域的服务可用性,用数据驱动架构优化决策。- 负责容量规划、变更管理、故障应急和根因分析,建立规范的线上变更和故障分级处理流程。- 配合多个业务域的架构重构,提供灰度发布、双跑验证、回滚保障的基础设施支持。- 建设自动化运维工具,提升故障定位和恢复效率。- 参与 On-Call 轮值,快速响应和处理线上故障。
职位要求
- 2 年以上 SRE 或后端开发经验,有核心业务链路的稳定性保障经验。- 具备后端研发能力,能独立阅读业务代码,能主动在关键链路上补充指标打点和埋点。- 熟悉监控告警体系(Prometheus / Grafana),有建设和完善监控体系的经验。- 熟悉 Linux 系统,熟练掌握至少一门编程语言(Go / Python / Shell)。- 熟悉常见中间件的运维和调优(MySQL / Redis / Kafka / Elasticsearch)。- 有故障排查和根因分析的实战经验,能在压力下快速定位和止血。- 良好的沟通能力,能与多个研发团队紧密协作。加分项- 有 SLO/SLI 体系建设和落地经验。- 有支付/交易/计费等资金链路的稳定性保障经验。- 有容器化和 K8s 环境下的运维经验。- 有大规模系统压测演练和容量治理经验。
投递