作为资深系统支持工程师,你将在保证复杂应用系统的运行效率、稳定性和可用性方面发挥关键作用。除了个人贡献,你还将领导团队实现运营成功,同时提高事件管理和DevOps的熟练程度。你将直接与客户接触,将面向客户的视角带入问题解决中,你的战略观点将在制定和提供创新解决方案方面发挥关键作用,这些解决方案将对团队和我们的客户产生持久影响。
岗位职责
- 理解复杂的应用系统,并找到处理商业影响问题的方法
- 运用事件管理流程和工具,应用监控指标和工具方面的技能来生成报告并采取纠正行动
- 利用你对不同日志技术(各种级别)的知识,并用它们进行警报、监控和确定事件的根本原因
- 遵循标准和最佳实践,提高系统的运行效率、稳定性和可用性
- 领导系统升级、迁移和维护活动的规划和执行,将运营中断和停机时间降至最低
- 有效地使用DevOps工具和实践来部署和运行软件
- 通过你的技术知识和领导力,成为年轻同事们的导师
- 应用我们的技术雷达中的最新技术思维来解决客户问题
- 主动识别潜在问题并实施预防措施
- 与客户保持一致和透明的沟通,让他们了解进度和更新,发现利用技术提高业务效率和效果的机会,并影响客户
我们的要求
技术技能
- 拥有丰富的Java和SpringBoot使用经验,以及对Python或Shell等脚本语言的良好理解
- 了解常用的前端框架,如React, VUE或Angular
- 对AWS、Azure或GCP等云平台有良好的理解
- 有使用EKS、DataDog、HoneyComb、Prometheus或Grafana等应用监控告警工具的经验,理解与之相关的各种指标,并能生成报告并采取纠正行动
- 有使用关系或非关系数据库的经验
- 有使用Jenkins、Github、Actions、Buildkite或Azure管道等CI/CD工具的经验
- 必须具有强大的调试和分类技巧,以有效地排查代码
- 有能力确保交付的成果,即对现有代码库的错误修复和增强,是高质量且经过充分测试的
- 可以进行系统性能分析,识别瓶颈并实施优化策略以提高系统效率
- 可以进行预测分析,并与开发团队合作提前识别问题,对各种架构如单体、N层、分层、微服务和无服务器有高级理解
专业技能
- 能够影响他人,并始终倡导技术卓越,同时在需要时对变化持开放态度
- 有良好的沟通和表达技巧
- 在外部技术社区有影响力,并愿意通过演讲、对开源的贡献、博客等方式与他人分享你的专业知识
- 对模糊的情况有韧性,并能从多个角度应对挑战
- 可以在需要时影响客户对各种流程的看法,包括事件管理、支持水平、工作范围等,并能详细地沟通以证明这种变化
- 主张并实施云最佳实践,包括资源优化、监控和警报
- 倡导最佳的安全实践并实施
- 对敏捷方法如Scrum或Kanban比较了解
- 愿意进行轮班,成为需要提供24x7 oncall服务团队的一员,能够处理多个项目的工作
- 有良好的英语沟通技巧,并能直接与客户沟通
其它你可以了解的
学习与发展
在 Thoughtworks 没有一刀切的职业道路您的职业发展完全取决于您个人。同时我们也会平衡自主权与我们的文化。您的职业生涯也会有互动工具、众多发展计划和愿意帮助您成长的同事的支持。我们认为互相帮助是我们最好的价值,这是我们的员工职业生涯中赋予他们权力。
关于Thoughtworks
Thoughtworks 是一家集战略、设计和工程推动数字创新为一体的全球技术咨询公司。 30 多年来,我们团队提供的卓有成效的解决方案赢得了客户的持续信任。在这里有计算机科学专业的毕业生,也有经验丰富的技术人员,有自学成才的开发人员、也有中途加入的人员,大家共同学习、面临挑战。大家的职业生涯因为加入我们而得到了更好发展,我们也因此在世界各地获得了无数奖项。
加入 Thoughtworks ,持续成长。让我们一起用好奇心、创新、热情和奉献精神超越平凡。
#LI-Onsite
Read Full Description