职位描述
我们正在快速发展,伴随着增长而来的是扩展方面的挑战。我们正在寻找一名高级 SRE,与我们的 DevOps 团队密切合作,以增强我们的基础设施并支持我们的增长。您将负责的部分领域包括:领导使用数据驱动的分析方法来提高应用程序和平台的可靠性和稳定性,从而改善 SLO;在一个或多个技术领域中展示高水平的技术专业知识,并主动识别和解决与技术相关的瓶颈问题;不容忍重复的手工工作,您将通过自动化和脚本来减少工作量;确保我们能够根据新的增长情况无缝扩展现有的 API 和服务;致力于 HA 架构以支持服务;致力于新服务的部署;致力于开发和维护我们的 CI/CD 基础设施。
offer要求 [offer requirements]
4年以上 DevOps/站点可靠性工程师或类似软件工程角色的工作经验;Hands-on 在 AWS 中管理生产工作负载的经验;丰富的 Unix 和脚本编写经验,展示使用 Python 自动执行任务和简化流程的能力;必须拥有基础设施即代码(IaC)工具和配置管理工具(Terraform、Ansible、Chef 等)方面的经验;熟练使用 Grafana、Datadog、Sentry、Prometheus 等工具,并在可观察性(如监控、SLO 警报和遥测收集)方面拥有经验;以积极主动的态度解决问题,及时发现并解决问题;计算机科学、工程或相关领域的理工科学士学位;任何 AWS 认证都是额外的加分项。
offer福利 [offer benefits]
透明的薪资结构;除公司假期外,每年有 15 天的 PTO;员工股票期权计划;Avoma 是一款智能会议助手,适用于希望将以客户为中心的会议所需的一些常见任务自动化的团队。我们利用 NLP 和机器学习来总结会议记录,并提取讨论的关键主题和行动项目。所有这些数据都会自动同步到客户关系管理中。这有助于节省最终用户的时间,使他们专注于最重要的事情,即与客户的互动;我们是一家获得风险投资的早期初创企业,拥有 1000 多家付费客户,并且每月都在持续增长。
