职位描述
本站申请链接
Scaleway 成立于 1999 年,是 Iliad 集团(欧洲电信业的领导者之一)的云计算子公司。我们的使命是通过帮助开发人员和企业创建、部署和适配各种基础设施上的应用程序,促进数字产业的责任感。通过位于巴黎和里尔的办事处,我们不断完善 Scaleway 的云计算生态系统,我们是首批用户。我们的25,000多家客户选择了我们的多AZ云服务、我们丰富的用户体验、我们的碳中性数据中心以及我们的多云架构管理工具。我们的产品包括针对裸机、控制和无服务器架构的全面解决方案,为云计算领域提供负责任的选择。加入我们充满活力的 600 多名来自不同领域的合作者组成的团队,在一个充满活力和国际化的环境中学习卓越的技术、创造力和合作精神。Scaleway 正在寻找一名站点可靠性工程师加入我们的团队。你将向首席站点可靠性工程师汇报工作,负责确保我们能够为全球用户提供可靠的产品服务。我们希望您具有强大的开发和系统管理背景。我们的系统在不断发展,观察和采取行动以确保其弹性所需的工具也需要相应发展。
offer要求
Minimum qualifications
- Previous experience as a developer in Go, Python or Rust
- Experience in system programming with usual scripting languages (bash, Python)
- Demonstrated ability to troubleshooting production systems failures
- A great attitude and desire to work with a team
- Passion for incremental improvements on tooling、热爱自动化的一切事物
- 具有使用 Linux 系统(Ubuntu/Debian)的经验
- 具有使用云环境架构(裸机、虚拟机、容器、协调器)的经验
- 对计算机网络有很好的了解:TCP/IP、DNS、负载平衡、IPv6、BGP 和网络虚拟化
- 了解书面和口语,能够用英语撰写技术文档、如果需要,能够说英语
优先资格
- 基础设施即代码和持续部署方面的经验
- 物理硬件自动化方面的经验
- 监控和amp;日志系统的经验
- 管理关系数据库的经验
- 对一个云平台和相关用例的了解
- 主动提出新的解决方案并为其辩护
- 具有团队合作精神,愿意分享知识、
- 具有团队合作精神,愿意分享知识和意见,并定期参加团队活动
- 具有良好的沟通技能和指导技能
职责
- 创建或优化现有工具和文档,以帮助识别、诊断和解决故障
- 与多个工程团队合作排除高影响问题
- 承担待命责任、
- 承担随叫随到的责任,缓解生产中遇到的问题,确保为客户提供最佳的实时解答
- 利用可观察性和监控技术,确保为客户提供高质量的服务
- 管理生产中产品的生命周期
- 帮助实施稳定性、弹性、可扩展性方面的最佳实践、
offer待遇
Technical Stack
- Python, Go, Rust
- RabbitMQ
- PostgreSQL
- HA Proxy、Nginx、REST API / Flask
- S3 API
- Sentry、Prometheus、Grafana、ElasticSearch、Fluentd、Kibana
- Ansible、AWX、Foreman、Salt
- GitLab、Nexus
- Ubuntu、Debian、CentOS
- Jira、Confluence、Slack、GSuite