Site Reliability Engineer – SRE Paris

  • 海外
  • Paris

职位描述

Scaleway 成立于 1999 年,是 Iliad 集团(欧洲电信业的领导者之一)的云计算子公司。我们的使命是通过帮助开发人员和企业创建、部署和适配各种基础设施上的应用程序,促进数字产业的责任感。通过位于巴黎和里尔的办事处,我们不断完善 Scaleway 的云计算生态系统,我们是首批用户。我们的25,000多家客户选择了我们的多AZ云服务、我们丰富的用户体验、我们的碳中性数据中心以及我们的多云架构管理工具。我们的产品包括针对裸机、控制和无服务器架构的全面解决方案,为云计算领域提供负责任的选择。加入我们充满活力的 600 多名来自不同领域的合作者组成的团队,在一个充满活力和国际化的环境中学习卓越的技术、创造力和合作精神。Scaleway 正在寻找一名站点可靠性工程师加入我们的团队。你将向首席站点可靠性工程师汇报工作,负责确保我们能够为全球用户提供可靠的产品服务。我们希望您具有强大的开发和系统管理背景。我们的系统在不断发展,观察和采取行动以确保其弹性所需的工具也需要相应发展。

offer要求 [offer requirements]

Minimum qualifications

  • Previous experience as a developer in Go, Python or Rust
  • Experience in system programming with usual scripting languages (bash, Python)
  • Demonstrated ability to troubleshooting production systems failures
  • A great attitude and desire to work with a team
  • Passion for incremental improvements on tooling、热爱自动化的一切事物
  • 具有使用 Linux 系统(Ubuntu/Debian)的经验
  • 具有使用云环境架构(裸机、虚拟机、容器、协调器)的经验
  • 对计算机网络有很好的了解:TCP/IP、DNS、负载平衡、IPv6、BGP 和网络虚拟化
  • 了解书面和口语,能够用英语撰写技术文档、如果需要,能够说英语

优先资格

  • 基础设施即代码和持续部署方面的经验
  • 物理硬件自动化方面的经验
  • 监控和amp;日志系统的经验
  • 管理关系数据库的经验
  • 对一个云平台和相关用例的了解
  • 主动提出新的解决方案并为其辩护
  • 具有团队合作精神,愿意分享知识、
  • 具有团队合作精神,愿意分享知识和意见,并定期参加团队活动
  • 具有良好的沟通技能和指导技能

职责

  • 创建或优化现有工具和文档,以帮助识别、诊断和解决故障
  • 与多个工程团队合作排除高影响问题
  • 承担待命责任、
  • 承担随叫随到的责任,缓解生产中遇到的问题,确保为客户提供最佳的实时解答
  • 利用可观察性和监控技术,确保为客户提供高质量的服务
  • 管理生产中产品的生命周期
  • 帮助实施稳定性、弹性、可扩展性方面的最佳实践、

offer福利 [offer benefits]

Technical Stack

  • Python, Go, Rust
  • RabbitMQ
  • PostgreSQL
  • HA Proxy、Nginx、REST API / Flask
  • S3 API
  • Sentry、Prometheus、Grafana、ElasticSearch、Fluentd、Kibana
  • Ansible、AWX、Foreman、Salt
  • GitLab、Nexus
  • Ubuntu、Debian、CentOS
  • Jira、Confluence、Slack、GSuite
滚动至顶部