职位描述
本站申请链接
offer要求
- 深入了解 Kubernetes 基础设施,并具有管理大规模启用 GPU 的 Kubernetes 集群的经验
- 具有使用 Docker 和容器化应用程序的经验
- 至少具有一种编程语言(如 Python、Golang 等)的经验、Golang 等编程语言的经验
- 具有使用 CI/CD 工具(如 ArgoCD、GitHub Actions 等)的经验
- 具有配置和维护监控系统(如 Grafana、Prometheus 等)的经验
- 具有使用 IaC 工具(如 Terraform 等)的经验
- 能够自如地应对突发事件,并参与随叫随到的轮换
- 充分了解机器学习模型开发生命周期流程和工具:ML 模型开发和实验、培训管道、模型服务和监控
- 能够在快节奏的环境中与工程师、科学家和非技术利益相关者协作并积极主动地开展工作
- 热衷于了解 DevOps 和 MLOps 社区的最新动态
- 具有好奇心、例如 Kubeflow)
- 配置和维护功能和嵌入式存储系统的经验
- 云基础架构经验 – GCP 更佳
offer待遇
