Anyscale招募软件工程师(Ray Data)

职位描述

本站申请链接

Anyscale,我们的使命是实现分布式计算的民主化,让所有技能水平的软件开发人员都能使用分布式计算。我们正在将 Ray 商业化,这是一个广受欢迎的开源项目,它为可扩展的机器学习创建了一个库生态系统。OpenAIUberSpotifyInstacartCruise 等公司都在其技术堆栈中加入了 Ray,以加快人工智能应用在现实世界中的进展。Andreessen Horowitz、NEA 和 Addition 的支持,迄今为止已筹集了 2.5 亿多美元。员工需要每周来公司 3 次。

关于职位:

Ray 的目标是为构建分布式应用程序(例如特征工程、模型训练和评估的机器学习管道)提供通用 API。数据通常是连接这些不同阶段的核心要素,因此对 Ray 的可用性、性能和稳定性起着至关重要的作用。我们正在寻找有能力的工程师来构建、优化和扩展 Ray 的 Datasets 库和数据处理能力。

关于 Ray Data 团队:

Ray Data 团队目前负责开发和维护 Ray Datasets 库,该库已为关键的生产用例提供支持(例如,亚马逊的 大规模数据压缩和阿里巴巴的 ML 管道)。Ray Datasets 是构建在 Apache Arrow 和 Ray Core(Ray 的 C++ 后端)之上的 Python 库,Ray Data 团队与 Ray Core 组件(包括调度器和内存&I/O 子系统)密切互动。Ray Data 团队还与包括 Train、RLlib 和 Serve 在内的 Ray ML 库密切合作。

您将参与的项目快照:

  • 大规模 Ray 数据集的性能(利用 Arrow 基元、优化 Ray 对象管理器等。)
  • 与 ML 训练和数据源集成
  • 稳定性和压力测试基础架构
  • 领导未来将流式工作负载集成到 Ray 的工作,例如 Ray 上的 Beam
  • 在 Anyscale 托管的 Ray 服务中实现差异化数据操作

offer要求

如果您具备以下条件,我们非常欢迎您的加入:

  • 至少 2 年相关工作经验
  • 扎实的算法、数据结构、系统设计背景
  • 构建可扩展和容错分布式系统的经验
  • 数据处理经验
  • 具有数据处理、数据库内部结构(包括 Spark 或 Dask)方面的经验

offer待遇

薪酬

  • 在 Anyscale,我们采用基于市场的薪酬方法。我们以数据为导向、透明、一致。该职位的目标薪酬为 170,112 美元至 237,000 美元。随着市场数据的变化,该职位的目标薪酬可能会有所调整。
  • 该职位还有资格参与 Anyscale 的股权和福利计划,包括以下内容:
  • 股票期权
  • 医疗保健计划、由 Anyscale 承担 99% 的保费
  • 401k 退休计划
  • 健康津贴
  • 教育津贴
  • 带薪育儿假
  • 灵活的休假时间
  • 通勤报销
  • 100% 的办公餐费

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部