职位描述
***必须位于三藩市湾区,否则您的申请将不予考虑***
我们的客户是一家获得风险投资支持的 SaaS 初创公司,最近刚刚获得 A 轮融资。他们正在为整个营销行业解决数十亿美元的数据质量问题。他们的平台使各大品牌和出版商能够优化消费者数据质量,提高营销投资回报率。在快节奏的协作环境中,他们致力于追求卓越和创新。
主要职责:
- 使用 Spark 和 AWS EMR 设计和维护可扩展的数据管道,以处理 TB 级的消费者数据
- 编写、测试和优化定制的 Scala 代码、测试和优化 ETL 工作流程的定制 Scala 代码
- 使用 Airflow 在 AWS 云环境中部署和管理 ETL 流程
- 通过 Snowflake 和 Databricks 自动向企业客户交付结构化数据
- 与数据科学团队合作,优化数据基础设施
- 使用 SQL 为数据建模工作做出贡献,以实现高效的大规模数据管理
- 使用 Tableau 创建监控工具和 KPI,以确保数据管道的健康状况
- 为内部团队和外部客户维护全面的文档
Tech Stack:AWS(EMR、EC2、S3、Athena、Sagemaker)、Spark、DBT、Snowflake、Databricks、Airflow、Terraform、Github、Tableau
编程语言:Scala、Python、SQL 和 Bash
offer要求 [offer requirements]
- 5-7 年相关工作经验(3-5 年可考虑)
- 强大的 SQL 和 Scala 技能
- 云计算工具经验(例如,Spark、AWS EMR、Snowflake、Databricks)
- 精通数据建模和分布式数据处理
- 出色的沟通技能,包括向非技术利益相关者解释复杂的概念
理想的候选人应具备以下条件:
- 能够在快节奏的初创企业中工作,在最少的监督下承担高影响力的职责
- 沟通能力强,善于向不同的利益相关者解释复杂的数据概念
- 热衷于解决营销中的数据质量挑战、具有相关行业经验
- 致力于长期发展,对所有权和未来团队领导潜力感到兴奋
offer福利 [offer benefits]
Compensation:
- 薪资范围:160,000 – 180,000 美元
- 股票期权包
- 全面健康福利和 401k
工作环境:
- 混合模式:平均 3 天在办公室,2 天在远程办公室
- 小团队、小型、高影响力的团队,有发展计划
- 直接向数据科学主管报告