模型效率技术人员

官网 Cohere

职位描述

我们的使命是扩展智能以服务人类。我们正在为开发人员和企业培训和部署前沿模型,这些开发人员和企业正在构建人工智能系统,为内容生成、语义搜索、RAG 和代理等神奇体验提供动力。我们相信,我们的工作有助于人工智能的广泛应用。我们专注于我们所构建的内容。我们每个人都有责任为提高我们模型的能力及其为客户带来的价值做出贡献。Cohere 是一支由研究人员、工程师、设计师等组成的团队,他们对自己的工作充满热情。每个人都是世界上最优秀的人才之一。加入我们的使命,塑造未来!大型语言模型 (LLM) 在各种任务中都表现出了卓越的性能。然而,LLM 推理所需的大量计算和内存给部署带来了挑战。模型效率团队负责通过改进模型架构和优化 ML 框架来提高基础模型的推理效率。作为该团队的一名工程师,您将通过剖析系统、识别瓶颈和使用创新解决方案解决问题,来改进包括延迟和吞吐量在内的关键模型服务指标。请注意:我们在多伦多、旧金山、纽约和伦敦设有办事处。我们欢迎远程友好环境,作为这种方法的一部分,我们根据兴趣、专长和时区战略性地分配团队,以促进协作和灵活性。您会发现模型效率团队集中在东部标准时间和太平洋标准时间两个时区。

offer要求 [offer requirements]

如果您具备以下条件,您可能非常适合加入模型效率团队:在开发高性能机器学习算法或机器学习基础架构方面拥有丰富的经验。在大型语言模型方面拥有实际操作经验。偏好行动和结果。渴望解决具有挑战性的机器学习研究问题。如果您在这些领域之一也拥有丰富的经验,那将是一个极大的优势:模型压缩技术:量化、剪枝、稀疏性、低秩压缩、知识提炼等。GPU/加速器编程或高性能计算。LLM 推理性能建模。机器学习框架内部。如果上述某些内容与您的经验不完全相符,我们仍然鼓励您申请!

offer福利 [offer benefits]

🦷 全面的健康和牙科福利,包括照顾您心理健康的单独预算。🐣 为加拿大、美国和英国员工提供 6 个月的 100% 育儿假补贴。🎨 艺术和文化方面的个人丰富福利。🏙远程灵活办公,在多伦多、纽约、旧金山和伦敦设有办事处,并提供联合办公津贴。✈️ 6 周假期。

滚动至顶部