搜索
条件筛选:
大模型推理引擎研发工程师
大模型推理引擎研发工程师
面议
北京 硕士
职位描述
参与快手大模型推理引擎研发,工作内容包括:
1、参与大模型推理引擎的设计和研发,支撑快手自研以及开源模型的快速部署和高性能推理;
2、通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等;
3、支持RL中的多样化采样、generation性能优化等。


任职要求
1、有较强的学习能力和编程能力及数学基础;
2、有开源大模型推理框架(vllm/slang/trt-llm)使用和优化经验者优先;
3、有cuda或triton开发优化gpu算子经验者优先;
4、有昇腾、寒武纪、沐曦、海光、AMD 等算力芯片优化经验者优先;
5、有大模型推理相关从业经验者优先。
工作地点:
北京市海淀区北京海淀区元中心快手乐园
一键扫码
马上投递
面议
北京 硕士
北京快手科技有限公司
股份制企业 电子/微电子技术/集成电路
1
前往
选择更多城市 (更多城市持续上线中…)