职位描述 1、对图像、视频、文本等进行深入的语义理解,支持短视频、直播、搜索、推荐、商业化等业务需求; 2、推进视觉相关基础技术研发,如大规模分类、检测、分割、序列识别、人脸、自监督学习、内容生成、模型压缩和优化等。 任职要求 1、硕士及以上学历,对视觉前沿技术有浓厚兴趣,时刻跟进学术界最新进展,有自己独立的想法和判断,能够快速复现学术界最新成果; 2、编程基础扎实,熟练掌握C++/Python,熟悉Pytorch、TensorFlow等训练框架; 3、对常见的模型结构、建模方法、Loss设计、优化策略、训练过程中的重要tricks等有深入了解和丰富经验; 4、工作认真努力,有很好的沟通能力。
职位描述 参与快手大模型推理引擎研发,工作内容包括: 1、参与大模型推理引擎的设计和研发,支撑快手自研以及开源模型的快速部署和高性能推理; 2、通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等; 3、支持RL中的多样化采样、generation性能优化等。 任职要求 1、有较强的学习能力和编程能力及数学基础; 2、有开源大模型推理框架(vllm/slang/trt-llm)使用和优化经验者优先; 3、有cuda或triton开发优化gpu算子经验者优先; 4、有昇腾、寒武纪、沐曦、海光、AMD 等算力芯片优化经验者优先; 5、有大模型推理相关从业经验者优先。