职位描述 参与共建AGI基础设施,支持大规模的人工智能(深度学习)平台,基于领先的400Gbps 的 Infiniband RDMA 网络和最新的 GPU。结合硬件,操作系统等对平台进行深度分析和优化。 岗位职责: 1. 负责基础设施管理,包括资源调度、扩容、监控和优化。 2. 优化和改进监控系统,确保系统的高可用性和性能。 3. 对新技术进行持续的探索研究,提升效率。 岗位要求: 1. 本科及以上学历,计算机相关专业优先,扎实的计算机软件基础; 2. 具备较强的 Python/go 等开发能力,扎实的系统化工程能力; 3. 具有自动化实践经验; 4. 具备较好的灵活性、学习迁移能力和对新技术的追求精神,能够从0-1快速学习掌握新技术并解决未遇到过的问题; 5. 硬件极客玩家,硬核操作系统开发者优先; 6. 有良好的团队合作精神和积极主动的沟通意识。