金山云全面接入智谱GLM系列推理模型
日前,金山云星流训推平台全面接入智谱GLM系列推理模型,为首批接入该系列推理模型的平台之一。
聚焦高效部署与分布式推理协同,金山云星流训推平台提供从模型部署到调用的服务能力,通过智能任务调度与跨节点并行计算,该平台可实现模型的高效推理。无需复杂配置,用户即可在公有云环境构建稳定、高性价比的模型服务。
金山云星流训推平台部署GLM系列推理模型流程:
1. 进入金山星流训推平台控制台并创建资源池
2. 进入模型在线服务导航页
3. 点击新建,创建模型在线服务
a. 部署类型选择模型部署
b. 选择GLM系列推理模型,用户可自主配置服务副本数
c. 填写基本信息、资源、网络等配置
d. 点击确认,模型开始部署
*模型部署所需时间较长,请耐心等待
4. 调用模型服务
a. 支持内网、公网调用和在线调试
b. 支持WebUI调用模型
*用户可根据需求选择调用方式进行模型调用


32B/9B系列GLM模型是国产AI大模型独角兽智谱于日前正式开源的,涵盖基座、推理、沉思模型,均遵循 MIT 许可协议。
据悉,GLM-Z1-32B-0414是具有深度思考能力的推理模型,相较其32B基座模型提升了数理能力和解决复杂任务的能力。据智谱公开测试结果,在AIME 24/25、LiveCodeBench、GPQA 等基准测试中,GLM-Z1-32B-0414 在数理推理能力、指令遵循能力和综合工具调用能力等方面表现突出。沿用了上述一系列技术,智谱还训练了一个9B的小尺寸模型。据智谱公开数据,该小尺寸模型虽然参数量更少,但是在数学推理及通用任务上依然表现优异。


此前,金山云星流训推平台已完成DeepSeek等多款大模型部署。通过接入更多优质大模型,金山云将为各领域客户提供更加高效、智能和更具性价比的模型服务。
发表评论