你的位置:开云(中国)Kaiyun·官方网站 - 登录入口 > 新闻资讯 > 开云(中国)Kaiyun·官方网站 - 登录入口新容器基于 Linux 平台-开云(中国)Kaiyun·官方网站 - 登录入口
开云(中国)Kaiyun·官方网站 - 登录入口新容器基于 Linux 平台-开云(中国)Kaiyun·官方网站 - 登录入口
发布日期:2025-08-14 07:03 点击次数:128
IT之家 8 月 12 日音尘开云(中国)Kaiyun·官方网站 - 登录入口,科技媒体 WccfTech 昨日(8 月 11 日)发布博文,报说念称英特尔为其锐炫 Pro 系列 GPU 的 Battlematrix 神志,发布首个重磅软件更新 LLM Scaler v1.0,要点优化了 AI 推明智商。
IT之家曾于 5 月报说念,英特尔在 COMPUTEX 2025 台北海外电脑展上,推出锐炫 Arc Pro B50 和 B60 两张显卡除外,还推出了 Project Battlematrix 推理使命站平台,因循最多 8 张锐炫 Pro 显卡并具备软件包因循,能开动高达 150B 参数的中等限制且精度高的 AI 模子。
Battlematrix 平台集成硬件与定制化软件栈,优化推感性能和企业部署体验;而 LLM Scaler 是基于 vLLM 框架建筑的 AI 大模子推理容器,因循多 GPU 膨大、长序列高效推理及多模态任务。
LLM Scaler v1.0 要点优化了 vLLM 推理框架,关于 32B KPI 模子,40K 序列长度下性能普及可达 1.8 倍;70B KPI 模子同要求下普及高达 4.2 倍,8B 至 32B 限制模子输出隐隐量较上版普及约 10%。
该版块还引入分层在线量化,灵验裁减显存占用,并因循管说念并行、数据并行、多模态模子及镶嵌、重排序等功能,普及模子顺应性与膨大性。
为便于企业级运维,LLM Scaler v1.0 集成了 XPU Manager 器用,因循 GPU 电源管制、固件升级、会诊及显存带宽检测。
新容器基于 Linux 平台,充分诈欺多 GPU 膨大和 PCIe 点对点数据传输,竣事最高 80% 的举座性能普及,系统同期具备 ECC、SRIOV、遥测与而已固件更新等可靠性与可管制性特质,欢快企业级部署需求。
英特尔强调,新软件栈慑服行业步伐,兼容主流建筑进程,OneCCL 基准测试器用的集成也为建筑者调优和性能评测提供了便利,进一步丰富了 Battlematrix 平台的生态因循。
凭据英特尔阶梯图,本季度内还将发布更为踏实的容器版块,进一步优化 vLLM 做事智商。瞻望到本年第四季度开云(中国)Kaiyun·官方网站 - 登录入口,Battlematrix 神志将竣事全功能版块落地,推进大模子推理平台的合手续升级,为专科边界用户带来更高效、更易用的 AI 科罚决议。
Powered by 开云(中国)Kaiyun·官方网站 - 登录入口 @2013-2022 RSS地图 HTML地图