英特尔发布Project Battlematrix推理工作站软件更新
英特尔发布Project Battlematrix(战斗阵列)推理工作站软件更新,英特并计划在第三季度末发布功能更全面的推理强化版LLM Scaler。 今年5月,工作英特尔发布了代号为Project Battlematrix(战斗阵列)的站软推理工作站。推理工作站具有广阔的英特发展前景,主要表现在:一是推理安全部署,数据可在本地进行处理;二是工作易于设置,将所有软件置于容器中,站软提供一站式解决方案;三是英特易扩展,可灵活配置不同数量的推理显卡;四是在成本效益上具有显著优势。Project Battlematrix推理工作站最多可支持八块英特尔锐炫 Pro B60 24GB GPU,工作提供高达192GB的站软VRAM,运行高达1500亿参数的英特中等规模且精度高的AI模型。 英特尔采用容器化方案来帮助客户解决软件部署的复杂性问题。在容器内部,工作对大语言模型进行了大量的优化,包括Linux软件栈的支持、验证以及分阶段的软件发布。基于全新的推理优化软件栈,Project Battlematrix还能够简化英特尔锐炫Pro B系列GPU的部署,加速英特尔GPU和AI战略的落实。 全新的软件栈在设计时充分考虑了易用性和行业标准,是专为Linux环境构建的容器化解决方案。经过优化,该方案能够借助多GPU扩展和PCIe P2P数据传输,带来卓越的推理性能。与此同时,该方案还具备企业级的可靠性和可管理性,如ECC、SRIOV、遥测和远程固件更新等。 LLM Scaler容器1.0版本对于前期客户支持至关重要,英特尔进行了以下更新: vLLM: ·针对长输入长度(>4K)的TPOP性能优化:在32B KPI模型上,40K序列长度的性能提升高达1.8倍;在70B KPI模型上,40K序列长度的性能提升高达4.2倍 ·与上一版本相比,8B-32B KPI模型的输出吞吐量性能优化约10% ·逐层在线量化,减少所需的GPU内存 ·支持vLLM中的PP(流水线并行)(实验性) ·支持torch.compile(实验性) ·推测解码(实验性) ·支持嵌入和重排序模型 ·增强的多模态模型支持 ·最大长度自动检测 ·数据并行支持 OneCCL基准测试工具支持 XPU Manager: ·GPU功耗 ·GPU固件更新 ·GPU诊断 ·GPU内存带宽 英特尔表示此版本将按照5月初发布时公开的时间表顺利交付,并计划在第三季度末发布功能更全面的强化版LLM Scaler,同时积极争取在第四季度发布完整版本。
-
上一篇
-
下一篇
- 最近发表
- 随机阅读
-
- A股“较好壕”董秘!福莱特阮泽云身家26亿,企业新闻
- 出来混迟早要还!嚣张大帝吃了瘪 惨遭小萨博尼斯暴力隔扣
- 7月份中国炼焦煤进口量环比增长5.7%
- 厦门:“沉浸+”重塑文旅新业态
- 工人复工经销商另起炉灶 吴长江系内部分裂
- 今起,铁路部门优化车票改签规则
- 安徽省用电负荷今年第三次刷新纪录_
- 直通县市两会|政协宁南县第十五届委员会第三次会议开幕
- 《艾尔登法环:黑夜君临》1.02补丁下周发布 增加单人游玩符文产量
- 厦门:“沉浸+”重塑文旅新业态
- 周琦发展联盟12分16板3盖帽 周琦发展联盟平均数据高吗?
- 美联储降息预期压垮美元,加元多头狂欢时刻!
- 工信部发布《制造业设计能力提升 专项行动计划(2019
- 如何投資房地產?名下共同房產價值2億的25歲房仲解答|天下雜誌
- 云南路建十五集团领导同云南省个旧市委书记会谈
- 民藏曙光:不问来处,科学确真才能开启黄金纪元 收藏资讯
- 河南下周天气以多云为主 中后期转入阴雨降温
- 周琦发展联盟12分16板3盖帽 周琦发展联盟平均数据高吗?
- 中国电影“决战”2025春节档
- 云南路建集团领导同云南省红河州元阳县副县长会谈
- 搜索
-