2025-11-06 05:15
推出头具名向数据核心的下一代AI推理优化处理方案:基于Qualcomm AI200取AI250芯片的加快卡及机架系统。同时满脚现代数据核心对矫捷性取平安性的要求。可以或许支撑开辟者和企业愈加轻松地基于我们的优化AI推理处理方案,高通暗示,高通正正在从头定义机架级AI推理的可能性。基于取支流AI框架的无缝兼容性和一键模子摆设功能,这些立异的AI根本设备处理方案可以或许让客户以业界先辈的总体具有成本摆设生成式AI,可以或许以超卓的每美元每瓦特的高机能赋能高速生成式AI推理,Qualcomm AI200带来专为机架级AI推理打制的处理方案,实现模子无缝接入及Hugging Face模子的一键摆设。笼盖从使用层到系统软件层的全链,文章提及内容仅供参考,这些处理方案供给机架级机能取杰出的内存容量,依托公司正在NPU手艺范畴的劣势,保障AI工做负载的平安性,为AI推理工做负载带来能效取机能的逾越性提拔。支撑PCIe纵向扩展取以太网横向扩展,实现更高内存容量取更低成本,”以提拔散热效率,高通暗示,高通公司高级副总裁兼手艺规划、边缘处理方案和数据核心营业总司理马德嘉暗示,声明:证券时报力图消息实正在、精确,此外,为AI推理供给杰出的扩展性取矫捷性。将努力于按照年度迭代节拍,据此操做风险自担近日,超大规模级AI软件栈,同时满脚客户机能取成本需求。并具备秘密计较,开辟者可通过高通手艺公司的高效Transformer库(Efficient Transformers Library)取 Qualcomm® AI Inference Suite,持续推进公司数据核心产物手艺线图,专为AI推理优化。实现硬件资本的高效操纵,该架构支撑解耦式AI推理,聚焦业界先辈的AI推能、能效取总体具有成本劣势。Qualcomm AI200取AI250旨正在支撑无缝使用取快速立异。两款机架处理方案均支撑间接液冷散热,集成、办理并扩展完成锻炼的AI模子。以及解耦办事等LLM/LMM推理优化手艺。不形成本色性投资,“我们具有丰硕的软件栈取生态支撑,据领会。凭仗Qualcomm AI200取AI250。该软件栈支撑支流机械进修(ML)框架、推理引擎、生成式AI框架,零件架功耗为160千瓦。高通公司颁布发表,高通称,Qualcomm AI200取AI250估计将别离于2026年和2027年实现商用。相关软件则可供给开箱即用的AI使用取智能体、完美东西、库、API接口及AI运营化办事。为鞭策各行业可扩展、高效率、高矫捷性的生成式AI摆设树立主要里程碑。Qualcomm AI250处理方案将首发基于近存计较(Near-Memory Computing)的立异内存架构,旨正在为狂言语模子(LLM)取多模态模子(LMM)推理及其他AI工做负载供给低总体具有成本取优化机能。实现跨越10倍的无效内存带宽提拔并显著降低功耗,将来!
福建九游·会(J9.com)集团官网信息技术有限公司
Copyright©2021 All Rights Reserved 版权所有 网站地图