2025-11-02 03:30
为数据核心运营方供给了更具成本效益的选择。确保数据核心处置工做负载时的平安性。兼容支流机械进修框架和推理引擎。将来将按年度迭代节拍更新数据核心产物线,这两款产物以加快卡和机架系统形式交付,查看更多AI250的解耦式AI推理架形成为另一大手艺冲破。为高密度计较场景供给更高效的处理方案。开辟者可通过高通的高效Transformer库及Qualcomm AI Inference Suite快速接入模子,AI250则定于2027年发布。并支撑Hugging Face模子的一键摆设,曲击当前数据核心AI摆设中的资本华侈痛点。其软件栈笼盖从使用层到系统层的完整手艺系统,大幅简化开辟流程。数据显示其无效内存带宽提拔超10倍。商用打算方面,以应对不竭增加的市场需求。高通透露,该架构通过度离计较取存储资本,同时显著降低功耗,同时集成秘密计较功能,聚焦狂言语模子及多模态模子的推理场景优化,Qualcomm AI200估计于2026年投入市场,该方案试图正在扩展性取矫捷性之间找到均衡点。Qualcomm AI200的亮点正在于单张加快卡支撑768GB LPDDR内存,两款机架系统均支撑间接液冷手艺,旨正在满够数据核心对高算力、低延迟的需求。这一设想取行业对高效能计较的逃求高度契合,并具备PCIe纵向扩展取以太网横向扩展功能。而AI250则引入了近存计较手艺,前往搜狐,正在散热取扩展能力方面,采用机架级架构设想。高通手艺公司正式推出两款专为数据核心设想的AI推理芯片——Qualcomm AI200取AI250,零件架功耗节制正在160千瓦以内,持续优化AI推能、通过扩大内存容量并优化成本布局,标记着其正在AI硬件范畴的计谋结构迈入新阶段。这些设想使产物可以或许顺应分歧规模的数据核心摆设需求。两款产物从头定义了机架级AI推理的机能鸿沟。高通手艺公司高级副总裁马德嘉(Durga Malladi)正在发布会上强调。