400-830-3360

取消



顶部

动态资讯分类

动态资讯

行业资讯

当前位置：首页 > 动态资讯 > 行业资讯

海光DCU助力DeepLink方案加速推进首次国产多算力混推发布日期：2026-03-10 18:09:54 浏览次数：

海光DCU助力DeepLink方案加速推进首次国产多算力混推(图1)

　　上证报中国证券网讯（记者郑维汉）近日，上海人工智能实验室推出DeepLink多元算力混合推理加速方案（简称“DeepLink混推方案”），并携手海光DCU开展混合调度与协同推理等相关测试，为全面迈向AGI筑牢国产算力基座。据悉，在传统大模型推理凯云官网架构中，单一芯片集群的PD分离（预填充-解码分离）推理策略，已成为业界主流推理优化应用方向。然而，面向国产异构芯片的协同推理，仍是当前行业亟待攻克的关键难题。而得益于上海人工智能实验室发布的DeepLink混推方案，海光DCU等多款国产AI加速卡有望首次实现深度协同，从而具备精准匹配算力密集型、访存密集型硬件的能力，同时兼顾推理时延与吞吐性能，实现异构算力效能最大化。此外，该方案还具备良好的可扩展性，能有效地应用于Attention-FFN（AF）分离等其他场景。公开信息显示，海光拥有中国唯一的“C86+GPGPU”自研产品矩阵，完全兼容全球主流生态，持续携手上海人工智能实验室助力各类客户敏捷落地AI创新。此前，海光DCU团队已与OpenDataLab团队、DeepLink团队深度协同，完成与智能文档语料解析引擎MinerU的全栈适配，依托“自研AI软件栈+开放生态”，助力MinerU实现非结构化文档向AI-Ready数据的高效、低成本转化。此次与DeepLink混推方案的联合推进，既是双方合作的进一步深化，更是国产异构算力协同领域的重要突破。未来，双方将更大力度推进异构混推技术优化与标准共建，为我国打造新质生产力增添“芯”动能。

　　上证报中国证券网讯（记者郑维汉）近日，上海人工智能实验室推出DeepLink多元算力混合推理加速方案（简称“DeepLink混推方案”），并携手海光DCU开展混合调度与协同推理等相关测试，为全面迈向AGI筑牢国产算力基座。

　　据悉，在传统大模型推理架构中，单一芯片集群的PD分离（预填充-解码分离）推理策略，已成为业界主流推理优化应用方向。然而，面向国产异构芯片的协同推理，仍是当前行业亟待攻克的关键难题。

　　而得益于上海人工智能实验室发布的DeepLink混推方案，海光DCU等多款国产AI加速卡有望首次实现深度协同，从而具备精准匹配算力密集型、访存密集型硬件的能力，同时兼顾推理时延与吞吐性能，实现异构算力效能最大化。

　　此外，该方案还具备良好的可扩展性，能有效地应用于Attention-FFN（AF）分离等其他场景。

　　公开信息显示，海光拥有中国唯一的“C86+GPGPU”自研产品矩阵，完全兼容全球主流生态，持续携手上海人工智能实验室助力各类客户敏捷落地AI创新。

　　此前，海光DCU团队已与OpenDataLab团队、DeepLink团队深度协同，完成与智能文档语料解析引擎MinerU的全栈适配，依托“自研AI软件栈+开放生态”，助力MinerU实现非结构化文档向AI-Ready数据的高效、低成本转化。

　　此次与DeepLink混推方案的联合推进，既是双方合作的进一步深化，更是国产异构算力协同领域的重要突破。未来，双方将更大力度推进异构混推技术优化与标准共建，为我国打造新质生产力增添“芯”动能。返回搜狐，查看更多