官方网站-首页
“存算一体”:大模型时代端边算力瓶颈的破局者?
【导语】随着信息时代数据量的爆炸性增长和人工智能技术的迅猛发展,传统冯·诺依曼架构在AI领域面临“功耗墙”和“内存墙”等严峻挑战。在此背景下,存算一体技术以其颠覆式的创新理念,试图打破这一僵局。本文将探讨存算一体技术如何突破冯·诺依曼架构的瓶颈,以及后摩智能等企业在该领域的探索与实践,特别是在大模型时代,存算一体技术如何重塑端边智能体验,引领算力革命的新篇章。
近年来,随着信息时代的数据大爆炸以及人工智能浪潮的到来,尤其是大模型技术的广泛应用,其训练和推理所需处理的数据量呈指数级增长。而基于“存储-计算分离”原理的冯·诺依曼架构虽独具优势,但在AI浪潮中已显疲态,存在着不容忽视的局限。
在传统冯・诺依曼架构中,数据需要在存储单元与计算单元间频繁搬运,导致大量的资源被浪费在数据搬运这一环节上。根据英特尔的研究表明,当半导体工艺达到7nm时,数据搬运功耗高达35pJ/bit,占总功耗的63.7%。数据传输造成的功耗损失越来越严重,限制了芯片发展的速度和效率,形成了“功耗墙”问题。
此外,在冯·诺依曼架构中,存储器与处理器是两个完全分离的单元,处理器根据指令从存储器中读取数据、完成运算,并存回存储器。但随着人工智能、大数据等新兴技术的迅猛发展,计算任务对数据处理的速度和规模提出了前所未有的高要求。而当下的存储器的数据访问速度跟不上计算单元的数据处理速度,二者之间形成了巨大的性能差距,“内存墙”问题日益凸显。
面对大模型推理对算力需求的持续拉动,如何攻克“功耗墙”“内存墙”等难题已然成为了工业界和学术界的焦点问题,一场旨在突破现有算力瓶颈的革命正蓄势待发。
在此背景下,“存算一体”正试图用一场颠覆式创新打破这一僵局。近年来,在半导体工艺持续突破与AI算力需求爆发的双重推动下,存算一体技术迎来了新的发展机遇。
从原理上来看,存算一体的核心是将存储功能与计算功能融合在同一个芯片上,直接利用存储单元进行数据处理——通过修改“读”电路的存内计算架构,可以在“读”电路中获取运算结果,并将结果直接“写”回存储器的目的地址,不再需要在计算单元和存储单元之间进行频繁的数据转移,消除了数据搬移带来的消耗,极大降低了功耗,大幅提升计算效率。
正是基于这样的特性,存算一体有力地突破冯·诺依曼架构所面临的瓶颈限制。
存算一体属于非冯诺伊曼架构,在特定领域可以提供更大算力(1000TOPS以上)和更高能效(超过10-100TOPS/W),明显超越现有ASIC算力芯片。除了用于AI计算外,存算技术也可用于感存算一体芯片和类脑芯片,代表了未来主流的大数据计算芯片架构。
近年来,大模型的蓬勃发展与广泛应用,其对强大算力和高存储带宽提出了迫切需求。而存算一体技术凭借其解决数据搬运难题、显著提升计算效率的优势,与大模型的发展需求完美契合。与此同时,大模型计算的应用场景正从云端逐步向端边侧拓展延伸,这一趋势为存算一体技术带来了更为广阔的发展空间。
根据量子位智库数据,预计2025年存算一体市场规模将达125亿元,随着技术成熟度提高以及大规模商用落地,至2030年这一市场规模将达1136亿元。
面对极具潜力且规模不断扩张的市场前景,存算一体芯片成为了科技领域备受瞩目的焦点。越来越多的企业正竞相投身存算一体芯片领域,并不断加快布局进程。国内诸如恒烁股份、亿铸科技等企业,均依托自身优势在不同技术路线上积极开展探索,力求在存算一体芯片市场中占据一席之地。
而在这股热潮下,后摩智能作为国内存算一体AI芯片的先行者和落地者,具有显著的代表性,其探索历程与实践成果生动展现出了我国存算一体芯片技术的多元化发展图景。
在大模型技术迅猛发展、应用场景持续拓展的大背景下,市场对于适配大模型的高性能芯片需求日益迫切。基于这一趋势洞察,后摩智能凭借在存算一体技术领域的前瞻性布局与深厚技术积累,于2023年年底果断调整研发方向,将重点转向基于大模型的应用需求,全力投入存算一体AI芯片的研发工作。
经过不懈努力与技术攻关,后摩智能迎来了重要时刻。在WAIC 2025期间,后摩智能的后摩漫界®M50芯片正式对外亮相,并同步推出力擎™系列M.2卡、力谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。
据了解,后摩漫界M50定位到了端边大模型应用场景(jǐng)。M50芯(xīn)片(piàn)采用(yòng)存(cún)算(suàn)一(yī)体(tǐ)计(jì)算(suàn)架(jià)构(gòu),实(shí)现(xiàn)了(le)160TOPS@INT8、100TFLOPS@bFP16的(de)物(wù)理(lǐ)算(suàn)力(lì),搭(dā)配(pèi)最(zuì)大(dà)48GB内(nèi)存(cún)与(yǔ)153.6GB/s的(de)超(chāo)高(gāo)带(dài)宽(kuān),而(ér)典(diǎn)型(xíng)功(gōng)耗(hào)仅(jǐn)10W,相(xiāng)当(dāng)于(yú)手(shǒu)机(jī)快(kuài)充(chōng)的(de)功(gōng)率(lǜ)。这(zhè)一(yī)性(xìng)能(néng)指(zhǐ)标(biāo)意(yì)味(wèi)着(zhe),PC、智(zhì)能语音设备、机器人等智能移动终端无需依赖云端,即可高效运行1.5B到70B参数的本地大模型,真正实现了“高算力、低功耗、即插即用”的愿景。
后摩智能的M50芯片及其产品矩阵(zhèn)的(de)发(fā)布(bù),标(biāo)志(zhì)着(zhe)端(duān)边(biān)智(zhì)能(néng)新(xīn)时(shí)代(dài)的(de)正(zhèng)式(shì)开启。通过存算一体技术的深度融合,后摩智能成功解决了端边设备在算力、功耗与带宽方面的痛点,为消费终端、智能办公与智能工业等领域提供了高效、安全、低成本的AI解决方案。
值得一提的是,8月27日,在深圳国际会展中心(宝安)举办的“IOTE 2025深圳・边缘计算产业生态大会”上,后摩智能产品市场负责人张伟超将发表“大模型时代的算力革命-‘存算一体’重塑端边智能体验”主题演讲,为我们带来更多后摩智能关于存算一体技术在端边算力提升路径、应用场景拓展以及与边缘计算生态深度融合等方面的结合与思考。

微信公众号搜索“ 新能源 ”加关注,最新环卫前沿洞察、企业动态、产品公告全面了解。推荐关注!
【微信扫描下方二维码可直接关注】



