
7月18日,第5届RISC-V中国峰会参加了上海的次级课程。作为未来电子行业的最大应用领域之一,人工智能是不可避免的话题。人工智能的快速发展推动了基础建筑的变化,计算强度需求的平均年增长率超过100%。 “开放,灵活和可定制的” RISC-V已成为发展AI计算独立力量的基础的战略支点。人工子部邀请各方的公司讨论RISC-V架构如何使用开放资源,开放和测量的功能来实现AI计算体系结构的变化,以及AI软件和Hardware中RISC-V架构应用程序的最新开发和实施。 Zhihe Computing Solutions总监Huang Yihao与基于RISC-V架构的大型技术模型的更改和应用分享了他们的发展。它有b自变形金刚出生于2017年6月和2025年7月以来的8年。在这个周期中有许多标志性事件:2022年11月的ChatGPT实施导致对大型模型的巨大期望。然后在今年1月,DeepSeek的出现达到了对当前国内模型和开放资源的新水平。可以看出,该模型在整个过程中都经历了许多变化,但是无论如何调整现代技术的要点,其基本体系结构仍然是变压器。尽管该模型整体上是“充满花朵”的,但主要操作员正在逐渐转换。这是三分介绍模型:第一个GPT-2,然后是Qianwen和DeepSeek R1模型。他们的建筑模型非常统一,第一部分是Attertion。在第二阶段,提出了FFN,而新的FFN是MOE架构,目的是减少计算量。这些模型中的变化集中在特定的ARCHI中不更改整个变压器的结构的讲师。他们的操作员通常集中在“ 22,21”左右。实际上,一切都与“ 22,21”操作员一致。如今,模型的计算强度不仅集中了,而且模型subs之间的计算强度也非常诗意。在所有运营商中,我们组织了最有利可图的运营商之一。 DeepSeep7b模型中有11个主要运营商,数学计算的数量约为95%。作为AOPEN资源指令集,RISC-V本身非常可扩展,并在此处包含AME指令。它非常适合Mathin操作员。除3个操作员外,AME可用于优化。除了在体系结构层面上进行微型创新外,模型的修改还有另一点,所有这些都调整了操作员的数据格式,包括第一个FP32到DeepSeek的当前FP8。现在AME操作员的指示可以实现MATRIX大小为16行,每行几乎可以使其大小为512位,同时可以实现等于字节的尺寸矩阵。 Huang Yihao共享的要点是,在变压器之后,AI将从识别当前规定的原始简单功能中移动。下图的左侧是传统的NA CNN网络,该网络产生卷积。它可以实现的最直接效果是认可。您可以找到“撒尿,汽车和动物”,但是很难认识到它们之间的关系。连接到大型模型后,您可以通过变压器和一次购买来判断不同项目之间的运动和关系。第一张图片显示了“熊猫竹子”的作用,第二张图片显示了“植物中的昆虫”,仅识别保留在植物中的昆虫。除了这两种情况外,我们还与客户合作制定了一些家庭场景,他们有需要:“看看让孩子们学习手机和使用手机。您可以清楚地识别AI实施的方案和功能,它提供了CPU A210的“综合促销”产品,该产品支持Transformer Architection,对操作员的体系结构,对第二个芯片A600的内部搜索是团结的。ESS在处理中期数据中将语音输入前语音中的语音,然后创建一个完整的AI代理。从我们的角度来看,今天很难成为AI标准的代理。作为A210之类的端侧芯片,末日测试芯片更适合AI代理使用站立场景。我们在模型中间取代了一些模糊的过程,尤其是第二段:“我们需要删除原始的巨无霸汉堡,然后更改为盘子并加入一杯可乐。”这种情况最初是在处理这种情况的,但是我们将其全部付诸实践,以处理它们以获得此类结果。在A210应用“模糊搜索”的情况下,涉及三个图像框架,三个图像帧指向“蜘蛛侠变换”的三个最多位置。第二种情况是火。我们不需要对特殊情况进行针对性的练习,因为依靠一般一般一般的能力,它确实可以为用户提供一种非常简单的搜索方法对于他们想要的某些内容,而无需为每种情况收集特定的数据材料和次要培训。此图显示,当火着火时,它停留在第二张,这应该是12秒。有一个明显的时间告诉我们,这段视频被大火抓住了12帧。这种“模糊搜索”确实是搜索安全和电影的简便方法。我们自己也尝试了。基于此型号,我们可以查找“门的视图”,并在门打开后位置。 A21方案的两个典型场景表明,大型模型操作员的统一在一定程度上为RISC-V提供了生态股息。在传统的逻辑中,RISC-V具有巨大的生态学差距,因为操作员的统一与RISC-VISC-VISC-VISC-V的操作员相同,可以使矩阵和向量计算。 - 刺是促进Zhihe计算的主要方向。