(资料图)
作为国产CPU的代表之一,龙芯这两年已经将架构转向自研的LoongArch指令集,号称100%自主,现在还在不断扩展LoongArch的应用领域,今天龙芯宣布支持了NCNN神经网络计算框架,各项性能比通用实现普遍提升一倍以上。
据龙芯介绍,近期经过龙芯中科与NCNN社区的共同努力,在NCNM中使用龙架构(LoongArch)向量优化实现了大部分算子,得益于龙架构向量的高效实现,优化后NCNN在平台上各项性能测试比通用实现普遍提升一倍以上。
基于龙架构向量优化开启前后的NCNN各项性能对比
(竖轴为耗时高度,越高耗时越久,性能越低)