最快的矩阵乘法(intel MKL数学库)
本帖最后由 你有种再说一遍 于 2024-8-14 22:45 编辑矩阵乘法的处理是非常重要,小到三维系统,大到AI的邻接矩阵求解相似性.
那么我们如果需要一个矩阵乘法,但是又不想利用GPU,此时有什么库呢?
有这个intel MKL库c#版本:
https://www.intel.cn/content/www ... your-c-program.html
看完之后我大受震撼,真就代码越长运行越快...
毕竟是intel自己出的数学库,没有比它自己更了解自己了,可谓是CPU上面最快的库了,别人处理1K画面都只能20ms,它能够2ms...
它的矩阵乘法是通过好几种技术:
1,AOS数据结构 2,并行 3,SIMD 4,矩阵分块 5,缓存行Z字跳跃 6,Coppersmith-Winograd算法
前面三种优化技术我们都烂熟于心了,加上已经在论坛讲过很多次了,就不重复了.
第四点第五点优化:
https://blog.csdn.net/u013471946/article/details/43957423
第六点优化:
https://blog.csdn.net/qq_42327795/article/details/114538451
通用矩阵乘(GEMM)优化算法:
https://zhenhuaw.me/blog/2019/gemm-optimization.html
B站,为什么6层嵌套循环让这个算法快了120倍:
https://b23.tv/3J9VzVb
(完)
收藏,用起时再来洗读 我不知道。我只是来学个cad的, 太高深,看不懂 超纲了,每一个汉字都认识,组合一起不懂什么意思了 图像转换用的吗 lelelewfxy 发表于 2024-8-6 17:31
图像转换用的吗
矩阵乘法用途很多的,主要是优化思想的学习 每次看到你发的贴子,我总有种错觉,觉得我的数学还可以抢救一下~但是bo算法我就喜欢深度优先和广度优先算法...我这该死的脑残志坚......
页:
[1]