- 积分
- 11902
- 明经币
- 个
- 注册时间
- 2015-8-18
- 在线时间
- 小时
- 威望
-
- 金钱
- 个
- 贡献
-
- 激情
-
|
本帖最后由 你有种再说一遍 于 2024-8-14 22:45 编辑
矩阵乘法的处理是非常重要,小到三维系统,大到AI的邻接矩阵求解相似性.
那么我们如果需要一个矩阵乘法,但是又不想利用GPU,此时有什么库呢?
有这个intel MKL库c#版本:
https://www.intel.cn/content/www ... your-c-program.html
看完之后我大受震撼,真就代码越长运行越快...
毕竟是intel自己出的数学库,没有比它自己更了解自己了,可谓是CPU上面最快的库了,别人处理1K画面都只能20ms,它能够2ms...
它的矩阵乘法是通过好几种技术:
1,AOS数据结构 2,并行 3,SIMD 4,矩阵分块 5,缓存行Z字跳跃 6,Coppersmith-Winograd算法
前面三种优化技术我们都烂熟于心了,加上已经在论坛讲过很多次了,就不重复了.
第四点第五点优化:
https://blog.csdn.net/u013471946/article/details/43957423
第六点优化:
https://blog.csdn.net/qq_42327795/article/details/114538451
通用矩阵乘(GEMM)优化算法:
https://zhenhuaw.me/blog/2019/gemm-optimization.html
B站,为什么6层嵌套循环让这个算法快了120倍:
https://b23.tv/3J9VzVb
(完)
|
评分
-
查看全部评分
|