高性能矩阵乘代码编写问题
我目前在做BLAS数学库中dgemm函数的c语言实现,虽然目前有很多高性能的数学库开源代码,但大部分都是用汇编代码和fortran代码实现。我在用c语言实现的时候,在Intel平台上测试性能很低,只达到理论峰值的三分之一,希望在这方面有研究的大侠高手多多指教,比较急切,谢谢各位!!
2010-03-08 22:29
2010-03-09 09:26
2010-03-09 15:58
2010-03-09 16:24
2010-03-09 18:20
2010-03-10 10:30
2010-03-10 16:50
2010-03-10 19:50