CORC  > 软件研究所  > 并行计算实验室  > 期刊论文
CPU-GPU并行矩阵乘法的实现与性能分析
程豪 ; 张云泉 ; 张先轶 ; 李玉成
刊名计算机工程
2010
卷号36期号:13页码:24-26,29
关键词混合并行 GPU技术 DGEMM程序 加速比hybrid parallelization GPU DGEMM speedup ratio
ISSN号1000-3428
其他题名implementation and performance analysis of cpu-gpu parallel matrix multiplication
中文摘要实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过实验验证了混合DGEMM性能、加速比、任务分配比例的估算方法,并探讨了影响混合DGEMM性能的各种因素。
学科主题Computer Science
语种中文
公开日期2011-05-23
附注The implementation of the CPU-GPU hybrid DGEMM is carried out on the ATI platform to improve the computing performance by computing both on GPU and CPU. Experimental results show that when matrix size is large, its performance on AMD Phenom II X4 940 and ATI FireStream 9270 platform, compared with using GPU alone, can be improved 16% on average. The evaluation method is verified along with the discussion of the factors which impact the hybrid DGEMM performance.
内容类型期刊论文
源URL[http://124.16.136.157/handle/311060/9688]  
专题软件研究所_并行计算实验室 _期刊论文
推荐引用方式
GB/T 7714
程豪,张云泉,张先轶,等. CPU-GPU并行矩阵乘法的实现与性能分析[J]. 计算机工程,2010,36(13):24-26,29.
APA 程豪,张云泉,张先轶,&李玉成.(2010).CPU-GPU并行矩阵乘法的实现与性能分析.计算机工程,36(13),24-26,29.
MLA 程豪,et al."CPU-GPU并行矩阵乘法的实现与性能分析".计算机工程 36.13(2010):24-26,29.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace