新型异构并行计算机上的数据传输与程序设计陈一峯北京大学内容摘要:

[D_1]} A parray {[[D_0][P]][ D_1]} B mainhost{ detour P { float *a, *b。 INIT_GPU($tid$)。 create D(a) create D(b) insert DataTransfer(a, A, b, B){} destroy D(a) destroy D(b) } } CUDA + Pthread Discontiguous Communication parray { mpi[7168] } M parray { pinned[2][14336][14336] } D parray {[[M][D_0][D_1]][D_2]} S parray {[[D_1][M][D_0]][D_2]} T insert DataTransfer(t,T,s,S) {} mainhost { parallel { detour pthd[3] { …… detour mpi[4] { …… } } …… detour cuda[2][128] { …… detour cuda[4][256] { …… } …… } …… } } Hierarchical SPMDs GPU SGEMM 16 ]W ID TH[ A]W ID TH[ A 10 ]W ID。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。