11.2.2 单机多GPU矩阵乘法