CbC/CbC_gcc: gcc/testsuite/c-c++-common/gomp/gridify-2.c annotate

annotate gcc/testsuite/c-c++-common/gomp/gridify-2.c @ 111:04ced10e8804

gcc 7

author	kono
date	Fri, 27 Oct 2017 22:46:09 +0900
parents
children

rev	line source
111 04ced10e8804 gcc 7 kono parents: diff changeset	1 /* { dg-do compile } */
04ced10e8804 gcc 7 kono parents: diff changeset	2 /* { dg-require-effective-target offload_hsa } */
04ced10e8804 gcc 7 kono parents: diff changeset	3 /* { dg-options "-fopenmp -fdump-tree-omplower-details" } */
04ced10e8804 gcc 7 kono parents: diff changeset	4
04ced10e8804 gcc 7 kono parents: diff changeset	5 #define BLOCK_SIZE 16
04ced10e8804 gcc 7 kono parents: diff changeset	6
04ced10e8804 gcc 7 kono parents: diff changeset	7
04ced10e8804 gcc 7 kono parents: diff changeset	8 void tiled_sgemm_tt(const int M, const int N, const int K, const float alpha, const float*A, const int LDA,
04ced10e8804 gcc 7 kono parents: diff changeset	9 const floatB, const int LDB, const float beta, floatC, const int LDC){
04ced10e8804 gcc 7 kono parents: diff changeset	10
04ced10e8804 gcc 7 kono parents: diff changeset	11 #pragma omp target teams map(to:A[MK],B[KN]) map(from:C[M*N])
04ced10e8804 gcc 7 kono parents: diff changeset	12 #pragma omp distribute collapse(2)
04ced10e8804 gcc 7 kono parents: diff changeset	13 for (int C_row_start=0 ; C_row_start < M ; C_row_start+=BLOCK_SIZE)
04ced10e8804 gcc 7 kono parents: diff changeset	14 for (int C_col_start=0 ; C_col_start < N ; C_col_start+=BLOCK_SIZE)
04ced10e8804 gcc 7 kono parents: diff changeset	15 {
04ced10e8804 gcc 7 kono parents: diff changeset	16 // Each team has a local copy of these mini matrices
04ced10e8804 gcc 7 kono parents: diff changeset	17 float As[BLOCK_SIZE][BLOCK_SIZE];
04ced10e8804 gcc 7 kono parents: diff changeset	18 float Bs[BLOCK_SIZE][BLOCK_SIZE];
04ced10e8804 gcc 7 kono parents: diff changeset	19 #pragma omp parallel
04ced10e8804 gcc 7 kono parents: diff changeset	20 {
04ced10e8804 gcc 7 kono parents: diff changeset	21 int C_row, C_col;
04ced10e8804 gcc 7 kono parents: diff changeset	22 float Cval = 0.0;
04ced10e8804 gcc 7 kono parents: diff changeset	23
04ced10e8804 gcc 7 kono parents: diff changeset	24 for (int kblock = 0; kblock < K ; kblock += BLOCK_SIZE )
04ced10e8804 gcc 7 kono parents: diff changeset	25 {
04ced10e8804 gcc 7 kono parents: diff changeset	26 #pragma omp for collapse(2)
04ced10e8804 gcc 7 kono parents: diff changeset	27 for (int row=0 ; row < BLOCK_SIZE ; row++)
04ced10e8804 gcc 7 kono parents: diff changeset	28 for (int col=0 ; col < BLOCK_SIZE ; col++)
04ced10e8804 gcc 7 kono parents: diff changeset	29 {
04ced10e8804 gcc 7 kono parents: diff changeset	30 C_row = C_row_start + row;
04ced10e8804 gcc 7 kono parents: diff changeset	31 C_col = C_col_start + col;
04ced10e8804 gcc 7 kono parents: diff changeset	32 if ((C_row < M) && (kblock + col < K))
04ced10e8804 gcc 7 kono parents: diff changeset	33 As[row][col] = A[(C_row*LDA)+ kblock + col];
04ced10e8804 gcc 7 kono parents: diff changeset	34 else
04ced10e8804 gcc 7 kono parents: diff changeset	35 As[row][col] = 0;
04ced10e8804 gcc 7 kono parents: diff changeset	36 if ((kblock + row < K) && C_col < N)
04ced10e8804 gcc 7 kono parents: diff changeset	37 Bs[row][col] = B[((kblock+row)*LDB)+ C_col];
04ced10e8804 gcc 7 kono parents: diff changeset	38 else
04ced10e8804 gcc 7 kono parents: diff changeset	39 Bs[row][col] = 0;
04ced10e8804 gcc 7 kono parents: diff changeset	40 }
04ced10e8804 gcc 7 kono parents: diff changeset	41
04ced10e8804 gcc 7 kono parents: diff changeset	42 #pragma omp for collapse(2)
04ced10e8804 gcc 7 kono parents: diff changeset	43 for (int row=0 ; row < BLOCK_SIZE ; row++)
04ced10e8804 gcc 7 kono parents: diff changeset	44 for (int col=0 ; col < BLOCK_SIZE ; col++)
04ced10e8804 gcc 7 kono parents: diff changeset	45 {
04ced10e8804 gcc 7 kono parents: diff changeset	46 for (int e = 0; e < BLOCK_SIZE; ++e)
04ced10e8804 gcc 7 kono parents: diff changeset	47 Cval += As[row][e] * Bs[e][col];
04ced10e8804 gcc 7 kono parents: diff changeset	48 }
04ced10e8804 gcc 7 kono parents: diff changeset	49 } /* End for kblock .. */
04ced10e8804 gcc 7 kono parents: diff changeset	50
04ced10e8804 gcc 7 kono parents: diff changeset	51
04ced10e8804 gcc 7 kono parents: diff changeset	52 #pragma omp for collapse(2)
04ced10e8804 gcc 7 kono parents: diff changeset	53 for (int row=0 ; row < BLOCK_SIZE ; row++)
04ced10e8804 gcc 7 kono parents: diff changeset	54 for (int col=0 ; col < BLOCK_SIZE ; col++)
04ced10e8804 gcc 7 kono parents: diff changeset	55 {
04ced10e8804 gcc 7 kono parents: diff changeset	56 C_row = C_row_start + row;
04ced10e8804 gcc 7 kono parents: diff changeset	57 C_col = C_col_start + col;
04ced10e8804 gcc 7 kono parents: diff changeset	58 if ((C_row < M) && (C_col < N))
04ced10e8804 gcc 7 kono parents: diff changeset	59 C[(C_rowLDC)+C_col] = alphaCval + betaC[(C_rowLDC)+C_col];
04ced10e8804 gcc 7 kono parents: diff changeset	60
04ced10e8804 gcc 7 kono parents: diff changeset	61 }
04ced10e8804 gcc 7 kono parents: diff changeset	62 } /* end parallel */
04ced10e8804 gcc 7 kono parents: diff changeset	63 } /* end target teams distribute */
04ced10e8804 gcc 7 kono parents: diff changeset	64 }
04ced10e8804 gcc 7 kono parents: diff changeset	65
04ced10e8804 gcc 7 kono parents: diff changeset	66 /* { dg-final { scan-tree-dump "Target construct will be turned into a gridified HSA kernel" "omplower" } } */

Mercurial > hg > CbC > CbC_gcc

annotate gcc/testsuite/c-c++-common/gomp/gridify-2.c @ 111:04ced10e8804