CbC/CbC_gcc: gcc/omp-grid.c annotate

annotate gcc/omp-grid.c @ 158:494b0b89df80 default tip

...

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Mon, 25 May 2020 18:13:55 +0900
parents	1830386684a0
children

rev	line source
111 04ced10e8804 gcc 7 kono parents: diff changeset	1 /* Lowering and expansion of OpenMP directives for HSA GPU agents.
04ced10e8804 gcc 7 kono parents: diff changeset	2
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	3 Copyright (C) 2013-2020 Free Software Foundation, Inc.
111 04ced10e8804 gcc 7 kono parents: diff changeset	4
04ced10e8804 gcc 7 kono parents: diff changeset	5 This file is part of GCC.
04ced10e8804 gcc 7 kono parents: diff changeset	6
04ced10e8804 gcc 7 kono parents: diff changeset	7 GCC is free software; you can redistribute it and/or modify it under
04ced10e8804 gcc 7 kono parents: diff changeset	8 the terms of the GNU General Public License as published by the Free
04ced10e8804 gcc 7 kono parents: diff changeset	9 Software Foundation; either version 3, or (at your option) any later
04ced10e8804 gcc 7 kono parents: diff changeset	10 version.
04ced10e8804 gcc 7 kono parents: diff changeset	11
04ced10e8804 gcc 7 kono parents: diff changeset	12 GCC is distributed in the hope that it will be useful, but WITHOUT ANY
04ced10e8804 gcc 7 kono parents: diff changeset	13 WARRANTY; without even the implied warranty of MERCHANTABILITY or
04ced10e8804 gcc 7 kono parents: diff changeset	14 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
04ced10e8804 gcc 7 kono parents: diff changeset	15 for more details.
04ced10e8804 gcc 7 kono parents: diff changeset	16
04ced10e8804 gcc 7 kono parents: diff changeset	17 You should have received a copy of the GNU General Public License
04ced10e8804 gcc 7 kono parents: diff changeset	18 along with GCC; see the file COPYING3. If not see
04ced10e8804 gcc 7 kono parents: diff changeset	19 <http://www.gnu.org/licenses/>. */
04ced10e8804 gcc 7 kono parents: diff changeset	20
04ced10e8804 gcc 7 kono parents: diff changeset	21 #include "config.h"
04ced10e8804 gcc 7 kono parents: diff changeset	22 #include "system.h"
04ced10e8804 gcc 7 kono parents: diff changeset	23 #include "coretypes.h"
04ced10e8804 gcc 7 kono parents: diff changeset	24 #include "backend.h"
04ced10e8804 gcc 7 kono parents: diff changeset	25 #include "tree.h"
04ced10e8804 gcc 7 kono parents: diff changeset	26 #include "gimple.h"
04ced10e8804 gcc 7 kono parents: diff changeset	27 #include "tree-pass.h"
04ced10e8804 gcc 7 kono parents: diff changeset	28 #include "ssa.h"
04ced10e8804 gcc 7 kono parents: diff changeset	29 #include "cgraph.h"
04ced10e8804 gcc 7 kono parents: diff changeset	30 #include "pretty-print.h"
04ced10e8804 gcc 7 kono parents: diff changeset	31 #include "fold-const.h"
04ced10e8804 gcc 7 kono parents: diff changeset	32 #include "gimplify.h"
04ced10e8804 gcc 7 kono parents: diff changeset	33 #include "gimple-iterator.h"
04ced10e8804 gcc 7 kono parents: diff changeset	34 #include "gimple-walk.h"
04ced10e8804 gcc 7 kono parents: diff changeset	35 #include "tree-inline.h"
04ced10e8804 gcc 7 kono parents: diff changeset	36 #include "langhooks.h"
04ced10e8804 gcc 7 kono parents: diff changeset	37 #include "omp-general.h"
04ced10e8804 gcc 7 kono parents: diff changeset	38 #include "omp-low.h"
04ced10e8804 gcc 7 kono parents: diff changeset	39 #include "omp-grid.h"
04ced10e8804 gcc 7 kono parents: diff changeset	40 #include "gimple-pretty-print.h"
04ced10e8804 gcc 7 kono parents: diff changeset	41
04ced10e8804 gcc 7 kono parents: diff changeset	42 /* Return the lastprivate predicate for a given gridified loop described by
04ced10e8804 gcc 7 kono parents: diff changeset	43 FD). */
04ced10e8804 gcc 7 kono parents: diff changeset	44
04ced10e8804 gcc 7 kono parents: diff changeset	45 tree
04ced10e8804 gcc 7 kono parents: diff changeset	46 omp_grid_lastprivate_predicate (struct omp_for_data *fd)
04ced10e8804 gcc 7 kono parents: diff changeset	47 {
04ced10e8804 gcc 7 kono parents: diff changeset	48 /* When dealing with a gridified loop, we need to check up to three collapsed
04ced10e8804 gcc 7 kono parents: diff changeset	49 iteration variables but they are not actually captured in this fd.
04ced10e8804 gcc 7 kono parents: diff changeset	50 Fortunately, we can easily rely on HSA builtins to get this
04ced10e8804 gcc 7 kono parents: diff changeset	51 information. */
04ced10e8804 gcc 7 kono parents: diff changeset	52
04ced10e8804 gcc 7 kono parents: diff changeset	53 tree id, size;
04ced10e8804 gcc 7 kono parents: diff changeset	54 if (gimple_omp_for_kind (fd->for_stmt) == GF_OMP_FOR_KIND_GRID_LOOP
04ced10e8804 gcc 7 kono parents: diff changeset	55 && gimple_omp_for_grid_intra_group (fd->for_stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	56 {
04ced10e8804 gcc 7 kono parents: diff changeset	57 id = builtin_decl_explicit (BUILT_IN_HSA_WORKITEMID);
04ced10e8804 gcc 7 kono parents: diff changeset	58 size = builtin_decl_explicit (BUILT_IN_HSA_CURRENTWORKGROUPSIZE);
04ced10e8804 gcc 7 kono parents: diff changeset	59 }
04ced10e8804 gcc 7 kono parents: diff changeset	60 else
04ced10e8804 gcc 7 kono parents: diff changeset	61 {
04ced10e8804 gcc 7 kono parents: diff changeset	62 id = builtin_decl_explicit (BUILT_IN_HSA_WORKITEMABSID);
04ced10e8804 gcc 7 kono parents: diff changeset	63 size = builtin_decl_explicit (BUILT_IN_HSA_GRIDSIZE);
04ced10e8804 gcc 7 kono parents: diff changeset	64 }
04ced10e8804 gcc 7 kono parents: diff changeset	65 tree cond = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	66 for (int dim = 0; dim < fd->collapse; dim++)
04ced10e8804 gcc 7 kono parents: diff changeset	67 {
04ced10e8804 gcc 7 kono parents: diff changeset	68 tree dim_tree = build_int_cstu (unsigned_type_node, dim);
04ced10e8804 gcc 7 kono parents: diff changeset	69 tree u1 = build_int_cstu (unsigned_type_node, 1);
04ced10e8804 gcc 7 kono parents: diff changeset	70 tree c2
04ced10e8804 gcc 7 kono parents: diff changeset	71 = build2 (EQ_EXPR, boolean_type_node,
04ced10e8804 gcc 7 kono parents: diff changeset	72 build2 (PLUS_EXPR, unsigned_type_node,
04ced10e8804 gcc 7 kono parents: diff changeset	73 build_call_expr (id, 1, dim_tree), u1),
04ced10e8804 gcc 7 kono parents: diff changeset	74 build_call_expr (size, 1, dim_tree));
04ced10e8804 gcc 7 kono parents: diff changeset	75 if (cond)
04ced10e8804 gcc 7 kono parents: diff changeset	76 cond = build2 (TRUTH_AND_EXPR, boolean_type_node, cond, c2);
04ced10e8804 gcc 7 kono parents: diff changeset	77 else
04ced10e8804 gcc 7 kono parents: diff changeset	78 cond = c2;
04ced10e8804 gcc 7 kono parents: diff changeset	79 }
04ced10e8804 gcc 7 kono parents: diff changeset	80 return cond;
04ced10e8804 gcc 7 kono parents: diff changeset	81 }
04ced10e8804 gcc 7 kono parents: diff changeset	82
04ced10e8804 gcc 7 kono parents: diff changeset	83 /* Structure describing the basic properties of the loop we ara analyzing
04ced10e8804 gcc 7 kono parents: diff changeset	84 whether it can be gridified and when it is gridified. */
04ced10e8804 gcc 7 kono parents: diff changeset	85
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	86 class grid_prop
111 04ced10e8804 gcc 7 kono parents: diff changeset	87 {
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	88 public:
111 04ced10e8804 gcc 7 kono parents: diff changeset	89 /* True when we are doing tiling gridification, i.e. when there is a distinct
04ced10e8804 gcc 7 kono parents: diff changeset	90 distribute loop over groups and a loop construct over work-items. False
04ced10e8804 gcc 7 kono parents: diff changeset	91 when distribute and parallel for loops form a combined construct. */
04ced10e8804 gcc 7 kono parents: diff changeset	92 bool tiling;
04ced10e8804 gcc 7 kono parents: diff changeset	93 /* Location of the target construct for optimization information
04ced10e8804 gcc 7 kono parents: diff changeset	94 messages. */
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	95 dump_user_location_t target_loc;
111 04ced10e8804 gcc 7 kono parents: diff changeset	96 /* The collapse clause of the involved loops. Collapse value of all of them
04ced10e8804 gcc 7 kono parents: diff changeset	97 must be the same for gridification to take place. */
04ced10e8804 gcc 7 kono parents: diff changeset	98 size_t collapse;
04ced10e8804 gcc 7 kono parents: diff changeset	99 /* Group sizes, if requested by the user or NULL if not requested. */
04ced10e8804 gcc 7 kono parents: diff changeset	100 tree group_sizes[3];
04ced10e8804 gcc 7 kono parents: diff changeset	101 };
04ced10e8804 gcc 7 kono parents: diff changeset	102
04ced10e8804 gcc 7 kono parents: diff changeset	103 #define GRID_MISSED_MSG_PREFIX "Will not turn target construct into a " \
04ced10e8804 gcc 7 kono parents: diff changeset	104 "gridified HSA kernel because "
04ced10e8804 gcc 7 kono parents: diff changeset	105
04ced10e8804 gcc 7 kono parents: diff changeset	106 /* Return true if STMT is an assignment of a register-type into a local
04ced10e8804 gcc 7 kono parents: diff changeset	107 VAR_DECL. If GRID is non-NULL, the assignment additionally must not be to
04ced10e8804 gcc 7 kono parents: diff changeset	108 any of the trees specifying group sizes there. */
04ced10e8804 gcc 7 kono parents: diff changeset	109
04ced10e8804 gcc 7 kono parents: diff changeset	110 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	111 grid_safe_assignment_p (gimple stmt, grid_prop grid)
04ced10e8804 gcc 7 kono parents: diff changeset	112 {
04ced10e8804 gcc 7 kono parents: diff changeset	113 gassign assign = dyn_cast <gassign > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	114 if (!assign)
04ced10e8804 gcc 7 kono parents: diff changeset	115 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	116 if (gimple_clobber_p (assign))
04ced10e8804 gcc 7 kono parents: diff changeset	117 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	118 tree lhs = gimple_assign_lhs (assign);
04ced10e8804 gcc 7 kono parents: diff changeset	119 if (!VAR_P (lhs)
04ced10e8804 gcc 7 kono parents: diff changeset	120 \|\| !is_gimple_reg_type (TREE_TYPE (lhs))
04ced10e8804 gcc 7 kono parents: diff changeset	121 \|\| is_global_var (lhs))
04ced10e8804 gcc 7 kono parents: diff changeset	122 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	123 if (grid)
04ced10e8804 gcc 7 kono parents: diff changeset	124 for (unsigned i = 0; i < grid->collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	125 if (lhs == grid->group_sizes[i])
04ced10e8804 gcc 7 kono parents: diff changeset	126 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	127 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	128 }
04ced10e8804 gcc 7 kono parents: diff changeset	129
04ced10e8804 gcc 7 kono parents: diff changeset	130 /* Return true if all statements in SEQ are assignments to local register-type
04ced10e8804 gcc 7 kono parents: diff changeset	131 variables that do not hold group size information. */
04ced10e8804 gcc 7 kono parents: diff changeset	132
04ced10e8804 gcc 7 kono parents: diff changeset	133 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	134 grid_seq_only_contains_local_assignments (gimple_seq seq, grid_prop *grid)
04ced10e8804 gcc 7 kono parents: diff changeset	135 {
04ced10e8804 gcc 7 kono parents: diff changeset	136 if (!seq)
04ced10e8804 gcc 7 kono parents: diff changeset	137 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	138
04ced10e8804 gcc 7 kono parents: diff changeset	139 gimple_stmt_iterator gsi;
04ced10e8804 gcc 7 kono parents: diff changeset	140 for (gsi = gsi_start (seq); !gsi_end_p (gsi); gsi_next (&gsi))
04ced10e8804 gcc 7 kono parents: diff changeset	141 if (!grid_safe_assignment_p (gsi_stmt (gsi), grid))
04ced10e8804 gcc 7 kono parents: diff changeset	142 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	143 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	144 }
04ced10e8804 gcc 7 kono parents: diff changeset	145
04ced10e8804 gcc 7 kono parents: diff changeset	146 /* Scan statements in SEQ and call itself recursively on any bind. GRID
04ced10e8804 gcc 7 kono parents: diff changeset	147 describes hitherto discovered properties of the loop that is evaluated for
04ced10e8804 gcc 7 kono parents: diff changeset	148 possible gridification. If during whole search only assignments to
04ced10e8804 gcc 7 kono parents: diff changeset	149 register-type local variables (that do not overwrite group size information)
04ced10e8804 gcc 7 kono parents: diff changeset	150 and one single OMP statement is encountered, return true, otherwise return
04ced10e8804 gcc 7 kono parents: diff changeset	151 false. RET is where we store any OMP statement encountered. */
04ced10e8804 gcc 7 kono parents: diff changeset	152
04ced10e8804 gcc 7 kono parents: diff changeset	153 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	154 grid_find_single_omp_among_assignments_1 (gimple_seq seq, grid_prop *grid,
04ced10e8804 gcc 7 kono parents: diff changeset	155 const char name, gimple *ret)
04ced10e8804 gcc 7 kono parents: diff changeset	156 {
04ced10e8804 gcc 7 kono parents: diff changeset	157 gimple_stmt_iterator gsi;
04ced10e8804 gcc 7 kono parents: diff changeset	158 for (gsi = gsi_start (seq); !gsi_end_p (gsi); gsi_next (&gsi))
04ced10e8804 gcc 7 kono parents: diff changeset	159 {
04ced10e8804 gcc 7 kono parents: diff changeset	160 gimple *stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	161
04ced10e8804 gcc 7 kono parents: diff changeset	162 if (grid_safe_assignment_p (stmt, grid))
04ced10e8804 gcc 7 kono parents: diff changeset	163 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	164 if (gbind bind = dyn_cast <gbind > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	165 {
04ced10e8804 gcc 7 kono parents: diff changeset	166 gimple_seq bind_body = gimple_bind_body (bind);
04ced10e8804 gcc 7 kono parents: diff changeset	167 if (!grid_find_single_omp_among_assignments_1 (bind_body, grid, name,
04ced10e8804 gcc 7 kono parents: diff changeset	168 ret))
04ced10e8804 gcc 7 kono parents: diff changeset	169 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	170 }
04ced10e8804 gcc 7 kono parents: diff changeset	171 else if (is_gimple_omp (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	172 {
04ced10e8804 gcc 7 kono parents: diff changeset	173 if (*ret)
04ced10e8804 gcc 7 kono parents: diff changeset	174 {
04ced10e8804 gcc 7 kono parents: diff changeset	175 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	176 {
04ced10e8804 gcc 7 kono parents: diff changeset	177 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	178 GRID_MISSED_MSG_PREFIX "%s construct "
04ced10e8804 gcc 7 kono parents: diff changeset	179 "contains multiple OpenMP constructs\n",
04ced10e8804 gcc 7 kono parents: diff changeset	180 name);
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	181 dump_printf_loc (MSG_NOTE, *ret,
111 04ced10e8804 gcc 7 kono parents: diff changeset	182 "The first OpenMP construct within "
04ced10e8804 gcc 7 kono parents: diff changeset	183 "a parallel\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	184 dump_printf_loc (MSG_NOTE, stmt,
111 04ced10e8804 gcc 7 kono parents: diff changeset	185 "The second OpenMP construct within "
04ced10e8804 gcc 7 kono parents: diff changeset	186 "a parallel\n");
04ced10e8804 gcc 7 kono parents: diff changeset	187 }
04ced10e8804 gcc 7 kono parents: diff changeset	188 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	189 }
04ced10e8804 gcc 7 kono parents: diff changeset	190 *ret = stmt;
04ced10e8804 gcc 7 kono parents: diff changeset	191 }
04ced10e8804 gcc 7 kono parents: diff changeset	192 else
04ced10e8804 gcc 7 kono parents: diff changeset	193 {
04ced10e8804 gcc 7 kono parents: diff changeset	194 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	195 {
04ced10e8804 gcc 7 kono parents: diff changeset	196 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	197 GRID_MISSED_MSG_PREFIX "%s construct contains "
04ced10e8804 gcc 7 kono parents: diff changeset	198 "a complex statement\n", name);
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	199 dump_printf_loc (MSG_NOTE, stmt,
111 04ced10e8804 gcc 7 kono parents: diff changeset	200 "This statement cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	201 "gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	202 }
04ced10e8804 gcc 7 kono parents: diff changeset	203 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	204 }
04ced10e8804 gcc 7 kono parents: diff changeset	205 }
04ced10e8804 gcc 7 kono parents: diff changeset	206 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	207 }
04ced10e8804 gcc 7 kono parents: diff changeset	208
04ced10e8804 gcc 7 kono parents: diff changeset	209 /* Scan statements in SEQ and make sure that it and any binds in it contain
04ced10e8804 gcc 7 kono parents: diff changeset	210 only assignments to local register-type variables (that do not overwrite
04ced10e8804 gcc 7 kono parents: diff changeset	211 group size information) and one OMP construct. If so, return that
04ced10e8804 gcc 7 kono parents: diff changeset	212 construct, otherwise return NULL. GRID describes hitherto discovered
04ced10e8804 gcc 7 kono parents: diff changeset	213 properties of the loop that is evaluated for possible gridification. If
04ced10e8804 gcc 7 kono parents: diff changeset	214 dumping is enabled and function fails, use NAME to dump a note with the
04ced10e8804 gcc 7 kono parents: diff changeset	215 reason for failure. */
04ced10e8804 gcc 7 kono parents: diff changeset	216
04ced10e8804 gcc 7 kono parents: diff changeset	217 static gimple *
04ced10e8804 gcc 7 kono parents: diff changeset	218 grid_find_single_omp_among_assignments (gimple_seq seq, grid_prop *grid,
04ced10e8804 gcc 7 kono parents: diff changeset	219 const char *name)
04ced10e8804 gcc 7 kono parents: diff changeset	220 {
04ced10e8804 gcc 7 kono parents: diff changeset	221 if (!seq)
04ced10e8804 gcc 7 kono parents: diff changeset	222 {
04ced10e8804 gcc 7 kono parents: diff changeset	223 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	224 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	225 GRID_MISSED_MSG_PREFIX "%s construct has empty body\n",
04ced10e8804 gcc 7 kono parents: diff changeset	226 name);
04ced10e8804 gcc 7 kono parents: diff changeset	227 return NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	228 }
04ced10e8804 gcc 7 kono parents: diff changeset	229
04ced10e8804 gcc 7 kono parents: diff changeset	230 gimple *ret = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	231 if (grid_find_single_omp_among_assignments_1 (seq, grid, name, &ret))
04ced10e8804 gcc 7 kono parents: diff changeset	232 {
04ced10e8804 gcc 7 kono parents: diff changeset	233 if (!ret && dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	234 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	235 GRID_MISSED_MSG_PREFIX "%s construct does not contain"
04ced10e8804 gcc 7 kono parents: diff changeset	236 " any other OpenMP construct\n", name);
04ced10e8804 gcc 7 kono parents: diff changeset	237 return ret;
04ced10e8804 gcc 7 kono parents: diff changeset	238 }
04ced10e8804 gcc 7 kono parents: diff changeset	239 else
04ced10e8804 gcc 7 kono parents: diff changeset	240 return NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	241 }
04ced10e8804 gcc 7 kono parents: diff changeset	242
04ced10e8804 gcc 7 kono parents: diff changeset	243 /* Walker function looking for statements there is no point gridifying (and for
04ced10e8804 gcc 7 kono parents: diff changeset	244 noreturn function calls which we cannot do). Return non-NULL if such a
04ced10e8804 gcc 7 kono parents: diff changeset	245 function is found. */
04ced10e8804 gcc 7 kono parents: diff changeset	246
04ced10e8804 gcc 7 kono parents: diff changeset	247 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	248 grid_find_ungridifiable_statement (gimple_stmt_iterator *gsi,
04ced10e8804 gcc 7 kono parents: diff changeset	249 bool *handled_ops_p,
04ced10e8804 gcc 7 kono parents: diff changeset	250 struct walk_stmt_info *wi)
04ced10e8804 gcc 7 kono parents: diff changeset	251 {
04ced10e8804 gcc 7 kono parents: diff changeset	252 *handled_ops_p = false;
04ced10e8804 gcc 7 kono parents: diff changeset	253 gimple stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	254 switch (gimple_code (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	255 {
04ced10e8804 gcc 7 kono parents: diff changeset	256 case GIMPLE_CALL:
04ced10e8804 gcc 7 kono parents: diff changeset	257 if (gimple_call_noreturn_p (as_a <gcall *> (stmt)))
04ced10e8804 gcc 7 kono parents: diff changeset	258 {
04ced10e8804 gcc 7 kono parents: diff changeset	259 *handled_ops_p = true;
04ced10e8804 gcc 7 kono parents: diff changeset	260 wi->info = stmt;
04ced10e8804 gcc 7 kono parents: diff changeset	261 return error_mark_node;
04ced10e8804 gcc 7 kono parents: diff changeset	262 }
04ced10e8804 gcc 7 kono parents: diff changeset	263 break;
04ced10e8804 gcc 7 kono parents: diff changeset	264
04ced10e8804 gcc 7 kono parents: diff changeset	265 /* We may reduce the following list if we find a way to implement the
04ced10e8804 gcc 7 kono parents: diff changeset	266 clauses, but now there is no point trying further. */
04ced10e8804 gcc 7 kono parents: diff changeset	267 case GIMPLE_OMP_CRITICAL:
04ced10e8804 gcc 7 kono parents: diff changeset	268 case GIMPLE_OMP_TASKGROUP:
04ced10e8804 gcc 7 kono parents: diff changeset	269 case GIMPLE_OMP_TASK:
04ced10e8804 gcc 7 kono parents: diff changeset	270 case GIMPLE_OMP_SECTION:
04ced10e8804 gcc 7 kono parents: diff changeset	271 case GIMPLE_OMP_SECTIONS:
04ced10e8804 gcc 7 kono parents: diff changeset	272 case GIMPLE_OMP_SECTIONS_SWITCH:
04ced10e8804 gcc 7 kono parents: diff changeset	273 case GIMPLE_OMP_TARGET:
04ced10e8804 gcc 7 kono parents: diff changeset	274 case GIMPLE_OMP_ORDERED:
04ced10e8804 gcc 7 kono parents: diff changeset	275 *handled_ops_p = true;
04ced10e8804 gcc 7 kono parents: diff changeset	276 wi->info = stmt;
04ced10e8804 gcc 7 kono parents: diff changeset	277 return error_mark_node;
04ced10e8804 gcc 7 kono parents: diff changeset	278 default:
04ced10e8804 gcc 7 kono parents: diff changeset	279 break;
04ced10e8804 gcc 7 kono parents: diff changeset	280 }
04ced10e8804 gcc 7 kono parents: diff changeset	281 return NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	282 }
04ced10e8804 gcc 7 kono parents: diff changeset	283
04ced10e8804 gcc 7 kono parents: diff changeset	284 /* Examine clauses of omp parallel statement PAR and if any prevents
04ced10e8804 gcc 7 kono parents: diff changeset	285 gridification, issue a missed-optimization diagnostics and return false,
04ced10e8804 gcc 7 kono parents: diff changeset	286 otherwise return true. GRID describes hitherto discovered properties of the
04ced10e8804 gcc 7 kono parents: diff changeset	287 loop that is evaluated for possible gridification. */
04ced10e8804 gcc 7 kono parents: diff changeset	288
04ced10e8804 gcc 7 kono parents: diff changeset	289 static bool
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	290 grid_parallel_clauses_gridifiable (gomp_parallel *par, dump_user_location_t tloc)
111 04ced10e8804 gcc 7 kono parents: diff changeset	291 {
04ced10e8804 gcc 7 kono parents: diff changeset	292 tree clauses = gimple_omp_parallel_clauses (par);
04ced10e8804 gcc 7 kono parents: diff changeset	293 while (clauses)
04ced10e8804 gcc 7 kono parents: diff changeset	294 {
04ced10e8804 gcc 7 kono parents: diff changeset	295 switch (OMP_CLAUSE_CODE (clauses))
04ced10e8804 gcc 7 kono parents: diff changeset	296 {
04ced10e8804 gcc 7 kono parents: diff changeset	297 case OMP_CLAUSE_NUM_THREADS:
04ced10e8804 gcc 7 kono parents: diff changeset	298 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	299 {
04ced10e8804 gcc 7 kono parents: diff changeset	300 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	301 GRID_MISSED_MSG_PREFIX "because there is "
04ced10e8804 gcc 7 kono parents: diff changeset	302 "a num_threads clause of the parallel "
04ced10e8804 gcc 7 kono parents: diff changeset	303 "construct\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	304 dump_printf_loc (MSG_NOTE, par,
111 04ced10e8804 gcc 7 kono parents: diff changeset	305 "Parallel construct has a num_threads clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	306 }
04ced10e8804 gcc 7 kono parents: diff changeset	307 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	308
04ced10e8804 gcc 7 kono parents: diff changeset	309 case OMP_CLAUSE_REDUCTION:
04ced10e8804 gcc 7 kono parents: diff changeset	310 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	311 {
04ced10e8804 gcc 7 kono parents: diff changeset	312 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	313 GRID_MISSED_MSG_PREFIX "a reduction clause "
04ced10e8804 gcc 7 kono parents: diff changeset	314 "is present\n ");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	315 dump_printf_loc (MSG_NOTE, par,
111 04ced10e8804 gcc 7 kono parents: diff changeset	316 "Parallel construct has a reduction clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	317 }
04ced10e8804 gcc 7 kono parents: diff changeset	318 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	319
04ced10e8804 gcc 7 kono parents: diff changeset	320 default:
04ced10e8804 gcc 7 kono parents: diff changeset	321 break;
04ced10e8804 gcc 7 kono parents: diff changeset	322 }
04ced10e8804 gcc 7 kono parents: diff changeset	323 clauses = OMP_CLAUSE_CHAIN (clauses);
04ced10e8804 gcc 7 kono parents: diff changeset	324 }
04ced10e8804 gcc 7 kono parents: diff changeset	325 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	326 }
04ced10e8804 gcc 7 kono parents: diff changeset	327
04ced10e8804 gcc 7 kono parents: diff changeset	328 /* Examine clauses and the body of omp loop statement GFOR and if something
04ced10e8804 gcc 7 kono parents: diff changeset	329 prevents gridification, issue a missed-optimization diagnostics and return
04ced10e8804 gcc 7 kono parents: diff changeset	330 false, otherwise return true. GRID describes hitherto discovered properties
04ced10e8804 gcc 7 kono parents: diff changeset	331 of the loop that is evaluated for possible gridification. */
04ced10e8804 gcc 7 kono parents: diff changeset	332
04ced10e8804 gcc 7 kono parents: diff changeset	333 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	334 grid_inner_loop_gridifiable_p (gomp_for gfor, grid_prop grid)
04ced10e8804 gcc 7 kono parents: diff changeset	335 {
04ced10e8804 gcc 7 kono parents: diff changeset	336 if (!grid_seq_only_contains_local_assignments (gimple_omp_for_pre_body (gfor),
04ced10e8804 gcc 7 kono parents: diff changeset	337 grid))
04ced10e8804 gcc 7 kono parents: diff changeset	338 {
04ced10e8804 gcc 7 kono parents: diff changeset	339 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	340 {
04ced10e8804 gcc 7 kono parents: diff changeset	341 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	342 GRID_MISSED_MSG_PREFIX "the inner loop "
04ced10e8804 gcc 7 kono parents: diff changeset	343 "loop bounds computation contains a complex "
04ced10e8804 gcc 7 kono parents: diff changeset	344 "statement\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	345 dump_printf_loc (MSG_NOTE, gfor,
111 04ced10e8804 gcc 7 kono parents: diff changeset	346 "Loop construct cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	347 "gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	348 }
04ced10e8804 gcc 7 kono parents: diff changeset	349 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	350 }
04ced10e8804 gcc 7 kono parents: diff changeset	351
04ced10e8804 gcc 7 kono parents: diff changeset	352 tree clauses = gimple_omp_for_clauses (gfor);
04ced10e8804 gcc 7 kono parents: diff changeset	353 while (clauses)
04ced10e8804 gcc 7 kono parents: diff changeset	354 {
04ced10e8804 gcc 7 kono parents: diff changeset	355 switch (OMP_CLAUSE_CODE (clauses))
04ced10e8804 gcc 7 kono parents: diff changeset	356 {
04ced10e8804 gcc 7 kono parents: diff changeset	357 case OMP_CLAUSE_SCHEDULE:
04ced10e8804 gcc 7 kono parents: diff changeset	358 if (OMP_CLAUSE_SCHEDULE_KIND (clauses) != OMP_CLAUSE_SCHEDULE_AUTO)
04ced10e8804 gcc 7 kono parents: diff changeset	359 {
04ced10e8804 gcc 7 kono parents: diff changeset	360 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	361 {
04ced10e8804 gcc 7 kono parents: diff changeset	362 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	363 GRID_MISSED_MSG_PREFIX "the inner loop "
04ced10e8804 gcc 7 kono parents: diff changeset	364 "has a non-automatic schedule clause\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	365 dump_printf_loc (MSG_NOTE, gfor,
111 04ced10e8804 gcc 7 kono parents: diff changeset	366 "Loop construct has a non automatic "
04ced10e8804 gcc 7 kono parents: diff changeset	367 "schedule clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	368 }
04ced10e8804 gcc 7 kono parents: diff changeset	369 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	370 }
04ced10e8804 gcc 7 kono parents: diff changeset	371 break;
04ced10e8804 gcc 7 kono parents: diff changeset	372
04ced10e8804 gcc 7 kono parents: diff changeset	373 case OMP_CLAUSE_REDUCTION:
04ced10e8804 gcc 7 kono parents: diff changeset	374 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	375 {
04ced10e8804 gcc 7 kono parents: diff changeset	376 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	377 GRID_MISSED_MSG_PREFIX "a reduction "
04ced10e8804 gcc 7 kono parents: diff changeset	378 "clause is present\n ");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	379 dump_printf_loc (MSG_NOTE, gfor,
111 04ced10e8804 gcc 7 kono parents: diff changeset	380 "Loop construct has a reduction schedule "
04ced10e8804 gcc 7 kono parents: diff changeset	381 "clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	382 }
04ced10e8804 gcc 7 kono parents: diff changeset	383 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	384
04ced10e8804 gcc 7 kono parents: diff changeset	385 default:
04ced10e8804 gcc 7 kono parents: diff changeset	386 break;
04ced10e8804 gcc 7 kono parents: diff changeset	387 }
04ced10e8804 gcc 7 kono parents: diff changeset	388 clauses = OMP_CLAUSE_CHAIN (clauses);
04ced10e8804 gcc 7 kono parents: diff changeset	389 }
04ced10e8804 gcc 7 kono parents: diff changeset	390 struct walk_stmt_info wi;
04ced10e8804 gcc 7 kono parents: diff changeset	391 memset (&wi, 0, sizeof (wi));
04ced10e8804 gcc 7 kono parents: diff changeset	392 if (walk_gimple_seq (gimple_omp_body (gfor),
04ced10e8804 gcc 7 kono parents: diff changeset	393 grid_find_ungridifiable_statement,
04ced10e8804 gcc 7 kono parents: diff changeset	394 NULL, &wi))
04ced10e8804 gcc 7 kono parents: diff changeset	395 {
04ced10e8804 gcc 7 kono parents: diff changeset	396 gimple bad = (gimple ) wi.info;
04ced10e8804 gcc 7 kono parents: diff changeset	397 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	398 {
04ced10e8804 gcc 7 kono parents: diff changeset	399 if (is_gimple_call (bad))
04ced10e8804 gcc 7 kono parents: diff changeset	400 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	401 GRID_MISSED_MSG_PREFIX "the inner loop contains "
04ced10e8804 gcc 7 kono parents: diff changeset	402 "call to a noreturn function\n");
04ced10e8804 gcc 7 kono parents: diff changeset	403 else
04ced10e8804 gcc 7 kono parents: diff changeset	404 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	405 GRID_MISSED_MSG_PREFIX "the inner loop contains "
04ced10e8804 gcc 7 kono parents: diff changeset	406 "statement %s which cannot be transformed\n",
04ced10e8804 gcc 7 kono parents: diff changeset	407 gimple_code_name[(int) gimple_code (bad)]);
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	408 dump_printf_loc (MSG_NOTE, bad,
111 04ced10e8804 gcc 7 kono parents: diff changeset	409 "This statement cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	410 "gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	411 }
04ced10e8804 gcc 7 kono parents: diff changeset	412 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	413 }
04ced10e8804 gcc 7 kono parents: diff changeset	414 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	415 }
04ced10e8804 gcc 7 kono parents: diff changeset	416
04ced10e8804 gcc 7 kono parents: diff changeset	417 /* Given distribute omp construct represented by DIST, which in the original
04ced10e8804 gcc 7 kono parents: diff changeset	418 source forms a compound construct with a looping construct, return true if it
04ced10e8804 gcc 7 kono parents: diff changeset	419 can be turned into a gridified HSA kernel. Otherwise return false. GRID
04ced10e8804 gcc 7 kono parents: diff changeset	420 describes hitherto discovered properties of the loop that is evaluated for
04ced10e8804 gcc 7 kono parents: diff changeset	421 possible gridification. */
04ced10e8804 gcc 7 kono parents: diff changeset	422
04ced10e8804 gcc 7 kono parents: diff changeset	423 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	424 grid_dist_follows_simple_pattern (gomp_for dist, grid_prop grid)
04ced10e8804 gcc 7 kono parents: diff changeset	425 {
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	426 dump_user_location_t tloc = grid->target_loc;
111 04ced10e8804 gcc 7 kono parents: diff changeset	427 gimple *stmt = grid_find_single_omp_among_assignments (gimple_omp_body (dist),
04ced10e8804 gcc 7 kono parents: diff changeset	428 grid, "distribute");
04ced10e8804 gcc 7 kono parents: diff changeset	429 gomp_parallel *par;
04ced10e8804 gcc 7 kono parents: diff changeset	430 if (!stmt
04ced10e8804 gcc 7 kono parents: diff changeset	431 \|\| !(par = dyn_cast <gomp_parallel *> (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	432 \|\| !grid_parallel_clauses_gridifiable (par, tloc))
04ced10e8804 gcc 7 kono parents: diff changeset	433 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	434
04ced10e8804 gcc 7 kono parents: diff changeset	435 stmt = grid_find_single_omp_among_assignments (gimple_omp_body (par), grid,
04ced10e8804 gcc 7 kono parents: diff changeset	436 "parallel");
04ced10e8804 gcc 7 kono parents: diff changeset	437 gomp_for *gfor;
04ced10e8804 gcc 7 kono parents: diff changeset	438 if (!stmt \|\| !(gfor = dyn_cast <gomp_for *> (stmt)))
04ced10e8804 gcc 7 kono parents: diff changeset	439 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	440
04ced10e8804 gcc 7 kono parents: diff changeset	441 if (gimple_omp_for_kind (gfor) != GF_OMP_FOR_KIND_FOR)
04ced10e8804 gcc 7 kono parents: diff changeset	442 {
04ced10e8804 gcc 7 kono parents: diff changeset	443 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	444 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	445 GRID_MISSED_MSG_PREFIX "the inner loop is not "
04ced10e8804 gcc 7 kono parents: diff changeset	446 "a simple for loop\n");
04ced10e8804 gcc 7 kono parents: diff changeset	447 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	448 }
04ced10e8804 gcc 7 kono parents: diff changeset	449 gcc_assert (gimple_omp_for_collapse (gfor) == grid->collapse);
04ced10e8804 gcc 7 kono parents: diff changeset	450
04ced10e8804 gcc 7 kono parents: diff changeset	451 if (!grid_inner_loop_gridifiable_p (gfor, grid))
04ced10e8804 gcc 7 kono parents: diff changeset	452 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	453
04ced10e8804 gcc 7 kono parents: diff changeset	454 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	455 }
04ced10e8804 gcc 7 kono parents: diff changeset	456
04ced10e8804 gcc 7 kono parents: diff changeset	457 /* Given an omp loop statement GFOR, return true if it can participate in
04ced10e8804 gcc 7 kono parents: diff changeset	458 tiling gridification, i.e. in one where the distribute and parallel for
04ced10e8804 gcc 7 kono parents: diff changeset	459 loops do not form a compound statement. GRID describes hitherto discovered
04ced10e8804 gcc 7 kono parents: diff changeset	460 properties of the loop that is evaluated for possible gridification. */
04ced10e8804 gcc 7 kono parents: diff changeset	461
04ced10e8804 gcc 7 kono parents: diff changeset	462 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	463 grid_gfor_follows_tiling_pattern (gomp_for gfor, grid_prop grid)
04ced10e8804 gcc 7 kono parents: diff changeset	464 {
04ced10e8804 gcc 7 kono parents: diff changeset	465 if (gimple_omp_for_kind (gfor) != GF_OMP_FOR_KIND_FOR)
04ced10e8804 gcc 7 kono parents: diff changeset	466 {
04ced10e8804 gcc 7 kono parents: diff changeset	467 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	468 {
04ced10e8804 gcc 7 kono parents: diff changeset	469 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	470 GRID_MISSED_MSG_PREFIX "an inner loop is not "
04ced10e8804 gcc 7 kono parents: diff changeset	471 "a simple for loop\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	472 dump_printf_loc (MSG_NOTE, gfor,
111 04ced10e8804 gcc 7 kono parents: diff changeset	473 "This statement is not a simple for loop\n");
04ced10e8804 gcc 7 kono parents: diff changeset	474 }
04ced10e8804 gcc 7 kono parents: diff changeset	475 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	476 }
04ced10e8804 gcc 7 kono parents: diff changeset	477
04ced10e8804 gcc 7 kono parents: diff changeset	478 if (!grid_inner_loop_gridifiable_p (gfor, grid))
04ced10e8804 gcc 7 kono parents: diff changeset	479 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	480
04ced10e8804 gcc 7 kono parents: diff changeset	481 if (gimple_omp_for_collapse (gfor) != grid->collapse)
04ced10e8804 gcc 7 kono parents: diff changeset	482 {
04ced10e8804 gcc 7 kono parents: diff changeset	483 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	484 {
04ced10e8804 gcc 7 kono parents: diff changeset	485 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	486 GRID_MISSED_MSG_PREFIX "an inner loop does not "
04ced10e8804 gcc 7 kono parents: diff changeset	487 "have use the same collapse clause\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	488 dump_printf_loc (MSG_NOTE, gfor,
111 04ced10e8804 gcc 7 kono parents: diff changeset	489 "Loop construct uses a different collapse clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	490 }
04ced10e8804 gcc 7 kono parents: diff changeset	491 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	492 }
04ced10e8804 gcc 7 kono parents: diff changeset	493
04ced10e8804 gcc 7 kono parents: diff changeset	494 struct omp_for_data fd;
04ced10e8804 gcc 7 kono parents: diff changeset	495 struct omp_for_data_loop *loops
04ced10e8804 gcc 7 kono parents: diff changeset	496 = (struct omp_for_data_loop *)alloca (grid->collapse
04ced10e8804 gcc 7 kono parents: diff changeset	497 * sizeof (struct omp_for_data_loop));
04ced10e8804 gcc 7 kono parents: diff changeset	498 omp_extract_for_data (gfor, &fd, loops);
04ced10e8804 gcc 7 kono parents: diff changeset	499 for (unsigned i = 0; i < grid->collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	500 {
04ced10e8804 gcc 7 kono parents: diff changeset	501 tree itype, type = TREE_TYPE (fd.loops[i].v);
04ced10e8804 gcc 7 kono parents: diff changeset	502 if (POINTER_TYPE_P (type))
04ced10e8804 gcc 7 kono parents: diff changeset	503 itype = signed_type_for (type);
04ced10e8804 gcc 7 kono parents: diff changeset	504 else
04ced10e8804 gcc 7 kono parents: diff changeset	505 itype = type;
04ced10e8804 gcc 7 kono parents: diff changeset	506
04ced10e8804 gcc 7 kono parents: diff changeset	507 tree n1 = fold_convert (itype, fd.loops[i].n1);
04ced10e8804 gcc 7 kono parents: diff changeset	508 tree n2 = fold_convert (itype, fd.loops[i].n2);
04ced10e8804 gcc 7 kono parents: diff changeset	509 tree t = build_int_cst (itype,
04ced10e8804 gcc 7 kono parents: diff changeset	510 (fd.loops[i].cond_code == LT_EXPR ? -1 : 1));
04ced10e8804 gcc 7 kono parents: diff changeset	511 t = fold_build2 (PLUS_EXPR, itype, fd.loops[i].step, t);
04ced10e8804 gcc 7 kono parents: diff changeset	512 t = fold_build2 (PLUS_EXPR, itype, t, n2);
04ced10e8804 gcc 7 kono parents: diff changeset	513 t = fold_build2 (MINUS_EXPR, itype, t, n1);
04ced10e8804 gcc 7 kono parents: diff changeset	514 if (TYPE_UNSIGNED (itype) && fd.loops[i].cond_code == GT_EXPR)
04ced10e8804 gcc 7 kono parents: diff changeset	515 t = fold_build2 (TRUNC_DIV_EXPR, itype,
04ced10e8804 gcc 7 kono parents: diff changeset	516 fold_build1 (NEGATE_EXPR, itype, t),
04ced10e8804 gcc 7 kono parents: diff changeset	517 fold_build1 (NEGATE_EXPR, itype, fd.loops[i].step));
04ced10e8804 gcc 7 kono parents: diff changeset	518 else
04ced10e8804 gcc 7 kono parents: diff changeset	519 t = fold_build2 (TRUNC_DIV_EXPR, itype, t, fd.loops[i].step);
04ced10e8804 gcc 7 kono parents: diff changeset	520
04ced10e8804 gcc 7 kono parents: diff changeset	521 if (!operand_equal_p (grid->group_sizes[i], t, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	522 {
04ced10e8804 gcc 7 kono parents: diff changeset	523 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	524 {
04ced10e8804 gcc 7 kono parents: diff changeset	525 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	526 GRID_MISSED_MSG_PREFIX "the distribute and "
04ced10e8804 gcc 7 kono parents: diff changeset	527 "an internal loop do not agree on tile size\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	528 dump_printf_loc (MSG_NOTE, gfor,
111 04ced10e8804 gcc 7 kono parents: diff changeset	529 "Loop construct does not seem to loop over "
04ced10e8804 gcc 7 kono parents: diff changeset	530 "a tile size\n");
04ced10e8804 gcc 7 kono parents: diff changeset	531 }
04ced10e8804 gcc 7 kono parents: diff changeset	532 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	533 }
04ced10e8804 gcc 7 kono parents: diff changeset	534 }
04ced10e8804 gcc 7 kono parents: diff changeset	535 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	536 }
04ced10e8804 gcc 7 kono parents: diff changeset	537
04ced10e8804 gcc 7 kono parents: diff changeset	538 /* Facing a call to FNDECL in the body of a distribute construct, return true
04ced10e8804 gcc 7 kono parents: diff changeset	539 if we can handle it or false if it precludes gridification. */
04ced10e8804 gcc 7 kono parents: diff changeset	540
04ced10e8804 gcc 7 kono parents: diff changeset	541 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	542 grid_call_permissible_in_distribute_p (tree fndecl)
04ced10e8804 gcc 7 kono parents: diff changeset	543 {
04ced10e8804 gcc 7 kono parents: diff changeset	544 if (DECL_PURE_P (fndecl) \|\| TREE_READONLY (fndecl))
04ced10e8804 gcc 7 kono parents: diff changeset	545 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	546
04ced10e8804 gcc 7 kono parents: diff changeset	547 const char *name = IDENTIFIER_POINTER (DECL_NAME (fndecl));
04ced10e8804 gcc 7 kono parents: diff changeset	548 if (strstr (name, "omp_") != name)
04ced10e8804 gcc 7 kono parents: diff changeset	549 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	550
04ced10e8804 gcc 7 kono parents: diff changeset	551 if ((strcmp (name, "omp_get_thread_num") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	552 \|\| (strcmp (name, "omp_get_num_threads") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	553 \|\| (strcmp (name, "omp_get_num_teams") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	554 \|\| (strcmp (name, "omp_get_team_num") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	555 \|\| (strcmp (name, "omp_get_level") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	556 \|\| (strcmp (name, "omp_get_active_level") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	557 \|\| (strcmp (name, "omp_in_parallel") == 0))
04ced10e8804 gcc 7 kono parents: diff changeset	558 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	559
04ced10e8804 gcc 7 kono parents: diff changeset	560 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	561 }
04ced10e8804 gcc 7 kono parents: diff changeset	562
04ced10e8804 gcc 7 kono parents: diff changeset	563 /* Facing a call satisfying grid_call_permissible_in_distribute_p in the body
04ced10e8804 gcc 7 kono parents: diff changeset	564 of a distribute construct that is pointed at by GSI, modify it as necessary
04ced10e8804 gcc 7 kono parents: diff changeset	565 for gridification. If the statement itself got removed, return true. */
04ced10e8804 gcc 7 kono parents: diff changeset	566
04ced10e8804 gcc 7 kono parents: diff changeset	567 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	568 grid_handle_call_in_distribute (gimple_stmt_iterator *gsi)
04ced10e8804 gcc 7 kono parents: diff changeset	569 {
04ced10e8804 gcc 7 kono parents: diff changeset	570 gimple stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	571 tree fndecl = gimple_call_fndecl (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	572 gcc_checking_assert (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	573 if (DECL_PURE_P (fndecl) \|\| TREE_READONLY (fndecl))
04ced10e8804 gcc 7 kono parents: diff changeset	574 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	575
04ced10e8804 gcc 7 kono parents: diff changeset	576 const char *name = IDENTIFIER_POINTER (DECL_NAME (fndecl));
04ced10e8804 gcc 7 kono parents: diff changeset	577 if ((strcmp (name, "omp_get_thread_num") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	578 \|\| (strcmp (name, "omp_get_level") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	579 \|\| (strcmp (name, "omp_get_active_level") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	580 \|\| (strcmp (name, "omp_in_parallel") == 0))
04ced10e8804 gcc 7 kono parents: diff changeset	581 {
04ced10e8804 gcc 7 kono parents: diff changeset	582 tree lhs = gimple_call_lhs (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	583 if (lhs)
04ced10e8804 gcc 7 kono parents: diff changeset	584 {
04ced10e8804 gcc 7 kono parents: diff changeset	585 gassign *assign
04ced10e8804 gcc 7 kono parents: diff changeset	586 = gimple_build_assign (lhs, build_zero_cst (TREE_TYPE (lhs)));
04ced10e8804 gcc 7 kono parents: diff changeset	587 gsi_insert_before (gsi, assign, GSI_SAME_STMT);
04ced10e8804 gcc 7 kono parents: diff changeset	588 }
04ced10e8804 gcc 7 kono parents: diff changeset	589 gsi_remove (gsi, true);
04ced10e8804 gcc 7 kono parents: diff changeset	590 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	591 }
04ced10e8804 gcc 7 kono parents: diff changeset	592
04ced10e8804 gcc 7 kono parents: diff changeset	593 /* The rest of the omp functions can stay as they are, HSA back-end will
04ced10e8804 gcc 7 kono parents: diff changeset	594 handle them correctly. */
04ced10e8804 gcc 7 kono parents: diff changeset	595 gcc_checking_assert ((strcmp (name, "omp_get_num_threads") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	596 \|\| (strcmp (name, "omp_get_num_teams") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	597 \|\| (strcmp (name, "omp_get_team_num") == 0));
04ced10e8804 gcc 7 kono parents: diff changeset	598 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	599 }
04ced10e8804 gcc 7 kono parents: diff changeset	600
04ced10e8804 gcc 7 kono parents: diff changeset	601 /* Given a sequence of statements within a distribute omp construct or a
04ced10e8804 gcc 7 kono parents: diff changeset	602 parallel construct, which in the original source does not form a compound
04ced10e8804 gcc 7 kono parents: diff changeset	603 construct with a looping construct, return true if it does not prevent us
04ced10e8804 gcc 7 kono parents: diff changeset	604 from turning it into a gridified HSA kernel. Otherwise return false. GRID
04ced10e8804 gcc 7 kono parents: diff changeset	605 describes hitherto discovered properties of the loop that is evaluated for
04ced10e8804 gcc 7 kono parents: diff changeset	606 possible gridification. IN_PARALLEL must be true if seq is within a
04ced10e8804 gcc 7 kono parents: diff changeset	607 parallel construct and flase if it is only within a distribute
04ced10e8804 gcc 7 kono parents: diff changeset	608 construct. */
04ced10e8804 gcc 7 kono parents: diff changeset	609
04ced10e8804 gcc 7 kono parents: diff changeset	610 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	611 grid_dist_follows_tiling_pattern (gimple_seq seq, grid_prop *grid,
04ced10e8804 gcc 7 kono parents: diff changeset	612 bool in_parallel)
04ced10e8804 gcc 7 kono parents: diff changeset	613 {
04ced10e8804 gcc 7 kono parents: diff changeset	614 gimple_stmt_iterator gsi;
04ced10e8804 gcc 7 kono parents: diff changeset	615 for (gsi = gsi_start (seq); !gsi_end_p (gsi); gsi_next (&gsi))
04ced10e8804 gcc 7 kono parents: diff changeset	616 {
04ced10e8804 gcc 7 kono parents: diff changeset	617 gimple *stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	618
04ced10e8804 gcc 7 kono parents: diff changeset	619 if (grid_safe_assignment_p (stmt, grid)
04ced10e8804 gcc 7 kono parents: diff changeset	620 \|\| gimple_code (stmt) == GIMPLE_GOTO
04ced10e8804 gcc 7 kono parents: diff changeset	621 \|\| gimple_code (stmt) == GIMPLE_LABEL
04ced10e8804 gcc 7 kono parents: diff changeset	622 \|\| gimple_code (stmt) == GIMPLE_COND)
04ced10e8804 gcc 7 kono parents: diff changeset	623 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	624 else if (gbind bind = dyn_cast <gbind > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	625 {
04ced10e8804 gcc 7 kono parents: diff changeset	626 if (!grid_dist_follows_tiling_pattern (gimple_bind_body (bind),
04ced10e8804 gcc 7 kono parents: diff changeset	627 grid, in_parallel))
04ced10e8804 gcc 7 kono parents: diff changeset	628 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	629 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	630 }
04ced10e8804 gcc 7 kono parents: diff changeset	631 else if (gtry try_stmt = dyn_cast <gtry > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	632 {
04ced10e8804 gcc 7 kono parents: diff changeset	633 if (gimple_try_kind (try_stmt) == GIMPLE_TRY_CATCH)
04ced10e8804 gcc 7 kono parents: diff changeset	634 {
04ced10e8804 gcc 7 kono parents: diff changeset	635 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	636 {
04ced10e8804 gcc 7 kono parents: diff changeset	637 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	638 GRID_MISSED_MSG_PREFIX "the distribute "
04ced10e8804 gcc 7 kono parents: diff changeset	639 "construct contains a try..catch region\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	640 dump_printf_loc (MSG_NOTE, try_stmt,
111 04ced10e8804 gcc 7 kono parents: diff changeset	641 "This statement cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	642 "tiled gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	643 }
04ced10e8804 gcc 7 kono parents: diff changeset	644 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	645 }
04ced10e8804 gcc 7 kono parents: diff changeset	646 if (!grid_dist_follows_tiling_pattern (gimple_try_eval (try_stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	647 grid, in_parallel))
04ced10e8804 gcc 7 kono parents: diff changeset	648 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	649 if (!grid_dist_follows_tiling_pattern (gimple_try_cleanup (try_stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	650 grid, in_parallel))
04ced10e8804 gcc 7 kono parents: diff changeset	651 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	652 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	653 }
04ced10e8804 gcc 7 kono parents: diff changeset	654 else if (is_gimple_call (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	655 {
04ced10e8804 gcc 7 kono parents: diff changeset	656 tree fndecl = gimple_call_fndecl (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	657 if (fndecl && grid_call_permissible_in_distribute_p (fndecl))
04ced10e8804 gcc 7 kono parents: diff changeset	658 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	659
04ced10e8804 gcc 7 kono parents: diff changeset	660 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	661 {
04ced10e8804 gcc 7 kono parents: diff changeset	662 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	663 GRID_MISSED_MSG_PREFIX "the distribute "
04ced10e8804 gcc 7 kono parents: diff changeset	664 "construct contains a call\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	665 dump_printf_loc (MSG_NOTE, stmt,
111 04ced10e8804 gcc 7 kono parents: diff changeset	666 "This statement cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	667 "tiled gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	668 }
04ced10e8804 gcc 7 kono parents: diff changeset	669 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	670 }
04ced10e8804 gcc 7 kono parents: diff changeset	671 else if (gomp_parallel par = dyn_cast <gomp_parallel > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	672 {
04ced10e8804 gcc 7 kono parents: diff changeset	673 if (in_parallel)
04ced10e8804 gcc 7 kono parents: diff changeset	674 {
04ced10e8804 gcc 7 kono parents: diff changeset	675 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	676 {
04ced10e8804 gcc 7 kono parents: diff changeset	677 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	678 GRID_MISSED_MSG_PREFIX "a parallel "
04ced10e8804 gcc 7 kono parents: diff changeset	679 "construct contains another parallel "
04ced10e8804 gcc 7 kono parents: diff changeset	680 "construct\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	681 dump_printf_loc (MSG_NOTE, stmt,
111 04ced10e8804 gcc 7 kono parents: diff changeset	682 "This parallel construct is nested in "
04ced10e8804 gcc 7 kono parents: diff changeset	683 "another one\n");
04ced10e8804 gcc 7 kono parents: diff changeset	684 }
04ced10e8804 gcc 7 kono parents: diff changeset	685 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	686 }
04ced10e8804 gcc 7 kono parents: diff changeset	687 if (!grid_parallel_clauses_gridifiable (par, grid->target_loc)
04ced10e8804 gcc 7 kono parents: diff changeset	688 \|\| !grid_dist_follows_tiling_pattern (gimple_omp_body (par),
04ced10e8804 gcc 7 kono parents: diff changeset	689 grid, true))
04ced10e8804 gcc 7 kono parents: diff changeset	690 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	691 }
04ced10e8804 gcc 7 kono parents: diff changeset	692 else if (gomp_for gfor = dyn_cast <gomp_for > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	693 {
04ced10e8804 gcc 7 kono parents: diff changeset	694 if (!in_parallel)
04ced10e8804 gcc 7 kono parents: diff changeset	695 {
04ced10e8804 gcc 7 kono parents: diff changeset	696 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	697 {
04ced10e8804 gcc 7 kono parents: diff changeset	698 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	699 GRID_MISSED_MSG_PREFIX "a loop "
04ced10e8804 gcc 7 kono parents: diff changeset	700 "construct is not nested within a parallel "
04ced10e8804 gcc 7 kono parents: diff changeset	701 "construct\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	702 dump_printf_loc (MSG_NOTE, stmt,
111 04ced10e8804 gcc 7 kono parents: diff changeset	703 "This loop construct is not nested in "
04ced10e8804 gcc 7 kono parents: diff changeset	704 "a parallel construct\n");
04ced10e8804 gcc 7 kono parents: diff changeset	705 }
04ced10e8804 gcc 7 kono parents: diff changeset	706 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	707 }
04ced10e8804 gcc 7 kono parents: diff changeset	708 if (!grid_gfor_follows_tiling_pattern (gfor, grid))
04ced10e8804 gcc 7 kono parents: diff changeset	709 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	710 }
04ced10e8804 gcc 7 kono parents: diff changeset	711 else
04ced10e8804 gcc 7 kono parents: diff changeset	712 {
04ced10e8804 gcc 7 kono parents: diff changeset	713 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	714 {
04ced10e8804 gcc 7 kono parents: diff changeset	715 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	716 GRID_MISSED_MSG_PREFIX "the distribute "
04ced10e8804 gcc 7 kono parents: diff changeset	717 "construct contains a complex statement\n");
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	718 dump_printf_loc (MSG_NOTE, stmt,
111 04ced10e8804 gcc 7 kono parents: diff changeset	719 "This statement cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	720 "tiled gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	721 }
04ced10e8804 gcc 7 kono parents: diff changeset	722 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	723 }
04ced10e8804 gcc 7 kono parents: diff changeset	724 }
04ced10e8804 gcc 7 kono parents: diff changeset	725 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	726 }
04ced10e8804 gcc 7 kono parents: diff changeset	727
04ced10e8804 gcc 7 kono parents: diff changeset	728 /* If TARGET follows a pattern that can be turned into a gridified HSA kernel,
04ced10e8804 gcc 7 kono parents: diff changeset	729 return true, otherwise return false. In the case of success, also fill in
04ced10e8804 gcc 7 kono parents: diff changeset	730 GRID with information describing the kernel grid. */
04ced10e8804 gcc 7 kono parents: diff changeset	731
04ced10e8804 gcc 7 kono parents: diff changeset	732 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	733 grid_target_follows_gridifiable_pattern (gomp_target target, grid_prop grid)
04ced10e8804 gcc 7 kono parents: diff changeset	734 {
04ced10e8804 gcc 7 kono parents: diff changeset	735 if (gimple_omp_target_kind (target) != GF_OMP_TARGET_KIND_REGION)
04ced10e8804 gcc 7 kono parents: diff changeset	736 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	737
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	738 dump_user_location_t tloc = target;
111 04ced10e8804 gcc 7 kono parents: diff changeset	739 grid->target_loc = tloc;
04ced10e8804 gcc 7 kono parents: diff changeset	740 gimple *stmt
04ced10e8804 gcc 7 kono parents: diff changeset	741 = grid_find_single_omp_among_assignments (gimple_omp_body (target),
04ced10e8804 gcc 7 kono parents: diff changeset	742 grid, "target");
04ced10e8804 gcc 7 kono parents: diff changeset	743 if (!stmt)
04ced10e8804 gcc 7 kono parents: diff changeset	744 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	745 gomp_teams teams = dyn_cast <gomp_teams > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	746 tree group_size = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	747 if (!teams)
04ced10e8804 gcc 7 kono parents: diff changeset	748 {
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	749 if (dump_enabled_p ())
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	750 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	751 GRID_MISSED_MSG_PREFIX "it does not have a sole "
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	752 "teams construct in it.\n");
111 04ced10e8804 gcc 7 kono parents: diff changeset	753 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	754 }
04ced10e8804 gcc 7 kono parents: diff changeset	755
04ced10e8804 gcc 7 kono parents: diff changeset	756 tree clauses = gimple_omp_teams_clauses (teams);
04ced10e8804 gcc 7 kono parents: diff changeset	757 while (clauses)
04ced10e8804 gcc 7 kono parents: diff changeset	758 {
04ced10e8804 gcc 7 kono parents: diff changeset	759 switch (OMP_CLAUSE_CODE (clauses))
04ced10e8804 gcc 7 kono parents: diff changeset	760 {
04ced10e8804 gcc 7 kono parents: diff changeset	761 case OMP_CLAUSE_NUM_TEAMS:
04ced10e8804 gcc 7 kono parents: diff changeset	762 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	763 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	764 GRID_MISSED_MSG_PREFIX "the teams construct "
04ced10e8804 gcc 7 kono parents: diff changeset	765 "contains a num_teams clause\n ");
04ced10e8804 gcc 7 kono parents: diff changeset	766 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	767
04ced10e8804 gcc 7 kono parents: diff changeset	768 case OMP_CLAUSE_REDUCTION:
04ced10e8804 gcc 7 kono parents: diff changeset	769 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	770 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	771 GRID_MISSED_MSG_PREFIX "a reduction "
04ced10e8804 gcc 7 kono parents: diff changeset	772 "clause is present\n ");
04ced10e8804 gcc 7 kono parents: diff changeset	773 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	774
04ced10e8804 gcc 7 kono parents: diff changeset	775 case OMP_CLAUSE_THREAD_LIMIT:
04ced10e8804 gcc 7 kono parents: diff changeset	776 if (!integer_zerop (OMP_CLAUSE_OPERAND (clauses, 0)))
04ced10e8804 gcc 7 kono parents: diff changeset	777 group_size = OMP_CLAUSE_OPERAND (clauses, 0);
04ced10e8804 gcc 7 kono parents: diff changeset	778 break;
04ced10e8804 gcc 7 kono parents: diff changeset	779
04ced10e8804 gcc 7 kono parents: diff changeset	780 default:
04ced10e8804 gcc 7 kono parents: diff changeset	781 break;
04ced10e8804 gcc 7 kono parents: diff changeset	782 }
04ced10e8804 gcc 7 kono parents: diff changeset	783 clauses = OMP_CLAUSE_CHAIN (clauses);
04ced10e8804 gcc 7 kono parents: diff changeset	784 }
04ced10e8804 gcc 7 kono parents: diff changeset	785
04ced10e8804 gcc 7 kono parents: diff changeset	786 stmt = grid_find_single_omp_among_assignments (gimple_omp_body (teams), grid,
04ced10e8804 gcc 7 kono parents: diff changeset	787 "teams");
04ced10e8804 gcc 7 kono parents: diff changeset	788 if (!stmt)
04ced10e8804 gcc 7 kono parents: diff changeset	789 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	790 gomp_for dist = dyn_cast <gomp_for > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	791 if (!dist)
04ced10e8804 gcc 7 kono parents: diff changeset	792 {
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	793 if (dump_enabled_p ())
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	794 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	795 GRID_MISSED_MSG_PREFIX "the teams construct does not "
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	796 "have a single distribute construct in it.\n");
111 04ced10e8804 gcc 7 kono parents: diff changeset	797 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	798 }
04ced10e8804 gcc 7 kono parents: diff changeset	799
04ced10e8804 gcc 7 kono parents: diff changeset	800 gcc_assert (gimple_omp_for_kind (dist) == GF_OMP_FOR_KIND_DISTRIBUTE);
04ced10e8804 gcc 7 kono parents: diff changeset	801
04ced10e8804 gcc 7 kono parents: diff changeset	802 grid->collapse = gimple_omp_for_collapse (dist);
04ced10e8804 gcc 7 kono parents: diff changeset	803 if (grid->collapse > 3)
04ced10e8804 gcc 7 kono parents: diff changeset	804 {
04ced10e8804 gcc 7 kono parents: diff changeset	805 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	806 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	807 GRID_MISSED_MSG_PREFIX "the distribute construct "
04ced10e8804 gcc 7 kono parents: diff changeset	808 "contains collapse clause with parameter greater "
04ced10e8804 gcc 7 kono parents: diff changeset	809 "than 3\n");
04ced10e8804 gcc 7 kono parents: diff changeset	810 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	811 }
04ced10e8804 gcc 7 kono parents: diff changeset	812
04ced10e8804 gcc 7 kono parents: diff changeset	813 struct omp_for_data fd;
04ced10e8804 gcc 7 kono parents: diff changeset	814 struct omp_for_data_loop *dist_loops
04ced10e8804 gcc 7 kono parents: diff changeset	815 = (struct omp_for_data_loop *)alloca (grid->collapse
04ced10e8804 gcc 7 kono parents: diff changeset	816 * sizeof (struct omp_for_data_loop));
04ced10e8804 gcc 7 kono parents: diff changeset	817 omp_extract_for_data (dist, &fd, dist_loops);
04ced10e8804 gcc 7 kono parents: diff changeset	818 if (fd.chunk_size)
04ced10e8804 gcc 7 kono parents: diff changeset	819 {
04ced10e8804 gcc 7 kono parents: diff changeset	820 if (group_size && !operand_equal_p (group_size, fd.chunk_size, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	821 {
04ced10e8804 gcc 7 kono parents: diff changeset	822 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	823 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	824 GRID_MISSED_MSG_PREFIX "the teams "
04ced10e8804 gcc 7 kono parents: diff changeset	825 "thread limit is different from distribute "
04ced10e8804 gcc 7 kono parents: diff changeset	826 "schedule chunk\n");
04ced10e8804 gcc 7 kono parents: diff changeset	827 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	828 }
04ced10e8804 gcc 7 kono parents: diff changeset	829 group_size = fd.chunk_size;
04ced10e8804 gcc 7 kono parents: diff changeset	830 }
04ced10e8804 gcc 7 kono parents: diff changeset	831 if (group_size && grid->collapse > 1)
04ced10e8804 gcc 7 kono parents: diff changeset	832 {
04ced10e8804 gcc 7 kono parents: diff changeset	833 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	834 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	835 GRID_MISSED_MSG_PREFIX "group size cannot be "
04ced10e8804 gcc 7 kono parents: diff changeset	836 "set using thread_limit or schedule clauses "
04ced10e8804 gcc 7 kono parents: diff changeset	837 "when also using a collapse clause greater than 1\n");
04ced10e8804 gcc 7 kono parents: diff changeset	838 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	839 }
04ced10e8804 gcc 7 kono parents: diff changeset	840
04ced10e8804 gcc 7 kono parents: diff changeset	841 if (gimple_omp_for_combined_p (dist))
04ced10e8804 gcc 7 kono parents: diff changeset	842 {
04ced10e8804 gcc 7 kono parents: diff changeset	843 grid->tiling = false;
04ced10e8804 gcc 7 kono parents: diff changeset	844 grid->group_sizes[0] = group_size;
04ced10e8804 gcc 7 kono parents: diff changeset	845 for (unsigned i = 1; i < grid->collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	846 grid->group_sizes[i] = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	847 return grid_dist_follows_simple_pattern (dist, grid);
04ced10e8804 gcc 7 kono parents: diff changeset	848 }
04ced10e8804 gcc 7 kono parents: diff changeset	849 else
04ced10e8804 gcc 7 kono parents: diff changeset	850 {
04ced10e8804 gcc 7 kono parents: diff changeset	851 grid->tiling = true;
04ced10e8804 gcc 7 kono parents: diff changeset	852 if (group_size)
04ced10e8804 gcc 7 kono parents: diff changeset	853 {
04ced10e8804 gcc 7 kono parents: diff changeset	854 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	855 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	856 GRID_MISSED_MSG_PREFIX "group size cannot be set "
04ced10e8804 gcc 7 kono parents: diff changeset	857 "using thread_limit or schedule clauses when "
04ced10e8804 gcc 7 kono parents: diff changeset	858 "distribute and loop constructs do not form "
04ced10e8804 gcc 7 kono parents: diff changeset	859 "one combined construct\n");
04ced10e8804 gcc 7 kono parents: diff changeset	860 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	861 }
04ced10e8804 gcc 7 kono parents: diff changeset	862 for (unsigned i = 0; i < grid->collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	863 {
04ced10e8804 gcc 7 kono parents: diff changeset	864 if (fd.loops[i].cond_code == GT_EXPR)
04ced10e8804 gcc 7 kono parents: diff changeset	865 grid->group_sizes[i] = fold_build1 (NEGATE_EXPR,
04ced10e8804 gcc 7 kono parents: diff changeset	866 TREE_TYPE (fd.loops[i].step),
04ced10e8804 gcc 7 kono parents: diff changeset	867 fd.loops[i].step);
04ced10e8804 gcc 7 kono parents: diff changeset	868 else
04ced10e8804 gcc 7 kono parents: diff changeset	869 grid->group_sizes[i] = fd.loops[i].step;
04ced10e8804 gcc 7 kono parents: diff changeset	870 }
04ced10e8804 gcc 7 kono parents: diff changeset	871 return grid_dist_follows_tiling_pattern (gimple_omp_body (dist), grid,
04ced10e8804 gcc 7 kono parents: diff changeset	872 false);
04ced10e8804 gcc 7 kono parents: diff changeset	873 }
04ced10e8804 gcc 7 kono parents: diff changeset	874 }
04ced10e8804 gcc 7 kono parents: diff changeset	875
04ced10e8804 gcc 7 kono parents: diff changeset	876 /* Operand walker, used to remap pre-body declarations according to a hash map
04ced10e8804 gcc 7 kono parents: diff changeset	877 provided in DATA. */
04ced10e8804 gcc 7 kono parents: diff changeset	878
04ced10e8804 gcc 7 kono parents: diff changeset	879 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	880 grid_remap_prebody_decls (tree tp, int walk_subtrees, void *data)
04ced10e8804 gcc 7 kono parents: diff changeset	881 {
04ced10e8804 gcc 7 kono parents: diff changeset	882 tree t = *tp;
04ced10e8804 gcc 7 kono parents: diff changeset	883
04ced10e8804 gcc 7 kono parents: diff changeset	884 if (DECL_P (t) \|\| TYPE_P (t))
04ced10e8804 gcc 7 kono parents: diff changeset	885 *walk_subtrees = 0;
04ced10e8804 gcc 7 kono parents: diff changeset	886 else
04ced10e8804 gcc 7 kono parents: diff changeset	887 *walk_subtrees = 1;
04ced10e8804 gcc 7 kono parents: diff changeset	888
04ced10e8804 gcc 7 kono parents: diff changeset	889 if (VAR_P (t))
04ced10e8804 gcc 7 kono parents: diff changeset	890 {
04ced10e8804 gcc 7 kono parents: diff changeset	891 struct walk_stmt_info wi = (struct walk_stmt_info ) data;
04ced10e8804 gcc 7 kono parents: diff changeset	892 hash_map<tree, tree> declmap = (hash_map<tree, tree> ) wi->info;
04ced10e8804 gcc 7 kono parents: diff changeset	893 tree *repl = declmap->get (t);
04ced10e8804 gcc 7 kono parents: diff changeset	894 if (repl)
04ced10e8804 gcc 7 kono parents: diff changeset	895 tp = repl;
04ced10e8804 gcc 7 kono parents: diff changeset	896 }
04ced10e8804 gcc 7 kono parents: diff changeset	897 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	898 }
04ced10e8804 gcc 7 kono parents: diff changeset	899
04ced10e8804 gcc 7 kono parents: diff changeset	900 /* Identifiers of segments into which a particular variable should be places
04ced10e8804 gcc 7 kono parents: diff changeset	901 when gridifying. */
04ced10e8804 gcc 7 kono parents: diff changeset	902
04ced10e8804 gcc 7 kono parents: diff changeset	903 enum grid_var_segment {GRID_SEGMENT_PRIVATE, GRID_SEGMENT_GROUP,
04ced10e8804 gcc 7 kono parents: diff changeset	904 GRID_SEGMENT_GLOBAL};
04ced10e8804 gcc 7 kono parents: diff changeset	905
04ced10e8804 gcc 7 kono parents: diff changeset	906 /* Mark VAR so that it is eventually placed into SEGMENT. Place an artificial
04ced10e8804 gcc 7 kono parents: diff changeset	907 builtin call into SEQ that will make sure the variable is always considered
04ced10e8804 gcc 7 kono parents: diff changeset	908 address taken. */
04ced10e8804 gcc 7 kono parents: diff changeset	909
04ced10e8804 gcc 7 kono parents: diff changeset	910 static void
04ced10e8804 gcc 7 kono parents: diff changeset	911 grid_mark_variable_segment (tree var, enum grid_var_segment segment)
04ced10e8804 gcc 7 kono parents: diff changeset	912 {
04ced10e8804 gcc 7 kono parents: diff changeset	913 /* Making a non-addressable variables would require that we re-gimplify all
04ced10e8804 gcc 7 kono parents: diff changeset	914 their uses. Fortunately, we do not have to do this because if they are
04ced10e8804 gcc 7 kono parents: diff changeset	915 not addressable, it means they are not used in atomic or parallel
04ced10e8804 gcc 7 kono parents: diff changeset	916 statements and so relaxed GPU consistency rules mean we can just keep them
04ced10e8804 gcc 7 kono parents: diff changeset	917 private. */
04ced10e8804 gcc 7 kono parents: diff changeset	918 if (!TREE_ADDRESSABLE (var))
04ced10e8804 gcc 7 kono parents: diff changeset	919 return;
04ced10e8804 gcc 7 kono parents: diff changeset	920
04ced10e8804 gcc 7 kono parents: diff changeset	921 switch (segment)
04ced10e8804 gcc 7 kono parents: diff changeset	922 {
04ced10e8804 gcc 7 kono parents: diff changeset	923 case GRID_SEGMENT_GROUP:
04ced10e8804 gcc 7 kono parents: diff changeset	924 DECL_ATTRIBUTES (var) = tree_cons (get_identifier ("hsa_group_segment"),
04ced10e8804 gcc 7 kono parents: diff changeset	925 NULL, DECL_ATTRIBUTES (var));
04ced10e8804 gcc 7 kono parents: diff changeset	926 break;
04ced10e8804 gcc 7 kono parents: diff changeset	927 case GRID_SEGMENT_GLOBAL:
04ced10e8804 gcc 7 kono parents: diff changeset	928 DECL_ATTRIBUTES (var) = tree_cons (get_identifier ("hsa_global_segment"),
04ced10e8804 gcc 7 kono parents: diff changeset	929 NULL, DECL_ATTRIBUTES (var));
04ced10e8804 gcc 7 kono parents: diff changeset	930 break;
04ced10e8804 gcc 7 kono parents: diff changeset	931 default:
04ced10e8804 gcc 7 kono parents: diff changeset	932 gcc_unreachable ();
04ced10e8804 gcc 7 kono parents: diff changeset	933 }
04ced10e8804 gcc 7 kono parents: diff changeset	934
04ced10e8804 gcc 7 kono parents: diff changeset	935 if (!TREE_STATIC (var))
04ced10e8804 gcc 7 kono parents: diff changeset	936 {
04ced10e8804 gcc 7 kono parents: diff changeset	937 TREE_STATIC (var) = 1;
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	938 const char *prefix = IDENTIFIER_POINTER (DECL_NAME (var));
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	939 SET_DECL_ASSEMBLER_NAME (var, create_tmp_var_name (prefix));
111 04ced10e8804 gcc 7 kono parents: diff changeset	940 varpool_node::finalize_decl (var);
04ced10e8804 gcc 7 kono parents: diff changeset	941 }
04ced10e8804 gcc 7 kono parents: diff changeset	942
04ced10e8804 gcc 7 kono parents: diff changeset	943 }
04ced10e8804 gcc 7 kono parents: diff changeset	944
04ced10e8804 gcc 7 kono parents: diff changeset	945 /* Copy leading register-type assignments to local variables in SRC to just
04ced10e8804 gcc 7 kono parents: diff changeset	946 before DST, Creating temporaries, adjusting mapping of operands in WI and
04ced10e8804 gcc 7 kono parents: diff changeset	947 remapping operands as necessary. Add any new temporaries to TGT_BIND.
04ced10e8804 gcc 7 kono parents: diff changeset	948 Return the first statement that does not conform to grid_safe_assignment_p
04ced10e8804 gcc 7 kono parents: diff changeset	949 or NULL. If VAR_SEGMENT is not GRID_SEGMENT_PRIVATE, also mark all
04ced10e8804 gcc 7 kono parents: diff changeset	950 variables in traversed bind statements so that they are put into the
04ced10e8804 gcc 7 kono parents: diff changeset	951 appropriate segment. */
04ced10e8804 gcc 7 kono parents: diff changeset	952
04ced10e8804 gcc 7 kono parents: diff changeset	953 static gimple *
04ced10e8804 gcc 7 kono parents: diff changeset	954 grid_copy_leading_local_assignments (gimple_seq src, gimple_stmt_iterator *dst,
04ced10e8804 gcc 7 kono parents: diff changeset	955 gbind *tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	956 enum grid_var_segment var_segment,
04ced10e8804 gcc 7 kono parents: diff changeset	957 struct walk_stmt_info *wi)
04ced10e8804 gcc 7 kono parents: diff changeset	958 {
04ced10e8804 gcc 7 kono parents: diff changeset	959 hash_map<tree, tree> declmap = (hash_map<tree, tree> ) wi->info;
04ced10e8804 gcc 7 kono parents: diff changeset	960 gimple_stmt_iterator gsi;
04ced10e8804 gcc 7 kono parents: diff changeset	961 for (gsi = gsi_start (src); !gsi_end_p (gsi); gsi_next (&gsi))
04ced10e8804 gcc 7 kono parents: diff changeset	962 {
04ced10e8804 gcc 7 kono parents: diff changeset	963 gimple *stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	964 if (gbind bind = dyn_cast <gbind > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	965 {
04ced10e8804 gcc 7 kono parents: diff changeset	966 gimple *r = grid_copy_leading_local_assignments
04ced10e8804 gcc 7 kono parents: diff changeset	967 (gimple_bind_body (bind), dst, tgt_bind, var_segment, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	968
04ced10e8804 gcc 7 kono parents: diff changeset	969 if (var_segment != GRID_SEGMENT_PRIVATE)
04ced10e8804 gcc 7 kono parents: diff changeset	970 for (tree var = gimple_bind_vars (bind);
04ced10e8804 gcc 7 kono parents: diff changeset	971 var;
04ced10e8804 gcc 7 kono parents: diff changeset	972 var = DECL_CHAIN (var))
04ced10e8804 gcc 7 kono parents: diff changeset	973 grid_mark_variable_segment (var, var_segment);
04ced10e8804 gcc 7 kono parents: diff changeset	974 if (r)
04ced10e8804 gcc 7 kono parents: diff changeset	975 return r;
04ced10e8804 gcc 7 kono parents: diff changeset	976 else
04ced10e8804 gcc 7 kono parents: diff changeset	977 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	978 }
04ced10e8804 gcc 7 kono parents: diff changeset	979 if (!grid_safe_assignment_p (stmt, NULL))
04ced10e8804 gcc 7 kono parents: diff changeset	980 return stmt;
04ced10e8804 gcc 7 kono parents: diff changeset	981 tree lhs = gimple_assign_lhs (as_a <gassign *> (stmt));
04ced10e8804 gcc 7 kono parents: diff changeset	982 tree repl = copy_var_decl (lhs, create_tmp_var_name (NULL),
04ced10e8804 gcc 7 kono parents: diff changeset	983 TREE_TYPE (lhs));
04ced10e8804 gcc 7 kono parents: diff changeset	984 DECL_CONTEXT (repl) = current_function_decl;
04ced10e8804 gcc 7 kono parents: diff changeset	985 gimple_bind_append_vars (tgt_bind, repl);
04ced10e8804 gcc 7 kono parents: diff changeset	986
04ced10e8804 gcc 7 kono parents: diff changeset	987 declmap->put (lhs, repl);
04ced10e8804 gcc 7 kono parents: diff changeset	988 gassign copy = as_a <gassign > (gimple_copy (stmt));
04ced10e8804 gcc 7 kono parents: diff changeset	989 walk_gimple_op (copy, grid_remap_prebody_decls, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	990 gsi_insert_before (dst, copy, GSI_SAME_STMT);
04ced10e8804 gcc 7 kono parents: diff changeset	991 }
04ced10e8804 gcc 7 kono parents: diff changeset	992 return NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	993 }
04ced10e8804 gcc 7 kono parents: diff changeset	994
04ced10e8804 gcc 7 kono parents: diff changeset	995 /* Statement walker function to make adjustments to statements within the
04ced10e8804 gcc 7 kono parents: diff changeset	996 gridifed kernel copy. */
04ced10e8804 gcc 7 kono parents: diff changeset	997
04ced10e8804 gcc 7 kono parents: diff changeset	998 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	999 grid_process_grid_body (gimple_stmt_iterator gsi, bool handled_ops_p,
04ced10e8804 gcc 7 kono parents: diff changeset	1000 struct walk_stmt_info *)
04ced10e8804 gcc 7 kono parents: diff changeset	1001 {
04ced10e8804 gcc 7 kono parents: diff changeset	1002 *handled_ops_p = false;
04ced10e8804 gcc 7 kono parents: diff changeset	1003 gimple stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	1004 if (gimple_code (stmt) == GIMPLE_OMP_FOR
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1005 && gimple_omp_for_kind (stmt) == GF_OMP_FOR_KIND_SIMD)
111 04ced10e8804 gcc 7 kono parents: diff changeset	1006 {
04ced10e8804 gcc 7 kono parents: diff changeset	1007 gomp_for loop = as_a <gomp_for > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1008 tree clauses = gimple_omp_for_clauses (loop);
04ced10e8804 gcc 7 kono parents: diff changeset	1009 tree cl = omp_find_clause (clauses, OMP_CLAUSE_SAFELEN);
04ced10e8804 gcc 7 kono parents: diff changeset	1010 if (cl)
04ced10e8804 gcc 7 kono parents: diff changeset	1011 OMP_CLAUSE_SAFELEN_EXPR (cl) = integer_one_node;
04ced10e8804 gcc 7 kono parents: diff changeset	1012 else
04ced10e8804 gcc 7 kono parents: diff changeset	1013 {
04ced10e8804 gcc 7 kono parents: diff changeset	1014 tree c = build_omp_clause (UNKNOWN_LOCATION, OMP_CLAUSE_SAFELEN);
04ced10e8804 gcc 7 kono parents: diff changeset	1015 OMP_CLAUSE_SAFELEN_EXPR (c) = integer_one_node;
04ced10e8804 gcc 7 kono parents: diff changeset	1016 OMP_CLAUSE_CHAIN (c) = clauses;
04ced10e8804 gcc 7 kono parents: diff changeset	1017 gimple_omp_for_set_clauses (loop, c);
04ced10e8804 gcc 7 kono parents: diff changeset	1018 }
04ced10e8804 gcc 7 kono parents: diff changeset	1019 }
04ced10e8804 gcc 7 kono parents: diff changeset	1020 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	1021 }
04ced10e8804 gcc 7 kono parents: diff changeset	1022
04ced10e8804 gcc 7 kono parents: diff changeset	1023 /* Given a PARLOOP that is a normal for looping construct but also a part of a
04ced10e8804 gcc 7 kono parents: diff changeset	1024 combined construct with a simd loop, eliminate the simd loop. */
04ced10e8804 gcc 7 kono parents: diff changeset	1025
04ced10e8804 gcc 7 kono parents: diff changeset	1026 static void
04ced10e8804 gcc 7 kono parents: diff changeset	1027 grid_eliminate_combined_simd_part (gomp_for *parloop)
04ced10e8804 gcc 7 kono parents: diff changeset	1028 {
04ced10e8804 gcc 7 kono parents: diff changeset	1029 struct walk_stmt_info wi;
04ced10e8804 gcc 7 kono parents: diff changeset	1030
04ced10e8804 gcc 7 kono parents: diff changeset	1031 memset (&wi, 0, sizeof (wi));
04ced10e8804 gcc 7 kono parents: diff changeset	1032 wi.val_only = true;
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1033 enum gf_mask msk = GF_OMP_FOR_KIND_SIMD;
111 04ced10e8804 gcc 7 kono parents: diff changeset	1034 wi.info = (void *) &msk;
04ced10e8804 gcc 7 kono parents: diff changeset	1035 walk_gimple_seq (gimple_omp_body (parloop), omp_find_combined_for, NULL, &wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1036 gimple stmt = (gimple ) wi.info;
04ced10e8804 gcc 7 kono parents: diff changeset	1037 /* We expect that the SIMD id the only statement in the parallel loop. */
04ced10e8804 gcc 7 kono parents: diff changeset	1038 gcc_assert (stmt
04ced10e8804 gcc 7 kono parents: diff changeset	1039 && gimple_code (stmt) == GIMPLE_OMP_FOR
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1040 && (gimple_omp_for_kind (stmt) == GF_OMP_FOR_KIND_SIMD)
111 04ced10e8804 gcc 7 kono parents: diff changeset	1041 && gimple_omp_for_combined_into_p (stmt)
04ced10e8804 gcc 7 kono parents: diff changeset	1042 && !gimple_omp_for_combined_p (stmt));
04ced10e8804 gcc 7 kono parents: diff changeset	1043 gomp_for simd = as_a <gomp_for > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1044
04ced10e8804 gcc 7 kono parents: diff changeset	1045 /* Copy over the iteration properties because the body refers to the index in
04ced10e8804 gcc 7 kono parents: diff changeset	1046 the bottmom-most loop. */
04ced10e8804 gcc 7 kono parents: diff changeset	1047 unsigned i, collapse = gimple_omp_for_collapse (parloop);
04ced10e8804 gcc 7 kono parents: diff changeset	1048 gcc_checking_assert (collapse == gimple_omp_for_collapse (simd));
04ced10e8804 gcc 7 kono parents: diff changeset	1049 for (i = 0; i < collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	1050 {
04ced10e8804 gcc 7 kono parents: diff changeset	1051 gimple_omp_for_set_index (parloop, i, gimple_omp_for_index (simd, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1052 gimple_omp_for_set_initial (parloop, i, gimple_omp_for_initial (simd, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1053 gimple_omp_for_set_final (parloop, i, gimple_omp_for_final (simd, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1054 gimple_omp_for_set_incr (parloop, i, gimple_omp_for_incr (simd, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1055 }
04ced10e8804 gcc 7 kono parents: diff changeset	1056
04ced10e8804 gcc 7 kono parents: diff changeset	1057 tree *tgt= gimple_omp_for_clauses_ptr (parloop);
04ced10e8804 gcc 7 kono parents: diff changeset	1058 while (*tgt)
04ced10e8804 gcc 7 kono parents: diff changeset	1059 tgt = &OMP_CLAUSE_CHAIN (*tgt);
04ced10e8804 gcc 7 kono parents: diff changeset	1060
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1061 /* Copy over all clauses, except for linear clauses, which are turned into
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1062 private clauses, and all other simd-specific clauses, which are
111 04ced10e8804 gcc 7 kono parents: diff changeset	1063 ignored. */
04ced10e8804 gcc 7 kono parents: diff changeset	1064 tree *pc = gimple_omp_for_clauses_ptr (simd);
04ced10e8804 gcc 7 kono parents: diff changeset	1065 while (*pc)
04ced10e8804 gcc 7 kono parents: diff changeset	1066 {
04ced10e8804 gcc 7 kono parents: diff changeset	1067 tree c = *pc;
04ced10e8804 gcc 7 kono parents: diff changeset	1068 switch (TREE_CODE (c))
04ced10e8804 gcc 7 kono parents: diff changeset	1069 {
04ced10e8804 gcc 7 kono parents: diff changeset	1070 case OMP_CLAUSE_LINEAR:
04ced10e8804 gcc 7 kono parents: diff changeset	1071 {
04ced10e8804 gcc 7 kono parents: diff changeset	1072 tree priv = build_omp_clause (UNKNOWN_LOCATION, OMP_CLAUSE_PRIVATE);
04ced10e8804 gcc 7 kono parents: diff changeset	1073 OMP_CLAUSE_DECL (priv) = OMP_CLAUSE_DECL (c);
04ced10e8804 gcc 7 kono parents: diff changeset	1074 OMP_CLAUSE_CHAIN (priv) = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1075 *tgt = priv;
04ced10e8804 gcc 7 kono parents: diff changeset	1076 tgt = &OMP_CLAUSE_CHAIN (priv);
04ced10e8804 gcc 7 kono parents: diff changeset	1077 pc = &OMP_CLAUSE_CHAIN (c);
04ced10e8804 gcc 7 kono parents: diff changeset	1078 break;
04ced10e8804 gcc 7 kono parents: diff changeset	1079 }
04ced10e8804 gcc 7 kono parents: diff changeset	1080
04ced10e8804 gcc 7 kono parents: diff changeset	1081 case OMP_CLAUSE_SAFELEN:
04ced10e8804 gcc 7 kono parents: diff changeset	1082 case OMP_CLAUSE_SIMDLEN:
04ced10e8804 gcc 7 kono parents: diff changeset	1083 case OMP_CLAUSE_ALIGNED:
04ced10e8804 gcc 7 kono parents: diff changeset	1084 pc = &OMP_CLAUSE_CHAIN (c);
04ced10e8804 gcc 7 kono parents: diff changeset	1085 break;
04ced10e8804 gcc 7 kono parents: diff changeset	1086
04ced10e8804 gcc 7 kono parents: diff changeset	1087 default:
04ced10e8804 gcc 7 kono parents: diff changeset	1088 *pc = OMP_CLAUSE_CHAIN (c);
04ced10e8804 gcc 7 kono parents: diff changeset	1089 OMP_CLAUSE_CHAIN (c) = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1090 *tgt = c;
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1091 tgt = &OMP_CLAUSE_CHAIN (c);
111 04ced10e8804 gcc 7 kono parents: diff changeset	1092 break;
04ced10e8804 gcc 7 kono parents: diff changeset	1093 }
04ced10e8804 gcc 7 kono parents: diff changeset	1094 }
04ced10e8804 gcc 7 kono parents: diff changeset	1095
04ced10e8804 gcc 7 kono parents: diff changeset	1096 /* Finally, throw away the simd and mark the parallel loop as not
04ced10e8804 gcc 7 kono parents: diff changeset	1097 combined. */
04ced10e8804 gcc 7 kono parents: diff changeset	1098 gimple_omp_set_body (parloop, gimple_omp_body (simd));
04ced10e8804 gcc 7 kono parents: diff changeset	1099 gimple_omp_for_set_combined_p (parloop, false);
04ced10e8804 gcc 7 kono parents: diff changeset	1100 }
04ced10e8804 gcc 7 kono parents: diff changeset	1101
04ced10e8804 gcc 7 kono parents: diff changeset	1102 /* Statement walker function marking all parallels as grid_phony and loops as
04ced10e8804 gcc 7 kono parents: diff changeset	1103 grid ones representing threads of a particular thread group. */
04ced10e8804 gcc 7 kono parents: diff changeset	1104
04ced10e8804 gcc 7 kono parents: diff changeset	1105 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	1106 grid_mark_tiling_loops (gimple_stmt_iterator gsi, bool handled_ops_p,
04ced10e8804 gcc 7 kono parents: diff changeset	1107 struct walk_stmt_info *wi_in)
04ced10e8804 gcc 7 kono parents: diff changeset	1108 {
04ced10e8804 gcc 7 kono parents: diff changeset	1109 *handled_ops_p = false;
04ced10e8804 gcc 7 kono parents: diff changeset	1110 if (gomp_for loop = dyn_cast <gomp_for > (gsi_stmt (*gsi)))
04ced10e8804 gcc 7 kono parents: diff changeset	1111 {
04ced10e8804 gcc 7 kono parents: diff changeset	1112 *handled_ops_p = true;
04ced10e8804 gcc 7 kono parents: diff changeset	1113 gimple_omp_for_set_kind (loop, GF_OMP_FOR_KIND_GRID_LOOP);
04ced10e8804 gcc 7 kono parents: diff changeset	1114 gimple_omp_for_set_grid_intra_group (loop, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1115 if (gimple_omp_for_combined_p (loop))
04ced10e8804 gcc 7 kono parents: diff changeset	1116 grid_eliminate_combined_simd_part (loop);
04ced10e8804 gcc 7 kono parents: diff changeset	1117
04ced10e8804 gcc 7 kono parents: diff changeset	1118 struct walk_stmt_info body_wi;
04ced10e8804 gcc 7 kono parents: diff changeset	1119 memset (&body_wi, 0, sizeof (body_wi));
04ced10e8804 gcc 7 kono parents: diff changeset	1120 walk_gimple_seq_mod (gimple_omp_body_ptr (loop),
04ced10e8804 gcc 7 kono parents: diff changeset	1121 grid_process_grid_body, NULL, &body_wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1122
04ced10e8804 gcc 7 kono parents: diff changeset	1123 gbind bind = (gbind ) wi_in->info;
04ced10e8804 gcc 7 kono parents: diff changeset	1124 tree c;
04ced10e8804 gcc 7 kono parents: diff changeset	1125 for (c = gimple_omp_for_clauses (loop); c; c = OMP_CLAUSE_CHAIN (c))
04ced10e8804 gcc 7 kono parents: diff changeset	1126 if (OMP_CLAUSE_CODE (c) == OMP_CLAUSE_LASTPRIVATE)
04ced10e8804 gcc 7 kono parents: diff changeset	1127 {
04ced10e8804 gcc 7 kono parents: diff changeset	1128 push_gimplify_context ();
04ced10e8804 gcc 7 kono parents: diff changeset	1129 tree ov = OMP_CLAUSE_DECL (c);
04ced10e8804 gcc 7 kono parents: diff changeset	1130 tree gv = copy_var_decl (ov, create_tmp_var_name (NULL),
04ced10e8804 gcc 7 kono parents: diff changeset	1131 TREE_TYPE (ov));
04ced10e8804 gcc 7 kono parents: diff changeset	1132
04ced10e8804 gcc 7 kono parents: diff changeset	1133 grid_mark_variable_segment (gv, GRID_SEGMENT_GROUP);
04ced10e8804 gcc 7 kono parents: diff changeset	1134 DECL_CONTEXT (gv) = current_function_decl;
04ced10e8804 gcc 7 kono parents: diff changeset	1135 gimple_bind_append_vars (bind, gv);
04ced10e8804 gcc 7 kono parents: diff changeset	1136 tree x = lang_hooks.decls.omp_clause_assign_op (c, gv, ov);
04ced10e8804 gcc 7 kono parents: diff changeset	1137 gimplify_and_add (x, &OMP_CLAUSE_LASTPRIVATE_GIMPLE_SEQ (c));
04ced10e8804 gcc 7 kono parents: diff changeset	1138 x = lang_hooks.decls.omp_clause_copy_ctor (c, ov, gv);
04ced10e8804 gcc 7 kono parents: diff changeset	1139 gimple_seq l = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1140 gimplify_and_add (x, &l);
04ced10e8804 gcc 7 kono parents: diff changeset	1141 gsi_insert_seq_after (gsi, l, GSI_SAME_STMT);
04ced10e8804 gcc 7 kono parents: diff changeset	1142 pop_gimplify_context (bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1143 }
04ced10e8804 gcc 7 kono parents: diff changeset	1144 }
04ced10e8804 gcc 7 kono parents: diff changeset	1145 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	1146 }
04ced10e8804 gcc 7 kono parents: diff changeset	1147
04ced10e8804 gcc 7 kono parents: diff changeset	1148 /* Statement walker function marking all parallels as grid_phony and loops as
04ced10e8804 gcc 7 kono parents: diff changeset	1149 grid ones representing threads of a particular thread group. */
04ced10e8804 gcc 7 kono parents: diff changeset	1150
04ced10e8804 gcc 7 kono parents: diff changeset	1151 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	1152 grid_mark_tiling_parallels_and_loops (gimple_stmt_iterator *gsi,
04ced10e8804 gcc 7 kono parents: diff changeset	1153 bool *handled_ops_p,
04ced10e8804 gcc 7 kono parents: diff changeset	1154 struct walk_stmt_info *wi_in)
04ced10e8804 gcc 7 kono parents: diff changeset	1155 {
04ced10e8804 gcc 7 kono parents: diff changeset	1156 *handled_ops_p = false;
04ced10e8804 gcc 7 kono parents: diff changeset	1157 wi_in->removed_stmt = false;
04ced10e8804 gcc 7 kono parents: diff changeset	1158 gimple stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	1159 if (gbind bind = dyn_cast <gbind > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	1160 {
04ced10e8804 gcc 7 kono parents: diff changeset	1161 for (tree var = gimple_bind_vars (bind); var; var = DECL_CHAIN (var))
04ced10e8804 gcc 7 kono parents: diff changeset	1162 grid_mark_variable_segment (var, GRID_SEGMENT_GROUP);
04ced10e8804 gcc 7 kono parents: diff changeset	1163 }
04ced10e8804 gcc 7 kono parents: diff changeset	1164 else if (gomp_parallel parallel = dyn_cast <gomp_parallel > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	1165 {
04ced10e8804 gcc 7 kono parents: diff changeset	1166 *handled_ops_p = true;
04ced10e8804 gcc 7 kono parents: diff changeset	1167 gimple_omp_parallel_set_grid_phony (parallel, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1168
04ced10e8804 gcc 7 kono parents: diff changeset	1169 gbind *new_bind = gimple_build_bind (NULL, NULL, make_node (BLOCK));
04ced10e8804 gcc 7 kono parents: diff changeset	1170 gimple_bind_set_body (new_bind, gimple_omp_body (parallel));
04ced10e8804 gcc 7 kono parents: diff changeset	1171 gimple_seq s = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1172 gimple_seq_add_stmt (&s, new_bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1173 gimple_omp_set_body (parallel, s);
04ced10e8804 gcc 7 kono parents: diff changeset	1174
04ced10e8804 gcc 7 kono parents: diff changeset	1175 struct walk_stmt_info wi_par;
04ced10e8804 gcc 7 kono parents: diff changeset	1176 memset (&wi_par, 0, sizeof (wi_par));
04ced10e8804 gcc 7 kono parents: diff changeset	1177 wi_par.info = new_bind;
04ced10e8804 gcc 7 kono parents: diff changeset	1178 walk_gimple_seq_mod (gimple_bind_body_ptr (new_bind),
04ced10e8804 gcc 7 kono parents: diff changeset	1179 grid_mark_tiling_loops, NULL, &wi_par);
04ced10e8804 gcc 7 kono parents: diff changeset	1180 }
04ced10e8804 gcc 7 kono parents: diff changeset	1181 else if (is_a <gcall *> (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	1182 wi_in->removed_stmt = grid_handle_call_in_distribute (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	1183 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	1184 }
04ced10e8804 gcc 7 kono parents: diff changeset	1185
04ced10e8804 gcc 7 kono parents: diff changeset	1186 /* Given freshly copied top level kernel SEQ, identify the individual OMP
04ced10e8804 gcc 7 kono parents: diff changeset	1187 components, mark them as part of kernel, copy assignment leading to them
04ced10e8804 gcc 7 kono parents: diff changeset	1188 just before DST, remapping them using WI and adding new temporaries to
04ced10e8804 gcc 7 kono parents: diff changeset	1189 TGT_BIND, and and return the loop that will be used for kernel dispatch. */
04ced10e8804 gcc 7 kono parents: diff changeset	1190
04ced10e8804 gcc 7 kono parents: diff changeset	1191 static gomp_for *
04ced10e8804 gcc 7 kono parents: diff changeset	1192 grid_process_kernel_body_copy (grid_prop *grid, gimple_seq seq,
04ced10e8804 gcc 7 kono parents: diff changeset	1193 gimple_stmt_iterator *dst,
04ced10e8804 gcc 7 kono parents: diff changeset	1194 gbind tgt_bind, struct walk_stmt_info wi)
04ced10e8804 gcc 7 kono parents: diff changeset	1195 {
04ced10e8804 gcc 7 kono parents: diff changeset	1196 gimple *stmt = grid_copy_leading_local_assignments (seq, dst, tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	1197 GRID_SEGMENT_GLOBAL, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1198 gomp_teams teams = dyn_cast <gomp_teams > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1199 gcc_assert (teams);
04ced10e8804 gcc 7 kono parents: diff changeset	1200 gimple_omp_teams_set_grid_phony (teams, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1201 stmt = grid_copy_leading_local_assignments (gimple_omp_body (teams), dst,
04ced10e8804 gcc 7 kono parents: diff changeset	1202 tgt_bind, GRID_SEGMENT_GLOBAL,
04ced10e8804 gcc 7 kono parents: diff changeset	1203 wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1204 gcc_checking_assert (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1205 gomp_for dist = dyn_cast <gomp_for > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1206 gcc_assert (dist);
04ced10e8804 gcc 7 kono parents: diff changeset	1207 gimple_seq prebody = gimple_omp_for_pre_body (dist);
04ced10e8804 gcc 7 kono parents: diff changeset	1208 if (prebody)
04ced10e8804 gcc 7 kono parents: diff changeset	1209 grid_copy_leading_local_assignments (prebody, dst, tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	1210 GRID_SEGMENT_GROUP, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1211
04ced10e8804 gcc 7 kono parents: diff changeset	1212 if (grid->tiling)
04ced10e8804 gcc 7 kono parents: diff changeset	1213 {
04ced10e8804 gcc 7 kono parents: diff changeset	1214 gimple_omp_for_set_kind (dist, GF_OMP_FOR_KIND_GRID_LOOP);
04ced10e8804 gcc 7 kono parents: diff changeset	1215 gimple_omp_for_set_grid_group_iter (dist, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1216
04ced10e8804 gcc 7 kono parents: diff changeset	1217 struct walk_stmt_info wi_tiled;
04ced10e8804 gcc 7 kono parents: diff changeset	1218 memset (&wi_tiled, 0, sizeof (wi_tiled));
04ced10e8804 gcc 7 kono parents: diff changeset	1219 walk_gimple_seq_mod (gimple_omp_body_ptr (dist),
04ced10e8804 gcc 7 kono parents: diff changeset	1220 grid_mark_tiling_parallels_and_loops, NULL,
04ced10e8804 gcc 7 kono parents: diff changeset	1221 &wi_tiled);
04ced10e8804 gcc 7 kono parents: diff changeset	1222 return dist;
04ced10e8804 gcc 7 kono parents: diff changeset	1223 }
04ced10e8804 gcc 7 kono parents: diff changeset	1224 else
04ced10e8804 gcc 7 kono parents: diff changeset	1225 {
04ced10e8804 gcc 7 kono parents: diff changeset	1226 gimple_omp_for_set_grid_phony (dist, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1227 stmt = grid_copy_leading_local_assignments (gimple_omp_body (dist), dst,
04ced10e8804 gcc 7 kono parents: diff changeset	1228 tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	1229 GRID_SEGMENT_PRIVATE, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1230 gcc_checking_assert (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1231 gomp_parallel parallel = as_a <gomp_parallel > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1232 gimple_omp_parallel_set_grid_phony (parallel, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1233 stmt = grid_copy_leading_local_assignments (gimple_omp_body (parallel),
04ced10e8804 gcc 7 kono parents: diff changeset	1234 dst, tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	1235 GRID_SEGMENT_PRIVATE, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1236 gomp_for inner_loop = as_a <gomp_for > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1237 gimple_omp_for_set_kind (inner_loop, GF_OMP_FOR_KIND_GRID_LOOP);
04ced10e8804 gcc 7 kono parents: diff changeset	1238 prebody = gimple_omp_for_pre_body (inner_loop);
04ced10e8804 gcc 7 kono parents: diff changeset	1239 if (prebody)
04ced10e8804 gcc 7 kono parents: diff changeset	1240 grid_copy_leading_local_assignments (prebody, dst, tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	1241 GRID_SEGMENT_PRIVATE, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1242
04ced10e8804 gcc 7 kono parents: diff changeset	1243 if (gimple_omp_for_combined_p (inner_loop))
04ced10e8804 gcc 7 kono parents: diff changeset	1244 grid_eliminate_combined_simd_part (inner_loop);
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	1245 struct walk_stmt_info body_wi;
111 04ced10e8804 gcc 7 kono parents: diff changeset	1246 memset (&body_wi, 0, sizeof (body_wi));
04ced10e8804 gcc 7 kono parents: diff changeset	1247 walk_gimple_seq_mod (gimple_omp_body_ptr (inner_loop),
04ced10e8804 gcc 7 kono parents: diff changeset	1248 grid_process_grid_body, NULL, &body_wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1249
04ced10e8804 gcc 7 kono parents: diff changeset	1250 return inner_loop;
04ced10e8804 gcc 7 kono parents: diff changeset	1251 }
04ced10e8804 gcc 7 kono parents: diff changeset	1252 }
04ced10e8804 gcc 7 kono parents: diff changeset	1253
04ced10e8804 gcc 7 kono parents: diff changeset	1254 /* If TARGET points to a GOMP_TARGET which follows a gridifiable pattern,
04ced10e8804 gcc 7 kono parents: diff changeset	1255 create a GPU kernel for it. GSI must point to the same statement, TGT_BIND
04ced10e8804 gcc 7 kono parents: diff changeset	1256 is the bind into which temporaries inserted before TARGET should be
04ced10e8804 gcc 7 kono parents: diff changeset	1257 added. */
04ced10e8804 gcc 7 kono parents: diff changeset	1258
04ced10e8804 gcc 7 kono parents: diff changeset	1259 static void
04ced10e8804 gcc 7 kono parents: diff changeset	1260 grid_attempt_target_gridification (gomp_target *target,
04ced10e8804 gcc 7 kono parents: diff changeset	1261 gimple_stmt_iterator *gsi,
04ced10e8804 gcc 7 kono parents: diff changeset	1262 gbind *tgt_bind)
04ced10e8804 gcc 7 kono parents: diff changeset	1263 {
04ced10e8804 gcc 7 kono parents: diff changeset	1264 /* removed group_size */
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	1265 grid_prop grid = {};
111 04ced10e8804 gcc 7 kono parents: diff changeset	1266 if (!target \|\| !grid_target_follows_gridifiable_pattern (target, &grid))
04ced10e8804 gcc 7 kono parents: diff changeset	1267 return;
04ced10e8804 gcc 7 kono parents: diff changeset	1268
04ced10e8804 gcc 7 kono parents: diff changeset	1269 location_t loc = gimple_location (target);
04ced10e8804 gcc 7 kono parents: diff changeset	1270 if (dump_enabled_p ())
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	1271 dump_printf_loc (MSG_OPTIMIZED_LOCATIONS, target,
111 04ced10e8804 gcc 7 kono parents: diff changeset	1272 "Target construct will be turned into a gridified HSA "
04ced10e8804 gcc 7 kono parents: diff changeset	1273 "kernel\n");
04ced10e8804 gcc 7 kono parents: diff changeset	1274
04ced10e8804 gcc 7 kono parents: diff changeset	1275 /* Copy target body to a GPUKERNEL construct: */
04ced10e8804 gcc 7 kono parents: diff changeset	1276 gimple_seq kernel_seq = copy_gimple_seq_and_replace_locals
04ced10e8804 gcc 7 kono parents: diff changeset	1277 (gimple_omp_body (target));
04ced10e8804 gcc 7 kono parents: diff changeset	1278
04ced10e8804 gcc 7 kono parents: diff changeset	1279 hash_map<tree, tree> *declmap = new hash_map<tree, tree>;
04ced10e8804 gcc 7 kono parents: diff changeset	1280 struct walk_stmt_info wi;
04ced10e8804 gcc 7 kono parents: diff changeset	1281 memset (&wi, 0, sizeof (struct walk_stmt_info));
04ced10e8804 gcc 7 kono parents: diff changeset	1282 wi.info = declmap;
04ced10e8804 gcc 7 kono parents: diff changeset	1283
04ced10e8804 gcc 7 kono parents: diff changeset	1284 /* Copy assignments in between OMP statements before target, mark OMP
04ced10e8804 gcc 7 kono parents: diff changeset	1285 statements within copy appropriately. */
04ced10e8804 gcc 7 kono parents: diff changeset	1286 gomp_for *inner_loop = grid_process_kernel_body_copy (&grid, kernel_seq, gsi,
04ced10e8804 gcc 7 kono parents: diff changeset	1287 tgt_bind, &wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1288
04ced10e8804 gcc 7 kono parents: diff changeset	1289 gbind *old_bind
04ced10e8804 gcc 7 kono parents: diff changeset	1290 = as_a <gbind *> (gimple_seq_first (gimple_omp_body (target)));
04ced10e8804 gcc 7 kono parents: diff changeset	1291 gbind new_bind = as_a <gbind > (gimple_seq_first (kernel_seq));
04ced10e8804 gcc 7 kono parents: diff changeset	1292 tree new_block = gimple_bind_block (new_bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1293 tree enc_block = BLOCK_SUPERCONTEXT (gimple_bind_block (old_bind));
04ced10e8804 gcc 7 kono parents: diff changeset	1294 BLOCK_CHAIN (new_block) = BLOCK_SUBBLOCKS (enc_block);
04ced10e8804 gcc 7 kono parents: diff changeset	1295 BLOCK_SUBBLOCKS (enc_block) = new_block;
04ced10e8804 gcc 7 kono parents: diff changeset	1296 BLOCK_SUPERCONTEXT (new_block) = enc_block;
04ced10e8804 gcc 7 kono parents: diff changeset	1297 gimple *gpukernel = gimple_build_omp_grid_body (kernel_seq);
04ced10e8804 gcc 7 kono parents: diff changeset	1298 gimple_seq_add_stmt
04ced10e8804 gcc 7 kono parents: diff changeset	1299 (gimple_bind_body_ptr (as_a <gbind *> (gimple_omp_body (target))),
04ced10e8804 gcc 7 kono parents: diff changeset	1300 gpukernel);
04ced10e8804 gcc 7 kono parents: diff changeset	1301
04ced10e8804 gcc 7 kono parents: diff changeset	1302 for (size_t i = 0; i < grid.collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	1303 walk_tree (&grid.group_sizes[i], grid_remap_prebody_decls, &wi, NULL);
04ced10e8804 gcc 7 kono parents: diff changeset	1304 push_gimplify_context ();
04ced10e8804 gcc 7 kono parents: diff changeset	1305 for (size_t i = 0; i < grid.collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	1306 {
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1307 tree index_var = gimple_omp_for_index (inner_loop, i);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1308 tree itype, type = TREE_TYPE (index_var);
111 04ced10e8804 gcc 7 kono parents: diff changeset	1309 if (POINTER_TYPE_P (type))
04ced10e8804 gcc 7 kono parents: diff changeset	1310 itype = signed_type_for (type);
04ced10e8804 gcc 7 kono parents: diff changeset	1311 else
04ced10e8804 gcc 7 kono parents: diff changeset	1312 itype = type;
04ced10e8804 gcc 7 kono parents: diff changeset	1313
04ced10e8804 gcc 7 kono parents: diff changeset	1314 enum tree_code cond_code = gimple_omp_for_cond (inner_loop, i);
04ced10e8804 gcc 7 kono parents: diff changeset	1315 tree n1 = unshare_expr (gimple_omp_for_initial (inner_loop, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1316 walk_tree (&n1, grid_remap_prebody_decls, &wi, NULL);
04ced10e8804 gcc 7 kono parents: diff changeset	1317 tree n2 = unshare_expr (gimple_omp_for_final (inner_loop, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1318 walk_tree (&n2, grid_remap_prebody_decls, &wi, NULL);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1319 tree step
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1320 = omp_get_for_step_from_incr (loc, gimple_omp_for_incr (inner_loop, i));
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1321 omp_adjust_for_condition (loc, &cond_code, &n2, index_var, step);
111 04ced10e8804 gcc 7 kono parents: diff changeset	1322 n1 = fold_convert (itype, n1);
04ced10e8804 gcc 7 kono parents: diff changeset	1323 n2 = fold_convert (itype, n2);
04ced10e8804 gcc 7 kono parents: diff changeset	1324
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	1325 tree cond = fold_build2 (cond_code, boolean_type_node, n1, n2);
111 04ced10e8804 gcc 7 kono parents: diff changeset	1326
04ced10e8804 gcc 7 kono parents: diff changeset	1327 tree t = build_int_cst (itype, (cond_code == LT_EXPR ? -1 : 1));
04ced10e8804 gcc 7 kono parents: diff changeset	1328 t = fold_build2 (PLUS_EXPR, itype, step, t);
04ced10e8804 gcc 7 kono parents: diff changeset	1329 t = fold_build2 (PLUS_EXPR, itype, t, n2);
04ced10e8804 gcc 7 kono parents: diff changeset	1330 t = fold_build2 (MINUS_EXPR, itype, t, n1);
04ced10e8804 gcc 7 kono parents: diff changeset	1331 if (TYPE_UNSIGNED (itype) && cond_code == GT_EXPR)
04ced10e8804 gcc 7 kono parents: diff changeset	1332 t = fold_build2 (TRUNC_DIV_EXPR, itype,
04ced10e8804 gcc 7 kono parents: diff changeset	1333 fold_build1 (NEGATE_EXPR, itype, t),
04ced10e8804 gcc 7 kono parents: diff changeset	1334 fold_build1 (NEGATE_EXPR, itype, step));
04ced10e8804 gcc 7 kono parents: diff changeset	1335 else
04ced10e8804 gcc 7 kono parents: diff changeset	1336 t = fold_build2 (TRUNC_DIV_EXPR, itype, t, step);
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	1337 t = fold_build3 (COND_EXPR, itype, cond, t, build_zero_cst (itype));
111 04ced10e8804 gcc 7 kono parents: diff changeset	1338 if (grid.tiling)
04ced10e8804 gcc 7 kono parents: diff changeset	1339 {
04ced10e8804 gcc 7 kono parents: diff changeset	1340 if (cond_code == GT_EXPR)
04ced10e8804 gcc 7 kono parents: diff changeset	1341 step = fold_build1 (NEGATE_EXPR, itype, step);
04ced10e8804 gcc 7 kono parents: diff changeset	1342 t = fold_build2 (MULT_EXPR, itype, t, step);
04ced10e8804 gcc 7 kono parents: diff changeset	1343 }
04ced10e8804 gcc 7 kono parents: diff changeset	1344
04ced10e8804 gcc 7 kono parents: diff changeset	1345 tree gs = fold_convert (uint32_type_node, t);
04ced10e8804 gcc 7 kono parents: diff changeset	1346 gimple_seq tmpseq = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1347 gimplify_expr (&gs, &tmpseq, NULL, is_gimple_val, fb_rvalue);
04ced10e8804 gcc 7 kono parents: diff changeset	1348 if (!gimple_seq_empty_p (tmpseq))
04ced10e8804 gcc 7 kono parents: diff changeset	1349 gsi_insert_seq_before (gsi, tmpseq, GSI_SAME_STMT);
04ced10e8804 gcc 7 kono parents: diff changeset	1350
04ced10e8804 gcc 7 kono parents: diff changeset	1351 tree ws;
04ced10e8804 gcc 7 kono parents: diff changeset	1352 if (grid.group_sizes[i])
04ced10e8804 gcc 7 kono parents: diff changeset	1353 {
04ced10e8804 gcc 7 kono parents: diff changeset	1354 ws = fold_convert (uint32_type_node, grid.group_sizes[i]);
04ced10e8804 gcc 7 kono parents: diff changeset	1355 tmpseq = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1356 gimplify_expr (&ws, &tmpseq, NULL, is_gimple_val, fb_rvalue);
04ced10e8804 gcc 7 kono parents: diff changeset	1357 if (!gimple_seq_empty_p (tmpseq))
04ced10e8804 gcc 7 kono parents: diff changeset	1358 gsi_insert_seq_before (gsi, tmpseq, GSI_SAME_STMT);
04ced10e8804 gcc 7 kono parents: diff changeset	1359 }
04ced10e8804 gcc 7 kono parents: diff changeset	1360 else
04ced10e8804 gcc 7 kono parents: diff changeset	1361 ws = build_zero_cst (uint32_type_node);
04ced10e8804 gcc 7 kono parents: diff changeset	1362
04ced10e8804 gcc 7 kono parents: diff changeset	1363 tree c = build_omp_clause (UNKNOWN_LOCATION, OMP_CLAUSE__GRIDDIM_);
04ced10e8804 gcc 7 kono parents: diff changeset	1364 OMP_CLAUSE__GRIDDIM__DIMENSION (c) = i;
04ced10e8804 gcc 7 kono parents: diff changeset	1365 OMP_CLAUSE__GRIDDIM__SIZE (c) = gs;
04ced10e8804 gcc 7 kono parents: diff changeset	1366 OMP_CLAUSE__GRIDDIM__GROUP (c) = ws;
04ced10e8804 gcc 7 kono parents: diff changeset	1367 OMP_CLAUSE_CHAIN (c) = gimple_omp_target_clauses (target);
04ced10e8804 gcc 7 kono parents: diff changeset	1368 gimple_omp_target_set_clauses (target, c);
04ced10e8804 gcc 7 kono parents: diff changeset	1369 }
04ced10e8804 gcc 7 kono parents: diff changeset	1370 pop_gimplify_context (tgt_bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1371 delete declmap;
04ced10e8804 gcc 7 kono parents: diff changeset	1372 return;
04ced10e8804 gcc 7 kono parents: diff changeset	1373 }
04ced10e8804 gcc 7 kono parents: diff changeset	1374
04ced10e8804 gcc 7 kono parents: diff changeset	1375 /* Walker function doing all the work for create_target_kernels. */
04ced10e8804 gcc 7 kono parents: diff changeset	1376
04ced10e8804 gcc 7 kono parents: diff changeset	1377 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	1378 grid_gridify_all_targets_stmt (gimple_stmt_iterator *gsi,
04ced10e8804 gcc 7 kono parents: diff changeset	1379 bool *handled_ops_p,
04ced10e8804 gcc 7 kono parents: diff changeset	1380 struct walk_stmt_info *incoming)
04ced10e8804 gcc 7 kono parents: diff changeset	1381 {
04ced10e8804 gcc 7 kono parents: diff changeset	1382 *handled_ops_p = false;
04ced10e8804 gcc 7 kono parents: diff changeset	1383
04ced10e8804 gcc 7 kono parents: diff changeset	1384 gimple stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	1385 gomp_target target = dyn_cast <gomp_target > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1386 if (target)
04ced10e8804 gcc 7 kono parents: diff changeset	1387 {
04ced10e8804 gcc 7 kono parents: diff changeset	1388 gbind tgt_bind = (gbind ) incoming->info;
04ced10e8804 gcc 7 kono parents: diff changeset	1389 gcc_checking_assert (tgt_bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1390 grid_attempt_target_gridification (target, gsi, tgt_bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1391 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	1392 }
04ced10e8804 gcc 7 kono parents: diff changeset	1393 gbind bind = dyn_cast <gbind > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1394 if (bind)
04ced10e8804 gcc 7 kono parents: diff changeset	1395 {
04ced10e8804 gcc 7 kono parents: diff changeset	1396 *handled_ops_p = true;
04ced10e8804 gcc 7 kono parents: diff changeset	1397 struct walk_stmt_info wi;
04ced10e8804 gcc 7 kono parents: diff changeset	1398 memset (&wi, 0, sizeof (wi));
04ced10e8804 gcc 7 kono parents: diff changeset	1399 wi.info = bind;
04ced10e8804 gcc 7 kono parents: diff changeset	1400 walk_gimple_seq_mod (gimple_bind_body_ptr (bind),
04ced10e8804 gcc 7 kono parents: diff changeset	1401 grid_gridify_all_targets_stmt, NULL, &wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1402 }
04ced10e8804 gcc 7 kono parents: diff changeset	1403 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	1404 }
04ced10e8804 gcc 7 kono parents: diff changeset	1405
04ced10e8804 gcc 7 kono parents: diff changeset	1406 /* Attempt to gridify all target constructs in BODY_P. All such targets will
04ced10e8804 gcc 7 kono parents: diff changeset	1407 have their bodies duplicated, with the new copy being put into a
04ced10e8804 gcc 7 kono parents: diff changeset	1408 gimple_omp_grid_body statement. All kernel-related construct within the
04ced10e8804 gcc 7 kono parents: diff changeset	1409 grid_body will be marked with phony flags or kernel kinds. Moreover, some
04ced10e8804 gcc 7 kono parents: diff changeset	1410 re-structuring is often needed, such as copying pre-bodies before the target
04ced10e8804 gcc 7 kono parents: diff changeset	1411 construct so that kernel grid sizes can be computed. */
04ced10e8804 gcc 7 kono parents: diff changeset	1412
04ced10e8804 gcc 7 kono parents: diff changeset	1413 void
04ced10e8804 gcc 7 kono parents: diff changeset	1414 omp_grid_gridify_all_targets (gimple_seq *body_p)
04ced10e8804 gcc 7 kono parents: diff changeset	1415 {
04ced10e8804 gcc 7 kono parents: diff changeset	1416 struct walk_stmt_info wi;
04ced10e8804 gcc 7 kono parents: diff changeset	1417 memset (&wi, 0, sizeof (wi));
04ced10e8804 gcc 7 kono parents: diff changeset	1418 walk_gimple_seq_mod (body_p, grid_gridify_all_targets_stmt, NULL, &wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1419 }

Mercurial > hg > CbC > CbC_gcc

annotate gcc/omp-grid.c @ 158:494b0b89df80 default tip