CbC/CbC_gcc: gcc/gimple-loop-jam.c annotate

annotate gcc/gimple-loop-jam.c @ 144:8f4e72ab4e11

fix segmentation fault caused by nothing next cur_op to end

author	Takahiro SHIMIZU <anatofuz@cr.ie.u-ryukyu.ac.jp>
date	Sun, 23 Dec 2018 21:23:56 +0900
parents	84e7813d76e9
children	1830386684a0

rev	line source
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1 /* Loop unroll-and-jam.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2 Copyright (C) 2017-2018 Free Software Foundation, Inc.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	3
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	4 This file is part of GCC.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	5
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	6 GCC is free software; you can redistribute it and/or modify it
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	7 under the terms of the GNU General Public License as published by the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	8 Free Software Foundation; either version 3, or (at your option) any
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	9 later version.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	10
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	11 GCC is distributed in the hope that it will be useful, but WITHOUT
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	12 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	13 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	14 for more details.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	15
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	16 You should have received a copy of the GNU General Public License
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	17 along with GCC; see the file COPYING3. If not see
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	18 <http://www.gnu.org/licenses/>. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	19
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	20 #include "config.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	21 #include "system.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	22 #include "coretypes.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	23 #include "params.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	24 #include "tree-pass.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	25 #include "backend.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	26 #include "tree.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	27 #include "gimple.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	28 #include "ssa.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	29 #include "fold-const.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	30 #include "tree-cfg.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	31 #include "tree-ssa.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	32 #include "tree-ssa-loop-niter.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	33 #include "tree-ssa-loop.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	34 #include "tree-ssa-loop-manip.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	35 #include "cfgloop.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	36 #include "tree-scalar-evolution.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	37 #include "gimple-iterator.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	38 #include "cfghooks.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	39 #include "tree-data-ref.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	40 #include "tree-ssa-loop-ivopts.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	41 #include "tree-vectorizer.h"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	42
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	43 /* Unroll and Jam transformation
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	44
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	45 This is a combination of two transformations, where the second
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	46 is not always valid. It's applicable if a loop nest has redundancies
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	47 over the iterations of an outer loop while not having that with
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	48 an inner loop.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	49
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	50 Given this nest:
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	51 for (i) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	52 for (j) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	53 B(i,j)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	54 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	55 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	56
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	57 first unroll:
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	58 for (i by 2) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	59 for (j) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	60 B(i,j)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	61 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	62 for (j) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	63 B(i+1,j)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	64 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	65 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	66
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	67 then fuse the two adjacent inner loops resulting from that:
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	68 for (i by 2) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	69 for (j) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	70 B(i,j)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	71 B(i+1,j)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	72 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	73 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	74
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	75 As the order of evaluations of the body B changes this is valid
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	76 only in certain situations: all distance vectors need to be forward.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	77 Additionally if there are multiple induction variables than just
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	78 a counting control IV (j above) we can also deal with some situations.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	79
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	80 The validity is checked by unroll_jam_possible_p, and the data-dep
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	81 testing below.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	82
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	83 A trivial example where the fusion is wrong would be when
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	84 B(i,j) == x[j-1] = x[j];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	85 for (i by 2) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	86 for (j) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	87 x[j-1] = x[j];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	88 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	89 for (j) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	90 x[j-1] = x[j];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	91 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	92 } effect: move content to front by two elements
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	93 -->
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	94 for (i by 2) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	95 for (j) {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	96 x[j-1] = x[j];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	97 x[j-1] = x[j];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	98 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	99 } effect: move content to front by one element
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	100 */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	101
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	102 /* Modify the loop tree for the fact that all code once belonging
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	103 to the OLD loop or the outer loop of OLD now is inside LOOP. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	104
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	105 static void
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	106 merge_loop_tree (struct loop loop, struct loop old)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	107 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	108 basic_block *bbs;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	109 int i, n;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	110 struct loop *subloop;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	111 edge e;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	112 edge_iterator ei;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	113
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	114 /* Find its nodes. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	115 bbs = XNEWVEC (basic_block, n_basic_blocks_for_fn (cfun));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	116 n = get_loop_body_with_size (loop, bbs, n_basic_blocks_for_fn (cfun));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	117
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	118 for (i = 0; i < n; i++)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	119 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	120 /* If the block was direct child of OLD loop it's now part
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	121 of LOOP. If it was outside OLD, then it moved into LOOP
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	122 as well. This avoids changing the loop father for BBs
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	123 in inner loops of OLD. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	124 if (bbs[i]->loop_father == old
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	125 \|\| loop_depth (bbs[i]->loop_father) < loop_depth (old))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	126 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	127 remove_bb_from_loops (bbs[i]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	128 add_bb_to_loop (bbs[i], loop);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	129 continue;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	130 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	131
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	132 /* If we find a direct subloop of OLD, move it to LOOP. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	133 subloop = bbs[i]->loop_father;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	134 if (loop_outer (subloop) == old && subloop->header == bbs[i])
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	135 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	136 flow_loop_tree_node_remove (subloop);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	137 flow_loop_tree_node_add (loop, subloop);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	138 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	139 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	140
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	141 /* Update the information about loop exit edges. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	142 for (i = 0; i < n; i++)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	143 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	144 FOR_EACH_EDGE (e, ei, bbs[i]->succs)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	145 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	146 rescan_loop_exit (e, false, false);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	147 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	148 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	149
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	150 loop->num_nodes = n;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	151
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	152 free (bbs);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	153 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	154
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	155 /* BB is part of the outer loop of an unroll-and-jam situation.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	156 Check if any statements therein would prevent the transformation. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	157
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	158 static bool
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	159 bb_prevents_fusion_p (basic_block bb)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	160 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	161 gimple_stmt_iterator gsi;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	162 /* BB is duplicated by outer unrolling and then all N-1 first copies
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	163 move into the body of the fused inner loop. If BB exits the outer loop
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	164 the last copy still does so, and the first N-1 copies are cancelled
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	165 by loop unrolling, so also after fusion it's the exit block.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	166 But there might be other reasons that prevent fusion:
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	167 * stores or unknown side-effects prevent fusion
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	168 * loads don't
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	169 * computations into SSA names: these aren't problematic. Their
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	170 result will be unused on the exit edges of the first N-1 copies
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	171 (those aren't taken after unrolling). If they are used on the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	172 other edge (the one leading to the outer latch block) they are
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	173 loop-carried (on the outer loop) and the Nth copy of BB will
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	174 compute them again (i.e. the first N-1 copies will be dead). */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	175 for (gsi = gsi_start_bb (bb); !gsi_end_p (gsi); gsi_next (&gsi))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	176 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	177 gimple *g = gsi_stmt (gsi);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	178 if (gimple_vdef (g) \|\| gimple_has_side_effects (g))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	179 return true;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	180 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	181 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	182 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	183
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	184 /* Given an inner loop LOOP (of some OUTER loop) determine if
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	185 we can safely fuse copies of it (generated by outer unrolling).
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	186 If so return true, otherwise return false. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	187
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	188 static bool
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	189 unroll_jam_possible_p (struct loop outer, struct loop loop)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	190 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	191 basic_block *bbs;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	192 int i, n;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	193 struct tree_niter_desc niter;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	194
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	195 /* When fusing the loops we skip the latch block
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	196 of the first one, so it mustn't have any effects to
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	197 preserve. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	198 if (!empty_block_p (loop->latch))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	199 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	200
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	201 if (!single_exit (loop))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	202 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	203
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	204 /* We need a perfect nest. Quick check for adjacent inner loops. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	205 if (outer->inner != loop \|\| loop->next)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	206 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	207
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	208 /* Prevent head-controlled inner loops, that we usually have.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	209 The guard block would need to be accepted
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	210 (invariant condition either entering or skipping the loop),
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	211 without also accepting arbitrary control flow. When unswitching
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	212 ran before us (as with -O3) this won't be a problem because its
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	213 outer loop unswitching will have moved out the invariant condition.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	214
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	215 If we do that we need to extend fuse_loops() to cope with this
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	216 by threading through the (still invariant) copied condition
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	217 between the two loop copies. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	218 if (!dominated_by_p (CDI_DOMINATORS, outer->latch, loop->header))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	219 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	220
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	221 /* The number of iterations of the inner loop must be loop invariant
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	222 with respect to the outer loop. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	223 if (!number_of_iterations_exit (loop, single_exit (loop), &niter,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	224 false, true)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	225 \|\| niter.cmp == ERROR_MARK
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	226 \|\| !integer_zerop (niter.may_be_zero)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	227 \|\| !expr_invariant_in_loop_p (outer, niter.niter))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	228 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	229
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	230 /* If the inner loop produces any values that are used inside the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	231 outer loop (except the virtual op) then it can flow
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	232 back (perhaps indirectly) into the inner loop. This prevents
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	233 fusion: without fusion the value at the last iteration is used,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	234 with fusion the value after the initial iteration is used.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	235
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	236 If all uses are outside the outer loop this doesn't prevent fusion;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	237 the value of the last iteration is still used (and the values from
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	238 all intermediate iterations are dead). */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	239 gphi_iterator psi;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	240 for (psi = gsi_start_phis (single_exit (loop)->dest);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	241 !gsi_end_p (psi); gsi_next (&psi))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	242 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	243 imm_use_iterator imm_iter;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	244 use_operand_p use_p;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	245 tree op = gimple_phi_result (psi.phi ());
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	246 if (virtual_operand_p (op))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	247 continue;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	248 FOR_EACH_IMM_USE_FAST (use_p, imm_iter, op)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	249 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	250 gimple *use_stmt = USE_STMT (use_p);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	251 if (!is_gimple_debug (use_stmt)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	252 && flow_bb_inside_loop_p (outer, gimple_bb (use_stmt)))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	253 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	254 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	255 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	256
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	257 /* And check blocks belonging to just outer loop. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	258 bbs = XNEWVEC (basic_block, n_basic_blocks_for_fn (cfun));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	259 n = get_loop_body_with_size (outer, bbs, n_basic_blocks_for_fn (cfun));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	260
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	261 for (i = 0; i < n; i++)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	262 if (bbs[i]->loop_father == outer && bb_prevents_fusion_p (bbs[i]))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	263 break;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	264 free (bbs);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	265 if (i != n)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	266 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	267
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	268 /* For now we can safely fuse copies of LOOP only if all
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	269 loop carried variables are inductions (or the virtual op).
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	270
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	271 We could handle reductions as well (the initial value in the second
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	272 body would be the after-iter value of the first body) if it's over
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	273 an associative and commutative operation. We wouldn't
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	274 be able to handle unknown cycles. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	275 for (psi = gsi_start_phis (loop->header); !gsi_end_p (psi); gsi_next (&psi))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	276 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	277 affine_iv iv;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	278 tree op = gimple_phi_result (psi.phi ());
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	279
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	280 if (virtual_operand_p (op))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	281 continue;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	282 if (!simple_iv (loop, loop, op, &iv, true))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	283 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	284 /* The inductions must be regular, loop invariant step and initial
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	285 value. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	286 if (!expr_invariant_in_loop_p (outer, iv.step)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	287 \|\| !expr_invariant_in_loop_p (outer, iv.base))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	288 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	289 /* XXX With more effort we could also be able to deal with inductions
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	290 where the initial value is loop variant but a simple IV in the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	291 outer loop. The initial value for the second body would be
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	292 the original initial value plus iv.base.step. The next value
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	293 for the fused loop would be the original next value of the first
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	294 copy, _not_ the next value of the second body. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	295 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	296
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	297 return true;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	298 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	299
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	300 /* Fuse LOOP with all further neighbors. The loops are expected to
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	301 be in appropriate form. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	302
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	303 static void
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	304 fuse_loops (struct loop *loop)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	305 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	306 struct loop *next = loop->next;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	307
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	308 while (next)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	309 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	310 edge e;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	311
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	312 remove_branch (single_pred_edge (loop->latch));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	313 /* Make delete_basic_block not fiddle with the loop structure. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	314 basic_block oldlatch = loop->latch;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	315 loop->latch = NULL;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	316 delete_basic_block (oldlatch);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	317 e = redirect_edge_and_branch (loop_latch_edge (next),
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	318 loop->header);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	319 loop->latch = e->src;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	320 flush_pending_stmts (e);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	321
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	322 gcc_assert (EDGE_COUNT (next->header->preds) == 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	323
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	324 /* The PHI nodes of the second body (single-argument now)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	325 need adjustments to use the right values: either directly
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	326 the value of the corresponding PHI in the first copy or
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	327 the one leaving the first body which unrolling did for us.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	328
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	329 See also unroll_jam_possible_p() for further possibilities. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	330 gphi_iterator psi_first, psi_second;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	331 e = single_pred_edge (next->header);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	332 for (psi_first = gsi_start_phis (loop->header),
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	333 psi_second = gsi_start_phis (next->header);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	334 !gsi_end_p (psi_first);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	335 gsi_next (&psi_first), gsi_next (&psi_second))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	336 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	337 gphi *phi_first = psi_first.phi ();
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	338 gphi *phi_second = psi_second.phi ();
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	339 tree firstop = gimple_phi_result (phi_first);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	340 /* The virtual operand is correct already as it's
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	341 always live at exit, hence has a LCSSA node and outer
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	342 loop unrolling updated SSA form. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	343 if (virtual_operand_p (firstop))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	344 continue;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	345
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	346 /* Due to unroll_jam_possible_p() we know that this is
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	347 an induction. The second body goes over the same
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	348 iteration space. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	349 add_phi_arg (phi_second, firstop, e,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	350 gimple_location (phi_first));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	351 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	352 gcc_assert (gsi_end_p (psi_second));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	353
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	354 merge_loop_tree (loop, next);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	355 gcc_assert (!next->num_nodes);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	356 struct loop *ln = next->next;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	357 delete_loop (next);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	358 next = ln;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	359 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	360 rewrite_into_loop_closed_ssa_1 (NULL, 0, SSA_OP_USE, loop);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	361 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	362
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	363 /* Returns true if the distance in DDR can be determined and adjusts
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	364 the unroll factor in *UNROLL to make unrolling valid for that distance.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	365 Otherwise return false.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	366
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	367 If this data dep can lead to a removed memory reference, increment
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	368 REMOVED and adjust PROFIT_UNROLL to be the necessary unroll factor
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	369 for this to happen. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	370
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	371 static bool
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	372 adjust_unroll_factor (struct data_dependence_relation *ddr,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	373 unsigned unroll, unsigned profit_unroll,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	374 unsigned *removed)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	375 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	376 bool ret = false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	377 if (DDR_ARE_DEPENDENT (ddr) != chrec_known)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	378 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	379 if (DDR_NUM_DIST_VECTS (ddr) == 0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	380 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	381 unsigned i;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	382 lambda_vector dist_v;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	383 FOR_EACH_VEC_ELT (DDR_DIST_VECTS (ddr), i, dist_v)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	384 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	385 /* A distance (a,b) is at worst transformed into (a/N,b) by the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	386 unrolling (factor N), so the transformation is valid if
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	387 a >= N, or b > 0, or b is zero and a > 0. Otherwise the unroll
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	388 factor needs to be limited so that the first condition holds.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	389 That may limit the factor down to zero in the worst case. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	390 int dist = dist_v[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	391 if (dist < 0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	392 gcc_unreachable ();
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	393 else if ((unsigned)dist >= *unroll)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	394 ;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	395 else if (lambda_vector_lexico_pos (dist_v + 1, DDR_NB_LOOPS (ddr) - 1)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	396 \|\| (lambda_vector_zerop (dist_v + 1, DDR_NB_LOOPS (ddr) - 1)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	397 && dist > 0))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	398 ;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	399 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	400 *unroll = dist;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	401
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	402 /* With a distance (a,0) it's always profitable to unroll-and-jam
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	403 (by a+1), because one memory reference will go away. With
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	404 (a,b) and b != 0 that's less clear. We will increase the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	405 number of streams without lowering the number of mem refs.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	406 So for now only handle the first situation. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	407 if (lambda_vector_zerop (dist_v + 1, DDR_NB_LOOPS (ddr) - 1))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	408 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	409 profit_unroll = MAX (profit_unroll, (unsigned)dist + 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	410 (*removed)++;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	411 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	412
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	413 ret = true;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	414 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	415 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	416 return ret;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	417 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	418
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	419 /* Main entry point for the unroll-and-jam transformation
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	420 described above. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	421
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	422 static unsigned int
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	423 tree_loop_unroll_and_jam (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	424 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	425 struct loop *loop;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	426 bool changed = false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	427
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	428 gcc_assert (scev_initialized_p ());
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	429
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	430 /* Go through all innermost loops. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	431 FOR_EACH_LOOP (loop, LI_ONLY_INNERMOST)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	432 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	433 struct loop *outer = loop_outer (loop);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	434
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	435 if (loop_depth (loop) < 2
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	436 \|\| optimize_loop_nest_for_size_p (outer))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	437 continue;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	438
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	439 if (!unroll_jam_possible_p (outer, loop))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	440 continue;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	441
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	442 vec<data_reference_p> datarefs;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	443 vec<ddr_p> dependences;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	444 unsigned unroll_factor, profit_unroll, removed;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	445 struct tree_niter_desc desc;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	446 bool unroll = false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	447
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	448 auto_vec<loop_p, 3> loop_nest;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	449 dependences.create (10);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	450 datarefs.create (10);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	451 if (!compute_data_dependences_for_loop (outer, true, &loop_nest,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	452 &datarefs, &dependences))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	453 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	454 if (dump_file && (dump_flags & TDF_DETAILS))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	455 fprintf (dump_file, "Cannot analyze data dependencies\n");
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	456 free_data_refs (datarefs);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	457 free_dependence_relations (dependences);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	458 return false;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	459 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	460 if (!datarefs.length ())
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	461 continue;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	462
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	463 if (dump_file && (dump_flags & TDF_DETAILS))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	464 dump_data_dependence_relations (dump_file, dependences);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	465
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	466 unroll_factor = (unsigned)-1;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	467 profit_unroll = 1;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	468 removed = 0;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	469
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	470 /* Check all dependencies. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	471 unsigned i;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	472 struct data_dependence_relation *ddr;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	473 FOR_EACH_VEC_ELT (dependences, i, ddr)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	474 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	475 struct data_reference dra, drb;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	476
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	477 /* If the refs are independend there's nothing to do. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	478 if (DDR_ARE_DEPENDENT (ddr) == chrec_known)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	479 continue;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	480 dra = DDR_A (ddr);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	481 drb = DDR_B (ddr);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	482 /* Nothing interesting for the self dependencies. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	483 if (dra == drb)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	484 continue;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	485
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	486 /* Now check the distance vector, for determining a sensible
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	487 outer unroll factor, and for validity of merging the inner
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	488 loop copies. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	489 if (!adjust_unroll_factor (ddr, &unroll_factor, &profit_unroll,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	490 &removed))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	491 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	492 /* Couldn't get the distance vector. For two reads that's
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	493 harmless (we assume we should unroll). For at least
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	494 one write this means we can't check the dependence direction
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	495 and hence can't determine safety. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	496
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	497 if (DR_IS_WRITE (dra) \|\| DR_IS_WRITE (drb))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	498 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	499 unroll_factor = 0;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	500 break;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	501 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	502 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	503 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	504
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	505 /* We regard a user-specified minimum percentage of zero as a request
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	506 to ignore all profitability concerns and apply the transformation
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	507 always. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	508 if (!PARAM_VALUE (PARAM_UNROLL_JAM_MIN_PERCENT))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	509 profit_unroll = 2;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	510 else if (removed * 100 / datarefs.length ()
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	511 < (unsigned)PARAM_VALUE (PARAM_UNROLL_JAM_MIN_PERCENT))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	512 profit_unroll = 1;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	513 if (unroll_factor > profit_unroll)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	514 unroll_factor = profit_unroll;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	515 if (unroll_factor > (unsigned)PARAM_VALUE (PARAM_UNROLL_JAM_MAX_UNROLL))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	516 unroll_factor = PARAM_VALUE (PARAM_UNROLL_JAM_MAX_UNROLL);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	517 unroll = (unroll_factor > 1
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	518 && can_unroll_loop_p (outer, unroll_factor, &desc));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	519
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	520 if (unroll)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	521 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	522 if (dump_enabled_p ())
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	523 dump_printf_loc (MSG_OPTIMIZED_LOCATIONS \| TDF_DETAILS,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	524 find_loop_location (outer),
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	525 "applying unroll and jam with factor %d\n",
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	526 unroll_factor);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	527 initialize_original_copy_tables ();
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	528 tree_unroll_loop (outer, unroll_factor, single_dom_exit (outer),
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	529 &desc);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	530 free_original_copy_tables ();
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	531 fuse_loops (outer->inner);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	532 changed = true;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	533 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	534
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	535 loop_nest.release ();
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	536 free_dependence_relations (dependences);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	537 free_data_refs (datarefs);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	538 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	539
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	540 if (changed)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	541 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	542 scev_reset ();
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	543 free_dominance_info (CDI_DOMINATORS);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	544 return TODO_cleanup_cfg;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	545 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	546 return 0;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	547 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	548
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	549 /* Pass boilerplate */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	550
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	551 namespace {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	552
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	553 const pass_data pass_data_loop_jam =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	554 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	555 GIMPLE_PASS, /* type */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	556 "unrolljam", /* name */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	557 OPTGROUP_LOOP, /* optinfo_flags */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	558 TV_LOOP_JAM, /* tv_id */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	559 PROP_cfg, /* properties_required */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	560 0, /* properties_provided */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	561 0, /* properties_destroyed */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	562 0, /* todo_flags_start */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	563 0, /* todo_flags_finish */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	564 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	565
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	566 class pass_loop_jam : public gimple_opt_pass
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	567 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	568 public:
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	569 pass_loop_jam (gcc::context *ctxt)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	570 : gimple_opt_pass (pass_data_loop_jam, ctxt)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	571 {}
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	572
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	573 /* opt_pass methods: */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	574 virtual bool gate (function *) { return flag_unroll_jam != 0; }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	575 virtual unsigned int execute (function *);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	576
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	577 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	578
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	579 unsigned int
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	580 pass_loop_jam::execute (function *fun)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	581 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	582 if (number_of_loops (fun) <= 1)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	583 return 0;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	584
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	585 return tree_loop_unroll_and_jam ();
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	586 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	587
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	588 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	589
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	590 gimple_opt_pass *
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	591 make_pass_loop_jam (gcc::context *ctxt)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	592 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	593 return new pass_loop_jam (ctxt);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	594 }

Mercurial > hg > CbC > CbC_gcc

annotate gcc/gimple-loop-jam.c @ 144:8f4e72ab4e11