CbC/CbC_gcc: libgomp/config/nvptx/bar.c annotate

annotate libgomp/config/nvptx/bar.c @ 158:494b0b89df80 default tip

...

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Mon, 25 May 2020 18:13:55 +0900
parents	1830386684a0
children

rev	line source
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1 /* Copyright (C) 2015-2020 Free Software Foundation, Inc.
111 04ced10e8804 gcc 7 kono parents: diff changeset	2 Contributed by Alexander Monakov <amonakov@ispras.ru>
04ced10e8804 gcc 7 kono parents: diff changeset	3
04ced10e8804 gcc 7 kono parents: diff changeset	4 This file is part of the GNU Offloading and Multi Processing Library
04ced10e8804 gcc 7 kono parents: diff changeset	5 (libgomp).
04ced10e8804 gcc 7 kono parents: diff changeset	6
04ced10e8804 gcc 7 kono parents: diff changeset	7 Libgomp is free software; you can redistribute it and/or modify it
04ced10e8804 gcc 7 kono parents: diff changeset	8 under the terms of the GNU General Public License as published by
04ced10e8804 gcc 7 kono parents: diff changeset	9 the Free Software Foundation; either version 3, or (at your option)
04ced10e8804 gcc 7 kono parents: diff changeset	10 any later version.
04ced10e8804 gcc 7 kono parents: diff changeset	11
04ced10e8804 gcc 7 kono parents: diff changeset	12 Libgomp is distributed in the hope that it will be useful, but WITHOUT ANY
04ced10e8804 gcc 7 kono parents: diff changeset	13 WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS
04ced10e8804 gcc 7 kono parents: diff changeset	14 FOR A PARTICULAR PURPOSE. See the GNU General Public License for
04ced10e8804 gcc 7 kono parents: diff changeset	15 more details.
04ced10e8804 gcc 7 kono parents: diff changeset	16
04ced10e8804 gcc 7 kono parents: diff changeset	17 Under Section 7 of GPL version 3, you are granted additional
04ced10e8804 gcc 7 kono parents: diff changeset	18 permissions described in the GCC Runtime Library Exception, version
04ced10e8804 gcc 7 kono parents: diff changeset	19 3.1, as published by the Free Software Foundation.
04ced10e8804 gcc 7 kono parents: diff changeset	20
04ced10e8804 gcc 7 kono parents: diff changeset	21 You should have received a copy of the GNU General Public License and
04ced10e8804 gcc 7 kono parents: diff changeset	22 a copy of the GCC Runtime Library Exception along with this program;
04ced10e8804 gcc 7 kono parents: diff changeset	23 see the files COPYING3 and COPYING.RUNTIME respectively. If not, see
04ced10e8804 gcc 7 kono parents: diff changeset	24 <http://www.gnu.org/licenses/>. */
04ced10e8804 gcc 7 kono parents: diff changeset	25
04ced10e8804 gcc 7 kono parents: diff changeset	26 /* This is an NVPTX specific implementation of a barrier synchronization
04ced10e8804 gcc 7 kono parents: diff changeset	27 mechanism for libgomp. This type is private to the library. This
04ced10e8804 gcc 7 kono parents: diff changeset	28 implementation uses atomic instructions and bar.sync instruction. */
04ced10e8804 gcc 7 kono parents: diff changeset	29
04ced10e8804 gcc 7 kono parents: diff changeset	30 #include <limits.h>
04ced10e8804 gcc 7 kono parents: diff changeset	31 #include "libgomp.h"
04ced10e8804 gcc 7 kono parents: diff changeset	32
04ced10e8804 gcc 7 kono parents: diff changeset	33
04ced10e8804 gcc 7 kono parents: diff changeset	34 void
04ced10e8804 gcc 7 kono parents: diff changeset	35 gomp_barrier_wait_end (gomp_barrier_t *bar, gomp_barrier_state_t state)
04ced10e8804 gcc 7 kono parents: diff changeset	36 {
04ced10e8804 gcc 7 kono parents: diff changeset	37 if (__builtin_expect (state & BAR_WAS_LAST, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	38 {
04ced10e8804 gcc 7 kono parents: diff changeset	39 /* Next time we'll be awaiting TOTAL threads again. */
04ced10e8804 gcc 7 kono parents: diff changeset	40 bar->awaited = bar->total;
04ced10e8804 gcc 7 kono parents: diff changeset	41 __atomic_store_n (&bar->generation, bar->generation + BAR_INCR,
04ced10e8804 gcc 7 kono parents: diff changeset	42 MEMMODEL_RELEASE);
04ced10e8804 gcc 7 kono parents: diff changeset	43 }
04ced10e8804 gcc 7 kono parents: diff changeset	44 asm ("bar.sync 1, %0;" : : "r" (32 * bar->total));
04ced10e8804 gcc 7 kono parents: diff changeset	45 }
04ced10e8804 gcc 7 kono parents: diff changeset	46
04ced10e8804 gcc 7 kono parents: diff changeset	47 void
04ced10e8804 gcc 7 kono parents: diff changeset	48 gomp_barrier_wait (gomp_barrier_t *bar)
04ced10e8804 gcc 7 kono parents: diff changeset	49 {
04ced10e8804 gcc 7 kono parents: diff changeset	50 gomp_barrier_wait_end (bar, gomp_barrier_wait_start (bar));
04ced10e8804 gcc 7 kono parents: diff changeset	51 }
04ced10e8804 gcc 7 kono parents: diff changeset	52
04ced10e8804 gcc 7 kono parents: diff changeset	53 /* Like gomp_barrier_wait, except that if the encountering thread
04ced10e8804 gcc 7 kono parents: diff changeset	54 is not the last one to hit the barrier, it returns immediately.
04ced10e8804 gcc 7 kono parents: diff changeset	55 The intended usage is that a thread which intends to gomp_barrier_destroy
04ced10e8804 gcc 7 kono parents: diff changeset	56 this barrier calls gomp_barrier_wait, while all other threads
04ced10e8804 gcc 7 kono parents: diff changeset	57 call gomp_barrier_wait_last. When gomp_barrier_wait returns,
04ced10e8804 gcc 7 kono parents: diff changeset	58 the barrier can be safely destroyed. */
04ced10e8804 gcc 7 kono parents: diff changeset	59
04ced10e8804 gcc 7 kono parents: diff changeset	60 void
04ced10e8804 gcc 7 kono parents: diff changeset	61 gomp_barrier_wait_last (gomp_barrier_t *bar)
04ced10e8804 gcc 7 kono parents: diff changeset	62 {
04ced10e8804 gcc 7 kono parents: diff changeset	63 /* Deferring to gomp_barrier_wait does not use the optimization opportunity
04ced10e8804 gcc 7 kono parents: diff changeset	64 allowed by the interface contract for all-but-last participants. The
04ced10e8804 gcc 7 kono parents: diff changeset	65 original implementation in config/linux/bar.c handles this better. */
04ced10e8804 gcc 7 kono parents: diff changeset	66 gomp_barrier_wait (bar);
04ced10e8804 gcc 7 kono parents: diff changeset	67 }
04ced10e8804 gcc 7 kono parents: diff changeset	68
04ced10e8804 gcc 7 kono parents: diff changeset	69 void
04ced10e8804 gcc 7 kono parents: diff changeset	70 gomp_team_barrier_wake (gomp_barrier_t *bar, int count)
04ced10e8804 gcc 7 kono parents: diff changeset	71 {
04ced10e8804 gcc 7 kono parents: diff changeset	72 asm ("bar.sync 1, %0;" : : "r" (32 * bar->total));
04ced10e8804 gcc 7 kono parents: diff changeset	73 }
04ced10e8804 gcc 7 kono parents: diff changeset	74
04ced10e8804 gcc 7 kono parents: diff changeset	75 void
04ced10e8804 gcc 7 kono parents: diff changeset	76 gomp_team_barrier_wait_end (gomp_barrier_t *bar, gomp_barrier_state_t state)
04ced10e8804 gcc 7 kono parents: diff changeset	77 {
04ced10e8804 gcc 7 kono parents: diff changeset	78 unsigned int generation, gen;
04ced10e8804 gcc 7 kono parents: diff changeset	79
04ced10e8804 gcc 7 kono parents: diff changeset	80 if (__builtin_expect (state & BAR_WAS_LAST, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	81 {
04ced10e8804 gcc 7 kono parents: diff changeset	82 /* Next time we'll be awaiting TOTAL threads again. */
04ced10e8804 gcc 7 kono parents: diff changeset	83 struct gomp_thread *thr = gomp_thread ();
04ced10e8804 gcc 7 kono parents: diff changeset	84 struct gomp_team *team = thr->ts.team;
04ced10e8804 gcc 7 kono parents: diff changeset	85
04ced10e8804 gcc 7 kono parents: diff changeset	86 bar->awaited = bar->total;
04ced10e8804 gcc 7 kono parents: diff changeset	87 team->work_share_cancelled = 0;
04ced10e8804 gcc 7 kono parents: diff changeset	88 if (__builtin_expect (team->task_count, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	89 {
04ced10e8804 gcc 7 kono parents: diff changeset	90 gomp_barrier_handle_tasks (state);
04ced10e8804 gcc 7 kono parents: diff changeset	91 state &= ~BAR_WAS_LAST;
04ced10e8804 gcc 7 kono parents: diff changeset	92 }
04ced10e8804 gcc 7 kono parents: diff changeset	93 else
04ced10e8804 gcc 7 kono parents: diff changeset	94 {
04ced10e8804 gcc 7 kono parents: diff changeset	95 state &= ~BAR_CANCELLED;
04ced10e8804 gcc 7 kono parents: diff changeset	96 state += BAR_INCR - BAR_WAS_LAST;
04ced10e8804 gcc 7 kono parents: diff changeset	97 __atomic_store_n (&bar->generation, state, MEMMODEL_RELEASE);
04ced10e8804 gcc 7 kono parents: diff changeset	98 asm ("bar.sync 1, %0;" : : "r" (32 * bar->total));
04ced10e8804 gcc 7 kono parents: diff changeset	99 return;
04ced10e8804 gcc 7 kono parents: diff changeset	100 }
04ced10e8804 gcc 7 kono parents: diff changeset	101 }
04ced10e8804 gcc 7 kono parents: diff changeset	102
04ced10e8804 gcc 7 kono parents: diff changeset	103 generation = state;
04ced10e8804 gcc 7 kono parents: diff changeset	104 state &= ~BAR_CANCELLED;
04ced10e8804 gcc 7 kono parents: diff changeset	105 do
04ced10e8804 gcc 7 kono parents: diff changeset	106 {
04ced10e8804 gcc 7 kono parents: diff changeset	107 asm ("bar.sync 1, %0;" : : "r" (32 * bar->total));
04ced10e8804 gcc 7 kono parents: diff changeset	108 gen = __atomic_load_n (&bar->generation, MEMMODEL_ACQUIRE);
04ced10e8804 gcc 7 kono parents: diff changeset	109 if (__builtin_expect (gen & BAR_TASK_PENDING, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	110 {
04ced10e8804 gcc 7 kono parents: diff changeset	111 gomp_barrier_handle_tasks (state);
04ced10e8804 gcc 7 kono parents: diff changeset	112 gen = __atomic_load_n (&bar->generation, MEMMODEL_ACQUIRE);
04ced10e8804 gcc 7 kono parents: diff changeset	113 }
04ced10e8804 gcc 7 kono parents: diff changeset	114 generation \|= gen & BAR_WAITING_FOR_TASK;
04ced10e8804 gcc 7 kono parents: diff changeset	115 }
04ced10e8804 gcc 7 kono parents: diff changeset	116 while (gen != state + BAR_INCR);
04ced10e8804 gcc 7 kono parents: diff changeset	117 }
04ced10e8804 gcc 7 kono parents: diff changeset	118
04ced10e8804 gcc 7 kono parents: diff changeset	119 void
04ced10e8804 gcc 7 kono parents: diff changeset	120 gomp_team_barrier_wait (gomp_barrier_t *bar)
04ced10e8804 gcc 7 kono parents: diff changeset	121 {
04ced10e8804 gcc 7 kono parents: diff changeset	122 gomp_team_barrier_wait_end (bar, gomp_barrier_wait_start (bar));
04ced10e8804 gcc 7 kono parents: diff changeset	123 }
04ced10e8804 gcc 7 kono parents: diff changeset	124
04ced10e8804 gcc 7 kono parents: diff changeset	125 void
04ced10e8804 gcc 7 kono parents: diff changeset	126 gomp_team_barrier_wait_final (gomp_barrier_t *bar)
04ced10e8804 gcc 7 kono parents: diff changeset	127 {
04ced10e8804 gcc 7 kono parents: diff changeset	128 gomp_barrier_state_t state = gomp_barrier_wait_final_start (bar);
04ced10e8804 gcc 7 kono parents: diff changeset	129 if (__builtin_expect (state & BAR_WAS_LAST, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	130 bar->awaited_final = bar->total;
04ced10e8804 gcc 7 kono parents: diff changeset	131 gomp_team_barrier_wait_end (bar, state);
04ced10e8804 gcc 7 kono parents: diff changeset	132 }
04ced10e8804 gcc 7 kono parents: diff changeset	133
04ced10e8804 gcc 7 kono parents: diff changeset	134 bool
04ced10e8804 gcc 7 kono parents: diff changeset	135 gomp_team_barrier_wait_cancel_end (gomp_barrier_t *bar,
04ced10e8804 gcc 7 kono parents: diff changeset	136 gomp_barrier_state_t state)
04ced10e8804 gcc 7 kono parents: diff changeset	137 {
04ced10e8804 gcc 7 kono parents: diff changeset	138 unsigned int generation, gen;
04ced10e8804 gcc 7 kono parents: diff changeset	139
04ced10e8804 gcc 7 kono parents: diff changeset	140 if (__builtin_expect (state & BAR_WAS_LAST, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	141 {
04ced10e8804 gcc 7 kono parents: diff changeset	142 /* Next time we'll be awaiting TOTAL threads again. */
04ced10e8804 gcc 7 kono parents: diff changeset	143 /* BAR_CANCELLED should never be set in state here, because
04ced10e8804 gcc 7 kono parents: diff changeset	144 cancellation means that at least one of the threads has been
04ced10e8804 gcc 7 kono parents: diff changeset	145 cancelled, thus on a cancellable barrier we should never see
04ced10e8804 gcc 7 kono parents: diff changeset	146 all threads to arrive. */
04ced10e8804 gcc 7 kono parents: diff changeset	147 struct gomp_thread *thr = gomp_thread ();
04ced10e8804 gcc 7 kono parents: diff changeset	148 struct gomp_team *team = thr->ts.team;
04ced10e8804 gcc 7 kono parents: diff changeset	149
04ced10e8804 gcc 7 kono parents: diff changeset	150 bar->awaited = bar->total;
04ced10e8804 gcc 7 kono parents: diff changeset	151 team->work_share_cancelled = 0;
04ced10e8804 gcc 7 kono parents: diff changeset	152 if (__builtin_expect (team->task_count, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	153 {
04ced10e8804 gcc 7 kono parents: diff changeset	154 gomp_barrier_handle_tasks (state);
04ced10e8804 gcc 7 kono parents: diff changeset	155 state &= ~BAR_WAS_LAST;
04ced10e8804 gcc 7 kono parents: diff changeset	156 }
04ced10e8804 gcc 7 kono parents: diff changeset	157 else
04ced10e8804 gcc 7 kono parents: diff changeset	158 {
04ced10e8804 gcc 7 kono parents: diff changeset	159 state += BAR_INCR - BAR_WAS_LAST;
04ced10e8804 gcc 7 kono parents: diff changeset	160 __atomic_store_n (&bar->generation, state, MEMMODEL_RELEASE);
04ced10e8804 gcc 7 kono parents: diff changeset	161 asm ("bar.sync 1, %0;" : : "r" (32 * bar->total));
04ced10e8804 gcc 7 kono parents: diff changeset	162 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	163 }
04ced10e8804 gcc 7 kono parents: diff changeset	164 }
04ced10e8804 gcc 7 kono parents: diff changeset	165
04ced10e8804 gcc 7 kono parents: diff changeset	166 if (__builtin_expect (state & BAR_CANCELLED, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	167 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	168
04ced10e8804 gcc 7 kono parents: diff changeset	169 generation = state;
04ced10e8804 gcc 7 kono parents: diff changeset	170 do
04ced10e8804 gcc 7 kono parents: diff changeset	171 {
04ced10e8804 gcc 7 kono parents: diff changeset	172 asm ("bar.sync 1, %0;" : : "r" (32 * bar->total));
04ced10e8804 gcc 7 kono parents: diff changeset	173 gen = __atomic_load_n (&bar->generation, MEMMODEL_ACQUIRE);
04ced10e8804 gcc 7 kono parents: diff changeset	174 if (__builtin_expect (gen & BAR_CANCELLED, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	175 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	176 if (__builtin_expect (gen & BAR_TASK_PENDING, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	177 {
04ced10e8804 gcc 7 kono parents: diff changeset	178 gomp_barrier_handle_tasks (state);
04ced10e8804 gcc 7 kono parents: diff changeset	179 gen = __atomic_load_n (&bar->generation, MEMMODEL_ACQUIRE);
04ced10e8804 gcc 7 kono parents: diff changeset	180 }
04ced10e8804 gcc 7 kono parents: diff changeset	181 generation \|= gen & BAR_WAITING_FOR_TASK;
04ced10e8804 gcc 7 kono parents: diff changeset	182 }
04ced10e8804 gcc 7 kono parents: diff changeset	183 while (gen != state + BAR_INCR);
04ced10e8804 gcc 7 kono parents: diff changeset	184
04ced10e8804 gcc 7 kono parents: diff changeset	185 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	186 }
04ced10e8804 gcc 7 kono parents: diff changeset	187
04ced10e8804 gcc 7 kono parents: diff changeset	188 bool
04ced10e8804 gcc 7 kono parents: diff changeset	189 gomp_team_barrier_wait_cancel (gomp_barrier_t *bar)
04ced10e8804 gcc 7 kono parents: diff changeset	190 {
04ced10e8804 gcc 7 kono parents: diff changeset	191 return gomp_team_barrier_wait_cancel_end (bar, gomp_barrier_wait_start (bar));
04ced10e8804 gcc 7 kono parents: diff changeset	192 }
04ced10e8804 gcc 7 kono parents: diff changeset	193
04ced10e8804 gcc 7 kono parents: diff changeset	194 void
04ced10e8804 gcc 7 kono parents: diff changeset	195 gomp_team_barrier_cancel (struct gomp_team *team)
04ced10e8804 gcc 7 kono parents: diff changeset	196 {
04ced10e8804 gcc 7 kono parents: diff changeset	197 gomp_mutex_lock (&team->task_lock);
04ced10e8804 gcc 7 kono parents: diff changeset	198 if (team->barrier.generation & BAR_CANCELLED)
04ced10e8804 gcc 7 kono parents: diff changeset	199 {
04ced10e8804 gcc 7 kono parents: diff changeset	200 gomp_mutex_unlock (&team->task_lock);
04ced10e8804 gcc 7 kono parents: diff changeset	201 return;
04ced10e8804 gcc 7 kono parents: diff changeset	202 }
04ced10e8804 gcc 7 kono parents: diff changeset	203 team->barrier.generation \|= BAR_CANCELLED;
04ced10e8804 gcc 7 kono parents: diff changeset	204 gomp_mutex_unlock (&team->task_lock);
04ced10e8804 gcc 7 kono parents: diff changeset	205 gomp_team_barrier_wake (&team->barrier, INT_MAX);
04ced10e8804 gcc 7 kono parents: diff changeset	206 }

Mercurial > hg > CbC > CbC_gcc

annotate libgomp/config/nvptx/bar.c @ 158:494b0b89df80 default tip