CbC/CbC_gcc: gcc/config/rs6000/emmintrin.h annotate

annotate gcc/config/rs6000/emmintrin.h @ 145:1830386684a0

gcc-9.2.0

author	anatofuz
date	Thu, 13 Feb 2020 11:34:05 +0900
parents	84e7813d76e9
children

rev	line source
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1 /* Copyright (C) 2003-2020 Free Software Foundation, Inc.
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	3 This file is part of GCC.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	4
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	5 GCC is free software; you can redistribute it and/or modify
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	6 it under the terms of the GNU General Public License as published by
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	7 the Free Software Foundation; either version 3, or (at your option)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	8 any later version.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	9
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	10 GCC is distributed in the hope that it will be useful,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	11 but WITHOUT ANY WARRANTY; without even the implied warranty of
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	12 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	13 GNU General Public License for more details.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	14
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	15 Under Section 7 of GPL version 3, you are granted additional
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	16 permissions described in the GCC Runtime Library Exception, version
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	17 3.1, as published by the Free Software Foundation.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	18
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	19 You should have received a copy of the GNU General Public License and
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	20 a copy of the GCC Runtime Library Exception along with this program;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	21 see the files COPYING3 and COPYING.RUNTIME respectively. If not, see
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	22 <http://www.gnu.org/licenses/>. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	23
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	24 /* Implemented from the specification included in the Intel C++ Compiler
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	25 User Guide and Reference, version 9.0. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	26
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	27 #ifndef NO_WARN_X86_INTRINSICS
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	28 /* This header is distributed to simplify porting x86_64 code that
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	29 makes explicit use of Intel intrinsics to powerpc64le.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	30 It is the user's responsibility to determine if the results are
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	31 acceptable and make additional changes as necessary.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	32 Note that much code that uses Intel intrinsics can be rewritten in
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	33 standard C or GNU C extensions, which are more portable and better
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	34 optimized across multiple targets.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	35
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	36 In the specific case of X86 SSE2 (__m128i, __m128d) intrinsics,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	37 the PowerPC VMX/VSX ISA is a good match for vector double SIMD
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	38 operations. However scalar double operations in vector (XMM)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	39 registers require the POWER8 VSX ISA (2.07) level. Also there are
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	40 important differences for data format and placement of double
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	41 scalars in the vector register.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	42
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	43 For PowerISA Scalar double is in FPRs (left most 64-bits of the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	44 low 32 VSRs), while X86_64 SSE2 uses the right most 64-bits of
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	45 the XMM. These differences require extra steps on POWER to match
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	46 the SSE2 scalar double semantics.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	47
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	48 Most SSE2 scalar double intrinsic operations can be performed more
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	49 efficiently as C language double scalar operations or optimized to
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	50 use vector SIMD operations. We recommend this for new applications.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	51
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	52 Another difference is the format and details of the X86_64 MXSCR vs
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	53 the PowerISA FPSCR / VSCR registers. We recommend applications
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	54 replace direct access to the MXSCR with the more portable <fenv.h>
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	55 Posix APIs. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	56 #error "Please read comment above. Use -DNO_WARN_X86_INTRINSICS to disable this error."
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	57 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	58
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	59 #ifndef EMMINTRIN_H_
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	60 #define EMMINTRIN_H_
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	61
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	62 #include <altivec.h>
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	63 #include <assert.h>
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	64
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	65 /* We need definitions from the SSE header files. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	66 #include <xmmintrin.h>
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	67
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	68 /* SSE2 */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	69 typedef __vector double __v2df;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	70 typedef __vector long long __v2di;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	71 typedef __vector unsigned long long __v2du;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	72 typedef __vector int __v4si;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	73 typedef __vector unsigned int __v4su;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	74 typedef __vector short __v8hi;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	75 typedef __vector unsigned short __v8hu;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	76 typedef __vector signed char __v16qi;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	77 typedef __vector unsigned char __v16qu;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	78
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	79 /* The Intel API is flexible enough that we must allow aliasing with other
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	80 vector types, and their scalar components. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	81 typedef long long __m128i __attribute__ ((__vector_size__ (16), __may_alias__));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	82 typedef double __m128d __attribute__ ((__vector_size__ (16), __may_alias__));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	83
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	84 /* Unaligned version of the same types. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	85 typedef long long __m128i_u __attribute__ ((__vector_size__ (16), __may_alias__, __aligned__ (1)));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	86 typedef double __m128d_u __attribute__ ((__vector_size__ (16), __may_alias__, __aligned__ (1)));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	87
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	88 /* Define two value permute mask. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	89 #define _MM_SHUFFLE2(x,y) (((x) << 1) \| (y))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	90
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	91 /* Create a vector with element 0 as F and the rest zero. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	92 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	93 _mm_set_sd (double __F)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	94 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	95 return __extension__ (__m128d){ __F, 0.0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	96 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	97
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	98 /* Create a vector with both elements equal to F. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	99 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	100 _mm_set1_pd (double __F)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	101 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	102 return __extension__ (__m128d){ __F, __F };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	103 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	104
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	105 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	106 _mm_set_pd1 (double __F)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	107 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	108 return _mm_set1_pd (__F);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	109 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	110
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	111 /* Create a vector with the lower value X and upper value W. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	112 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	113 _mm_set_pd (double __W, double __X)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	114 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	115 return __extension__ (__m128d){ __X, __W };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	116 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	117
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	118 /* Create a vector with the lower value W and upper value X. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	119 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	120 _mm_setr_pd (double __W, double __X)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	121 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	122 return __extension__ (__m128d){ __W, __X };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	123 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	124
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	125 /* Create an undefined vector. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	126 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	127 _mm_undefined_pd (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	128 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	129 __m128d __Y = __Y;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	130 return __Y;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	131 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	132
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	133 /* Create a vector of zeros. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	134 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	135 _mm_setzero_pd (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	136 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	137 return (__m128d) vec_splats (0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	138 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	139
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	140 /* Sets the low DPFP value of A from the low value of B. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	141 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	142 _mm_move_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	143 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	144 __v2df result = (__v2df) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	145 result [0] = ((__v2df) __B)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	146 return (__m128d) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	147 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	148
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	149 /* Load two DPFP values from P. The address must be 16-byte aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	150 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	151 _mm_load_pd (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	152 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	153 assert(((unsigned long)__P & 0xfUL) == 0UL);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	154 return ((__m128d)vec_ld(0, (__v16qu*)__P));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	155 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	156
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	157 /* Load two DPFP values from P. The address need not be 16-byte aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	158 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	159 _mm_loadu_pd (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	160 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	161 return (vec_vsx_ld(0, __P));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	162 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	163
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	164 /* Create a vector with all two elements equal to P. /
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	165 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	166 _mm_load1_pd (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	167 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	168 return (vec_splats (*__P));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	169 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	170
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	171 /* Create a vector with element 0 as P and the rest zero. /
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	172 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	173 _mm_load_sd (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	174 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	175 return _mm_set_sd (*__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	176 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	177
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	178 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	179 _mm_load_pd1 (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	180 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	181 return _mm_load1_pd (__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	182 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	183
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	184 /* Load two DPFP values in reverse order. The address must be aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	185 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	186 _mm_loadr_pd (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	187 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	188 __v2df __tmp = _mm_load_pd (__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	189 return (__m128d)vec_xxpermdi (__tmp, __tmp, 2);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	190 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	191
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	192 /* Store two DPFP values. The address must be 16-byte aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	193 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	194 _mm_store_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	195 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	196 assert(((unsigned long)__P & 0xfUL) == 0UL);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	197 vec_st((__v16qu)__A, 0, (__v16qu*)__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	198 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	199
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	200 /* Store two DPFP values. The address need not be 16-byte aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	201 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	202 _mm_storeu_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	203 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	204 (__m128d_u )__P = __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	205 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	206
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	207 /* Stores the lower DPFP value. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	208 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	209 _mm_store_sd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	210 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	211 *__P = ((__v2df)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	212 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	213
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	214 extern __inline double __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	215 _mm_cvtsd_f64 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	216 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	217 return ((__v2df)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	218 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	219
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	220 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	221 _mm_storel_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	222 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	223 _mm_store_sd (__P, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	224 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	225
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	226 /* Stores the upper DPFP value. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	227 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	228 _mm_storeh_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	229 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	230 *__P = ((__v2df)__A)[1];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	231 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	232 /* Store the lower DPFP value across two words.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	233 The address must be 16-byte aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	234 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	235 _mm_store1_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	236 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	237 _mm_store_pd (__P, vec_splat (__A, 0));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	238 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	239
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	240 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	241 _mm_store_pd1 (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	242 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	243 _mm_store1_pd (__P, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	244 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	245
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	246 /* Store two DPFP values in reverse order. The address must be aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	247 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	248 _mm_storer_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	249 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	250 _mm_store_pd (__P, vec_xxpermdi (__A, __A, 2));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	251 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	252
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	253 /* Intel intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	254 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	255 _mm_cvtsi128_si64 (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	256 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	257 return ((__v2di)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	258 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	259
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	260 /* Microsoft intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	261 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	262 _mm_cvtsi128_si64x (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	263 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	264 return ((__v2di)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	265 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	266
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	267 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	268 _mm_add_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	269 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	270 return (__m128d) ((__v2df)__A + (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	271 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	272
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	273 /* Add the lower double-precision (64-bit) floating-point element in
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	274 a and b, store the result in the lower element of dst, and copy
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	275 the upper element from a to the upper element of dst. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	276 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	277 _mm_add_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	278 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	279 __A[0] = __A[0] + __B[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	280 return (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	281 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	282
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	283 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	284 _mm_sub_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	285 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	286 return (__m128d) ((__v2df)__A - (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	287 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	288
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	289 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	290 _mm_sub_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	291 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	292 __A[0] = __A[0] - __B[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	293 return (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	294 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	295
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	296 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	297 _mm_mul_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	298 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	299 return (__m128d) ((__v2df)__A * (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	300 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	301
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	302 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	303 _mm_mul_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	304 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	305 __A[0] = __A[0] * __B[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	306 return (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	307 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	308
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	309 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	310 _mm_div_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	311 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	312 return (__m128d) ((__v2df)__A / (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	313 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	314
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	315 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	316 _mm_div_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	317 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	318 __A[0] = __A[0] / __B[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	319 return (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	320 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	321
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	322 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	323 _mm_sqrt_pd (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	324 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	325 return (vec_sqrt (__A));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	326 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	327
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	328 /* Return pair {sqrt (B[0]), A[1]}. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	329 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	330 _mm_sqrt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	331 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	332 __v2df c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	333 c = vec_sqrt ((__v2df) _mm_set1_pd (__B[0]));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	334 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	335 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	336
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	337 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	338 _mm_min_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	339 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	340 return (vec_min (__A, __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	341 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	342
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	343 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	344 _mm_min_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	345 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	346 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	347 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	348 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	349 c = vec_min (a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	350 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	351 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	352
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	353 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	354 _mm_max_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	355 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	356 return (vec_max (__A, __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	357 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	358
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	359 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	360 _mm_max_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	361 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	362 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	363 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	364 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	365 c = vec_max (a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	366 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	367 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	368
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	369 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	370 _mm_cmpeq_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	371 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	372 return ((__m128d)vec_cmpeq ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	373 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	374
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	375 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	376 _mm_cmplt_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	377 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	378 return ((__m128d)vec_cmplt ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	379 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	380
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	381 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	382 _mm_cmple_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	383 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	384 return ((__m128d)vec_cmple ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	385 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	386
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	387 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	388 _mm_cmpgt_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	389 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	390 return ((__m128d)vec_cmpgt ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	391 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	392
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	393 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	394 _mm_cmpge_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	395 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	396 return ((__m128d)vec_cmpge ((__v2df) __A,(__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	397 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	398
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	399 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	400 _mm_cmpneq_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	401 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	402 __v2df temp = (__v2df) vec_cmpeq ((__v2df) __A, (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	403 return ((__m128d)vec_nor (temp, temp));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	404 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	405
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	406 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	407 _mm_cmpnlt_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	408 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	409 return ((__m128d)vec_cmpge ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	410 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	411
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	412 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	413 _mm_cmpnle_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	414 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	415 return ((__m128d)vec_cmpgt ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	416 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	417
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	418 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	419 _mm_cmpngt_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	420 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	421 return ((__m128d)vec_cmple ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	422 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	423
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	424 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	425 _mm_cmpnge_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	426 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	427 return ((__m128d)vec_cmplt ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	428 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	429
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	430 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	431 _mm_cmpord_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	432 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	433 #if _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	434 __v2du c, d;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	435 /* Compare against self will return false (0's) if NAN. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	436 c = (__v2du)vec_cmpeq (__A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	437 d = (__v2du)vec_cmpeq (__B, __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	438 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	439 __v2du a, b;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	440 __v2du c, d;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	441 const __v2du double_exp_mask = {0x7ff0000000000000, 0x7ff0000000000000};
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	442 a = (__v2du)vec_abs ((__v2df)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	443 b = (__v2du)vec_abs ((__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	444 c = (__v2du)vec_cmpgt (double_exp_mask, a);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	445 d = (__v2du)vec_cmpgt (double_exp_mask, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	446 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	447 /* A != NAN and B != NAN. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	448 return ((__m128d)vec_and(c, d));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	449 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	450
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	451 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	452 _mm_cmpunord_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	453 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	454 #if _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	455 __v2du c, d;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	456 /* Compare against self will return false (0's) if NAN. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	457 c = (__v2du)vec_cmpeq ((__v2df)__A, (__v2df)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	458 d = (__v2du)vec_cmpeq ((__v2df)__B, (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	459 /* A == NAN OR B == NAN converts too:
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	460 NOT(A != NAN) OR NOT(B != NAN). */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	461 c = vec_nor (c, c);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	462 return ((__m128d)vec_orc(c, d));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	463 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	464 __v2du c, d;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	465 /* Compare against self will return false (0's) if NAN. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	466 c = (__v2du)vec_cmpeq ((__v2df)__A, (__v2df)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	467 d = (__v2du)vec_cmpeq ((__v2df)__B, (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	468 /* Convert the true ('1's) is NAN. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	469 c = vec_nor (c, c);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	470 d = vec_nor (d, d);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	471 return ((__m128d)vec_or(c, d));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	472 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	473 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	474
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	475 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	476 _mm_cmpeq_sd(__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	477 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	478 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	479 /* PowerISA VSX does not allow partial (for just lower double)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	480 results. So to insure we don't generate spurious exceptions
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	481 (from the upper double values) we splat the lower double
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	482 before we do the operation. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	483 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	484 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	485 c = (__v2df) vec_cmpeq(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	486 /* Then we merge the lower double result with the original upper
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	487 double from __A. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	488 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	489 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	490
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	491 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	492 _mm_cmplt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	493 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	494 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	495 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	496 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	497 c = (__v2df) vec_cmplt(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	498 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	499 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	500
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	501 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	502 _mm_cmple_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	503 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	504 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	505 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	506 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	507 c = (__v2df) vec_cmple(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	508 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	509 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	510
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	511 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	512 _mm_cmpgt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	513 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	514 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	515 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	516 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	517 c = (__v2df) vec_cmpgt(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	518 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	519 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	520
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	521 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	522 _mm_cmpge_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	523 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	524 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	525 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	526 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	527 c = (__v2df) vec_cmpge(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	528 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	529 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	530
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	531 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	532 _mm_cmpneq_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	533 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	534 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	535 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	536 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	537 c = (__v2df) vec_cmpeq(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	538 c = vec_nor (c, c);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	539 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	540 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	541
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	542 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	543 _mm_cmpnlt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	544 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	545 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	546 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	547 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	548 /* Not less than is just greater than or equal. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	549 c = (__v2df) vec_cmpge(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	550 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	551 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	552
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	553 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	554 _mm_cmpnle_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	555 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	556 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	557 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	558 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	559 /* Not less than or equal is just greater than. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	560 c = (__v2df) vec_cmpge(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	561 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	562 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	563
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	564 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	565 _mm_cmpngt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	566 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	567 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	568 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	569 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	570 /* Not greater than is just less than or equal. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	571 c = (__v2df) vec_cmple(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	572 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	573 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	574
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	575 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	576 _mm_cmpnge_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	577 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	578 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	579 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	580 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	581 /* Not greater than or equal is just less than. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	582 c = (__v2df) vec_cmplt(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	583 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	584 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	585
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	586 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	587 _mm_cmpord_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	588 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	589 __v2df r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	590 r = (__v2df)_mm_cmpord_pd (vec_splats (__A[0]), vec_splats (__B[0]));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	591 return (__m128d) _mm_setr_pd (r[0], ((__v2df)__A)[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	592 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	593
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	594 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	595 _mm_cmpunord_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	596 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	597 __v2df r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	598 r = _mm_cmpunord_pd (vec_splats (__A[0]), vec_splats (__B[0]));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	599 return (__m128d) _mm_setr_pd (r[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	600 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	601
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	602 /* FIXME
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	603 The __mm_comi??_sd and __mm_ucomi??_sd implementations below are
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	604 exactly the same because GCC for PowerPC only generates unordered
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	605 compares (scalar and vector).
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	606 Technically __mm_comieq_sp et all should be using the ordered
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	607 compare and signal for QNaNs. The __mm_ucomieq_sd et all should
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	608 be OK. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	609 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	610 _mm_comieq_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	611 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	612 return (__A[0] == __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	613 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	614
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	615 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	616 _mm_comilt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	617 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	618 return (__A[0] < __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	619 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	620
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	621 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	622 _mm_comile_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	623 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	624 return (__A[0] <= __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	625 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	626
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	627 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	628 _mm_comigt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	629 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	630 return (__A[0] > __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	631 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	632
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	633 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	634 _mm_comige_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	635 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	636 return (__A[0] >= __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	637 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	638
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	639 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	640 _mm_comineq_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	641 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	642 return (__A[0] != __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	643 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	644
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	645 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	646 _mm_ucomieq_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	647 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	648 return (__A[0] == __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	649 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	650
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	651 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	652 _mm_ucomilt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	653 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	654 return (__A[0] < __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	655 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	656
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	657 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	658 _mm_ucomile_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	659 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	660 return (__A[0] <= __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	661 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	662
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	663 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	664 _mm_ucomigt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	665 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	666 return (__A[0] > __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	667 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	668
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	669 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	670 _mm_ucomige_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	671 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	672 return (__A[0] >= __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	673 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	674
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	675 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	676 _mm_ucomineq_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	677 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	678 return (__A[0] != __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	679 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	680
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	681 /* Create a vector of Qi, where i is the element number. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	682 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	683 _mm_set_epi64x (long long __q1, long long __q0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	684 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	685 return __extension__ (__m128i)(__v2di){ __q0, __q1 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	686 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	687
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	688 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	689 _mm_set_epi64 (__m64 __q1, __m64 __q0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	690 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	691 return _mm_set_epi64x ((long long)__q1, (long long)__q0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	692 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	693
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	694 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	695 _mm_set_epi32 (int __q3, int __q2, int __q1, int __q0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	696 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	697 return __extension__ (__m128i)(__v4si){ __q0, __q1, __q2, __q3 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	698 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	699
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	700 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	701 _mm_set_epi16 (short __q7, short __q6, short __q5, short __q4,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	702 short __q3, short __q2, short __q1, short __q0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	703 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	704 return __extension__ (__m128i)(__v8hi){
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	705 __q0, __q1, __q2, __q3, __q4, __q5, __q6, __q7 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	706 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	707
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	708 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	709 _mm_set_epi8 (char __q15, char __q14, char __q13, char __q12,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	710 char __q11, char __q10, char __q09, char __q08,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	711 char __q07, char __q06, char __q05, char __q04,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	712 char __q03, char __q02, char __q01, char __q00)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	713 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	714 return __extension__ (__m128i)(__v16qi){
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	715 __q00, __q01, __q02, __q03, __q04, __q05, __q06, __q07,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	716 __q08, __q09, __q10, __q11, __q12, __q13, __q14, __q15
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	717 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	718 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	719
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	720 /* Set all of the elements of the vector to A. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	721 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	722 _mm_set1_epi64x (long long __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	723 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	724 return _mm_set_epi64x (__A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	725 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	726
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	727 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	728 _mm_set1_epi64 (__m64 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	729 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	730 return _mm_set_epi64 (__A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	731 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	732
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	733 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	734 _mm_set1_epi32 (int __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	735 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	736 return _mm_set_epi32 (__A, __A, __A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	737 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	738
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	739 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	740 _mm_set1_epi16 (short __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	741 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	742 return _mm_set_epi16 (__A, __A, __A, __A, __A, __A, __A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	743 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	744
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	745 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	746 _mm_set1_epi8 (char __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	747 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	748 return _mm_set_epi8 (__A, __A, __A, __A, __A, __A, __A, __A,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	749 __A, __A, __A, __A, __A, __A, __A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	750 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	751
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	752 /* Create a vector of Qi, where i is the element number.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	753 The parameter order is reversed from the _mm_set_epi* functions. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	754 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	755 _mm_setr_epi64 (__m64 __q0, __m64 __q1)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	756 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	757 return _mm_set_epi64 (__q1, __q0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	758 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	759
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	760 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	761 _mm_setr_epi32 (int __q0, int __q1, int __q2, int __q3)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	762 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	763 return _mm_set_epi32 (__q3, __q2, __q1, __q0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	764 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	765
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	766 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	767 _mm_setr_epi16 (short __q0, short __q1, short __q2, short __q3,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	768 short __q4, short __q5, short __q6, short __q7)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	769 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	770 return _mm_set_epi16 (__q7, __q6, __q5, __q4, __q3, __q2, __q1, __q0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	771 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	772
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	773 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	774 _mm_setr_epi8 (char __q00, char __q01, char __q02, char __q03,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	775 char __q04, char __q05, char __q06, char __q07,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	776 char __q08, char __q09, char __q10, char __q11,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	777 char __q12, char __q13, char __q14, char __q15)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	778 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	779 return _mm_set_epi8 (__q15, __q14, __q13, __q12, __q11, __q10, __q09, __q08,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	780 __q07, __q06, __q05, __q04, __q03, __q02, __q01, __q00);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	781 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	782
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	783 /* Create a vector with element 0 as P and the rest zero. /
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	784 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	785 _mm_load_si128 (__m128i const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	786 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	787 return *__P;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	788 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	789
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	790 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	791 _mm_loadu_si128 (__m128i_u const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	792 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	793 return (__m128i) (vec_vsx_ld(0, (signed int const *)__P));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	794 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	795
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	796 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	797 _mm_loadl_epi64 (__m128i_u const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	798 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	799 return _mm_set_epi64 ((__m64)0LL, (__m64 )__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	800 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	801
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	802 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	803 _mm_store_si128 (__m128i *__P, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	804 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	805 assert(((unsigned long )__P & 0xfUL) == 0UL);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	806 vec_st ((__v16qu) __B, 0, (__v16qu*)__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	807 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	808
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	809 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	810 _mm_storeu_si128 (__m128i_u *__P, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	811 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	812 *__P = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	813 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	814
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	815 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	816 _mm_storel_epi64 (__m128i_u *__P, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	817 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	818 (long long )__P = ((__v2di)__B)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	819 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	820
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	821 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	822 _mm_movepi64_pi64 (__m128i_u __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	823 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	824 return (__m64) ((__v2di)__B)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	825 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	826
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	827 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	828 _mm_movpi64_epi64 (__m64 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	829 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	830 return _mm_set_epi64 ((__m64)0LL, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	831 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	832
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	833 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	834 _mm_move_epi64 (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	835 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	836 return _mm_set_epi64 ((__m64)0LL, (__m64)__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	837 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	838
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	839 /* Create an undefined vector. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	840 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	841 _mm_undefined_si128 (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	842 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	843 __m128i __Y = __Y;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	844 return __Y;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	845 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	846
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	847 /* Create a vector of zeros. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	848 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	849 _mm_setzero_si128 (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	850 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	851 return __extension__ (__m128i)(__v4si){ 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	852 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	853
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	854 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	855 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	856 _mm_cvtepi32_pd (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	857 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	858 __v2di val;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	859 /* For LE need to generate Vector Unpack Low Signed Word.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	860 Which is generated from unpackh. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	861 val = (__v2di)vec_unpackh ((__v4si)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	862
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	863 return (__m128d)vec_ctf (val, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	864 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	865 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	866
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	867 extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	868 _mm_cvtepi32_ps (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	869 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	870 return ((__m128)vec_ctf((__v4si)__A, 0));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	871 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	872
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	873 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	874 _mm_cvtpd_epi32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	875 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	876 __v2df rounded = vec_rint (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	877 __v4si result, temp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	878 const __v4si vzero =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	879 { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	880
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	881 /* VSX Vector truncate Double-Precision to integer and Convert to
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	882 Signed Integer Word format with Saturate. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	883 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	884 "xvcvdpsxws %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	885 : "=wa" (temp)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	886 : "wa" (rounded)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	887 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	888
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	889 #ifdef _ARCH_PWR8
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	890 #ifdef __LITTLE_ENDIAN__
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	891 temp = vec_mergeo (temp, temp);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	892 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	893 temp = vec_mergee (temp, temp);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	894 #endif
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	895 result = (__v4si) vec_vpkudum ((__vector long long) temp,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	896 (__vector long long) vzero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	897 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	898 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	899 const __v16qu pkperm = {0x00, 0x01, 0x02, 0x03, 0x08, 0x09, 0x0a, 0x0b,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	900 0x14, 0x15, 0x16, 0x17, 0x1c, 0x1d, 0x1e, 0x1f };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	901 result = (__v4si) vec_perm ((__v16qu) temp, (__v16qu) vzero, pkperm);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	902 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	903 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	904 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	905 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	906
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	907 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	908 _mm_cvtpd_pi32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	909 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	910 __m128i result = _mm_cvtpd_epi32(__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	911
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	912 return (__m64) result[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	913 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	914
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	915 extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	916 _mm_cvtpd_ps (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	917 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	918 __v4sf result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	919 __v4si temp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	920 const __v4si vzero = { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	921
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	922 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	923 "xvcvdpsp %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	924 : "=wa" (temp)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	925 : "wa" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	926 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	927
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	928 #ifdef _ARCH_PWR8
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	929 #ifdef __LITTLE_ENDIAN__
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	930 temp = vec_mergeo (temp, temp);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	931 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	932 temp = vec_mergee (temp, temp);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	933 #endif
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	934 result = (__v4sf) vec_vpkudum ((__vector long long) temp,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	935 (__vector long long) vzero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	936 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	937 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	938 const __v16qu pkperm = {0x00, 0x01, 0x02, 0x03, 0x08, 0x09, 0x0a, 0x0b,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	939 0x14, 0x15, 0x16, 0x17, 0x1c, 0x1d, 0x1e, 0x1f };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	940 result = (__v4sf) vec_perm ((__v16qu) temp, (__v16qu) vzero, pkperm);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	941 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	942 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	943 return ((__m128)result);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	944 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	945
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	946 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	947 _mm_cvttpd_epi32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	948 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	949 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	950 __v4si temp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	951 const __v4si vzero = { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	952
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	953 /* VSX Vector truncate Double-Precision to integer and Convert to
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	954 Signed Integer Word format with Saturate. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	955 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	956 "xvcvdpsxws %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	957 : "=wa" (temp)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	958 : "wa" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	959 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	960
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	961 #ifdef _ARCH_PWR8
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	962 #ifdef __LITTLE_ENDIAN__
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	963 temp = vec_mergeo (temp, temp);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	964 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	965 temp = vec_mergee (temp, temp);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	966 #endif
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	967 result = (__v4si) vec_vpkudum ((__vector long long) temp,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	968 (__vector long long) vzero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	969 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	970 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	971 const __v16qu pkperm = {0x00, 0x01, 0x02, 0x03, 0x08, 0x09, 0x0a, 0x0b,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	972 0x14, 0x15, 0x16, 0x17, 0x1c, 0x1d, 0x1e, 0x1f };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	973 result = (__v4si) vec_perm ((__v16qu) temp, (__v16qu) vzero, pkperm);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	974 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	975 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	976
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	977 return ((__m128i) result);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	978 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	979
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	980 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	981 _mm_cvttpd_pi32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	982 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	983 __m128i result = _mm_cvttpd_epi32 (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	984
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	985 return (__m64) result[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	986 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	987
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	988 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	989 _mm_cvtsi128_si32 (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	990 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	991 return ((__v4si)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	992 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	993
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	994 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	995 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	996 _mm_cvtpi32_pd (__m64 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	997 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	998 __v4si temp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	999 __v2di tmp2;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1000 __v2df result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1001
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1002 temp = (__v4si)vec_splats (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1003 tmp2 = (__v2di)vec_unpackl (temp);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1004 result = vec_ctf ((__vector signed long long) tmp2, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1005 return (__m128d)result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1006 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1007 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1008
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1009 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1010 _mm_cvtps_epi32 (__m128 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1011 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1012 __v4sf rounded;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1013 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1014
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1015 rounded = vec_rint((__v4sf) __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1016 result = vec_cts (rounded, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1017 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1018 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1019
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1020 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1021 _mm_cvttps_epi32 (__m128 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1022 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1023 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1024
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1025 result = vec_cts ((__v4sf) __A, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1026 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1027 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1028
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1029 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1030 _mm_cvtps_pd (__m128 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1031 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1032 /* Check if vec_doubleh is defined by <altivec.h>. If so use that. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1033 #ifdef vec_doubleh
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1034 return (__m128d) vec_doubleh ((__v4sf)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1035 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1036 /* Otherwise the compiler is not current and so need to generate the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1037 equivalent code. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1038 __v4sf a = (__v4sf)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1039 __v4sf temp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1040 __v2df result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1041 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1042 /* The input float values are in elements {[0], [1]} but the convert
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1043 instruction needs them in elements {[1], [3]}, So we use two
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1044 shift left double vector word immediates to get the elements
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1045 lined up. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1046 temp = __builtin_vsx_xxsldwi (a, a, 3);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1047 temp = __builtin_vsx_xxsldwi (a, temp, 2);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1048 #else
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1049 /* The input float values are in elements {[0], [1]} but the convert
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1050 instruction needs them in elements {[0], [2]}, So we use two
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1051 shift left double vector word immediates to get the elements
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1052 lined up. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1053 temp = vec_vmrghw (a, a);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1054 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1055 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1056 " xvcvspdp %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1057 : "=wa" (result)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1058 : "wa" (temp)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1059 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1060 return (__m128d) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1061 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1062 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1063
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1064 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1065 _mm_cvtsd_si32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1066 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1067 __v2df rounded = vec_rint((__v2df) __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1068 int result = ((__v2df)rounded)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1069
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1070 return result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1071 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1072 /* Intel intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1073 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1074 _mm_cvtsd_si64 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1075 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1076 __v2df rounded = vec_rint ((__v2df) __A );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1077 long long result = ((__v2df) rounded)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1078
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1079 return result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1080 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1081
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1082 /* Microsoft intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1083 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1084 _mm_cvtsd_si64x (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1085 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1086 return _mm_cvtsd_si64 ((__v2df)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1087 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1088
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1089 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1090 _mm_cvttsd_si32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1091 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1092 int result = ((__v2df)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1093
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1094 return result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1095 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1096
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1097 /* Intel intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1098 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1099 _mm_cvttsd_si64 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1100 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1101 long long result = ((__v2df)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1102
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1103 return result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1104 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1105
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1106 /* Microsoft intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1107 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1108 _mm_cvttsd_si64x (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1109 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1110 return _mm_cvttsd_si64 (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1111 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1112
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1113 extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1114 _mm_cvtsd_ss (__m128 __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1115 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1116 __v4sf result = (__v4sf)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1117
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1118 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1119 __v4sf temp_s;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1120 /* Copy double element[0] to element [1] for conversion. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1121 __v2df temp_b = vec_splat((__v2df)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1122
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1123 /* Pre-rotate __A left 3 (logically right 1) elements. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1124 result = __builtin_vsx_xxsldwi (result, result, 3);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1125 /* Convert double to single float scalar in a vector. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1126 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1127 "xscvdpsp %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1128 : "=wa" (temp_s)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1129 : "wa" (temp_b)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1130 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1131 /* Shift the resulting scalar into vector element [0]. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1132 result = __builtin_vsx_xxsldwi (result, temp_s, 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1133 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1134 result [0] = ((__v2df)__B)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1135 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1136 return (__m128) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1137 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1138
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1139 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1140 _mm_cvtsi32_sd (__m128d __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1141 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1142 __v2df result = (__v2df)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1143 double db = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1144 result [0] = db;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1145 return (__m128d)result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1146 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1147
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1148 /* Intel intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1149 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1150 _mm_cvtsi64_sd (__m128d __A, long long __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1151 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1152 __v2df result = (__v2df)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1153 double db = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1154 result [0] = db;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1155 return (__m128d)result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1156 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1157
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1158 /* Microsoft intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1159 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1160 _mm_cvtsi64x_sd (__m128d __A, long long __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1161 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1162 return _mm_cvtsi64_sd (__A, __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1163 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1164
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1165 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1166 _mm_cvtss_sd (__m128d __A, __m128 __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1167 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1168 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1169 /* Use splat to move element [0] into position for the convert. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1170 __v4sf temp = vec_splat ((__v4sf)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1171 __v2df res;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1172 /* Convert single float scalar to double in a vector. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1173 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1174 "xscvspdp %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1175 : "=wa" (res)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1176 : "wa" (temp)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1177 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1178 return (__m128d) vec_mergel (res, (__v2df)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1179 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1180 __v2df res = (__v2df)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1181 res [0] = ((__v4sf)__B) [0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1182 return (__m128d) res;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1183 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1184 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1185
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1186 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1187 _mm_shuffle_pd(__m128d __A, __m128d __B, const int __mask)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1188 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1189 __vector double result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1190 const int litmsk = __mask & 0x3;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1191
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1192 if (litmsk == 0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1193 result = vec_mergeh (__A, __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1194 #if __GNUC__ < 6
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1195 else if (litmsk == 1)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1196 result = vec_xxpermdi (__B, __A, 2);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1197 else if (litmsk == 2)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1198 result = vec_xxpermdi (__B, __A, 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1199 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1200 else if (litmsk == 1)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1201 result = vec_xxpermdi (__A, __B, 2);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1202 else if (litmsk == 2)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1203 result = vec_xxpermdi (__A, __B, 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1204 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1205 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1206 result = vec_mergel (__A, __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1207
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1208 return result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1209 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1210
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1211 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1212 _mm_unpackhi_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1213 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1214 return (__m128d) vec_mergel ((__v2df)__A, (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1215 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1216
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1217 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1218 _mm_unpacklo_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1219 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1220 return (__m128d) vec_mergeh ((__v2df)__A, (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1221 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1222
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1223 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1224 _mm_loadh_pd (__m128d __A, double const *__B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1225 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1226 __v2df result = (__v2df)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1227 result [1] = *__B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1228 return (__m128d)result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1229 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1230
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1231 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1232 _mm_loadl_pd (__m128d __A, double const *__B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1233 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1234 __v2df result = (__v2df)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1235 result [0] = *__B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1236 return (__m128d)result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1237 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1238
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1239 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1240 /* Intrinsic functions that require PowerISA 2.07 minimum. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1241
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1242 /* Creates a 2-bit mask from the most significant bits of the DPFP values. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1243 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1244 _mm_movemask_pd (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1245 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1246 __vector unsigned long long result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1247 static const __vector unsigned int perm_mask =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1248 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1249 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1250 0x80800040, 0x80808080, 0x80808080, 0x80808080
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1251 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1252 0x80808080, 0x80808080, 0x80808080, 0x80804000
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1253 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1254 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1255
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1256 result = ((__vector unsigned long long)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1257 vec_vbpermq ((__vector unsigned char) __A,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1258 (__vector unsigned char) perm_mask));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1259
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1260 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1261 return result[1];
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1262 #else
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1263 return result[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1264 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1265 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1266 #endif /* _ARCH_PWR8 */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1267
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1268 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1269 _mm_packs_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1270 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1271 return (__m128i) vec_packs ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1272 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1273
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1274 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1275 _mm_packs_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1276 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1277 return (__m128i) vec_packs ((__v4si)__A, (__v4si)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1278 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1279
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1280 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1281 _mm_packus_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1282 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1283 return (__m128i) vec_packsu ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1284 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1285
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1286 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1287 _mm_unpackhi_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1288 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1289 return (__m128i) vec_mergel ((__v16qu)__A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1290 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1291
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1292 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1293 _mm_unpackhi_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1294 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1295 return (__m128i) vec_mergel ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1296 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1297
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1298 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1299 _mm_unpackhi_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1300 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1301 return (__m128i) vec_mergel ((__v4su)__A, (__v4su)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1302 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1303
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1304 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1305 _mm_unpackhi_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1306 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1307 return (__m128i) vec_mergel ((__vector long long) __A,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1308 (__vector long long) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1309 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1310
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1311 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1312 _mm_unpacklo_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1313 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1314 return (__m128i) vec_mergeh ((__v16qu)__A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1315 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1316
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1317 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1318 _mm_unpacklo_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1319 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1320 return (__m128i) vec_mergeh ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1321 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1322
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1323 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1324 _mm_unpacklo_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1325 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1326 return (__m128i) vec_mergeh ((__v4si)__A, (__v4si)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1327 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1328
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1329 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1330 _mm_unpacklo_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1331 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1332 return (__m128i) vec_mergeh ((__vector long long) __A,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1333 (__vector long long) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1334 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1335
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1336 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1337 _mm_add_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1338 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1339 return (__m128i) ((__v16qu)__A + (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1340 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1341
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1342 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1343 _mm_add_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1344 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1345 return (__m128i) ((__v8hu)__A + (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1346 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1347
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1348 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1349 _mm_add_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1350 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1351 return (__m128i) ((__v4su)__A + (__v4su)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1352 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1353
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1354 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1355 _mm_add_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1356 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1357 return (__m128i) ((__v2du)__A + (__v2du)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1358 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1359
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1360 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1361 _mm_adds_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1362 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1363 return (__m128i) vec_adds ((__v16qi)__A, (__v16qi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1364 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1365
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1366 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1367 _mm_adds_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1368 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1369 return (__m128i) vec_adds ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1370 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1371
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1372 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1373 _mm_adds_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1374 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1375 return (__m128i) vec_adds ((__v16qu)__A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1376 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1377
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1378 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1379 _mm_adds_epu16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1380 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1381 return (__m128i) vec_adds ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1382 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1383
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1384 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1385 _mm_sub_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1386 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1387 return (__m128i) ((__v16qu)__A - (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1388 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1389
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1390 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1391 _mm_sub_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1392 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1393 return (__m128i) ((__v8hu)__A - (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1394 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1395
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1396 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1397 _mm_sub_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1398 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1399 return (__m128i) ((__v4su)__A - (__v4su)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1400 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1401
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1402 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1403 _mm_sub_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1404 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1405 return (__m128i) ((__v2du)__A - (__v2du)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1406 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1407
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1408 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1409 _mm_subs_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1410 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1411 return (__m128i) vec_subs ((__v16qi)__A, (__v16qi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1412 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1413
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1414 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1415 _mm_subs_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1416 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1417 return (__m128i) vec_subs ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1418 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1419
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1420 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1421 _mm_subs_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1422 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1423 return (__m128i) vec_subs ((__v16qu)__A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1424 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1425
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1426 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1427 _mm_subs_epu16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1428 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1429 return (__m128i) vec_subs ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1430 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1431
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1432 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1433 _mm_madd_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1434 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1435 __vector signed int zero = {0, 0, 0, 0};
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1436
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1437 return (__m128i) vec_vmsumshm ((__v8hi)__A, (__v8hi)__B, zero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1438 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1439
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1440 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1441 _mm_mulhi_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1442 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1443 __vector signed int w0, w1;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1444
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1445 __vector unsigned char xform1 = {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1446 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1447 0x02, 0x03, 0x12, 0x13, 0x06, 0x07, 0x16, 0x17,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1448 0x0A, 0x0B, 0x1A, 0x1B, 0x0E, 0x0F, 0x1E, 0x1F
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1449 #else
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1450 0x00, 0x01, 0x10, 0x11, 0x04, 0x05, 0x14, 0x15,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1451 0x08, 0x09, 0x18, 0x19, 0x0C, 0x0D, 0x1C, 0x1D
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1452 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1453 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1454
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1455 w0 = vec_vmulesh ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1456 w1 = vec_vmulosh ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1457 return (__m128i) vec_perm (w0, w1, xform1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1458 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1459
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1460 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1461 _mm_mullo_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1462 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1463 return (__m128i) ((__v8hi)__A * (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1464 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1465
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1466 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1467 _mm_mul_su32 (__m64 __A, __m64 __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1468 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1469 unsigned int a = __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1470 unsigned int b = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1471
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1472 return ((__m64)a * (__m64)b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1473 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1474
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1475 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1476 _mm_mul_epu32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1477 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1478 #if __GNUC__ < 8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1479 __v2du result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1480
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1481 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1482 /* VMX Vector Multiply Odd Unsigned Word. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1483 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1484 "vmulouw %0,%1,%2"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1485 : "=v" (result)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1486 : "v" (__A), "v" (__B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1487 : );
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1488 #else
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1489 /* VMX Vector Multiply Even Unsigned Word. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1490 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1491 "vmuleuw %0,%1,%2"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1492 : "=v" (result)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1493 : "v" (__A), "v" (__B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1494 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1495 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1496 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1497 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1498 return (__m128i) vec_mule ((__v4su)__A, (__v4su)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1499 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1500 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1501
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1502 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1503 _mm_slli_epi16 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1504 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1505 __v8hu lshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1506 __v8hi result = { 0, 0, 0, 0, 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1507
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1508 if (__B >= 0 && __B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1509 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1510 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1511 lshift = (__v8hu) vec_splat_s16(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1512 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1513 lshift = vec_splats ((unsigned short) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1514
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1515 result = vec_sl ((__v8hi) __A, lshift);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1516 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1517
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1518 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1519 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1520
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1521 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1522 _mm_slli_epi32 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1523 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1524 __v4su lshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1525 __v4si result = { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1526
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1527 if (__B >= 0 && __B < 32)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1528 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1529 if (__builtin_constant_p(__B) && __B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1530 lshift = (__v4su) vec_splat_s32(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1531 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1532 lshift = vec_splats ((unsigned int) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1533
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1534 result = vec_sl ((__v4si) __A, lshift);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1535 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1536
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1537 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1538 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1539
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1540 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1541 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1542 _mm_slli_epi64 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1543 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1544 __v2du lshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1545 __v2di result = { 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1546
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1547 if (__B >= 0 && __B < 64)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1548 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1549 if (__builtin_constant_p(__B) && __B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1550 lshift = (__v2du) vec_splat_s32(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1551 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1552 lshift = (__v2du) vec_splats ((unsigned int) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1553
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1554 result = vec_sl ((__v2di) __A, lshift);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1555 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1556
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1557 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1558 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1559 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1560
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1561 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1562 _mm_srai_epi16 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1563 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1564 __v8hu rshift = { 15, 15, 15, 15, 15, 15, 15, 15 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1565 __v8hi result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1566
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1567 if (__B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1568 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1569 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1570 rshift = (__v8hu) vec_splat_s16(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1571 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1572 rshift = vec_splats ((unsigned short) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1573 }
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1574 result = vec_sra ((__v8hi) __A, rshift);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1575
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1576 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1577 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1578
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1579 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1580 _mm_srai_epi32 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1581 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1582 __v4su rshift = { 31, 31, 31, 31 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1583 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1584
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1585 if (__B < 32)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1586 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1587 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1588 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1589 if (__B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1590 rshift = (__v4su) vec_splat_s32(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1591 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1592 rshift = (__v4su) vec_splats((unsigned int)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1593 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1594 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1595 rshift = vec_splats ((unsigned int) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1596 }
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1597 result = vec_sra ((__v4si) __A, rshift);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1598
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1599 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1600 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1601
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1602 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1603 _mm_bslli_si128 (__m128i __A, const int __N)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1604 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1605 __v16qu result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1606 const __v16qu zeros = { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1607
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1608 if (__N < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1609 result = vec_sld ((__v16qu) __A, zeros, __N);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1610 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1611 result = zeros;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1612
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1613 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1614 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1615
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1616 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1617 _mm_bsrli_si128 (__m128i __A, const int __N)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1618 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1619 __v16qu result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1620 const __v16qu zeros = { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1621
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1622 if (__N < 16)
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1623 #ifdef __LITTLE_ENDIAN__
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1624 if (__builtin_constant_p(__N))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1625 /* Would like to use Vector Shift Left Double by Octet
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1626 Immediate here to use the immediate form and avoid
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1627 load of __N * 8 value into a separate VR. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1628 result = vec_sld (zeros, (__v16qu) __A, (16 - __N));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1629 else
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1630 #endif
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1631 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1632 __v16qu shift = vec_splats((unsigned char)(__N*8));
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1633 #ifdef __LITTLE_ENDIAN__
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1634 result = vec_sro ((__v16qu)__A, shift);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1635 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1636 result = vec_slo ((__v16qu)__A, shift);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1637 #endif
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1638 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1639 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1640 result = zeros;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1641
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1642 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1643 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1644
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1645 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1646 _mm_srli_si128 (__m128i __A, const int __N)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1647 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1648 return _mm_bsrli_si128 (__A, __N);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1649 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1650
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1651 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1652 _mm_slli_si128 (__m128i __A, const int _imm5)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1653 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1654 __v16qu result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1655 const __v16qu zeros = { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1656
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1657 if (_imm5 < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1658 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1659 result = vec_sld ((__v16qu) __A, zeros, _imm5);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1660 #else
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1661 result = vec_sld (zeros, (__v16qu) __A, (16 - _imm5));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1662 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1663 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1664 result = zeros;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1665
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1666 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1667 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1668
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1669 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1670
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1671 _mm_srli_epi16 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1672 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1673 __v8hu rshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1674 __v8hi result = { 0, 0, 0, 0, 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1675
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1676 if (__B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1677 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1678 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1679 rshift = (__v8hu) vec_splat_s16(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1680 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1681 rshift = vec_splats ((unsigned short) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1682
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1683 result = vec_sr ((__v8hi) __A, rshift);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1684 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1685
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1686 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1687 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1688
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1689 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1690 _mm_srli_epi32 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1691 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1692 __v4su rshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1693 __v4si result = { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1694
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1695 if (__B < 32)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1696 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1697 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1698 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1699 if (__B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1700 rshift = (__v4su) vec_splat_s32(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1701 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1702 rshift = (__v4su) vec_splats((unsigned int)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1703 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1704 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1705 rshift = vec_splats ((unsigned int) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1706
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1707 result = vec_sr ((__v4si) __A, rshift);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1708 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1709
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1710 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1711 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1712
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1713 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1714 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1715 _mm_srli_epi64 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1716 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1717 __v2du rshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1718 __v2di result = { 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1719
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1720 if (__B < 64)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1721 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1722 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1723 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1724 if (__B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1725 rshift = (__v2du) vec_splat_s32(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1726 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1727 rshift = (__v2du) vec_splats((unsigned long long)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1728 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1729 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1730 rshift = (__v2du) vec_splats ((unsigned int) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1731
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1732 result = vec_sr ((__v2di) __A, rshift);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1733 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1734
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1735 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1736 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1737 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1738
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1739 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1740 _mm_sll_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1741 {
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1742 __v8hu lshift;
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1743 __vector __bool short shmask;
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1744 const __v8hu shmax = { 15, 15, 15, 15, 15, 15, 15, 15 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1745 __v8hu result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1746
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1747 #ifdef __LITTLE_ENDIAN__
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1748 lshift = vec_splat ((__v8hu) __B, 0);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1749 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1750 lshift = vec_splat ((__v8hu) __B, 3);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1751 #endif
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1752 shmask = vec_cmple (lshift, shmax);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1753 result = vec_sl ((__v8hu) __A, lshift);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1754 result = vec_sel ((__v8hu) shmask, result, shmask);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1755
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1756 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1757 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1758
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1759 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1760 _mm_sll_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1761 {
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1762 __v4su lshift;
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1763 __vector __bool int shmask;
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1764 const __v4su shmax = { 32, 32, 32, 32 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1765 __v4su result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1766 #ifdef __LITTLE_ENDIAN__
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1767 lshift = vec_splat ((__v4su) __B, 0);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1768 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1769 lshift = vec_splat ((__v4su) __B, 1);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1770 #endif
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1771 shmask = vec_cmplt (lshift, shmax);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1772 result = vec_sl ((__v4su) __A, lshift);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1773 result = vec_sel ((__v4su) shmask, result, shmask);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1774
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1775 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1776 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1777
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1778 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1779 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1780 _mm_sll_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1781 {
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1782 __v2du lshift;
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1783 __vector __bool long long shmask;
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1784 const __v2du shmax = { 64, 64 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1785 __v2du result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1786
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1787 lshift = vec_splat ((__v2du) __B, 0);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1788 shmask = vec_cmplt (lshift, shmax);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1789 result = vec_sl ((__v2du) __A, lshift);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1790 result = vec_sel ((__v2du) shmask, result, shmask);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1791
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1792 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1793 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1794 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1795
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1796 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1797 _mm_sra_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1798 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1799 const __v8hu rshmax = { 15, 15, 15, 15, 15, 15, 15, 15 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1800 __v8hu rshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1801 __v8hi result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1802
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1803 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1804 rshift = vec_splat ((__v8hu)__B, 0);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1805 #else
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1806 rshift = vec_splat ((__v8hu)__B, 3);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1807 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1808 rshift = vec_min (rshift, rshmax);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1809 result = vec_sra ((__v8hi) __A, rshift);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1810
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1811 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1812 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1813
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1814 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1815 _mm_sra_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1816 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1817 const __v4su rshmax = { 31, 31, 31, 31 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1818 __v4su rshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1819 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1820
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1821 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1822 rshift = vec_splat ((__v4su)__B, 0);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1823 #else
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1824 rshift = vec_splat ((__v4su)__B, 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1825 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1826 rshift = vec_min (rshift, rshmax);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1827 result = vec_sra ((__v4si) __A, rshift);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1828
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1829 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1830 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1831
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1832 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1833 _mm_srl_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1834 {
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1835 __v8hu rshift;
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1836 __vector __bool short shmask;
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1837 const __v8hu shmax = { 15, 15, 15, 15, 15, 15, 15, 15 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1838 __v8hu result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1839
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1840 #ifdef __LITTLE_ENDIAN__
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1841 rshift = vec_splat ((__v8hu) __B, 0);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1842 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1843 rshift = vec_splat ((__v8hu) __B, 3);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1844 #endif
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1845 shmask = vec_cmple (rshift, shmax);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1846 result = vec_sr ((__v8hu) __A, rshift);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1847 result = vec_sel ((__v8hu) shmask, result, shmask);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1848
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1849 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1850 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1851
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1852 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1853 _mm_srl_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1854 {
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1855 __v4su rshift;
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1856 __vector __bool int shmask;
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1857 const __v4su shmax = { 32, 32, 32, 32 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1858 __v4su result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1859
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1860 #ifdef __LITTLE_ENDIAN__
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1861 rshift = vec_splat ((__v4su) __B, 0);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1862 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1863 rshift = vec_splat ((__v4su) __B, 1);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1864 #endif
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1865 shmask = vec_cmplt (rshift, shmax);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1866 result = vec_sr ((__v4su) __A, rshift);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1867 result = vec_sel ((__v4su) shmask, result, shmask);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1868
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1869 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1870 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1871
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1872 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1873 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1874 _mm_srl_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1875 {
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1876 __v2du rshift;
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1877 __vector __bool long long shmask;
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1878 const __v2du shmax = { 64, 64 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1879 __v2du result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1880
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1881 rshift = vec_splat ((__v2du) __B, 0);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1882 shmask = vec_cmplt (rshift, shmax);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1883 result = vec_sr ((__v2du) __A, rshift);
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	1884 result = vec_sel ((__v2du) shmask, result, shmask);
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1885
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1886 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1887 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1888 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1889
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1890 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1891 _mm_and_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1892 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1893 return (vec_and ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1894 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1895
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1896 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1897 _mm_andnot_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1898 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1899 return (vec_andc ((__v2df) __B, (__v2df) __A));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1900 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1901
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1902 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1903 _mm_or_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1904 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1905 return (vec_or ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1906 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1907
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1908 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1909 _mm_xor_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1910 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1911 return (vec_xor ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1912 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1913
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1914 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1915 _mm_and_si128 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1916 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1917 return (__m128i)vec_and ((__v2di) __A, (__v2di) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1918 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1919
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1920 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1921 _mm_andnot_si128 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1922 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1923 return (__m128i)vec_andc ((__v2di) __B, (__v2di) __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1924 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1925
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1926 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1927 _mm_or_si128 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1928 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1929 return (__m128i)vec_or ((__v2di) __A, (__v2di) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1930 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1931
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1932 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1933 _mm_xor_si128 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1934 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1935 return (__m128i)vec_xor ((__v2di) __A, (__v2di) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1936 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1937
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1938 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1939 _mm_cmpeq_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1940 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1941 return (__m128i) vec_cmpeq ((__v16qi) __A, (__v16qi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1942 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1943
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1944 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1945 _mm_cmpeq_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1946 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1947 return (__m128i) vec_cmpeq ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1948 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1949
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1950 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1951 _mm_cmpeq_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1952 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1953 return (__m128i) vec_cmpeq ((__v4si) __A, (__v4si)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1954 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1955
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1956 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1957 _mm_cmplt_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1958 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1959 return (__m128i) vec_cmplt ((__v16qi) __A, (__v16qi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1960 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1961
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1962 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1963 _mm_cmplt_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1964 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1965 return (__m128i) vec_cmplt ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1966 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1967
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1968 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1969 _mm_cmplt_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1970 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1971 return (__m128i) vec_cmplt ((__v4si) __A, (__v4si)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1972 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1973
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1974 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1975 _mm_cmpgt_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1976 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1977 return (__m128i) vec_cmpgt ((__v16qi) __A, (__v16qi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1978 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1979
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1980 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1981 _mm_cmpgt_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1982 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1983 return (__m128i) vec_cmpgt ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1984 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1985
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1986 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1987 _mm_cmpgt_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1988 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1989 return (__m128i) vec_cmpgt ((__v4si) __A, (__v4si)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1990 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1991
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1992 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1993 _mm_extract_epi16 (__m128i const __A, int const __N)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1994 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1995 return (unsigned short) ((__v8hi)__A)[__N & 7];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1996 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1997
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1998 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1999 _mm_insert_epi16 (__m128i const __A, int const __D, int const __N)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2000 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2001 __v8hi result = (__v8hi)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2002
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2003 result [(__N & 7)] = __D;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2004
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2005 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2006 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2007
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2008 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2009 _mm_max_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2010 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2011 return (__m128i) vec_max ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2012 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2013
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2014 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2015 _mm_max_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2016 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2017 return (__m128i) vec_max ((__v16qu) __A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2018 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2019
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2020 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2021 _mm_min_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2022 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2023 return (__m128i) vec_min ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2024 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2025
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2026 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2027 _mm_min_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2028 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2029 return (__m128i) vec_min ((__v16qu) __A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2030 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2031
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2032
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2033 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2034 /* Intrinsic functions that require PowerISA 2.07 minimum. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2035
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2036 /* Creates a 4-bit mask from the most significant bits of the SPFP values. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2037 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2038 _mm_movemask_epi8 (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2039 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2040 __vector unsigned long long result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2041 static const __vector unsigned char perm_mask =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2042 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2043 0x78, 0x70, 0x68, 0x60, 0x58, 0x50, 0x48, 0x40,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2044 0x38, 0x30, 0x28, 0x20, 0x18, 0x10, 0x08, 0x00
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2045 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2046
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2047 result = ((__vector unsigned long long)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2048 vec_vbpermq ((__vector unsigned char) __A,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2049 (__vector unsigned char) perm_mask));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2050
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2051 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2052 return result[1];
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2053 #else
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2054 return result[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2055 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2056 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2057 #endif /* _ARCH_PWR8 */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2058
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2059 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2060 _mm_mulhi_epu16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2061 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2062 __v4su w0, w1;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2063 __v16qu xform1 = {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2064 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2065 0x02, 0x03, 0x12, 0x13, 0x06, 0x07, 0x16, 0x17,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2066 0x0A, 0x0B, 0x1A, 0x1B, 0x0E, 0x0F, 0x1E, 0x1F
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2067 #else
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2068 0x00, 0x01, 0x10, 0x11, 0x04, 0x05, 0x14, 0x15,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2069 0x08, 0x09, 0x18, 0x19, 0x0C, 0x0D, 0x1C, 0x1D
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2070 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2071 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2072
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2073 w0 = vec_vmuleuh ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2074 w1 = vec_vmulouh ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2075 return (__m128i) vec_perm (w0, w1, xform1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2076 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2077
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2078 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2079 _mm_shufflehi_epi16 (__m128i __A, const int __mask)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2080 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2081 unsigned long element_selector_98 = __mask & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2082 unsigned long element_selector_BA = (__mask >> 2) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2083 unsigned long element_selector_DC = (__mask >> 4) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2084 unsigned long element_selector_FE = (__mask >> 6) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2085 static const unsigned short permute_selectors[4] =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2086 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2087 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2088 0x0908, 0x0B0A, 0x0D0C, 0x0F0E
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2089 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2090 0x0809, 0x0A0B, 0x0C0D, 0x0E0F
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2091 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2092 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2093 __v2du pmask =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2094 #ifdef __LITTLE_ENDIAN__
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2095 { 0x1716151413121110UL, 0UL};
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2096 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2097 { 0x1011121314151617UL, 0UL};
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2098 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2099 __m64_union t;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2100 __v2du a, r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2101
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2102 t.as_short[0] = permute_selectors[element_selector_98];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2103 t.as_short[1] = permute_selectors[element_selector_BA];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2104 t.as_short[2] = permute_selectors[element_selector_DC];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2105 t.as_short[3] = permute_selectors[element_selector_FE];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2106 pmask[1] = t.as_m64;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2107 a = (__v2du)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2108 r = vec_perm (a, a, (__vector unsigned char)pmask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2109 return (__m128i) r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2110 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2111
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2112 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2113 _mm_shufflelo_epi16 (__m128i __A, const int __mask)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2114 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2115 unsigned long element_selector_10 = __mask & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2116 unsigned long element_selector_32 = (__mask >> 2) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2117 unsigned long element_selector_54 = (__mask >> 4) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2118 unsigned long element_selector_76 = (__mask >> 6) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2119 static const unsigned short permute_selectors[4] =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2120 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2121 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2122 0x0100, 0x0302, 0x0504, 0x0706
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2123 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2124 0x0001, 0x0203, 0x0405, 0x0607
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2125 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2126 };
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2127 __v2du pmask =
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2128 #ifdef __LITTLE_ENDIAN__
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2129 { 0UL, 0x1f1e1d1c1b1a1918UL};
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2130 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2131 { 0UL, 0x18191a1b1c1d1e1fUL};
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2132 #endif
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2133 __m64_union t;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2134 __v2du a, r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2135 t.as_short[0] = permute_selectors[element_selector_10];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2136 t.as_short[1] = permute_selectors[element_selector_32];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2137 t.as_short[2] = permute_selectors[element_selector_54];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2138 t.as_short[3] = permute_selectors[element_selector_76];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2139 pmask[0] = t.as_m64;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2140 a = (__v2du)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2141 r = vec_perm (a, a, (__vector unsigned char)pmask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2142 return (__m128i) r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2143 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2144
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2145 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2146 _mm_shuffle_epi32 (__m128i __A, const int __mask)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2147 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2148 unsigned long element_selector_10 = __mask & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2149 unsigned long element_selector_32 = (__mask >> 2) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2150 unsigned long element_selector_54 = (__mask >> 4) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2151 unsigned long element_selector_76 = (__mask >> 6) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2152 static const unsigned int permute_selectors[4] =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2153 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2154 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2155 0x03020100, 0x07060504, 0x0B0A0908, 0x0F0E0D0C
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2156 #else
1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2157 0x00010203, 0x04050607, 0x08090A0B, 0x0C0D0E0F
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2158 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2159 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2160 __v4su t;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2161
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2162 t[0] = permute_selectors[element_selector_10];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2163 t[1] = permute_selectors[element_selector_32];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2164 t[2] = permute_selectors[element_selector_54] + 0x10101010;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2165 t[3] = permute_selectors[element_selector_76] + 0x10101010;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2166 return (__m128i)vec_perm ((__v4si) __A, (__v4si)__A, (__vector unsigned char)t);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2167 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2168
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2169 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2170 _mm_maskmoveu_si128 (__m128i __A, __m128i __B, char *__C)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2171 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2172 __v2du hibit = { 0x7f7f7f7f7f7f7f7fUL, 0x7f7f7f7f7f7f7f7fUL};
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2173 __v16qu mask, tmp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2174 __m128i_u p = (__m128i_u)__C;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2175
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2176 tmp = (__v16qu)_mm_loadu_si128(p);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2177 mask = (__v16qu)vec_cmpgt ((__v16qu)__B, (__v16qu)hibit);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2178 tmp = vec_sel (tmp, (__v16qu)__A, mask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2179 _mm_storeu_si128 (p, (__m128i)tmp);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2180 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2181
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2182 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2183 _mm_avg_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2184 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2185 return (__m128i) vec_avg ((__v16qu)__A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2186 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2187
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2188 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2189 _mm_avg_epu16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2190 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2191 return (__m128i) vec_avg ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2192 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2193
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2194
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2195 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2196 _mm_sad_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2197 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2198 __v16qu a, b;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2199 __v16qu vmin, vmax, vabsdiff;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2200 __v4si vsum;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2201 const __v4su zero = { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2202 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2203
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2204 a = (__v16qu) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2205 b = (__v16qu) __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2206 vmin = vec_min (a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2207 vmax = vec_max (a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2208 vabsdiff = vec_sub (vmax, vmin);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2209 /* Sum four groups of bytes into integers. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2210 vsum = (__vector signed int) vec_sum4s (vabsdiff, zero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2211 /* Sum across four integers with two integer results. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2212 result = vec_sum2s (vsum, (__vector signed int) zero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2213 /* Rotate the sums into the correct position. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2214 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2215 result = vec_sld (result, result, 4);
145 1830386684a0 gcc-9.2.0 anatofuz parents: 131 diff changeset	2216 #else
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2217 result = vec_sld (result, result, 6);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2218 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2219 /* Rotate the sums into the correct position. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2220 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2221 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2222
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2223 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2224 _mm_stream_si32 (int *__A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2225 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2226 /* Use the data cache block touch for store transient. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2227 __asm__ (
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2228 "dcbtstt 0,%0"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2229 :
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2230 : "b" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2231 : "memory"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2232 );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2233 *__A = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2234 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2235
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2236 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2237 _mm_stream_si64 (long long int *__A, long long int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2238 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2239 /* Use the data cache block touch for store transient. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2240 __asm__ (
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2241 " dcbtstt 0,%0"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2242 :
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2243 : "b" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2244 : "memory"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2245 );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2246 *__A = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2247 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2248
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2249 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2250 _mm_stream_si128 (__m128i *__A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2251 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2252 /* Use the data cache block touch for store transient. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2253 __asm__ (
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2254 "dcbtstt 0,%0"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2255 :
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2256 : "b" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2257 : "memory"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2258 );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2259 *__A = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2260 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2261
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2262 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2263 _mm_stream_pd (double *__A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2264 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2265 /* Use the data cache block touch for store transient. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2266 __asm__ (
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2267 "dcbtstt 0,%0"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2268 :
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2269 : "b" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2270 : "memory"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2271 );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2272 (__m128d)__A = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2273 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2274
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2275 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2276 _mm_clflush (void const *__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2277 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2278 /* Use the data cache block flush. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2279 __asm__ (
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2280 "dcbf 0,%0"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2281 :
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2282 : "b" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2283 : "memory"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2284 );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2285 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2286
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2287 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2288 _mm_lfence (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2289 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2290 /* Use light weight sync for load to load ordering. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2291 __atomic_thread_fence (__ATOMIC_RELEASE);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2292 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2293
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2294 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2295 _mm_mfence (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2296 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2297 /* Use heavy weight sync for any to any ordering. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2298 __atomic_thread_fence (__ATOMIC_SEQ_CST);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2299 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2300
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2301 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2302 _mm_cvtsi32_si128 (int __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2303 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2304 return _mm_set_epi32 (0, 0, 0, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2305 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2306
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2307 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2308 _mm_cvtsi64_si128 (long long __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2309 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2310 return __extension__ (__m128i)(__v2di){ __A, 0LL };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2311 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2312
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2313 /* Microsoft intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2314 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2315 _mm_cvtsi64x_si128 (long long __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2316 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2317 return __extension__ (__m128i)(__v2di){ __A, 0LL };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2318 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2319
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2320 /* Casts between various SP, DP, INT vector types. Note that these do no
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2321 conversion of values, they just change the type. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2322 extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2323 _mm_castpd_ps(__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2324 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2325 return (__m128) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2326 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2327
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2328 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2329 _mm_castpd_si128(__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2330 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2331 return (__m128i) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2332 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2333
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2334 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2335 _mm_castps_pd(__m128 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2336 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2337 return (__m128d) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2338 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2339
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2340 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2341 _mm_castps_si128(__m128 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2342 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2343 return (__m128i) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2344 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2345
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2346 extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2347 _mm_castsi128_ps(__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2348 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2349 return (__m128) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2350 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2351
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2352 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2353 _mm_castsi128_pd(__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2354 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2355 return (__m128d) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2356 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2357
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2358 #endif /* EMMINTRIN_H_ */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2359

Mercurial > hg > CbC > CbC_gcc

annotate gcc/config/rs6000/emmintrin.h @ 145:1830386684a0