CbC/CbC_gcc: gcc/config/rs6000/emmintrin.h annotate

annotate gcc/config/rs6000/emmintrin.h @ 132:d34655255c78

update gcc-8.2

author	mir3636
date	Thu, 25 Oct 2018 10:21:07 +0900
parents	84e7813d76e9
children	1830386684a0

rev	line source
131 84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1 /* Copyright (C) 2003-2018 Free Software Foundation, Inc.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	3 This file is part of GCC.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	4
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	5 GCC is free software; you can redistribute it and/or modify
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	6 it under the terms of the GNU General Public License as published by
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	7 the Free Software Foundation; either version 3, or (at your option)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	8 any later version.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	9
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	10 GCC is distributed in the hope that it will be useful,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	11 but WITHOUT ANY WARRANTY; without even the implied warranty of
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	12 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	13 GNU General Public License for more details.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	14
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	15 Under Section 7 of GPL version 3, you are granted additional
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	16 permissions described in the GCC Runtime Library Exception, version
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	17 3.1, as published by the Free Software Foundation.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	18
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	19 You should have received a copy of the GNU General Public License and
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	20 a copy of the GCC Runtime Library Exception along with this program;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	21 see the files COPYING3 and COPYING.RUNTIME respectively. If not, see
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	22 <http://www.gnu.org/licenses/>. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	23
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	24 /* Implemented from the specification included in the Intel C++ Compiler
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	25 User Guide and Reference, version 9.0. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	26
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	27 #ifndef NO_WARN_X86_INTRINSICS
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	28 /* This header is distributed to simplify porting x86_64 code that
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	29 makes explicit use of Intel intrinsics to powerpc64le.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	30 It is the user's responsibility to determine if the results are
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	31 acceptable and make additional changes as necessary.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	32 Note that much code that uses Intel intrinsics can be rewritten in
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	33 standard C or GNU C extensions, which are more portable and better
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	34 optimized across multiple targets.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	35
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	36 In the specific case of X86 SSE2 (__m128i, __m128d) intrinsics,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	37 the PowerPC VMX/VSX ISA is a good match for vector double SIMD
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	38 operations. However scalar double operations in vector (XMM)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	39 registers require the POWER8 VSX ISA (2.07) level. Also there are
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	40 important differences for data format and placement of double
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	41 scalars in the vector register.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	42
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	43 For PowerISA Scalar double is in FPRs (left most 64-bits of the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	44 low 32 VSRs), while X86_64 SSE2 uses the right most 64-bits of
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	45 the XMM. These differences require extra steps on POWER to match
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	46 the SSE2 scalar double semantics.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	47
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	48 Most SSE2 scalar double intrinsic operations can be performed more
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	49 efficiently as C language double scalar operations or optimized to
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	50 use vector SIMD operations. We recommend this for new applications.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	51
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	52 Another difference is the format and details of the X86_64 MXSCR vs
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	53 the PowerISA FPSCR / VSCR registers. We recommend applications
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	54 replace direct access to the MXSCR with the more portable <fenv.h>
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	55 Posix APIs. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	56 #error "Please read comment above. Use -DNO_WARN_X86_INTRINSICS to disable this error."
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	57 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	58
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	59 #ifndef EMMINTRIN_H_
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	60 #define EMMINTRIN_H_
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	61
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	62 #include <altivec.h>
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	63 #include <assert.h>
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	64
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	65 /* We need definitions from the SSE header files. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	66 #include <xmmintrin.h>
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	67
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	68 /* SSE2 */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	69 typedef __vector double __v2df;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	70 typedef __vector long long __v2di;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	71 typedef __vector unsigned long long __v2du;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	72 typedef __vector int __v4si;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	73 typedef __vector unsigned int __v4su;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	74 typedef __vector short __v8hi;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	75 typedef __vector unsigned short __v8hu;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	76 typedef __vector signed char __v16qi;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	77 typedef __vector unsigned char __v16qu;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	78
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	79 /* The Intel API is flexible enough that we must allow aliasing with other
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	80 vector types, and their scalar components. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	81 typedef long long __m128i __attribute__ ((__vector_size__ (16), __may_alias__));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	82 typedef double __m128d __attribute__ ((__vector_size__ (16), __may_alias__));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	83
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	84 /* Unaligned version of the same types. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	85 typedef long long __m128i_u __attribute__ ((__vector_size__ (16), __may_alias__, __aligned__ (1)));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	86 typedef double __m128d_u __attribute__ ((__vector_size__ (16), __may_alias__, __aligned__ (1)));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	87
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	88 /* Define two value permute mask. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	89 #define _MM_SHUFFLE2(x,y) (((x) << 1) \| (y))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	90
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	91 /* Create a vector with element 0 as F and the rest zero. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	92 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	93 _mm_set_sd (double __F)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	94 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	95 return __extension__ (__m128d){ __F, 0.0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	96 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	97
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	98 /* Create a vector with both elements equal to F. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	99 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	100 _mm_set1_pd (double __F)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	101 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	102 return __extension__ (__m128d){ __F, __F };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	103 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	104
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	105 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	106 _mm_set_pd1 (double __F)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	107 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	108 return _mm_set1_pd (__F);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	109 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	110
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	111 /* Create a vector with the lower value X and upper value W. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	112 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	113 _mm_set_pd (double __W, double __X)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	114 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	115 return __extension__ (__m128d){ __X, __W };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	116 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	117
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	118 /* Create a vector with the lower value W and upper value X. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	119 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	120 _mm_setr_pd (double __W, double __X)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	121 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	122 return __extension__ (__m128d){ __W, __X };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	123 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	124
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	125 /* Create an undefined vector. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	126 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	127 _mm_undefined_pd (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	128 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	129 __m128d __Y = __Y;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	130 return __Y;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	131 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	132
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	133 /* Create a vector of zeros. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	134 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	135 _mm_setzero_pd (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	136 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	137 return (__m128d) vec_splats (0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	138 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	139
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	140 /* Sets the low DPFP value of A from the low value of B. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	141 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	142 _mm_move_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	143 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	144 __v2df result = (__v2df) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	145 result [0] = ((__v2df) __B)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	146 return (__m128d) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	147 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	148
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	149 /* Load two DPFP values from P. The address must be 16-byte aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	150 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	151 _mm_load_pd (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	152 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	153 assert(((unsigned long)__P & 0xfUL) == 0UL);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	154 return ((__m128d)vec_ld(0, (__v16qu*)__P));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	155 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	156
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	157 /* Load two DPFP values from P. The address need not be 16-byte aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	158 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	159 _mm_loadu_pd (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	160 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	161 return (vec_vsx_ld(0, __P));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	162 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	163
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	164 /* Create a vector with all two elements equal to P. /
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	165 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	166 _mm_load1_pd (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	167 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	168 return (vec_splats (*__P));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	169 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	170
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	171 /* Create a vector with element 0 as P and the rest zero. /
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	172 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	173 _mm_load_sd (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	174 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	175 return _mm_set_sd (*__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	176 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	177
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	178 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	179 _mm_load_pd1 (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	180 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	181 return _mm_load1_pd (__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	182 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	183
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	184 /* Load two DPFP values in reverse order. The address must be aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	185 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	186 _mm_loadr_pd (double const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	187 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	188 __v2df __tmp = _mm_load_pd (__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	189 return (__m128d)vec_xxpermdi (__tmp, __tmp, 2);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	190 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	191
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	192 /* Store two DPFP values. The address must be 16-byte aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	193 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	194 _mm_store_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	195 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	196 assert(((unsigned long)__P & 0xfUL) == 0UL);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	197 vec_st((__v16qu)__A, 0, (__v16qu*)__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	198 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	199
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	200 /* Store two DPFP values. The address need not be 16-byte aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	201 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	202 _mm_storeu_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	203 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	204 (__m128d_u )__P = __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	205 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	206
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	207 /* Stores the lower DPFP value. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	208 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	209 _mm_store_sd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	210 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	211 *__P = ((__v2df)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	212 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	213
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	214 extern __inline double __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	215 _mm_cvtsd_f64 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	216 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	217 return ((__v2df)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	218 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	219
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	220 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	221 _mm_storel_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	222 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	223 _mm_store_sd (__P, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	224 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	225
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	226 /* Stores the upper DPFP value. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	227 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	228 _mm_storeh_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	229 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	230 *__P = ((__v2df)__A)[1];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	231 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	232 /* Store the lower DPFP value across two words.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	233 The address must be 16-byte aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	234 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	235 _mm_store1_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	236 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	237 _mm_store_pd (__P, vec_splat (__A, 0));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	238 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	239
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	240 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	241 _mm_store_pd1 (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	242 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	243 _mm_store1_pd (__P, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	244 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	245
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	246 /* Store two DPFP values in reverse order. The address must be aligned. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	247 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	248 _mm_storer_pd (double *__P, __m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	249 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	250 _mm_store_pd (__P, vec_xxpermdi (__A, __A, 2));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	251 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	252
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	253 /* Intel intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	254 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	255 _mm_cvtsi128_si64 (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	256 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	257 return ((__v2di)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	258 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	259
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	260 /* Microsoft intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	261 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	262 _mm_cvtsi128_si64x (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	263 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	264 return ((__v2di)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	265 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	266
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	267 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	268 _mm_add_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	269 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	270 return (__m128d) ((__v2df)__A + (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	271 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	272
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	273 /* Add the lower double-precision (64-bit) floating-point element in
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	274 a and b, store the result in the lower element of dst, and copy
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	275 the upper element from a to the upper element of dst. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	276 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	277 _mm_add_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	278 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	279 __A[0] = __A[0] + __B[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	280 return (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	281 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	282
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	283 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	284 _mm_sub_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	285 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	286 return (__m128d) ((__v2df)__A - (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	287 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	288
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	289 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	290 _mm_sub_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	291 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	292 __A[0] = __A[0] - __B[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	293 return (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	294 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	295
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	296 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	297 _mm_mul_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	298 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	299 return (__m128d) ((__v2df)__A * (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	300 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	301
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	302 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	303 _mm_mul_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	304 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	305 __A[0] = __A[0] * __B[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	306 return (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	307 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	308
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	309 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	310 _mm_div_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	311 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	312 return (__m128d) ((__v2df)__A / (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	313 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	314
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	315 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	316 _mm_div_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	317 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	318 __A[0] = __A[0] / __B[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	319 return (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	320 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	321
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	322 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	323 _mm_sqrt_pd (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	324 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	325 return (vec_sqrt (__A));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	326 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	327
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	328 /* Return pair {sqrt (B[0]), A[1]}. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	329 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	330 _mm_sqrt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	331 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	332 __v2df c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	333 c = vec_sqrt ((__v2df) _mm_set1_pd (__B[0]));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	334 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	335 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	336
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	337 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	338 _mm_min_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	339 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	340 return (vec_min (__A, __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	341 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	342
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	343 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	344 _mm_min_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	345 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	346 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	347 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	348 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	349 c = vec_min (a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	350 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	351 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	352
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	353 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	354 _mm_max_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	355 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	356 return (vec_max (__A, __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	357 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	358
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	359 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	360 _mm_max_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	361 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	362 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	363 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	364 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	365 c = vec_max (a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	366 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	367 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	368
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	369 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	370 _mm_cmpeq_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	371 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	372 return ((__m128d)vec_cmpeq ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	373 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	374
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	375 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	376 _mm_cmplt_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	377 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	378 return ((__m128d)vec_cmplt ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	379 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	380
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	381 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	382 _mm_cmple_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	383 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	384 return ((__m128d)vec_cmple ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	385 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	386
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	387 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	388 _mm_cmpgt_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	389 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	390 return ((__m128d)vec_cmpgt ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	391 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	392
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	393 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	394 _mm_cmpge_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	395 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	396 return ((__m128d)vec_cmpge ((__v2df) __A,(__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	397 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	398
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	399 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	400 _mm_cmpneq_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	401 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	402 __v2df temp = (__v2df) vec_cmpeq ((__v2df) __A, (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	403 return ((__m128d)vec_nor (temp, temp));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	404 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	405
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	406 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	407 _mm_cmpnlt_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	408 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	409 return ((__m128d)vec_cmpge ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	410 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	411
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	412 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	413 _mm_cmpnle_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	414 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	415 return ((__m128d)vec_cmpgt ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	416 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	417
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	418 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	419 _mm_cmpngt_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	420 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	421 return ((__m128d)vec_cmple ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	422 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	423
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	424 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	425 _mm_cmpnge_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	426 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	427 return ((__m128d)vec_cmplt ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	428 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	429
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	430 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	431 _mm_cmpord_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	432 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	433 #if _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	434 __v2du c, d;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	435 /* Compare against self will return false (0's) if NAN. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	436 c = (__v2du)vec_cmpeq (__A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	437 d = (__v2du)vec_cmpeq (__B, __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	438 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	439 __v2du a, b;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	440 __v2du c, d;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	441 const __v2du double_exp_mask = {0x7ff0000000000000, 0x7ff0000000000000};
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	442 a = (__v2du)vec_abs ((__v2df)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	443 b = (__v2du)vec_abs ((__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	444 c = (__v2du)vec_cmpgt (double_exp_mask, a);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	445 d = (__v2du)vec_cmpgt (double_exp_mask, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	446 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	447 /* A != NAN and B != NAN. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	448 return ((__m128d)vec_and(c, d));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	449 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	450
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	451 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	452 _mm_cmpunord_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	453 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	454 #if _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	455 __v2du c, d;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	456 /* Compare against self will return false (0's) if NAN. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	457 c = (__v2du)vec_cmpeq ((__v2df)__A, (__v2df)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	458 d = (__v2du)vec_cmpeq ((__v2df)__B, (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	459 /* A == NAN OR B == NAN converts too:
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	460 NOT(A != NAN) OR NOT(B != NAN). */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	461 c = vec_nor (c, c);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	462 return ((__m128d)vec_orc(c, d));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	463 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	464 __v2du c, d;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	465 /* Compare against self will return false (0's) if NAN. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	466 c = (__v2du)vec_cmpeq ((__v2df)__A, (__v2df)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	467 d = (__v2du)vec_cmpeq ((__v2df)__B, (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	468 /* Convert the true ('1's) is NAN. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	469 c = vec_nor (c, c);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	470 d = vec_nor (d, d);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	471 return ((__m128d)vec_or(c, d));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	472 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	473 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	474
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	475 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	476 _mm_cmpeq_sd(__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	477 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	478 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	479 /* PowerISA VSX does not allow partial (for just lower double)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	480 results. So to insure we don't generate spurious exceptions
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	481 (from the upper double values) we splat the lower double
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	482 before we do the operation. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	483 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	484 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	485 c = (__v2df) vec_cmpeq(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	486 /* Then we merge the lower double result with the original upper
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	487 double from __A. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	488 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	489 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	490
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	491 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	492 _mm_cmplt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	493 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	494 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	495 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	496 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	497 c = (__v2df) vec_cmplt(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	498 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	499 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	500
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	501 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	502 _mm_cmple_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	503 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	504 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	505 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	506 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	507 c = (__v2df) vec_cmple(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	508 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	509 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	510
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	511 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	512 _mm_cmpgt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	513 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	514 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	515 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	516 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	517 c = (__v2df) vec_cmpgt(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	518 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	519 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	520
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	521 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	522 _mm_cmpge_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	523 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	524 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	525 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	526 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	527 c = (__v2df) vec_cmpge(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	528 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	529 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	530
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	531 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	532 _mm_cmpneq_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	533 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	534 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	535 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	536 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	537 c = (__v2df) vec_cmpeq(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	538 c = vec_nor (c, c);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	539 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	540 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	541
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	542 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	543 _mm_cmpnlt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	544 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	545 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	546 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	547 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	548 /* Not less than is just greater than or equal. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	549 c = (__v2df) vec_cmpge(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	550 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	551 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	552
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	553 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	554 _mm_cmpnle_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	555 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	556 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	557 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	558 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	559 /* Not less than or equal is just greater than. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	560 c = (__v2df) vec_cmpge(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	561 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	562 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	563
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	564 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	565 _mm_cmpngt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	566 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	567 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	568 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	569 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	570 /* Not greater than is just less than or equal. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	571 c = (__v2df) vec_cmple(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	572 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	573 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	574
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	575 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	576 _mm_cmpnge_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	577 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	578 __v2df a, b, c;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	579 a = vec_splats (__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	580 b = vec_splats (__B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	581 /* Not greater than or equal is just less than. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	582 c = (__v2df) vec_cmplt(a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	583 return (__m128d) _mm_setr_pd (c[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	584 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	585
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	586 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	587 _mm_cmpord_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	588 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	589 __v2df r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	590 r = (__v2df)_mm_cmpord_pd (vec_splats (__A[0]), vec_splats (__B[0]));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	591 return (__m128d) _mm_setr_pd (r[0], ((__v2df)__A)[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	592 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	593
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	594 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	595 _mm_cmpunord_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	596 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	597 __v2df r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	598 r = _mm_cmpunord_pd (vec_splats (__A[0]), vec_splats (__B[0]));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	599 return (__m128d) _mm_setr_pd (r[0], __A[1]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	600 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	601
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	602 /* FIXME
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	603 The __mm_comi??_sd and __mm_ucomi??_sd implementations below are
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	604 exactly the same because GCC for PowerPC only generates unordered
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	605 compares (scalar and vector).
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	606 Technically __mm_comieq_sp et all should be using the ordered
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	607 compare and signal for QNaNs. The __mm_ucomieq_sd et all should
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	608 be OK. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	609 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	610 _mm_comieq_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	611 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	612 return (__A[0] == __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	613 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	614
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	615 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	616 _mm_comilt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	617 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	618 return (__A[0] < __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	619 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	620
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	621 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	622 _mm_comile_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	623 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	624 return (__A[0] <= __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	625 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	626
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	627 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	628 _mm_comigt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	629 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	630 return (__A[0] > __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	631 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	632
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	633 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	634 _mm_comige_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	635 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	636 return (__A[0] >= __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	637 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	638
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	639 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	640 _mm_comineq_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	641 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	642 return (__A[0] != __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	643 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	644
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	645 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	646 _mm_ucomieq_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	647 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	648 return (__A[0] == __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	649 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	650
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	651 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	652 _mm_ucomilt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	653 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	654 return (__A[0] < __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	655 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	656
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	657 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	658 _mm_ucomile_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	659 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	660 return (__A[0] <= __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	661 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	662
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	663 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	664 _mm_ucomigt_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	665 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	666 return (__A[0] > __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	667 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	668
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	669 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	670 _mm_ucomige_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	671 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	672 return (__A[0] >= __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	673 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	674
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	675 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	676 _mm_ucomineq_sd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	677 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	678 return (__A[0] != __B[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	679 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	680
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	681 /* Create a vector of Qi, where i is the element number. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	682 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	683 _mm_set_epi64x (long long __q1, long long __q0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	684 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	685 return __extension__ (__m128i)(__v2di){ __q0, __q1 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	686 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	687
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	688 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	689 _mm_set_epi64 (__m64 __q1, __m64 __q0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	690 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	691 return _mm_set_epi64x ((long long)__q1, (long long)__q0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	692 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	693
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	694 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	695 _mm_set_epi32 (int __q3, int __q2, int __q1, int __q0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	696 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	697 return __extension__ (__m128i)(__v4si){ __q0, __q1, __q2, __q3 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	698 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	699
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	700 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	701 _mm_set_epi16 (short __q7, short __q6, short __q5, short __q4,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	702 short __q3, short __q2, short __q1, short __q0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	703 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	704 return __extension__ (__m128i)(__v8hi){
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	705 __q0, __q1, __q2, __q3, __q4, __q5, __q6, __q7 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	706 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	707
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	708 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	709 _mm_set_epi8 (char __q15, char __q14, char __q13, char __q12,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	710 char __q11, char __q10, char __q09, char __q08,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	711 char __q07, char __q06, char __q05, char __q04,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	712 char __q03, char __q02, char __q01, char __q00)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	713 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	714 return __extension__ (__m128i)(__v16qi){
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	715 __q00, __q01, __q02, __q03, __q04, __q05, __q06, __q07,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	716 __q08, __q09, __q10, __q11, __q12, __q13, __q14, __q15
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	717 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	718 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	719
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	720 /* Set all of the elements of the vector to A. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	721 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	722 _mm_set1_epi64x (long long __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	723 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	724 return _mm_set_epi64x (__A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	725 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	726
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	727 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	728 _mm_set1_epi64 (__m64 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	729 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	730 return _mm_set_epi64 (__A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	731 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	732
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	733 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	734 _mm_set1_epi32 (int __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	735 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	736 return _mm_set_epi32 (__A, __A, __A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	737 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	738
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	739 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	740 _mm_set1_epi16 (short __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	741 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	742 return _mm_set_epi16 (__A, __A, __A, __A, __A, __A, __A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	743 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	744
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	745 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	746 _mm_set1_epi8 (char __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	747 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	748 return _mm_set_epi8 (__A, __A, __A, __A, __A, __A, __A, __A,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	749 __A, __A, __A, __A, __A, __A, __A, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	750 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	751
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	752 /* Create a vector of Qi, where i is the element number.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	753 The parameter order is reversed from the _mm_set_epi* functions. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	754 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	755 _mm_setr_epi64 (__m64 __q0, __m64 __q1)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	756 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	757 return _mm_set_epi64 (__q1, __q0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	758 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	759
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	760 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	761 _mm_setr_epi32 (int __q0, int __q1, int __q2, int __q3)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	762 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	763 return _mm_set_epi32 (__q3, __q2, __q1, __q0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	764 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	765
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	766 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	767 _mm_setr_epi16 (short __q0, short __q1, short __q2, short __q3,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	768 short __q4, short __q5, short __q6, short __q7)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	769 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	770 return _mm_set_epi16 (__q7, __q6, __q5, __q4, __q3, __q2, __q1, __q0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	771 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	772
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	773 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	774 _mm_setr_epi8 (char __q00, char __q01, char __q02, char __q03,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	775 char __q04, char __q05, char __q06, char __q07,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	776 char __q08, char __q09, char __q10, char __q11,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	777 char __q12, char __q13, char __q14, char __q15)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	778 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	779 return _mm_set_epi8 (__q15, __q14, __q13, __q12, __q11, __q10, __q09, __q08,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	780 __q07, __q06, __q05, __q04, __q03, __q02, __q01, __q00);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	781 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	782
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	783 /* Create a vector with element 0 as P and the rest zero. /
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	784 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	785 _mm_load_si128 (__m128i const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	786 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	787 return *__P;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	788 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	789
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	790 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	791 _mm_loadu_si128 (__m128i_u const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	792 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	793 return (__m128i) (vec_vsx_ld(0, (signed int const *)__P));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	794 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	795
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	796 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	797 _mm_loadl_epi64 (__m128i_u const *__P)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	798 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	799 return _mm_set_epi64 ((__m64)0LL, (__m64 )__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	800 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	801
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	802 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	803 _mm_store_si128 (__m128i *__P, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	804 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	805 assert(((unsigned long )__P & 0xfUL) == 0UL);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	806 vec_st ((__v16qu) __B, 0, (__v16qu*)__P);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	807 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	808
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	809 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	810 _mm_storeu_si128 (__m128i_u *__P, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	811 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	812 *__P = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	813 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	814
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	815 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	816 _mm_storel_epi64 (__m128i_u *__P, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	817 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	818 (long long )__P = ((__v2di)__B)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	819 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	820
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	821 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	822 _mm_movepi64_pi64 (__m128i_u __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	823 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	824 return (__m64) ((__v2di)__B)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	825 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	826
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	827 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	828 _mm_movpi64_epi64 (__m64 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	829 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	830 return _mm_set_epi64 ((__m64)0LL, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	831 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	832
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	833 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	834 _mm_move_epi64 (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	835 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	836 return _mm_set_epi64 ((__m64)0LL, (__m64)__A[0]);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	837 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	838
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	839 /* Create an undefined vector. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	840 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	841 _mm_undefined_si128 (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	842 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	843 __m128i __Y = __Y;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	844 return __Y;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	845 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	846
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	847 /* Create a vector of zeros. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	848 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	849 _mm_setzero_si128 (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	850 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	851 return __extension__ (__m128i)(__v4si){ 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	852 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	853
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	854 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	855 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	856 _mm_cvtepi32_pd (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	857 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	858 __v2di val;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	859 /* For LE need to generate Vector Unpack Low Signed Word.
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	860 Which is generated from unpackh. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	861 val = (__v2di)vec_unpackh ((__v4si)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	862
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	863 return (__m128d)vec_ctf (val, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	864 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	865 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	866
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	867 extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	868 _mm_cvtepi32_ps (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	869 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	870 return ((__m128)vec_ctf((__v4si)__A, 0));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	871 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	872
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	873 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	874 _mm_cvtpd_epi32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	875 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	876 __v2df rounded = vec_rint (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	877 __v4si result, temp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	878 const __v4si vzero =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	879 { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	880
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	881 /* VSX Vector truncate Double-Precision to integer and Convert to
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	882 Signed Integer Word format with Saturate. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	883 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	884 "xvcvdpsxws %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	885 : "=wa" (temp)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	886 : "wa" (rounded)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	887 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	888
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	889 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	890 temp = vec_mergeo (temp, temp);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	891 result = (__v4si) vec_vpkudum ((__vector long long) temp,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	892 (__vector long long) vzero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	893 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	894 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	895 const __v16qu pkperm = {0x00, 0x01, 0x02, 0x03, 0x08, 0x09, 0x0a, 0x0b,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	896 0x14, 0x15, 0x16, 0x17, 0x1c, 0x1d, 0x1e, 0x1f };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	897 result = (__v4si) vec_perm ((__v16qu) temp, (__v16qu) vzero, pkperm);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	898 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	899 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	900 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	901 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	902
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	903 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	904 _mm_cvtpd_pi32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	905 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	906 __m128i result = _mm_cvtpd_epi32(__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	907
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	908 return (__m64) result[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	909 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	910
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	911 extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	912 _mm_cvtpd_ps (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	913 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	914 __v4sf result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	915 __v4si temp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	916 const __v4si vzero = { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	917
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	918 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	919 "xvcvdpsp %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	920 : "=wa" (temp)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	921 : "wa" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	922 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	923
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	924 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	925 temp = vec_mergeo (temp, temp);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	926 result = (__v4sf) vec_vpkudum ((__vector long long) temp,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	927 (__vector long long) vzero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	928 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	929 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	930 const __v16qu pkperm = {0x00, 0x01, 0x02, 0x03, 0x08, 0x09, 0x0a, 0x0b,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	931 0x14, 0x15, 0x16, 0x17, 0x1c, 0x1d, 0x1e, 0x1f };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	932 result = (__v4sf) vec_perm ((__v16qu) temp, (__v16qu) vzero, pkperm);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	933 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	934 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	935 return ((__m128)result);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	936 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	937
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	938 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	939 _mm_cvttpd_epi32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	940 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	941 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	942 __v4si temp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	943 const __v4si vzero = { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	944
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	945 /* VSX Vector truncate Double-Precision to integer and Convert to
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	946 Signed Integer Word format with Saturate. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	947 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	948 "xvcvdpsxws %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	949 : "=wa" (temp)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	950 : "wa" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	951 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	952
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	953 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	954 temp = vec_mergeo (temp, temp);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	955 result = (__v4si) vec_vpkudum ((__vector long long) temp,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	956 (__vector long long) vzero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	957 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	958 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	959 const __v16qu pkperm = {0x00, 0x01, 0x02, 0x03, 0x08, 0x09, 0x0a, 0x0b,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	960 0x14, 0x15, 0x16, 0x17, 0x1c, 0x1d, 0x1e, 0x1f };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	961 result = (__v4si) vec_perm ((__v16qu) temp, (__v16qu) vzero, pkperm);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	962 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	963 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	964
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	965 return ((__m128i) result);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	966 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	967
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	968 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	969 _mm_cvttpd_pi32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	970 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	971 __m128i result = _mm_cvttpd_epi32 (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	972
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	973 return (__m64) result[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	974 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	975
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	976 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	977 _mm_cvtsi128_si32 (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	978 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	979 return ((__v4si)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	980 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	981
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	982 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	983 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	984 _mm_cvtpi32_pd (__m64 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	985 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	986 __v4si temp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	987 __v2di tmp2;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	988 __v2df result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	989
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	990 temp = (__v4si)vec_splats (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	991 tmp2 = (__v2di)vec_unpackl (temp);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	992 result = vec_ctf ((__vector signed long long) tmp2, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	993 return (__m128d)result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	994 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	995 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	996
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	997 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	998 _mm_cvtps_epi32 (__m128 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	999 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1000 __v4sf rounded;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1001 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1002
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1003 rounded = vec_rint((__v4sf) __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1004 result = vec_cts (rounded, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1005 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1006 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1007
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1008 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1009 _mm_cvttps_epi32 (__m128 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1010 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1011 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1012
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1013 result = vec_cts ((__v4sf) __A, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1014 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1015 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1016
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1017 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1018 _mm_cvtps_pd (__m128 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1019 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1020 /* Check if vec_doubleh is defined by <altivec.h>. If so use that. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1021 #ifdef vec_doubleh
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1022 return (__m128d) vec_doubleh ((__v4sf)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1023 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1024 /* Otherwise the compiler is not current and so need to generate the
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1025 equivalent code. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1026 __v4sf a = (__v4sf)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1027 __v4sf temp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1028 __v2df result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1029 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1030 /* The input float values are in elements {[0], [1]} but the convert
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1031 instruction needs them in elements {[1], [3]}, So we use two
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1032 shift left double vector word immediates to get the elements
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1033 lined up. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1034 temp = __builtin_vsx_xxsldwi (a, a, 3);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1035 temp = __builtin_vsx_xxsldwi (a, temp, 2);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1036 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1037 /* The input float values are in elements {[0], [1]} but the convert
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1038 instruction needs them in elements {[0], [2]}, So we use two
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1039 shift left double vector word immediates to get the elements
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1040 lined up. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1041 temp = vec_vmrghw (a, a);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1042 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1043 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1044 " xvcvspdp %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1045 : "=wa" (result)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1046 : "wa" (temp)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1047 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1048 return (__m128d) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1049 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1050 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1051
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1052 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1053 _mm_cvtsd_si32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1054 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1055 __v2df rounded = vec_rint((__v2df) __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1056 int result = ((__v2df)rounded)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1057
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1058 return result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1059 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1060 /* Intel intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1061 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1062 _mm_cvtsd_si64 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1063 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1064 __v2df rounded = vec_rint ((__v2df) __A );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1065 long long result = ((__v2df) rounded)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1066
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1067 return result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1068 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1069
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1070 /* Microsoft intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1071 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1072 _mm_cvtsd_si64x (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1073 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1074 return _mm_cvtsd_si64 ((__v2df)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1075 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1076
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1077 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1078 _mm_cvttsd_si32 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1079 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1080 int result = ((__v2df)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1081
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1082 return result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1083 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1084
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1085 /* Intel intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1086 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1087 _mm_cvttsd_si64 (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1088 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1089 long long result = ((__v2df)__A)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1090
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1091 return result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1092 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1093
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1094 /* Microsoft intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1095 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1096 _mm_cvttsd_si64x (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1097 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1098 return _mm_cvttsd_si64 (__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1099 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1100
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1101 extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1102 _mm_cvtsd_ss (__m128 __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1103 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1104 __v4sf result = (__v4sf)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1105
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1106 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1107 __v4sf temp_s;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1108 /* Copy double element[0] to element [1] for conversion. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1109 __v2df temp_b = vec_splat((__v2df)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1110
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1111 /* Pre-rotate __A left 3 (logically right 1) elements. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1112 result = __builtin_vsx_xxsldwi (result, result, 3);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1113 /* Convert double to single float scalar in a vector. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1114 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1115 "xscvdpsp %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1116 : "=wa" (temp_s)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1117 : "wa" (temp_b)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1118 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1119 /* Shift the resulting scalar into vector element [0]. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1120 result = __builtin_vsx_xxsldwi (result, temp_s, 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1121 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1122 result [0] = ((__v2df)__B)[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1123 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1124 return (__m128) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1125 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1126
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1127 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1128 _mm_cvtsi32_sd (__m128d __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1129 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1130 __v2df result = (__v2df)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1131 double db = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1132 result [0] = db;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1133 return (__m128d)result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1134 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1135
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1136 /* Intel intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1137 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1138 _mm_cvtsi64_sd (__m128d __A, long long __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1139 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1140 __v2df result = (__v2df)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1141 double db = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1142 result [0] = db;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1143 return (__m128d)result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1144 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1145
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1146 /* Microsoft intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1147 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1148 _mm_cvtsi64x_sd (__m128d __A, long long __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1149 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1150 return _mm_cvtsi64_sd (__A, __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1151 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1152
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1153 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1154 _mm_cvtss_sd (__m128d __A, __m128 __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1155 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1156 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1157 /* Use splat to move element [0] into position for the convert. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1158 __v4sf temp = vec_splat ((__v4sf)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1159 __v2df res;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1160 /* Convert single float scalar to double in a vector. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1161 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1162 "xscvspdp %x0,%x1"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1163 : "=wa" (res)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1164 : "wa" (temp)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1165 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1166 return (__m128d) vec_mergel (res, (__v2df)__A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1167 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1168 __v2df res = (__v2df)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1169 res [0] = ((__v4sf)__B) [0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1170 return (__m128d) res;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1171 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1172 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1173
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1174 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1175 _mm_shuffle_pd(__m128d __A, __m128d __B, const int __mask)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1176 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1177 __vector double result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1178 const int litmsk = __mask & 0x3;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1179
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1180 if (litmsk == 0)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1181 result = vec_mergeh (__A, __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1182 #if __GNUC__ < 6
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1183 else if (litmsk == 1)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1184 result = vec_xxpermdi (__B, __A, 2);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1185 else if (litmsk == 2)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1186 result = vec_xxpermdi (__B, __A, 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1187 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1188 else if (litmsk == 1)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1189 result = vec_xxpermdi (__A, __B, 2);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1190 else if (litmsk == 2)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1191 result = vec_xxpermdi (__A, __B, 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1192 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1193 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1194 result = vec_mergel (__A, __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1195
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1196 return result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1197 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1198
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1199 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1200 _mm_unpackhi_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1201 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1202 return (__m128d) vec_mergel ((__v2df)__A, (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1203 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1204
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1205 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1206 _mm_unpacklo_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1207 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1208 return (__m128d) vec_mergeh ((__v2df)__A, (__v2df)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1209 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1210
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1211 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1212 _mm_loadh_pd (__m128d __A, double const *__B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1213 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1214 __v2df result = (__v2df)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1215 result [1] = *__B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1216 return (__m128d)result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1217 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1218
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1219 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1220 _mm_loadl_pd (__m128d __A, double const *__B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1221 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1222 __v2df result = (__v2df)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1223 result [0] = *__B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1224 return (__m128d)result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1225 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1226
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1227 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1228 /* Intrinsic functions that require PowerISA 2.07 minimum. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1229
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1230 /* Creates a 2-bit mask from the most significant bits of the DPFP values. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1231 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1232 _mm_movemask_pd (__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1233 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1234 __vector unsigned long long result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1235 static const __vector unsigned int perm_mask =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1236 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1237 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1238 0x80800040, 0x80808080, 0x80808080, 0x80808080
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1239 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1240 0x80808080, 0x80808080, 0x80808080, 0x80800040
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1241 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1242 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1243
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1244 result = ((__vector unsigned long long)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1245 vec_vbpermq ((__vector unsigned char) __A,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1246 (__vector unsigned char) perm_mask));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1247
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1248 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1249 return result[1];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1250 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1251 return result[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1252 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1253 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1254 #endif /* _ARCH_PWR8 */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1255
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1256 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1257 _mm_packs_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1258 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1259 return (__m128i) vec_packs ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1260 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1261
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1262 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1263 _mm_packs_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1264 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1265 return (__m128i) vec_packs ((__v4si)__A, (__v4si)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1266 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1267
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1268 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1269 _mm_packus_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1270 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1271 return (__m128i) vec_packsu ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1272 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1273
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1274 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1275 _mm_unpackhi_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1276 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1277 return (__m128i) vec_mergel ((__v16qu)__A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1278 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1279
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1280 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1281 _mm_unpackhi_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1282 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1283 return (__m128i) vec_mergel ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1284 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1285
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1286 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1287 _mm_unpackhi_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1288 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1289 return (__m128i) vec_mergel ((__v4su)__A, (__v4su)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1290 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1291
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1292 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1293 _mm_unpackhi_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1294 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1295 return (__m128i) vec_mergel ((__vector long long) __A,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1296 (__vector long long) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1297 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1298
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1299 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1300 _mm_unpacklo_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1301 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1302 return (__m128i) vec_mergeh ((__v16qu)__A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1303 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1304
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1305 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1306 _mm_unpacklo_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1307 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1308 return (__m128i) vec_mergeh ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1309 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1310
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1311 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1312 _mm_unpacklo_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1313 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1314 return (__m128i) vec_mergeh ((__v4si)__A, (__v4si)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1315 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1316
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1317 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1318 _mm_unpacklo_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1319 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1320 return (__m128i) vec_mergeh ((__vector long long) __A,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1321 (__vector long long) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1322 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1323
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1324 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1325 _mm_add_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1326 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1327 return (__m128i) ((__v16qu)__A + (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1328 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1329
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1330 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1331 _mm_add_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1332 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1333 return (__m128i) ((__v8hu)__A + (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1334 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1335
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1336 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1337 _mm_add_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1338 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1339 return (__m128i) ((__v4su)__A + (__v4su)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1340 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1341
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1342 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1343 _mm_add_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1344 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1345 return (__m128i) ((__v2du)__A + (__v2du)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1346 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1347
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1348 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1349 _mm_adds_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1350 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1351 return (__m128i) vec_adds ((__v16qi)__A, (__v16qi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1352 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1353
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1354 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1355 _mm_adds_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1356 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1357 return (__m128i) vec_adds ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1358 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1359
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1360 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1361 _mm_adds_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1362 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1363 return (__m128i) vec_adds ((__v16qu)__A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1364 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1365
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1366 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1367 _mm_adds_epu16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1368 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1369 return (__m128i) vec_adds ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1370 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1371
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1372 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1373 _mm_sub_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1374 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1375 return (__m128i) ((__v16qu)__A - (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1376 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1377
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1378 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1379 _mm_sub_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1380 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1381 return (__m128i) ((__v8hu)__A - (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1382 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1383
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1384 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1385 _mm_sub_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1386 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1387 return (__m128i) ((__v4su)__A - (__v4su)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1388 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1389
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1390 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1391 _mm_sub_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1392 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1393 return (__m128i) ((__v2du)__A - (__v2du)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1394 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1395
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1396 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1397 _mm_subs_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1398 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1399 return (__m128i) vec_subs ((__v16qi)__A, (__v16qi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1400 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1401
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1402 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1403 _mm_subs_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1404 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1405 return (__m128i) vec_subs ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1406 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1407
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1408 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1409 _mm_subs_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1410 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1411 return (__m128i) vec_subs ((__v16qu)__A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1412 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1413
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1414 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1415 _mm_subs_epu16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1416 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1417 return (__m128i) vec_subs ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1418 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1419
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1420 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1421 _mm_madd_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1422 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1423 __vector signed int zero = {0, 0, 0, 0};
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1424
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1425 return (__m128i) vec_vmsumshm ((__v8hi)__A, (__v8hi)__B, zero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1426 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1427
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1428 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1429 _mm_mulhi_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1430 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1431 __vector signed int w0, w1;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1432
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1433 __vector unsigned char xform1 = {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1434 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1435 0x02, 0x03, 0x12, 0x13, 0x06, 0x07, 0x16, 0x17,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1436 0x0A, 0x0B, 0x1A, 0x1B, 0x0E, 0x0F, 0x1E, 0x1F
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1437 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1438 0x00, 0x01, 0x10, 0x11, 0x04, 0x05, 0x14, 0x15,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1439 0x08, 0x09, 0x18, 0x19, 0x0C, 0x0D, 0x1C, 0x1D
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1440 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1441 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1442
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1443 w0 = vec_vmulesh ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1444 w1 = vec_vmulosh ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1445 return (__m128i) vec_perm (w0, w1, xform1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1446 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1447
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1448 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1449 _mm_mullo_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1450 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1451 return (__m128i) ((__v8hi)__A * (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1452 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1453
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1454 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1455 _mm_mul_su32 (__m64 __A, __m64 __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1456 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1457 unsigned int a = __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1458 unsigned int b = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1459
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1460 return ((__m64)a * (__m64)b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1461 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1462
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1463 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1464 _mm_mul_epu32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1465 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1466 #if __GNUC__ < 8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1467 __v2du result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1468
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1469 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1470 /* VMX Vector Multiply Odd Unsigned Word. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1471 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1472 "vmulouw %0,%1,%2"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1473 : "=v" (result)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1474 : "v" (__A), "v" (__B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1475 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1476 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1477 /* VMX Vector Multiply Even Unsigned Word. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1478 __asm__(
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1479 "vmuleuw %0,%1,%2"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1480 : "=v" (result)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1481 : "v" (__A), "v" (__B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1482 : );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1483 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1484 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1485 #else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1486 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1487 return (__m128i) vec_mule ((__v4su)__A, (__v4su)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1488 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1489 return (__m128i) vec_mulo ((__v4su)__A, (__v4su)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1490 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1491 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1492 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1493
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1494 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1495 _mm_slli_epi16 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1496 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1497 __v8hu lshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1498 __v8hi result = { 0, 0, 0, 0, 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1499
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1500 if (__B >= 0 && __B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1501 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1502 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1503 lshift = (__v8hu) vec_splat_s16(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1504 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1505 lshift = vec_splats ((unsigned short) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1506
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1507 result = vec_vslh ((__v8hi) __A, lshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1508 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1509
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1510 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1511 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1512
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1513 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1514 _mm_slli_epi32 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1515 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1516 __v4su lshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1517 __v4si result = { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1518
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1519 if (__B >= 0 && __B < 32)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1520 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1521 if (__builtin_constant_p(__B) && __B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1522 lshift = (__v4su) vec_splat_s32(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1523 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1524 lshift = vec_splats ((unsigned int) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1525
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1526 result = vec_vslw ((__v4si) __A, lshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1527 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1528
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1529 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1530 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1531
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1532 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1533 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1534 _mm_slli_epi64 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1535 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1536 __v2du lshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1537 __v2di result = { 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1538
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1539 if (__B >= 0 && __B < 64)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1540 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1541 if (__builtin_constant_p(__B) && __B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1542 lshift = (__v2du) vec_splat_s32(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1543 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1544 lshift = (__v2du) vec_splats ((unsigned int) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1545
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1546 result = vec_vsld ((__v2di) __A, lshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1547 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1548
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1549 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1550 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1551 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1552
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1553 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1554 _mm_srai_epi16 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1555 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1556 __v8hu rshift = { 15, 15, 15, 15, 15, 15, 15, 15 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1557 __v8hi result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1558
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1559 if (__B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1560 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1561 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1562 rshift = (__v8hu) vec_splat_s16(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1563 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1564 rshift = vec_splats ((unsigned short) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1565 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1566 result = vec_vsrah ((__v8hi) __A, rshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1567
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1568 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1569 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1570
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1571 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1572 _mm_srai_epi32 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1573 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1574 __v4su rshift = { 31, 31, 31, 31 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1575 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1576
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1577 if (__B < 32)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1578 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1579 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1580 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1581 if (__B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1582 rshift = (__v4su) vec_splat_s32(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1583 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1584 rshift = (__v4su) vec_splats((unsigned int)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1585 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1586 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1587 rshift = vec_splats ((unsigned int) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1588 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1589 result = vec_vsraw ((__v4si) __A, rshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1590
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1591 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1592 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1593
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1594 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1595 _mm_bslli_si128 (__m128i __A, const int __N)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1596 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1597 __v16qu result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1598 const __v16qu zeros = { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1599
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1600 if (__N < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1601 result = vec_sld ((__v16qu) __A, zeros, __N);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1602 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1603 result = zeros;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1604
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1605 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1606 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1607
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1608 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1609 _mm_bsrli_si128 (__m128i __A, const int __N)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1610 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1611 __v16qu result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1612 const __v16qu zeros = { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1613
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1614 if (__N < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1615 if (__builtin_constant_p(__N))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1616 /* Would like to use Vector Shift Left Double by Octet
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1617 Immediate here to use the immediate form and avoid
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1618 load of __N * 8 value into a separate VR. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1619 result = vec_sld (zeros, (__v16qu) __A, (16 - __N));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1620 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1621 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1622 __v16qu shift = vec_splats((unsigned char)(__N*8));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1623 result = vec_sro ((__v16qu)__A, shift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1624 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1625 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1626 result = zeros;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1627
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1628 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1629 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1630
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1631 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1632 _mm_srli_si128 (__m128i __A, const int __N)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1633 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1634 return _mm_bsrli_si128 (__A, __N);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1635 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1636
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1637 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1638 _mm_slli_si128 (__m128i __A, const int _imm5)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1639 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1640 __v16qu result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1641 const __v16qu zeros = { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1642
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1643 if (_imm5 < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1644 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1645 result = vec_sld ((__v16qu) __A, zeros, _imm5);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1646 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1647 result = vec_sld (zeros, (__v16qu) __A, (16 - _imm5));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1648 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1649 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1650 result = zeros;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1651
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1652 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1653 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1654
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1655 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1656
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1657 _mm_srli_epi16 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1658 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1659 __v8hu rshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1660 __v8hi result = { 0, 0, 0, 0, 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1661
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1662 if (__B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1663 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1664 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1665 rshift = (__v8hu) vec_splat_s16(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1666 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1667 rshift = vec_splats ((unsigned short) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1668
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1669 result = vec_vsrh ((__v8hi) __A, rshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1670 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1671
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1672 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1673 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1674
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1675 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1676 _mm_srli_epi32 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1677 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1678 __v4su rshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1679 __v4si result = { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1680
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1681 if (__B < 32)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1682 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1683 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1684 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1685 if (__B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1686 rshift = (__v4su) vec_splat_s32(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1687 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1688 rshift = (__v4su) vec_splats((unsigned int)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1689 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1690 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1691 rshift = vec_splats ((unsigned int) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1692
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1693 result = vec_vsrw ((__v4si) __A, rshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1694 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1695
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1696 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1697 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1698
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1699 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1700 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1701 _mm_srli_epi64 (__m128i __A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1702 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1703 __v2du rshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1704 __v2di result = { 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1705
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1706 if (__B < 64)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1707 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1708 if (__builtin_constant_p(__B))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1709 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1710 if (__B < 16)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1711 rshift = (__v2du) vec_splat_s32(__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1712 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1713 rshift = (__v2du) vec_splats((unsigned long long)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1714 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1715 else
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1716 rshift = (__v2du) vec_splats ((unsigned int) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1717
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1718 result = vec_vsrd ((__v2di) __A, rshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1719 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1720
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1721 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1722 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1723 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1724
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1725 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1726 _mm_sll_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1727 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1728 __v8hu lshift, shmask;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1729 const __v8hu shmax = { 15, 15, 15, 15, 15, 15, 15, 15 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1730 __v8hu result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1731
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1732 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1733 lshift = vec_splat ((__v8hu)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1734 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1735 lshift = vec_splat ((__v8hu)__B, 3);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1736 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1737 shmask = lshift <= shmax;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1738 result = vec_vslh ((__v8hu) __A, lshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1739 result = vec_sel (shmask, result, shmask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1740
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1741 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1742 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1743
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1744 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1745 _mm_sll_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1746 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1747 __v4su lshift, shmask;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1748 const __v4su shmax = { 32, 32, 32, 32 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1749 __v4su result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1750 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1751 lshift = vec_splat ((__v4su)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1752 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1753 lshift = vec_splat ((__v4su)__B, 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1754 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1755 shmask = lshift < shmax;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1756 result = vec_vslw ((__v4su) __A, lshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1757 result = vec_sel (shmask, result, shmask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1758
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1759 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1760 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1761
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1762 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1763 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1764 _mm_sll_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1765 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1766 __v2du lshift, shmask;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1767 const __v2du shmax = { 64, 64 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1768 __v2du result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1769
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1770 lshift = (__v2du) vec_splat ((__v2du)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1771 shmask = lshift < shmax;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1772 result = vec_vsld ((__v2du) __A, lshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1773 result = (__v2du) vec_sel ((__v2df) shmask, (__v2df) result,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1774 (__v2df) shmask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1775
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1776 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1777 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1778 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1779
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1780 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1781 _mm_sra_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1782 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1783 const __v8hu rshmax = { 15, 15, 15, 15, 15, 15, 15, 15 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1784 __v8hu rshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1785 __v8hi result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1786
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1787 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1788 rshift = vec_splat ((__v8hu)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1789 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1790 rshift = vec_splat ((__v8hu)__B, 3);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1791 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1792 rshift = vec_min (rshift, rshmax);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1793 result = vec_vsrah ((__v8hi) __A, rshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1794
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1795 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1796 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1797
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1798 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1799 _mm_sra_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1800 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1801 const __v4su rshmax = { 31, 31, 31, 31 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1802 __v4su rshift;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1803 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1804
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1805 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1806 rshift = vec_splat ((__v4su)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1807 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1808 rshift = vec_splat ((__v4su)__B, 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1809 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1810 rshift = vec_min (rshift, rshmax);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1811 result = vec_vsraw ((__v4si) __A, rshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1812
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1813 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1814 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1815
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1816 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1817 _mm_srl_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1818 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1819 __v8hu rshift, shmask;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1820 const __v8hu shmax = { 15, 15, 15, 15, 15, 15, 15, 15 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1821 __v8hu result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1822
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1823 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1824 rshift = vec_splat ((__v8hu)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1825 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1826 rshift = vec_splat ((__v8hu)__B, 3);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1827 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1828 shmask = rshift <= shmax;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1829 result = vec_vsrh ((__v8hu) __A, rshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1830 result = vec_sel (shmask, result, shmask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1831
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1832 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1833 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1834
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1835 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1836 _mm_srl_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1837 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1838 __v4su rshift, shmask;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1839 const __v4su shmax = { 32, 32, 32, 32 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1840 __v4su result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1841
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1842 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1843 rshift = vec_splat ((__v4su)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1844 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1845 rshift = vec_splat ((__v4su)__B, 1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1846 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1847 shmask = rshift < shmax;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1848 result = vec_vsrw ((__v4su) __A, rshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1849 result = vec_sel (shmask, result, shmask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1850
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1851 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1852 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1853
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1854 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1855 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1856 _mm_srl_epi64 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1857 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1858 __v2du rshift, shmask;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1859 const __v2du shmax = { 64, 64 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1860 __v2du result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1861
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1862 rshift = (__v2du) vec_splat ((__v2du)__B, 0);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1863 shmask = rshift < shmax;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1864 result = vec_vsrd ((__v2du) __A, rshift);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1865 result = (__v2du)vec_sel ((__v2du)shmask, (__v2du)result, (__v2du)shmask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1866
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1867 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1868 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1869 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1870
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1871 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1872 _mm_and_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1873 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1874 return (vec_and ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1875 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1876
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1877 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1878 _mm_andnot_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1879 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1880 return (vec_andc ((__v2df) __B, (__v2df) __A));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1881 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1882
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1883 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1884 _mm_or_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1885 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1886 return (vec_or ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1887 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1888
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1889 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1890 _mm_xor_pd (__m128d __A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1891 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1892 return (vec_xor ((__v2df) __A, (__v2df) __B));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1893 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1894
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1895 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1896 _mm_and_si128 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1897 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1898 return (__m128i)vec_and ((__v2di) __A, (__v2di) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1899 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1900
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1901 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1902 _mm_andnot_si128 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1903 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1904 return (__m128i)vec_andc ((__v2di) __B, (__v2di) __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1905 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1906
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1907 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1908 _mm_or_si128 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1909 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1910 return (__m128i)vec_or ((__v2di) __A, (__v2di) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1911 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1912
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1913 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1914 _mm_xor_si128 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1915 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1916 return (__m128i)vec_xor ((__v2di) __A, (__v2di) __B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1917 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1918
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1919 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1920 _mm_cmpeq_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1921 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1922 return (__m128i) vec_cmpeq ((__v16qi) __A, (__v16qi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1923 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1924
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1925 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1926 _mm_cmpeq_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1927 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1928 return (__m128i) vec_cmpeq ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1929 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1930
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1931 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1932 _mm_cmpeq_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1933 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1934 return (__m128i) vec_cmpeq ((__v4si) __A, (__v4si)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1935 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1936
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1937 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1938 _mm_cmplt_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1939 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1940 return (__m128i) vec_cmplt ((__v16qi) __A, (__v16qi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1941 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1942
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1943 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1944 _mm_cmplt_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1945 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1946 return (__m128i) vec_cmplt ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1947 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1948
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1949 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1950 _mm_cmplt_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1951 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1952 return (__m128i) vec_cmplt ((__v4si) __A, (__v4si)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1953 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1954
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1955 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1956 _mm_cmpgt_epi8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1957 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1958 return (__m128i) vec_cmpgt ((__v16qi) __A, (__v16qi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1959 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1960
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1961 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1962 _mm_cmpgt_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1963 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1964 return (__m128i) vec_cmpgt ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1965 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1966
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1967 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1968 _mm_cmpgt_epi32 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1969 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1970 return (__m128i) vec_cmpgt ((__v4si) __A, (__v4si)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1971 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1972
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1973 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1974 _mm_extract_epi16 (__m128i const __A, int const __N)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1975 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1976 return (unsigned short) ((__v8hi)__A)[__N & 7];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1977 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1978
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1979 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1980 _mm_insert_epi16 (__m128i const __A, int const __D, int const __N)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1981 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1982 __v8hi result = (__v8hi)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1983
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1984 result [(__N & 7)] = __D;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1985
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1986 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1987 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1988
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1989 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1990 _mm_max_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1991 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1992 return (__m128i) vec_max ((__v8hi)__A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1993 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1994
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1995 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1996 _mm_max_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1997 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1998 return (__m128i) vec_max ((__v16qu) __A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	1999 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2000
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2001 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2002 _mm_min_epi16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2003 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2004 return (__m128i) vec_min ((__v8hi) __A, (__v8hi)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2005 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2006
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2007 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2008 _mm_min_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2009 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2010 return (__m128i) vec_min ((__v16qu) __A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2011 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2012
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2013
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2014 #ifdef _ARCH_PWR8
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2015 /* Intrinsic functions that require PowerISA 2.07 minimum. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2016
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2017 /* Creates a 4-bit mask from the most significant bits of the SPFP values. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2018 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2019 _mm_movemask_epi8 (__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2020 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2021 __vector unsigned long long result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2022 static const __vector unsigned char perm_mask =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2023 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2024 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2025 0x78, 0x70, 0x68, 0x60, 0x58, 0x50, 0x48, 0x40,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2026 0x38, 0x30, 0x28, 0x20, 0x18, 0x10, 0x08, 0x00
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2027 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2028 0x00, 0x08, 0x10, 0x18, 0x20, 0x28, 0x30, 0x38,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2029 0x40, 0x48, 0x50, 0x58, 0x60, 0x68, 0x70, 0x78
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2030 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2031 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2032
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2033 result = ((__vector unsigned long long)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2034 vec_vbpermq ((__vector unsigned char) __A,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2035 (__vector unsigned char) perm_mask));
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2036
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2037 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2038 return result[1];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2039 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2040 return result[0];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2041 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2042 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2043 #endif /* _ARCH_PWR8 */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2044
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2045 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2046 _mm_mulhi_epu16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2047 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2048 __v4su w0, w1;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2049 __v16qu xform1 = {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2050 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2051 0x02, 0x03, 0x12, 0x13, 0x06, 0x07, 0x16, 0x17,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2052 0x0A, 0x0B, 0x1A, 0x1B, 0x0E, 0x0F, 0x1E, 0x1F
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2053 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2054 0x00, 0x01, 0x10, 0x11, 0x04, 0x05, 0x14, 0x15,
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2055 0x08, 0x09, 0x18, 0x19, 0x0C, 0x0D, 0x1C, 0x1D
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2056 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2057 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2058
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2059 w0 = vec_vmuleuh ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2060 w1 = vec_vmulouh ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2061 return (__m128i) vec_perm (w0, w1, xform1);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2062 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2063
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2064 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2065 _mm_shufflehi_epi16 (__m128i __A, const int __mask)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2066 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2067 unsigned long element_selector_98 = __mask & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2068 unsigned long element_selector_BA = (__mask >> 2) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2069 unsigned long element_selector_DC = (__mask >> 4) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2070 unsigned long element_selector_FE = (__mask >> 6) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2071 static const unsigned short permute_selectors[4] =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2072 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2073 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2074 0x0908, 0x0B0A, 0x0D0C, 0x0F0E
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2075 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2076 0x0607, 0x0405, 0x0203, 0x0001
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2077 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2078 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2079 __v2du pmask =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2080 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2081 { 0x1716151413121110UL, 0x1f1e1d1c1b1a1918UL};
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2082 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2083 { 0x1011121314151617UL, 0x18191a1b1c1d1e1fUL};
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2084 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2085 __m64_union t;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2086 __v2du a, r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2087
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2088 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2089 t.as_short[0] = permute_selectors[element_selector_98];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2090 t.as_short[1] = permute_selectors[element_selector_BA];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2091 t.as_short[2] = permute_selectors[element_selector_DC];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2092 t.as_short[3] = permute_selectors[element_selector_FE];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2093 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2094 t.as_short[3] = permute_selectors[element_selector_98];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2095 t.as_short[2] = permute_selectors[element_selector_BA];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2096 t.as_short[1] = permute_selectors[element_selector_DC];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2097 t.as_short[0] = permute_selectors[element_selector_FE];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2098 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2099 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2100 pmask[1] = t.as_m64;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2101 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2102 pmask[0] = t.as_m64;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2103 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2104 a = (__v2du)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2105 r = vec_perm (a, a, (__vector unsigned char)pmask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2106 return (__m128i) r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2107 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2108
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2109 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2110 _mm_shufflelo_epi16 (__m128i __A, const int __mask)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2111 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2112 unsigned long element_selector_10 = __mask & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2113 unsigned long element_selector_32 = (__mask >> 2) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2114 unsigned long element_selector_54 = (__mask >> 4) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2115 unsigned long element_selector_76 = (__mask >> 6) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2116 static const unsigned short permute_selectors[4] =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2117 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2118 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2119 0x0100, 0x0302, 0x0504, 0x0706
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2120 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2121 0x0e0f, 0x0c0d, 0x0a0b, 0x0809
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2122 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2123 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2124 __v2du pmask = { 0x1011121314151617UL, 0x1f1e1d1c1b1a1918UL};
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2125 __m64_union t;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2126 __v2du a, r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2127
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2128 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2129 t.as_short[0] = permute_selectors[element_selector_10];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2130 t.as_short[1] = permute_selectors[element_selector_32];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2131 t.as_short[2] = permute_selectors[element_selector_54];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2132 t.as_short[3] = permute_selectors[element_selector_76];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2133 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2134 t.as_short[3] = permute_selectors[element_selector_10];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2135 t.as_short[2] = permute_selectors[element_selector_32];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2136 t.as_short[1] = permute_selectors[element_selector_54];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2137 t.as_short[0] = permute_selectors[element_selector_76];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2138 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2139 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2140 pmask[0] = t.as_m64;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2141 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2142 pmask[1] = t.as_m64;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2143 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2144 a = (__v2du)__A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2145 r = vec_perm (a, a, (__vector unsigned char)pmask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2146 return (__m128i) r;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2147 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2148
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2149 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2150 _mm_shuffle_epi32 (__m128i __A, const int __mask)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2151 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2152 unsigned long element_selector_10 = __mask & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2153 unsigned long element_selector_32 = (__mask >> 2) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2154 unsigned long element_selector_54 = (__mask >> 4) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2155 unsigned long element_selector_76 = (__mask >> 6) & 0x03;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2156 static const unsigned int permute_selectors[4] =
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2157 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2158 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2159 0x03020100, 0x07060504, 0x0B0A0908, 0x0F0E0D0C
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2160 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2161 0x0C0D0E0F, 0x08090A0B, 0x04050607, 0x00010203
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2162 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2163 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2164 __v4su t;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2165
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2166 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2167 t[0] = permute_selectors[element_selector_10];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2168 t[1] = permute_selectors[element_selector_32];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2169 t[2] = permute_selectors[element_selector_54] + 0x10101010;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2170 t[3] = permute_selectors[element_selector_76] + 0x10101010;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2171 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2172 t[3] = permute_selectors[element_selector_10] + 0x10101010;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2173 t[2] = permute_selectors[element_selector_32] + 0x10101010;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2174 t[1] = permute_selectors[element_selector_54];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2175 t[0] = permute_selectors[element_selector_76];
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2176 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2177 return (__m128i)vec_perm ((__v4si) __A, (__v4si)__A, (__vector unsigned char)t);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2178 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2179
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2180 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2181 _mm_maskmoveu_si128 (__m128i __A, __m128i __B, char *__C)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2182 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2183 __v2du hibit = { 0x7f7f7f7f7f7f7f7fUL, 0x7f7f7f7f7f7f7f7fUL};
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2184 __v16qu mask, tmp;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2185 __m128i_u p = (__m128i_u)__C;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2186
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2187 tmp = (__v16qu)_mm_loadu_si128(p);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2188 mask = (__v16qu)vec_cmpgt ((__v16qu)__B, (__v16qu)hibit);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2189 tmp = vec_sel (tmp, (__v16qu)__A, mask);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2190 _mm_storeu_si128 (p, (__m128i)tmp);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2191 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2192
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2193 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2194 _mm_avg_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2195 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2196 return (__m128i) vec_avg ((__v16qu)__A, (__v16qu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2197 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2198
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2199 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2200 _mm_avg_epu16 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2201 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2202 return (__m128i) vec_avg ((__v8hu)__A, (__v8hu)__B);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2203 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2204
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2205
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2206 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2207 _mm_sad_epu8 (__m128i __A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2208 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2209 __v16qu a, b;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2210 __v16qu vmin, vmax, vabsdiff;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2211 __v4si vsum;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2212 const __v4su zero = { 0, 0, 0, 0 };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2213 __v4si result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2214
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2215 a = (__v16qu) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2216 b = (__v16qu) __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2217 vmin = vec_min (a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2218 vmax = vec_max (a, b);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2219 vabsdiff = vec_sub (vmax, vmin);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2220 /* Sum four groups of bytes into integers. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2221 vsum = (__vector signed int) vec_sum4s (vabsdiff, zero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2222 /* Sum across four integers with two integer results. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2223 result = vec_sum2s (vsum, (__vector signed int) zero);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2224 /* Rotate the sums into the correct position. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2225 #ifdef __LITTLE_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2226 result = vec_sld (result, result, 4);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2227 #elif __BIG_ENDIAN__
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2228 result = vec_sld (result, result, 6);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2229 #endif
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2230 /* Rotate the sums into the correct position. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2231 return (__m128i) result;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2232 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2233
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2234 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2235 _mm_stream_si32 (int *__A, int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2236 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2237 /* Use the data cache block touch for store transient. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2238 __asm__ (
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2239 "dcbtstt 0,%0"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2240 :
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2241 : "b" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2242 : "memory"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2243 );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2244 *__A = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2245 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2246
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2247 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2248 _mm_stream_si64 (long long int *__A, long long int __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2249 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2250 /* Use the data cache block touch for store transient. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2251 __asm__ (
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2252 " dcbtstt 0,%0"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2253 :
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2254 : "b" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2255 : "memory"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2256 );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2257 *__A = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2258 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2259
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2260 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2261 _mm_stream_si128 (__m128i *__A, __m128i __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2262 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2263 /* Use the data cache block touch for store transient. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2264 __asm__ (
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2265 "dcbtstt 0,%0"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2266 :
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2267 : "b" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2268 : "memory"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2269 );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2270 *__A = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2271 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2272
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2273 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2274 _mm_stream_pd (double *__A, __m128d __B)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2275 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2276 /* Use the data cache block touch for store transient. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2277 __asm__ (
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2278 "dcbtstt 0,%0"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2279 :
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2280 : "b" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2281 : "memory"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2282 );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2283 (__m128d)__A = __B;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2284 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2285
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2286 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2287 _mm_clflush (void const *__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2288 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2289 /* Use the data cache block flush. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2290 __asm__ (
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2291 "dcbf 0,%0"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2292 :
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2293 : "b" (__A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2294 : "memory"
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2295 );
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2296 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2297
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2298 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2299 _mm_lfence (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2300 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2301 /* Use light weight sync for load to load ordering. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2302 __atomic_thread_fence (__ATOMIC_RELEASE);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2303 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2304
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2305 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2306 _mm_mfence (void)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2307 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2308 /* Use heavy weight sync for any to any ordering. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2309 __atomic_thread_fence (__ATOMIC_SEQ_CST);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2310 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2311
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2312 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2313 _mm_cvtsi32_si128 (int __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2314 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2315 return _mm_set_epi32 (0, 0, 0, __A);
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2316 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2317
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2318 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2319 _mm_cvtsi64_si128 (long long __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2320 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2321 return __extension__ (__m128i)(__v2di){ __A, 0LL };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2322 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2323
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2324 /* Microsoft intrinsic. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2325 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2326 _mm_cvtsi64x_si128 (long long __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2327 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2328 return __extension__ (__m128i)(__v2di){ __A, 0LL };
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2329 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2330
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2331 /* Casts between various SP, DP, INT vector types. Note that these do no
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2332 conversion of values, they just change the type. */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2333 extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2334 _mm_castpd_ps(__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2335 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2336 return (__m128) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2337 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2338
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2339 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2340 _mm_castpd_si128(__m128d __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2341 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2342 return (__m128i) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2343 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2344
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2345 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2346 _mm_castps_pd(__m128 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2347 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2348 return (__m128d) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2349 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2350
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2351 extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2352 _mm_castps_si128(__m128 __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2353 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2354 return (__m128i) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2355 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2356
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2357 extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2358 _mm_castsi128_ps(__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2359 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2360 return (__m128) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2361 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2362
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2363 extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2364 _mm_castsi128_pd(__m128i __A)
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2365 {
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2366 return (__m128d) __A;
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2367 }
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2368
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2369 #endif /* EMMINTRIN_H_ */
84e7813d76e9 gcc-8.2 mir3636 parents: diff changeset	2370

Mercurial > hg > CbC > CbC_gcc

annotate gcc/config/rs6000/emmintrin.h @ 132:d34655255c78