CbC/CbC_gcc: gcc/config/rs6000/mmintrin.h annotate

annotate gcc/config/rs6000/mmintrin.h @ 111:04ced10e8804

gcc 7

author	kono
date	Fri, 27 Oct 2017 22:46:09 +0900
parents
children	84e7813d76e9

rev	line source
111 04ced10e8804 gcc 7 kono parents: diff changeset	1 /* Copyright (C) 2002-2017 Free Software Foundation, Inc.
04ced10e8804 gcc 7 kono parents: diff changeset	2
04ced10e8804 gcc 7 kono parents: diff changeset	3 This file is part of GCC.
04ced10e8804 gcc 7 kono parents: diff changeset	4
04ced10e8804 gcc 7 kono parents: diff changeset	5 GCC is free software; you can redistribute it and/or modify
04ced10e8804 gcc 7 kono parents: diff changeset	6 it under the terms of the GNU General Public License as published by
04ced10e8804 gcc 7 kono parents: diff changeset	7 the Free Software Foundation; either version 3, or (at your option)
04ced10e8804 gcc 7 kono parents: diff changeset	8 any later version.
04ced10e8804 gcc 7 kono parents: diff changeset	9
04ced10e8804 gcc 7 kono parents: diff changeset	10 GCC is distributed in the hope that it will be useful,
04ced10e8804 gcc 7 kono parents: diff changeset	11 but WITHOUT ANY WARRANTY; without even the implied warranty of
04ced10e8804 gcc 7 kono parents: diff changeset	12 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
04ced10e8804 gcc 7 kono parents: diff changeset	13 GNU General Public License for more details.
04ced10e8804 gcc 7 kono parents: diff changeset	14
04ced10e8804 gcc 7 kono parents: diff changeset	15 Under Section 7 of GPL version 3, you are granted additional
04ced10e8804 gcc 7 kono parents: diff changeset	16 permissions described in the GCC Runtime Library Exception, version
04ced10e8804 gcc 7 kono parents: diff changeset	17 3.1, as published by the Free Software Foundation.
04ced10e8804 gcc 7 kono parents: diff changeset	18
04ced10e8804 gcc 7 kono parents: diff changeset	19 You should have received a copy of the GNU General Public License and
04ced10e8804 gcc 7 kono parents: diff changeset	20 a copy of the GCC Runtime Library Exception along with this program;
04ced10e8804 gcc 7 kono parents: diff changeset	21 see the files COPYING3 and COPYING.RUNTIME respectively. If not, see
04ced10e8804 gcc 7 kono parents: diff changeset	22 <http://www.gnu.org/licenses/>. */
04ced10e8804 gcc 7 kono parents: diff changeset	23
04ced10e8804 gcc 7 kono parents: diff changeset	24 /* Implemented from the specification included in the Intel C++ Compiler
04ced10e8804 gcc 7 kono parents: diff changeset	25 User Guide and Reference, version 9.0. */
04ced10e8804 gcc 7 kono parents: diff changeset	26
04ced10e8804 gcc 7 kono parents: diff changeset	27 #ifndef NO_WARN_X86_INTRINSICS
04ced10e8804 gcc 7 kono parents: diff changeset	28 /* This header is distributed to simplify porting x86_64 code that
04ced10e8804 gcc 7 kono parents: diff changeset	29 makes explicit use of Intel intrinsics to powerpc64le.
04ced10e8804 gcc 7 kono parents: diff changeset	30 It is the user's responsibility to determine if the results are
04ced10e8804 gcc 7 kono parents: diff changeset	31 acceptable and make additional changes as necessary.
04ced10e8804 gcc 7 kono parents: diff changeset	32 Note that much code that uses Intel intrinsics can be rewritten in
04ced10e8804 gcc 7 kono parents: diff changeset	33 standard C or GNU C extensions, which are more portable and better
04ced10e8804 gcc 7 kono parents: diff changeset	34 optimized across multiple targets.
04ced10e8804 gcc 7 kono parents: diff changeset	35
04ced10e8804 gcc 7 kono parents: diff changeset	36 In the specific case of X86 MMX (__m64) intrinsics, the PowerPC
04ced10e8804 gcc 7 kono parents: diff changeset	37 target does not support a native __vector_size__ (8) type. Instead
04ced10e8804 gcc 7 kono parents: diff changeset	38 we typedef __m64 to a 64-bit unsigned long long, which is natively
04ced10e8804 gcc 7 kono parents: diff changeset	39 supported in 64-bit mode. This works well for the _si64 and some
04ced10e8804 gcc 7 kono parents: diff changeset	40 _pi32 operations, but starts to generate long sequences for _pi16
04ced10e8804 gcc 7 kono parents: diff changeset	41 and _pi8 operations. For those cases it better (faster and
04ced10e8804 gcc 7 kono parents: diff changeset	42 smaller code) to transfer __m64 data to the PowerPC vector 128-bit
04ced10e8804 gcc 7 kono parents: diff changeset	43 unit, perform the operation, and then transfer the result back to
04ced10e8804 gcc 7 kono parents: diff changeset	44 the __m64 type. This implies that the direct register move
04ced10e8804 gcc 7 kono parents: diff changeset	45 instructions, introduced with power8, are available for efficient
04ced10e8804 gcc 7 kono parents: diff changeset	46 implementation of these transfers.
04ced10e8804 gcc 7 kono parents: diff changeset	47
04ced10e8804 gcc 7 kono parents: diff changeset	48 Most MMX intrinsic operations can be performed efficiently as
04ced10e8804 gcc 7 kono parents: diff changeset	49 C language 64-bit scalar operation or optimized to use the newer
04ced10e8804 gcc 7 kono parents: diff changeset	50 128-bit SSE/Altivec operations. We recomend this for new
04ced10e8804 gcc 7 kono parents: diff changeset	51 applications. */
04ced10e8804 gcc 7 kono parents: diff changeset	52 #warning "Please read comment above. Use -DNO_WARN_X86_INTRINSICS to disable this warning."
04ced10e8804 gcc 7 kono parents: diff changeset	53 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	54
04ced10e8804 gcc 7 kono parents: diff changeset	55 #ifndef _MMINTRIN_H_INCLUDED
04ced10e8804 gcc 7 kono parents: diff changeset	56 #define _MMINTRIN_H_INCLUDED
04ced10e8804 gcc 7 kono parents: diff changeset	57
04ced10e8804 gcc 7 kono parents: diff changeset	58 #include <altivec.h>
04ced10e8804 gcc 7 kono parents: diff changeset	59 /* The Intel API is flexible enough that we must allow aliasing with other
04ced10e8804 gcc 7 kono parents: diff changeset	60 vector types, and their scalar components. */
04ced10e8804 gcc 7 kono parents: diff changeset	61 typedef __attribute__ ((__aligned__ (8))) unsigned long long __m64;
04ced10e8804 gcc 7 kono parents: diff changeset	62
04ced10e8804 gcc 7 kono parents: diff changeset	63 typedef __attribute__ ((__aligned__ (8)))
04ced10e8804 gcc 7 kono parents: diff changeset	64 union
04ced10e8804 gcc 7 kono parents: diff changeset	65 {
04ced10e8804 gcc 7 kono parents: diff changeset	66 __m64 as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	67 char as_char[8];
04ced10e8804 gcc 7 kono parents: diff changeset	68 signed char as_signed_char [8];
04ced10e8804 gcc 7 kono parents: diff changeset	69 short as_short[4];
04ced10e8804 gcc 7 kono parents: diff changeset	70 int as_int[2];
04ced10e8804 gcc 7 kono parents: diff changeset	71 long long as_long_long;
04ced10e8804 gcc 7 kono parents: diff changeset	72 float as_float[2];
04ced10e8804 gcc 7 kono parents: diff changeset	73 double as_double;
04ced10e8804 gcc 7 kono parents: diff changeset	74 } __m64_union;
04ced10e8804 gcc 7 kono parents: diff changeset	75
04ced10e8804 gcc 7 kono parents: diff changeset	76 /* Empty the multimedia state. */
04ced10e8804 gcc 7 kono parents: diff changeset	77 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	78 _mm_empty (void)
04ced10e8804 gcc 7 kono parents: diff changeset	79 {
04ced10e8804 gcc 7 kono parents: diff changeset	80 /* nothing to do on PowerPC. */
04ced10e8804 gcc 7 kono parents: diff changeset	81 }
04ced10e8804 gcc 7 kono parents: diff changeset	82
04ced10e8804 gcc 7 kono parents: diff changeset	83 extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	84 _m_empty (void)
04ced10e8804 gcc 7 kono parents: diff changeset	85 {
04ced10e8804 gcc 7 kono parents: diff changeset	86 /* nothing to do on PowerPC. */
04ced10e8804 gcc 7 kono parents: diff changeset	87 }
04ced10e8804 gcc 7 kono parents: diff changeset	88
04ced10e8804 gcc 7 kono parents: diff changeset	89 /* Convert I to a __m64 object. The integer is zero-extended to 64-bits. */
04ced10e8804 gcc 7 kono parents: diff changeset	90 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	91 _mm_cvtsi32_si64 (int __i)
04ced10e8804 gcc 7 kono parents: diff changeset	92 {
04ced10e8804 gcc 7 kono parents: diff changeset	93 return (__m64) (unsigned int) __i;
04ced10e8804 gcc 7 kono parents: diff changeset	94 }
04ced10e8804 gcc 7 kono parents: diff changeset	95
04ced10e8804 gcc 7 kono parents: diff changeset	96 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	97 _m_from_int (int __i)
04ced10e8804 gcc 7 kono parents: diff changeset	98 {
04ced10e8804 gcc 7 kono parents: diff changeset	99 return _mm_cvtsi32_si64 (__i);
04ced10e8804 gcc 7 kono parents: diff changeset	100 }
04ced10e8804 gcc 7 kono parents: diff changeset	101
04ced10e8804 gcc 7 kono parents: diff changeset	102 /* Convert the lower 32 bits of the __m64 object into an integer. */
04ced10e8804 gcc 7 kono parents: diff changeset	103 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	104 _mm_cvtsi64_si32 (__m64 __i)
04ced10e8804 gcc 7 kono parents: diff changeset	105 {
04ced10e8804 gcc 7 kono parents: diff changeset	106 return ((int) __i);
04ced10e8804 gcc 7 kono parents: diff changeset	107 }
04ced10e8804 gcc 7 kono parents: diff changeset	108
04ced10e8804 gcc 7 kono parents: diff changeset	109 extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	110 _m_to_int (__m64 __i)
04ced10e8804 gcc 7 kono parents: diff changeset	111 {
04ced10e8804 gcc 7 kono parents: diff changeset	112 return _mm_cvtsi64_si32 (__i);
04ced10e8804 gcc 7 kono parents: diff changeset	113 }
04ced10e8804 gcc 7 kono parents: diff changeset	114
04ced10e8804 gcc 7 kono parents: diff changeset	115 #ifdef __powerpc64__
04ced10e8804 gcc 7 kono parents: diff changeset	116 /* Convert I to a __m64 object. */
04ced10e8804 gcc 7 kono parents: diff changeset	117
04ced10e8804 gcc 7 kono parents: diff changeset	118 /* Intel intrinsic. */
04ced10e8804 gcc 7 kono parents: diff changeset	119 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	120 _m_from_int64 (long long __i)
04ced10e8804 gcc 7 kono parents: diff changeset	121 {
04ced10e8804 gcc 7 kono parents: diff changeset	122 return (__m64) __i;
04ced10e8804 gcc 7 kono parents: diff changeset	123 }
04ced10e8804 gcc 7 kono parents: diff changeset	124
04ced10e8804 gcc 7 kono parents: diff changeset	125 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	126 _mm_cvtsi64_m64 (long long __i)
04ced10e8804 gcc 7 kono parents: diff changeset	127 {
04ced10e8804 gcc 7 kono parents: diff changeset	128 return (__m64) __i;
04ced10e8804 gcc 7 kono parents: diff changeset	129 }
04ced10e8804 gcc 7 kono parents: diff changeset	130
04ced10e8804 gcc 7 kono parents: diff changeset	131 /* Microsoft intrinsic. */
04ced10e8804 gcc 7 kono parents: diff changeset	132 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	133 _mm_cvtsi64x_si64 (long long __i)
04ced10e8804 gcc 7 kono parents: diff changeset	134 {
04ced10e8804 gcc 7 kono parents: diff changeset	135 return (__m64) __i;
04ced10e8804 gcc 7 kono parents: diff changeset	136 }
04ced10e8804 gcc 7 kono parents: diff changeset	137
04ced10e8804 gcc 7 kono parents: diff changeset	138 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	139 _mm_set_pi64x (long long __i)
04ced10e8804 gcc 7 kono parents: diff changeset	140 {
04ced10e8804 gcc 7 kono parents: diff changeset	141 return (__m64) __i;
04ced10e8804 gcc 7 kono parents: diff changeset	142 }
04ced10e8804 gcc 7 kono parents: diff changeset	143
04ced10e8804 gcc 7 kono parents: diff changeset	144 /* Convert the __m64 object to a 64bit integer. */
04ced10e8804 gcc 7 kono parents: diff changeset	145
04ced10e8804 gcc 7 kono parents: diff changeset	146 /* Intel intrinsic. */
04ced10e8804 gcc 7 kono parents: diff changeset	147 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	148 _m_to_int64 (__m64 __i)
04ced10e8804 gcc 7 kono parents: diff changeset	149 {
04ced10e8804 gcc 7 kono parents: diff changeset	150 return (long long)__i;
04ced10e8804 gcc 7 kono parents: diff changeset	151 }
04ced10e8804 gcc 7 kono parents: diff changeset	152
04ced10e8804 gcc 7 kono parents: diff changeset	153 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	154 _mm_cvtm64_si64 (__m64 __i)
04ced10e8804 gcc 7 kono parents: diff changeset	155 {
04ced10e8804 gcc 7 kono parents: diff changeset	156 return (long long) __i;
04ced10e8804 gcc 7 kono parents: diff changeset	157 }
04ced10e8804 gcc 7 kono parents: diff changeset	158
04ced10e8804 gcc 7 kono parents: diff changeset	159 /* Microsoft intrinsic. */
04ced10e8804 gcc 7 kono parents: diff changeset	160 extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	161 _mm_cvtsi64_si64x (__m64 __i)
04ced10e8804 gcc 7 kono parents: diff changeset	162 {
04ced10e8804 gcc 7 kono parents: diff changeset	163 return (long long) __i;
04ced10e8804 gcc 7 kono parents: diff changeset	164 }
04ced10e8804 gcc 7 kono parents: diff changeset	165
04ced10e8804 gcc 7 kono parents: diff changeset	166 #ifdef _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	167 /* Pack the four 16-bit values from M1 into the lower four 8-bit values of
04ced10e8804 gcc 7 kono parents: diff changeset	168 the result, and the four 16-bit values from M2 into the upper four 8-bit
04ced10e8804 gcc 7 kono parents: diff changeset	169 values of the result, all with signed saturation. */
04ced10e8804 gcc 7 kono parents: diff changeset	170 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	171 _mm_packs_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	172 {
04ced10e8804 gcc 7 kono parents: diff changeset	173 __vector signed short vm1;
04ced10e8804 gcc 7 kono parents: diff changeset	174 __vector signed char vresult;
04ced10e8804 gcc 7 kono parents: diff changeset	175
04ced10e8804 gcc 7 kono parents: diff changeset	176 vm1 = (__vector signed short)__builtin_pack_vector_int128 (__m2, __m1);
04ced10e8804 gcc 7 kono parents: diff changeset	177 vresult = vec_vpkshss (vm1, vm1);
04ced10e8804 gcc 7 kono parents: diff changeset	178 return (__m64) __builtin_unpack_vector_int128 ((__vector __int128)vresult, 0);
04ced10e8804 gcc 7 kono parents: diff changeset	179 }
04ced10e8804 gcc 7 kono parents: diff changeset	180
04ced10e8804 gcc 7 kono parents: diff changeset	181 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	182 _m_packsswb (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	183 {
04ced10e8804 gcc 7 kono parents: diff changeset	184 return _mm_packs_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	185 }
04ced10e8804 gcc 7 kono parents: diff changeset	186
04ced10e8804 gcc 7 kono parents: diff changeset	187 /* Pack the two 32-bit values from M1 in to the lower two 16-bit values of
04ced10e8804 gcc 7 kono parents: diff changeset	188 the result, and the two 32-bit values from M2 into the upper two 16-bit
04ced10e8804 gcc 7 kono parents: diff changeset	189 values of the result, all with signed saturation. */
04ced10e8804 gcc 7 kono parents: diff changeset	190 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	191 _mm_packs_pi32 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	192 {
04ced10e8804 gcc 7 kono parents: diff changeset	193 __vector signed int vm1;
04ced10e8804 gcc 7 kono parents: diff changeset	194 __vector signed short vresult;
04ced10e8804 gcc 7 kono parents: diff changeset	195
04ced10e8804 gcc 7 kono parents: diff changeset	196 vm1 = (__vector signed int)__builtin_pack_vector_int128 (__m2, __m1);
04ced10e8804 gcc 7 kono parents: diff changeset	197 vresult = vec_vpkswss (vm1, vm1);
04ced10e8804 gcc 7 kono parents: diff changeset	198 return ((__m64) __builtin_unpack_vector_int128 ((__vector __int128)vresult, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	199 }
04ced10e8804 gcc 7 kono parents: diff changeset	200
04ced10e8804 gcc 7 kono parents: diff changeset	201 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	202 _m_packssdw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	203 {
04ced10e8804 gcc 7 kono parents: diff changeset	204 return _mm_packs_pi32 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	205 }
04ced10e8804 gcc 7 kono parents: diff changeset	206
04ced10e8804 gcc 7 kono parents: diff changeset	207 /* Pack the four 16-bit values from M1 into the lower four 8-bit values of
04ced10e8804 gcc 7 kono parents: diff changeset	208 the result, and the four 16-bit values from M2 into the upper four 8-bit
04ced10e8804 gcc 7 kono parents: diff changeset	209 values of the result, all with unsigned saturation. */
04ced10e8804 gcc 7 kono parents: diff changeset	210 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	211 _mm_packs_pu16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	212 {
04ced10e8804 gcc 7 kono parents: diff changeset	213 __vector signed short vm1;
04ced10e8804 gcc 7 kono parents: diff changeset	214 __vector unsigned char vresult;
04ced10e8804 gcc 7 kono parents: diff changeset	215
04ced10e8804 gcc 7 kono parents: diff changeset	216 vm1 = (__vector signed short)__builtin_pack_vector_int128 (__m2, __m1);
04ced10e8804 gcc 7 kono parents: diff changeset	217 vresult = vec_vpkshus (vm1, vm1);
04ced10e8804 gcc 7 kono parents: diff changeset	218 return ((__m64) __builtin_unpack_vector_int128 ((__vector __int128)vresult, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	219 }
04ced10e8804 gcc 7 kono parents: diff changeset	220
04ced10e8804 gcc 7 kono parents: diff changeset	221 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	222 _m_packuswb (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	223 {
04ced10e8804 gcc 7 kono parents: diff changeset	224 return _mm_packs_pu16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	225 }
04ced10e8804 gcc 7 kono parents: diff changeset	226 #endif /* end ARCH_PWR8 */
04ced10e8804 gcc 7 kono parents: diff changeset	227
04ced10e8804 gcc 7 kono parents: diff changeset	228 /* Interleave the four 8-bit values from the high half of M1 with the four
04ced10e8804 gcc 7 kono parents: diff changeset	229 8-bit values from the high half of M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	230 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	231 _mm_unpackhi_pi8 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	232 {
04ced10e8804 gcc 7 kono parents: diff changeset	233 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	234 __vector unsigned char a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	235
04ced10e8804 gcc 7 kono parents: diff changeset	236 a = (__vector unsigned char)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	237 b = (__vector unsigned char)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	238 c = vec_mergel (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	239 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	240 #else
04ced10e8804 gcc 7 kono parents: diff changeset	241 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	242
04ced10e8804 gcc 7 kono parents: diff changeset	243 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	244 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	245
04ced10e8804 gcc 7 kono parents: diff changeset	246 res.as_char[0] = m1.as_char[4];
04ced10e8804 gcc 7 kono parents: diff changeset	247 res.as_char[1] = m2.as_char[4];
04ced10e8804 gcc 7 kono parents: diff changeset	248 res.as_char[2] = m1.as_char[5];
04ced10e8804 gcc 7 kono parents: diff changeset	249 res.as_char[3] = m2.as_char[5];
04ced10e8804 gcc 7 kono parents: diff changeset	250 res.as_char[4] = m1.as_char[6];
04ced10e8804 gcc 7 kono parents: diff changeset	251 res.as_char[5] = m2.as_char[6];
04ced10e8804 gcc 7 kono parents: diff changeset	252 res.as_char[6] = m1.as_char[7];
04ced10e8804 gcc 7 kono parents: diff changeset	253 res.as_char[7] = m2.as_char[7];
04ced10e8804 gcc 7 kono parents: diff changeset	254
04ced10e8804 gcc 7 kono parents: diff changeset	255 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	256 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	257 }
04ced10e8804 gcc 7 kono parents: diff changeset	258
04ced10e8804 gcc 7 kono parents: diff changeset	259 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	260 _m_punpckhbw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	261 {
04ced10e8804 gcc 7 kono parents: diff changeset	262 return _mm_unpackhi_pi8 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	263 }
04ced10e8804 gcc 7 kono parents: diff changeset	264
04ced10e8804 gcc 7 kono parents: diff changeset	265 /* Interleave the two 16-bit values from the high half of M1 with the two
04ced10e8804 gcc 7 kono parents: diff changeset	266 16-bit values from the high half of M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	267 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	268 _mm_unpackhi_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	269 {
04ced10e8804 gcc 7 kono parents: diff changeset	270 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	271
04ced10e8804 gcc 7 kono parents: diff changeset	272 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	273 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	274
04ced10e8804 gcc 7 kono parents: diff changeset	275 res.as_short[0] = m1.as_short[2];
04ced10e8804 gcc 7 kono parents: diff changeset	276 res.as_short[1] = m2.as_short[2];
04ced10e8804 gcc 7 kono parents: diff changeset	277 res.as_short[2] = m1.as_short[3];
04ced10e8804 gcc 7 kono parents: diff changeset	278 res.as_short[3] = m2.as_short[3];
04ced10e8804 gcc 7 kono parents: diff changeset	279
04ced10e8804 gcc 7 kono parents: diff changeset	280 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	281 }
04ced10e8804 gcc 7 kono parents: diff changeset	282
04ced10e8804 gcc 7 kono parents: diff changeset	283 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	284 _m_punpckhwd (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	285 {
04ced10e8804 gcc 7 kono parents: diff changeset	286 return _mm_unpackhi_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	287 }
04ced10e8804 gcc 7 kono parents: diff changeset	288 /* Interleave the 32-bit value from the high half of M1 with the 32-bit
04ced10e8804 gcc 7 kono parents: diff changeset	289 value from the high half of M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	290 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	291 _mm_unpackhi_pi32 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	292 {
04ced10e8804 gcc 7 kono parents: diff changeset	293 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	294
04ced10e8804 gcc 7 kono parents: diff changeset	295 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	296 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	297
04ced10e8804 gcc 7 kono parents: diff changeset	298 res.as_int[0] = m1.as_int[1];
04ced10e8804 gcc 7 kono parents: diff changeset	299 res.as_int[1] = m2.as_int[1];
04ced10e8804 gcc 7 kono parents: diff changeset	300
04ced10e8804 gcc 7 kono parents: diff changeset	301 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	302 }
04ced10e8804 gcc 7 kono parents: diff changeset	303
04ced10e8804 gcc 7 kono parents: diff changeset	304 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	305 _m_punpckhdq (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	306 {
04ced10e8804 gcc 7 kono parents: diff changeset	307 return _mm_unpackhi_pi32 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	308 }
04ced10e8804 gcc 7 kono parents: diff changeset	309 /* Interleave the four 8-bit values from the low half of M1 with the four
04ced10e8804 gcc 7 kono parents: diff changeset	310 8-bit values from the low half of M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	311 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	312 _mm_unpacklo_pi8 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	313 {
04ced10e8804 gcc 7 kono parents: diff changeset	314 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	315 __vector unsigned char a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	316
04ced10e8804 gcc 7 kono parents: diff changeset	317 a = (__vector unsigned char)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	318 b = (__vector unsigned char)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	319 c = vec_mergel (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	320 return (__builtin_unpack_vector_int128 ((vector __int128_t)c, 1));
04ced10e8804 gcc 7 kono parents: diff changeset	321 #else
04ced10e8804 gcc 7 kono parents: diff changeset	322 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	323
04ced10e8804 gcc 7 kono parents: diff changeset	324 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	325 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	326
04ced10e8804 gcc 7 kono parents: diff changeset	327 res.as_char[0] = m1.as_char[0];
04ced10e8804 gcc 7 kono parents: diff changeset	328 res.as_char[1] = m2.as_char[0];
04ced10e8804 gcc 7 kono parents: diff changeset	329 res.as_char[2] = m1.as_char[1];
04ced10e8804 gcc 7 kono parents: diff changeset	330 res.as_char[3] = m2.as_char[1];
04ced10e8804 gcc 7 kono parents: diff changeset	331 res.as_char[4] = m1.as_char[2];
04ced10e8804 gcc 7 kono parents: diff changeset	332 res.as_char[5] = m2.as_char[2];
04ced10e8804 gcc 7 kono parents: diff changeset	333 res.as_char[6] = m1.as_char[3];
04ced10e8804 gcc 7 kono parents: diff changeset	334 res.as_char[7] = m2.as_char[3];
04ced10e8804 gcc 7 kono parents: diff changeset	335
04ced10e8804 gcc 7 kono parents: diff changeset	336 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	337 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	338 }
04ced10e8804 gcc 7 kono parents: diff changeset	339
04ced10e8804 gcc 7 kono parents: diff changeset	340 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	341 _m_punpcklbw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	342 {
04ced10e8804 gcc 7 kono parents: diff changeset	343 return _mm_unpacklo_pi8 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	344 }
04ced10e8804 gcc 7 kono parents: diff changeset	345 /* Interleave the two 16-bit values from the low half of M1 with the two
04ced10e8804 gcc 7 kono parents: diff changeset	346 16-bit values from the low half of M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	347 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	348 _mm_unpacklo_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	349 {
04ced10e8804 gcc 7 kono parents: diff changeset	350 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	351
04ced10e8804 gcc 7 kono parents: diff changeset	352 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	353 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	354
04ced10e8804 gcc 7 kono parents: diff changeset	355 res.as_short[0] = m1.as_short[0];
04ced10e8804 gcc 7 kono parents: diff changeset	356 res.as_short[1] = m2.as_short[0];
04ced10e8804 gcc 7 kono parents: diff changeset	357 res.as_short[2] = m1.as_short[1];
04ced10e8804 gcc 7 kono parents: diff changeset	358 res.as_short[3] = m2.as_short[1];
04ced10e8804 gcc 7 kono parents: diff changeset	359
04ced10e8804 gcc 7 kono parents: diff changeset	360 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	361 }
04ced10e8804 gcc 7 kono parents: diff changeset	362
04ced10e8804 gcc 7 kono parents: diff changeset	363 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	364 _m_punpcklwd (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	365 {
04ced10e8804 gcc 7 kono parents: diff changeset	366 return _mm_unpacklo_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	367 }
04ced10e8804 gcc 7 kono parents: diff changeset	368
04ced10e8804 gcc 7 kono parents: diff changeset	369 /* Interleave the 32-bit value from the low half of M1 with the 32-bit
04ced10e8804 gcc 7 kono parents: diff changeset	370 value from the low half of M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	371 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	372 _mm_unpacklo_pi32 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	373 {
04ced10e8804 gcc 7 kono parents: diff changeset	374 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	375
04ced10e8804 gcc 7 kono parents: diff changeset	376 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	377 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	378
04ced10e8804 gcc 7 kono parents: diff changeset	379 res.as_int[0] = m1.as_int[0];
04ced10e8804 gcc 7 kono parents: diff changeset	380 res.as_int[1] = m2.as_int[0];
04ced10e8804 gcc 7 kono parents: diff changeset	381
04ced10e8804 gcc 7 kono parents: diff changeset	382 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	383 }
04ced10e8804 gcc 7 kono parents: diff changeset	384
04ced10e8804 gcc 7 kono parents: diff changeset	385 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	386 _m_punpckldq (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	387 {
04ced10e8804 gcc 7 kono parents: diff changeset	388 return _mm_unpacklo_pi32 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	389 }
04ced10e8804 gcc 7 kono parents: diff changeset	390
04ced10e8804 gcc 7 kono parents: diff changeset	391 /* Add the 8-bit values in M1 to the 8-bit values in M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	392 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	393 _mm_add_pi8 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	394 {
04ced10e8804 gcc 7 kono parents: diff changeset	395 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	396 __vector signed char a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	397
04ced10e8804 gcc 7 kono parents: diff changeset	398 a = (__vector signed char)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	399 b = (__vector signed char)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	400 c = vec_add (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	401 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	402 #else
04ced10e8804 gcc 7 kono parents: diff changeset	403 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	404
04ced10e8804 gcc 7 kono parents: diff changeset	405 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	406 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	407
04ced10e8804 gcc 7 kono parents: diff changeset	408 res.as_char[0] = m1.as_char[0] + m2.as_char[0];
04ced10e8804 gcc 7 kono parents: diff changeset	409 res.as_char[1] = m1.as_char[1] + m2.as_char[1];
04ced10e8804 gcc 7 kono parents: diff changeset	410 res.as_char[2] = m1.as_char[2] + m2.as_char[2];
04ced10e8804 gcc 7 kono parents: diff changeset	411 res.as_char[3] = m1.as_char[3] + m2.as_char[3];
04ced10e8804 gcc 7 kono parents: diff changeset	412 res.as_char[4] = m1.as_char[4] + m2.as_char[4];
04ced10e8804 gcc 7 kono parents: diff changeset	413 res.as_char[5] = m1.as_char[5] + m2.as_char[5];
04ced10e8804 gcc 7 kono parents: diff changeset	414 res.as_char[6] = m1.as_char[6] + m2.as_char[6];
04ced10e8804 gcc 7 kono parents: diff changeset	415 res.as_char[7] = m1.as_char[7] + m2.as_char[7];
04ced10e8804 gcc 7 kono parents: diff changeset	416
04ced10e8804 gcc 7 kono parents: diff changeset	417 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	418 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	419 }
04ced10e8804 gcc 7 kono parents: diff changeset	420
04ced10e8804 gcc 7 kono parents: diff changeset	421 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	422 _m_paddb (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	423 {
04ced10e8804 gcc 7 kono parents: diff changeset	424 return _mm_add_pi8 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	425 }
04ced10e8804 gcc 7 kono parents: diff changeset	426
04ced10e8804 gcc 7 kono parents: diff changeset	427 /* Add the 16-bit values in M1 to the 16-bit values in M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	428 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	429 _mm_add_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	430 {
04ced10e8804 gcc 7 kono parents: diff changeset	431 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	432 __vector signed short a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	433
04ced10e8804 gcc 7 kono parents: diff changeset	434 a = (__vector signed short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	435 b = (__vector signed short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	436 c = vec_add (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	437 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	438 #else
04ced10e8804 gcc 7 kono parents: diff changeset	439 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	440
04ced10e8804 gcc 7 kono parents: diff changeset	441 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	442 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	443
04ced10e8804 gcc 7 kono parents: diff changeset	444 res.as_short[0] = m1.as_short[0] + m2.as_short[0];
04ced10e8804 gcc 7 kono parents: diff changeset	445 res.as_short[1] = m1.as_short[1] + m2.as_short[1];
04ced10e8804 gcc 7 kono parents: diff changeset	446 res.as_short[2] = m1.as_short[2] + m2.as_short[2];
04ced10e8804 gcc 7 kono parents: diff changeset	447 res.as_short[3] = m1.as_short[3] + m2.as_short[3];
04ced10e8804 gcc 7 kono parents: diff changeset	448
04ced10e8804 gcc 7 kono parents: diff changeset	449 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	450 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	451 }
04ced10e8804 gcc 7 kono parents: diff changeset	452
04ced10e8804 gcc 7 kono parents: diff changeset	453 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	454 _m_paddw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	455 {
04ced10e8804 gcc 7 kono parents: diff changeset	456 return _mm_add_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	457 }
04ced10e8804 gcc 7 kono parents: diff changeset	458
04ced10e8804 gcc 7 kono parents: diff changeset	459 /* Add the 32-bit values in M1 to the 32-bit values in M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	460 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	461 _mm_add_pi32 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	462 {
04ced10e8804 gcc 7 kono parents: diff changeset	463 #if _ARCH_PWR9
04ced10e8804 gcc 7 kono parents: diff changeset	464 __vector signed int a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	465
04ced10e8804 gcc 7 kono parents: diff changeset	466 a = (__vector signed int)vec_splats (__m1, __m1);
04ced10e8804 gcc 7 kono parents: diff changeset	467 b = (__vector signed int)vec_splats (__m2, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	468 c = vec_add (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	469 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	470 #else
04ced10e8804 gcc 7 kono parents: diff changeset	471 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	472
04ced10e8804 gcc 7 kono parents: diff changeset	473 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	474 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	475
04ced10e8804 gcc 7 kono parents: diff changeset	476 res.as_int[0] = m1.as_int[0] + m2.as_int[0];
04ced10e8804 gcc 7 kono parents: diff changeset	477 res.as_int[1] = m1.as_int[1] + m2.as_int[1];
04ced10e8804 gcc 7 kono parents: diff changeset	478
04ced10e8804 gcc 7 kono parents: diff changeset	479 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	480 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	481 }
04ced10e8804 gcc 7 kono parents: diff changeset	482
04ced10e8804 gcc 7 kono parents: diff changeset	483 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	484 _m_paddd (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	485 {
04ced10e8804 gcc 7 kono parents: diff changeset	486 return _mm_add_pi32 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	487 }
04ced10e8804 gcc 7 kono parents: diff changeset	488
04ced10e8804 gcc 7 kono parents: diff changeset	489 /* Subtract the 8-bit values in M2 from the 8-bit values in M1. */
04ced10e8804 gcc 7 kono parents: diff changeset	490 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	491 _mm_sub_pi8 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	492 {
04ced10e8804 gcc 7 kono parents: diff changeset	493 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	494 __vector signed char a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	495
04ced10e8804 gcc 7 kono parents: diff changeset	496 a = (__vector signed char)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	497 b = (__vector signed char)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	498 c = vec_sub (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	499 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	500 #else
04ced10e8804 gcc 7 kono parents: diff changeset	501 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	502
04ced10e8804 gcc 7 kono parents: diff changeset	503 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	504 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	505
04ced10e8804 gcc 7 kono parents: diff changeset	506 res.as_char[0] = m1.as_char[0] - m2.as_char[0];
04ced10e8804 gcc 7 kono parents: diff changeset	507 res.as_char[1] = m1.as_char[1] - m2.as_char[1];
04ced10e8804 gcc 7 kono parents: diff changeset	508 res.as_char[2] = m1.as_char[2] - m2.as_char[2];
04ced10e8804 gcc 7 kono parents: diff changeset	509 res.as_char[3] = m1.as_char[3] - m2.as_char[3];
04ced10e8804 gcc 7 kono parents: diff changeset	510 res.as_char[4] = m1.as_char[4] - m2.as_char[4];
04ced10e8804 gcc 7 kono parents: diff changeset	511 res.as_char[5] = m1.as_char[5] - m2.as_char[5];
04ced10e8804 gcc 7 kono parents: diff changeset	512 res.as_char[6] = m1.as_char[6] - m2.as_char[6];
04ced10e8804 gcc 7 kono parents: diff changeset	513 res.as_char[7] = m1.as_char[7] - m2.as_char[7];
04ced10e8804 gcc 7 kono parents: diff changeset	514
04ced10e8804 gcc 7 kono parents: diff changeset	515 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	516 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	517 }
04ced10e8804 gcc 7 kono parents: diff changeset	518
04ced10e8804 gcc 7 kono parents: diff changeset	519 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	520 _m_psubb (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	521 {
04ced10e8804 gcc 7 kono parents: diff changeset	522 return _mm_sub_pi8 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	523 }
04ced10e8804 gcc 7 kono parents: diff changeset	524
04ced10e8804 gcc 7 kono parents: diff changeset	525 /* Subtract the 16-bit values in M2 from the 16-bit values in M1. */
04ced10e8804 gcc 7 kono parents: diff changeset	526 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	527 _mm_sub_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	528 {
04ced10e8804 gcc 7 kono parents: diff changeset	529 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	530 __vector signed short a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	531
04ced10e8804 gcc 7 kono parents: diff changeset	532 a = (__vector signed short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	533 b = (__vector signed short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	534 c = vec_sub (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	535 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	536 #else
04ced10e8804 gcc 7 kono parents: diff changeset	537 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	538
04ced10e8804 gcc 7 kono parents: diff changeset	539 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	540 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	541
04ced10e8804 gcc 7 kono parents: diff changeset	542 res.as_short[0] = m1.as_short[0] - m2.as_short[0];
04ced10e8804 gcc 7 kono parents: diff changeset	543 res.as_short[1] = m1.as_short[1] - m2.as_short[1];
04ced10e8804 gcc 7 kono parents: diff changeset	544 res.as_short[2] = m1.as_short[2] - m2.as_short[2];
04ced10e8804 gcc 7 kono parents: diff changeset	545 res.as_short[3] = m1.as_short[3] - m2.as_short[3];
04ced10e8804 gcc 7 kono parents: diff changeset	546
04ced10e8804 gcc 7 kono parents: diff changeset	547 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	548 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	549 }
04ced10e8804 gcc 7 kono parents: diff changeset	550
04ced10e8804 gcc 7 kono parents: diff changeset	551 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	552 _m_psubw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	553 {
04ced10e8804 gcc 7 kono parents: diff changeset	554 return _mm_sub_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	555 }
04ced10e8804 gcc 7 kono parents: diff changeset	556
04ced10e8804 gcc 7 kono parents: diff changeset	557 /* Subtract the 32-bit values in M2 from the 32-bit values in M1. */
04ced10e8804 gcc 7 kono parents: diff changeset	558 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	559 _mm_sub_pi32 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	560 {
04ced10e8804 gcc 7 kono parents: diff changeset	561 #if _ARCH_PWR9
04ced10e8804 gcc 7 kono parents: diff changeset	562 __vector signed int a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	563
04ced10e8804 gcc 7 kono parents: diff changeset	564 a = (__vector signed int)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	565 b = (__vector signed int)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	566 c = vec_sub (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	567 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	568 #else
04ced10e8804 gcc 7 kono parents: diff changeset	569 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	570
04ced10e8804 gcc 7 kono parents: diff changeset	571 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	572 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	573
04ced10e8804 gcc 7 kono parents: diff changeset	574 res.as_int[0] = m1.as_int[0] - m2.as_int[0];
04ced10e8804 gcc 7 kono parents: diff changeset	575 res.as_int[1] = m1.as_int[1] - m2.as_int[1];
04ced10e8804 gcc 7 kono parents: diff changeset	576
04ced10e8804 gcc 7 kono parents: diff changeset	577 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	578 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	579 }
04ced10e8804 gcc 7 kono parents: diff changeset	580
04ced10e8804 gcc 7 kono parents: diff changeset	581 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	582 _m_psubd (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	583 {
04ced10e8804 gcc 7 kono parents: diff changeset	584 return _mm_add_pi32 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	585 }
04ced10e8804 gcc 7 kono parents: diff changeset	586
04ced10e8804 gcc 7 kono parents: diff changeset	587 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	588 _mm_add_si64 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	589 {
04ced10e8804 gcc 7 kono parents: diff changeset	590 return (__m1 + __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	591 }
04ced10e8804 gcc 7 kono parents: diff changeset	592
04ced10e8804 gcc 7 kono parents: diff changeset	593 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	594 _mm_sub_si64 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	595 {
04ced10e8804 gcc 7 kono parents: diff changeset	596 return (__m1 - __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	597 }
04ced10e8804 gcc 7 kono parents: diff changeset	598
04ced10e8804 gcc 7 kono parents: diff changeset	599 /* Shift the 64-bit value in M left by COUNT. */
04ced10e8804 gcc 7 kono parents: diff changeset	600 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	601 _mm_sll_si64 (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	602 {
04ced10e8804 gcc 7 kono parents: diff changeset	603 return (__m << __count);
04ced10e8804 gcc 7 kono parents: diff changeset	604 }
04ced10e8804 gcc 7 kono parents: diff changeset	605
04ced10e8804 gcc 7 kono parents: diff changeset	606 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	607 _m_psllq (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	608 {
04ced10e8804 gcc 7 kono parents: diff changeset	609 return _mm_sll_si64 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	610 }
04ced10e8804 gcc 7 kono parents: diff changeset	611
04ced10e8804 gcc 7 kono parents: diff changeset	612 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	613 _mm_slli_si64 (__m64 __m, const int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	614 {
04ced10e8804 gcc 7 kono parents: diff changeset	615 return (__m << __count);
04ced10e8804 gcc 7 kono parents: diff changeset	616 }
04ced10e8804 gcc 7 kono parents: diff changeset	617
04ced10e8804 gcc 7 kono parents: diff changeset	618 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	619 _m_psllqi (__m64 __m, const int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	620 {
04ced10e8804 gcc 7 kono parents: diff changeset	621 return _mm_slli_si64 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	622 }
04ced10e8804 gcc 7 kono parents: diff changeset	623
04ced10e8804 gcc 7 kono parents: diff changeset	624 /* Shift the 64-bit value in M left by COUNT; shift in zeros. */
04ced10e8804 gcc 7 kono parents: diff changeset	625 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	626 _mm_srl_si64 (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	627 {
04ced10e8804 gcc 7 kono parents: diff changeset	628 return (__m >> __count);
04ced10e8804 gcc 7 kono parents: diff changeset	629 }
04ced10e8804 gcc 7 kono parents: diff changeset	630
04ced10e8804 gcc 7 kono parents: diff changeset	631 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	632 _m_psrlq (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	633 {
04ced10e8804 gcc 7 kono parents: diff changeset	634 return _mm_srl_si64 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	635 }
04ced10e8804 gcc 7 kono parents: diff changeset	636
04ced10e8804 gcc 7 kono parents: diff changeset	637 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	638 _mm_srli_si64 (__m64 __m, const int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	639 {
04ced10e8804 gcc 7 kono parents: diff changeset	640 return (__m >> __count);
04ced10e8804 gcc 7 kono parents: diff changeset	641 }
04ced10e8804 gcc 7 kono parents: diff changeset	642
04ced10e8804 gcc 7 kono parents: diff changeset	643 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	644 _m_psrlqi (__m64 __m, const int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	645 {
04ced10e8804 gcc 7 kono parents: diff changeset	646 return _mm_srli_si64 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	647 }
04ced10e8804 gcc 7 kono parents: diff changeset	648
04ced10e8804 gcc 7 kono parents: diff changeset	649 /* Bit-wise AND the 64-bit values in M1 and M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	650 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	651 _mm_and_si64 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	652 {
04ced10e8804 gcc 7 kono parents: diff changeset	653 return (__m1 & __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	654 }
04ced10e8804 gcc 7 kono parents: diff changeset	655
04ced10e8804 gcc 7 kono parents: diff changeset	656 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	657 _m_pand (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	658 {
04ced10e8804 gcc 7 kono parents: diff changeset	659 return _mm_and_si64 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	660 }
04ced10e8804 gcc 7 kono parents: diff changeset	661
04ced10e8804 gcc 7 kono parents: diff changeset	662 /* Bit-wise complement the 64-bit value in M1 and bit-wise AND it with the
04ced10e8804 gcc 7 kono parents: diff changeset	663 64-bit value in M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	664 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	665 _mm_andnot_si64 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	666 {
04ced10e8804 gcc 7 kono parents: diff changeset	667 return (~__m1 & __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	668 }
04ced10e8804 gcc 7 kono parents: diff changeset	669
04ced10e8804 gcc 7 kono parents: diff changeset	670 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	671 _m_pandn (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	672 {
04ced10e8804 gcc 7 kono parents: diff changeset	673 return _mm_andnot_si64 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	674 }
04ced10e8804 gcc 7 kono parents: diff changeset	675
04ced10e8804 gcc 7 kono parents: diff changeset	676 /* Bit-wise inclusive OR the 64-bit values in M1 and M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	677 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	678 _mm_or_si64 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	679 {
04ced10e8804 gcc 7 kono parents: diff changeset	680 return (__m1 \| __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	681 }
04ced10e8804 gcc 7 kono parents: diff changeset	682
04ced10e8804 gcc 7 kono parents: diff changeset	683 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	684 _m_por (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	685 {
04ced10e8804 gcc 7 kono parents: diff changeset	686 return _mm_or_si64 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	687 }
04ced10e8804 gcc 7 kono parents: diff changeset	688
04ced10e8804 gcc 7 kono parents: diff changeset	689 /* Bit-wise exclusive OR the 64-bit values in M1 and M2. */
04ced10e8804 gcc 7 kono parents: diff changeset	690 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	691 _mm_xor_si64 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	692 {
04ced10e8804 gcc 7 kono parents: diff changeset	693 return (__m1 ^ __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	694 }
04ced10e8804 gcc 7 kono parents: diff changeset	695
04ced10e8804 gcc 7 kono parents: diff changeset	696 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	697 _m_pxor (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	698 {
04ced10e8804 gcc 7 kono parents: diff changeset	699 return _mm_xor_si64 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	700 }
04ced10e8804 gcc 7 kono parents: diff changeset	701
04ced10e8804 gcc 7 kono parents: diff changeset	702 /* Creates a 64-bit zero. */
04ced10e8804 gcc 7 kono parents: diff changeset	703 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	704 _mm_setzero_si64 (void)
04ced10e8804 gcc 7 kono parents: diff changeset	705 {
04ced10e8804 gcc 7 kono parents: diff changeset	706 return (__m64) 0;
04ced10e8804 gcc 7 kono parents: diff changeset	707 }
04ced10e8804 gcc 7 kono parents: diff changeset	708
04ced10e8804 gcc 7 kono parents: diff changeset	709 /* Compare eight 8-bit values. The result of the comparison is 0xFF if the
04ced10e8804 gcc 7 kono parents: diff changeset	710 test is true and zero if false. */
04ced10e8804 gcc 7 kono parents: diff changeset	711 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	712 _mm_cmpeq_pi8 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	713 {
04ced10e8804 gcc 7 kono parents: diff changeset	714 #ifdef _ARCH_PWR6
04ced10e8804 gcc 7 kono parents: diff changeset	715 __m64 res;
04ced10e8804 gcc 7 kono parents: diff changeset	716 __asm__(
04ced10e8804 gcc 7 kono parents: diff changeset	717 "cmpb %0,%1,%2;\n"
04ced10e8804 gcc 7 kono parents: diff changeset	718 : "=r" (res)
04ced10e8804 gcc 7 kono parents: diff changeset	719 : "r" (__m1),
04ced10e8804 gcc 7 kono parents: diff changeset	720 "r" (__m2)
04ced10e8804 gcc 7 kono parents: diff changeset	721 : );
04ced10e8804 gcc 7 kono parents: diff changeset	722 return (res);
04ced10e8804 gcc 7 kono parents: diff changeset	723 #else
04ced10e8804 gcc 7 kono parents: diff changeset	724 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	725
04ced10e8804 gcc 7 kono parents: diff changeset	726 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	727 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	728
04ced10e8804 gcc 7 kono parents: diff changeset	729 res.as_char[0] = (m1.as_char[0] == m2.as_char[0])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	730 res.as_char[1] = (m1.as_char[1] == m2.as_char[1])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	731 res.as_char[2] = (m1.as_char[2] == m2.as_char[2])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	732 res.as_char[3] = (m1.as_char[3] == m2.as_char[3])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	733 res.as_char[4] = (m1.as_char[4] == m2.as_char[4])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	734 res.as_char[5] = (m1.as_char[5] == m2.as_char[5])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	735 res.as_char[6] = (m1.as_char[6] == m2.as_char[6])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	736 res.as_char[7] = (m1.as_char[7] == m2.as_char[7])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	737
04ced10e8804 gcc 7 kono parents: diff changeset	738 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	739 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	740 }
04ced10e8804 gcc 7 kono parents: diff changeset	741
04ced10e8804 gcc 7 kono parents: diff changeset	742 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	743 _m_pcmpeqb (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	744 {
04ced10e8804 gcc 7 kono parents: diff changeset	745 return _mm_cmpeq_pi8 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	746 }
04ced10e8804 gcc 7 kono parents: diff changeset	747
04ced10e8804 gcc 7 kono parents: diff changeset	748 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	749 _mm_cmpgt_pi8 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	750 {
04ced10e8804 gcc 7 kono parents: diff changeset	751 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	752 __vector signed char a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	753
04ced10e8804 gcc 7 kono parents: diff changeset	754 a = (__vector signed char)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	755 b = (__vector signed char)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	756 c = (__vector signed char)vec_cmpgt (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	757 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	758 #else
04ced10e8804 gcc 7 kono parents: diff changeset	759 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	760
04ced10e8804 gcc 7 kono parents: diff changeset	761 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	762 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	763
04ced10e8804 gcc 7 kono parents: diff changeset	764 res.as_char[0] = (m1.as_char[0] > m2.as_char[0])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	765 res.as_char[1] = (m1.as_char[1] > m2.as_char[1])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	766 res.as_char[2] = (m1.as_char[2] > m2.as_char[2])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	767 res.as_char[3] = (m1.as_char[3] > m2.as_char[3])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	768 res.as_char[4] = (m1.as_char[4] > m2.as_char[4])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	769 res.as_char[5] = (m1.as_char[5] > m2.as_char[5])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	770 res.as_char[6] = (m1.as_char[6] > m2.as_char[6])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	771 res.as_char[7] = (m1.as_char[7] > m2.as_char[7])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	772
04ced10e8804 gcc 7 kono parents: diff changeset	773 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	774 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	775 }
04ced10e8804 gcc 7 kono parents: diff changeset	776
04ced10e8804 gcc 7 kono parents: diff changeset	777 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	778 _m_pcmpgtb (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	779 {
04ced10e8804 gcc 7 kono parents: diff changeset	780 return _mm_cmpgt_pi8 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	781 }
04ced10e8804 gcc 7 kono parents: diff changeset	782
04ced10e8804 gcc 7 kono parents: diff changeset	783 /* Compare four 16-bit values. The result of the comparison is 0xFFFF if
04ced10e8804 gcc 7 kono parents: diff changeset	784 the test is true and zero if false. */
04ced10e8804 gcc 7 kono parents: diff changeset	785 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	786 _mm_cmpeq_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	787 {
04ced10e8804 gcc 7 kono parents: diff changeset	788 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	789 __vector signed short a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	790
04ced10e8804 gcc 7 kono parents: diff changeset	791 a = (__vector signed short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	792 b = (__vector signed short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	793 c = (__vector signed short)vec_cmpeq (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	794 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	795 #else
04ced10e8804 gcc 7 kono parents: diff changeset	796 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	797
04ced10e8804 gcc 7 kono parents: diff changeset	798 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	799 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	800
04ced10e8804 gcc 7 kono parents: diff changeset	801 res.as_short[0] = (m1.as_short[0] == m2.as_short[0])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	802 res.as_short[1] = (m1.as_short[1] == m2.as_short[1])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	803 res.as_short[2] = (m1.as_short[2] == m2.as_short[2])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	804 res.as_short[3] = (m1.as_short[3] == m2.as_short[3])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	805
04ced10e8804 gcc 7 kono parents: diff changeset	806 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	807 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	808 }
04ced10e8804 gcc 7 kono parents: diff changeset	809
04ced10e8804 gcc 7 kono parents: diff changeset	810 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	811 _m_pcmpeqw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	812 {
04ced10e8804 gcc 7 kono parents: diff changeset	813 return _mm_cmpeq_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	814 }
04ced10e8804 gcc 7 kono parents: diff changeset	815
04ced10e8804 gcc 7 kono parents: diff changeset	816 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	817 _mm_cmpgt_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	818 {
04ced10e8804 gcc 7 kono parents: diff changeset	819 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	820 __vector signed short a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	821
04ced10e8804 gcc 7 kono parents: diff changeset	822 a = (__vector signed short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	823 b = (__vector signed short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	824 c = (__vector signed short)vec_cmpgt (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	825 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	826 #else
04ced10e8804 gcc 7 kono parents: diff changeset	827 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	828
04ced10e8804 gcc 7 kono parents: diff changeset	829 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	830 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	831
04ced10e8804 gcc 7 kono parents: diff changeset	832 res.as_short[0] = (m1.as_short[0] > m2.as_short[0])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	833 res.as_short[1] = (m1.as_short[1] > m2.as_short[1])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	834 res.as_short[2] = (m1.as_short[2] > m2.as_short[2])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	835 res.as_short[3] = (m1.as_short[3] > m2.as_short[3])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	836
04ced10e8804 gcc 7 kono parents: diff changeset	837 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	838 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	839 }
04ced10e8804 gcc 7 kono parents: diff changeset	840
04ced10e8804 gcc 7 kono parents: diff changeset	841 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	842 _m_pcmpgtw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	843 {
04ced10e8804 gcc 7 kono parents: diff changeset	844 return _mm_cmpgt_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	845 }
04ced10e8804 gcc 7 kono parents: diff changeset	846
04ced10e8804 gcc 7 kono parents: diff changeset	847 /* Compare two 32-bit values. The result of the comparison is 0xFFFFFFFF if
04ced10e8804 gcc 7 kono parents: diff changeset	848 the test is true and zero if false. */
04ced10e8804 gcc 7 kono parents: diff changeset	849 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	850 _mm_cmpeq_pi32 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	851 {
04ced10e8804 gcc 7 kono parents: diff changeset	852 #if _ARCH_PWR9
04ced10e8804 gcc 7 kono parents: diff changeset	853 __vector signed int a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	854
04ced10e8804 gcc 7 kono parents: diff changeset	855 a = (__vector signed int)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	856 b = (__vector signed int)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	857 c = (__vector signed short)vec_cmpeq (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	858 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	859 #else
04ced10e8804 gcc 7 kono parents: diff changeset	860 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	861
04ced10e8804 gcc 7 kono parents: diff changeset	862 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	863 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	864
04ced10e8804 gcc 7 kono parents: diff changeset	865 res.as_int[0] = (m1.as_int[0] == m2.as_int[0])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	866 res.as_int[1] = (m1.as_int[1] == m2.as_int[1])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	867
04ced10e8804 gcc 7 kono parents: diff changeset	868 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	869 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	870 }
04ced10e8804 gcc 7 kono parents: diff changeset	871
04ced10e8804 gcc 7 kono parents: diff changeset	872 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	873 _m_pcmpeqd (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	874 {
04ced10e8804 gcc 7 kono parents: diff changeset	875 return _mm_cmpeq_pi32 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	876 }
04ced10e8804 gcc 7 kono parents: diff changeset	877
04ced10e8804 gcc 7 kono parents: diff changeset	878 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	879 _mm_cmpgt_pi32 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	880 {
04ced10e8804 gcc 7 kono parents: diff changeset	881 #if _ARCH_PWR9
04ced10e8804 gcc 7 kono parents: diff changeset	882 __vector signed int a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	883
04ced10e8804 gcc 7 kono parents: diff changeset	884 a = (__vector signed int)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	885 b = (__vector signed int)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	886 c = (__vector signed short)vec_cmpgt (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	887 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	888 #else
04ced10e8804 gcc 7 kono parents: diff changeset	889 __m64_union m1, m2, res;
04ced10e8804 gcc 7 kono parents: diff changeset	890
04ced10e8804 gcc 7 kono parents: diff changeset	891 m1.as_m64 = __m1;
04ced10e8804 gcc 7 kono parents: diff changeset	892 m2.as_m64 = __m2;
04ced10e8804 gcc 7 kono parents: diff changeset	893
04ced10e8804 gcc 7 kono parents: diff changeset	894 res.as_int[0] = (m1.as_int[0] > m2.as_int[0])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	895 res.as_int[1] = (m1.as_int[1] > m2.as_int[1])? -1: 0;
04ced10e8804 gcc 7 kono parents: diff changeset	896
04ced10e8804 gcc 7 kono parents: diff changeset	897 return (__m64) res.as_m64;
04ced10e8804 gcc 7 kono parents: diff changeset	898 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	899 }
04ced10e8804 gcc 7 kono parents: diff changeset	900
04ced10e8804 gcc 7 kono parents: diff changeset	901 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	902 _m_pcmpgtd (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	903 {
04ced10e8804 gcc 7 kono parents: diff changeset	904 return _mm_cmpgt_pi32 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	905 }
04ced10e8804 gcc 7 kono parents: diff changeset	906
04ced10e8804 gcc 7 kono parents: diff changeset	907 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	908 /* Add the 8-bit values in M1 to the 8-bit values in M2 using signed
04ced10e8804 gcc 7 kono parents: diff changeset	909 saturated arithmetic. */
04ced10e8804 gcc 7 kono parents: diff changeset	910 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	911 _mm_adds_pi8 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	912 {
04ced10e8804 gcc 7 kono parents: diff changeset	913 __vector signed char a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	914
04ced10e8804 gcc 7 kono parents: diff changeset	915 a = (__vector signed char)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	916 b = (__vector signed char)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	917 c = vec_adds (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	918 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	919 }
04ced10e8804 gcc 7 kono parents: diff changeset	920
04ced10e8804 gcc 7 kono parents: diff changeset	921 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	922 _m_paddsb (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	923 {
04ced10e8804 gcc 7 kono parents: diff changeset	924 return _mm_adds_pi8 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	925 }
04ced10e8804 gcc 7 kono parents: diff changeset	926 /* Add the 16-bit values in M1 to the 16-bit values in M2 using signed
04ced10e8804 gcc 7 kono parents: diff changeset	927 saturated arithmetic. */
04ced10e8804 gcc 7 kono parents: diff changeset	928 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	929 _mm_adds_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	930 {
04ced10e8804 gcc 7 kono parents: diff changeset	931 __vector signed short a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	932
04ced10e8804 gcc 7 kono parents: diff changeset	933 a = (__vector signed short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	934 b = (__vector signed short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	935 c = vec_adds (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	936 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	937 }
04ced10e8804 gcc 7 kono parents: diff changeset	938
04ced10e8804 gcc 7 kono parents: diff changeset	939 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	940 _m_paddsw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	941 {
04ced10e8804 gcc 7 kono parents: diff changeset	942 return _mm_adds_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	943 }
04ced10e8804 gcc 7 kono parents: diff changeset	944 /* Add the 8-bit values in M1 to the 8-bit values in M2 using unsigned
04ced10e8804 gcc 7 kono parents: diff changeset	945 saturated arithmetic. */
04ced10e8804 gcc 7 kono parents: diff changeset	946 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	947 _mm_adds_pu8 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	948 {
04ced10e8804 gcc 7 kono parents: diff changeset	949 __vector unsigned char a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	950
04ced10e8804 gcc 7 kono parents: diff changeset	951 a = (__vector unsigned char)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	952 b = (__vector unsigned char)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	953 c = vec_adds (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	954 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	955 }
04ced10e8804 gcc 7 kono parents: diff changeset	956
04ced10e8804 gcc 7 kono parents: diff changeset	957 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	958 _m_paddusb (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	959 {
04ced10e8804 gcc 7 kono parents: diff changeset	960 return _mm_adds_pu8 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	961 }
04ced10e8804 gcc 7 kono parents: diff changeset	962
04ced10e8804 gcc 7 kono parents: diff changeset	963 /* Add the 16-bit values in M1 to the 16-bit values in M2 using unsigned
04ced10e8804 gcc 7 kono parents: diff changeset	964 saturated arithmetic. */
04ced10e8804 gcc 7 kono parents: diff changeset	965 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	966 _mm_adds_pu16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	967 {
04ced10e8804 gcc 7 kono parents: diff changeset	968 __vector unsigned short a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	969
04ced10e8804 gcc 7 kono parents: diff changeset	970 a = (__vector unsigned short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	971 b = (__vector unsigned short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	972 c = vec_adds (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	973 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	974 }
04ced10e8804 gcc 7 kono parents: diff changeset	975
04ced10e8804 gcc 7 kono parents: diff changeset	976 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	977 _m_paddusw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	978 {
04ced10e8804 gcc 7 kono parents: diff changeset	979 return _mm_adds_pu16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	980 }
04ced10e8804 gcc 7 kono parents: diff changeset	981
04ced10e8804 gcc 7 kono parents: diff changeset	982 /* Subtract the 8-bit values in M2 from the 8-bit values in M1 using signed
04ced10e8804 gcc 7 kono parents: diff changeset	983 saturating arithmetic. */
04ced10e8804 gcc 7 kono parents: diff changeset	984 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	985 _mm_subs_pi8 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	986 {
04ced10e8804 gcc 7 kono parents: diff changeset	987 __vector signed char a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	988
04ced10e8804 gcc 7 kono parents: diff changeset	989 a = (__vector signed char)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	990 b = (__vector signed char)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	991 c = vec_subs (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	992 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	993 }
04ced10e8804 gcc 7 kono parents: diff changeset	994
04ced10e8804 gcc 7 kono parents: diff changeset	995 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	996 _m_psubsb (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	997 {
04ced10e8804 gcc 7 kono parents: diff changeset	998 return _mm_subs_pi8 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	999 }
04ced10e8804 gcc 7 kono parents: diff changeset	1000
04ced10e8804 gcc 7 kono parents: diff changeset	1001 /* Subtract the 16-bit values in M2 from the 16-bit values in M1 using
04ced10e8804 gcc 7 kono parents: diff changeset	1002 signed saturating arithmetic. */
04ced10e8804 gcc 7 kono parents: diff changeset	1003 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1004 _mm_subs_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1005 {
04ced10e8804 gcc 7 kono parents: diff changeset	1006 __vector signed short a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	1007
04ced10e8804 gcc 7 kono parents: diff changeset	1008 a = (__vector signed short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	1009 b = (__vector signed short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1010 c = vec_subs (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	1011 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1012 }
04ced10e8804 gcc 7 kono parents: diff changeset	1013
04ced10e8804 gcc 7 kono parents: diff changeset	1014 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1015 _m_psubsw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1016 {
04ced10e8804 gcc 7 kono parents: diff changeset	1017 return _mm_subs_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1018 }
04ced10e8804 gcc 7 kono parents: diff changeset	1019
04ced10e8804 gcc 7 kono parents: diff changeset	1020 /* Subtract the 8-bit values in M2 from the 8-bit values in M1 using
04ced10e8804 gcc 7 kono parents: diff changeset	1021 unsigned saturating arithmetic. */
04ced10e8804 gcc 7 kono parents: diff changeset	1022 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1023 _mm_subs_pu8 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1024 {
04ced10e8804 gcc 7 kono parents: diff changeset	1025 __vector unsigned char a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	1026
04ced10e8804 gcc 7 kono parents: diff changeset	1027 a = (__vector unsigned char)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	1028 b = (__vector unsigned char)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1029 c = vec_subs (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	1030 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1031 }
04ced10e8804 gcc 7 kono parents: diff changeset	1032
04ced10e8804 gcc 7 kono parents: diff changeset	1033 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1034 _m_psubusb (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1035 {
04ced10e8804 gcc 7 kono parents: diff changeset	1036 return _mm_subs_pu8 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1037 }
04ced10e8804 gcc 7 kono parents: diff changeset	1038
04ced10e8804 gcc 7 kono parents: diff changeset	1039 /* Subtract the 16-bit values in M2 from the 16-bit values in M1 using
04ced10e8804 gcc 7 kono parents: diff changeset	1040 unsigned saturating arithmetic. */
04ced10e8804 gcc 7 kono parents: diff changeset	1041 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1042 _mm_subs_pu16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1043 {
04ced10e8804 gcc 7 kono parents: diff changeset	1044 __vector unsigned short a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	1045
04ced10e8804 gcc 7 kono parents: diff changeset	1046 a = (__vector unsigned short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	1047 b = (__vector unsigned short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1048 c = vec_subs (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	1049 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1050 }
04ced10e8804 gcc 7 kono parents: diff changeset	1051
04ced10e8804 gcc 7 kono parents: diff changeset	1052 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1053 _m_psubusw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1054 {
04ced10e8804 gcc 7 kono parents: diff changeset	1055 return _mm_subs_pu16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1056 }
04ced10e8804 gcc 7 kono parents: diff changeset	1057
04ced10e8804 gcc 7 kono parents: diff changeset	1058 /* Multiply four 16-bit values in M1 by four 16-bit values in M2 producing
04ced10e8804 gcc 7 kono parents: diff changeset	1059 four 32-bit intermediate results, which are then summed by pairs to
04ced10e8804 gcc 7 kono parents: diff changeset	1060 produce two 32-bit results. */
04ced10e8804 gcc 7 kono parents: diff changeset	1061 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1062 _mm_madd_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1063 {
04ced10e8804 gcc 7 kono parents: diff changeset	1064 __vector signed short a, b;
04ced10e8804 gcc 7 kono parents: diff changeset	1065 __vector signed int c;
04ced10e8804 gcc 7 kono parents: diff changeset	1066 __vector signed int zero = {0, 0, 0, 0};
04ced10e8804 gcc 7 kono parents: diff changeset	1067
04ced10e8804 gcc 7 kono parents: diff changeset	1068 a = (__vector signed short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	1069 b = (__vector signed short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1070 c = vec_vmsumshm (a, b, zero);
04ced10e8804 gcc 7 kono parents: diff changeset	1071 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1072 }
04ced10e8804 gcc 7 kono parents: diff changeset	1073
04ced10e8804 gcc 7 kono parents: diff changeset	1074 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1075 _m_pmaddwd (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1076 {
04ced10e8804 gcc 7 kono parents: diff changeset	1077 return _mm_madd_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1078 }
04ced10e8804 gcc 7 kono parents: diff changeset	1079 /* Multiply four signed 16-bit values in M1 by four signed 16-bit values in
04ced10e8804 gcc 7 kono parents: diff changeset	1080 M2 and produce the high 16 bits of the 32-bit results. */
04ced10e8804 gcc 7 kono parents: diff changeset	1081 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1082 _mm_mulhi_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1083 {
04ced10e8804 gcc 7 kono parents: diff changeset	1084 __vector signed short a, b;
04ced10e8804 gcc 7 kono parents: diff changeset	1085 __vector signed short c;
04ced10e8804 gcc 7 kono parents: diff changeset	1086 __vector signed int w0, w1;
04ced10e8804 gcc 7 kono parents: diff changeset	1087 __vector unsigned char xform1 = {
04ced10e8804 gcc 7 kono parents: diff changeset	1088 0x02, 0x03, 0x12, 0x13, 0x06, 0x07, 0x16, 0x17,
04ced10e8804 gcc 7 kono parents: diff changeset	1089 0x0A, 0x0B, 0x1A, 0x1B, 0x0E, 0x0F, 0x1E, 0x1F
04ced10e8804 gcc 7 kono parents: diff changeset	1090 };
04ced10e8804 gcc 7 kono parents: diff changeset	1091
04ced10e8804 gcc 7 kono parents: diff changeset	1092 a = (__vector signed short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	1093 b = (__vector signed short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1094
04ced10e8804 gcc 7 kono parents: diff changeset	1095 w0 = vec_vmulesh (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	1096 w1 = vec_vmulosh (a, b);
04ced10e8804 gcc 7 kono parents: diff changeset	1097 c = (__vector signed short)vec_perm (w0, w1, xform1);
04ced10e8804 gcc 7 kono parents: diff changeset	1098
04ced10e8804 gcc 7 kono parents: diff changeset	1099 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1100 }
04ced10e8804 gcc 7 kono parents: diff changeset	1101
04ced10e8804 gcc 7 kono parents: diff changeset	1102 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1103 _m_pmulhw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1104 {
04ced10e8804 gcc 7 kono parents: diff changeset	1105 return _mm_mulhi_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1106 }
04ced10e8804 gcc 7 kono parents: diff changeset	1107
04ced10e8804 gcc 7 kono parents: diff changeset	1108 /* Multiply four 16-bit values in M1 by four 16-bit values in M2 and produce
04ced10e8804 gcc 7 kono parents: diff changeset	1109 the low 16 bits of the results. */
04ced10e8804 gcc 7 kono parents: diff changeset	1110 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1111 _mm_mullo_pi16 (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1112 {
04ced10e8804 gcc 7 kono parents: diff changeset	1113 __vector signed short a, b, c;
04ced10e8804 gcc 7 kono parents: diff changeset	1114
04ced10e8804 gcc 7 kono parents: diff changeset	1115 a = (__vector signed short)vec_splats (__m1);
04ced10e8804 gcc 7 kono parents: diff changeset	1116 b = (__vector signed short)vec_splats (__m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1117 c = a * b;
04ced10e8804 gcc 7 kono parents: diff changeset	1118 return (__builtin_unpack_vector_int128 ((__vector __int128_t)c, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1119 }
04ced10e8804 gcc 7 kono parents: diff changeset	1120
04ced10e8804 gcc 7 kono parents: diff changeset	1121 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1122 _m_pmullw (__m64 __m1, __m64 __m2)
04ced10e8804 gcc 7 kono parents: diff changeset	1123 {
04ced10e8804 gcc 7 kono parents: diff changeset	1124 return _mm_mullo_pi16 (__m1, __m2);
04ced10e8804 gcc 7 kono parents: diff changeset	1125 }
04ced10e8804 gcc 7 kono parents: diff changeset	1126
04ced10e8804 gcc 7 kono parents: diff changeset	1127 /* Shift four 16-bit values in M left by COUNT. */
04ced10e8804 gcc 7 kono parents: diff changeset	1128 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1129 _mm_sll_pi16 (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1130 {
04ced10e8804 gcc 7 kono parents: diff changeset	1131 __vector signed short m, r;
04ced10e8804 gcc 7 kono parents: diff changeset	1132 __vector unsigned short c;
04ced10e8804 gcc 7 kono parents: diff changeset	1133
04ced10e8804 gcc 7 kono parents: diff changeset	1134 if (__count <= 15)
04ced10e8804 gcc 7 kono parents: diff changeset	1135 {
04ced10e8804 gcc 7 kono parents: diff changeset	1136 m = (__vector signed short)vec_splats (__m);
04ced10e8804 gcc 7 kono parents: diff changeset	1137 c = (__vector unsigned short)vec_splats ((unsigned short)__count);
04ced10e8804 gcc 7 kono parents: diff changeset	1138 r = vec_sl (m, (__vector unsigned short)c);
04ced10e8804 gcc 7 kono parents: diff changeset	1139 return (__builtin_unpack_vector_int128 ((__vector __int128_t)r, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1140 }
04ced10e8804 gcc 7 kono parents: diff changeset	1141 else
04ced10e8804 gcc 7 kono parents: diff changeset	1142 return (0);
04ced10e8804 gcc 7 kono parents: diff changeset	1143 }
04ced10e8804 gcc 7 kono parents: diff changeset	1144
04ced10e8804 gcc 7 kono parents: diff changeset	1145 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1146 _m_psllw (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1147 {
04ced10e8804 gcc 7 kono parents: diff changeset	1148 return _mm_sll_pi16 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1149 }
04ced10e8804 gcc 7 kono parents: diff changeset	1150
04ced10e8804 gcc 7 kono parents: diff changeset	1151 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1152 _mm_slli_pi16 (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1153 {
04ced10e8804 gcc 7 kono parents: diff changeset	1154 /* Promote int to long then invoke mm_sll_pi16. */
04ced10e8804 gcc 7 kono parents: diff changeset	1155 return _mm_sll_pi16 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1156 }
04ced10e8804 gcc 7 kono parents: diff changeset	1157
04ced10e8804 gcc 7 kono parents: diff changeset	1158 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1159 _m_psllwi (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1160 {
04ced10e8804 gcc 7 kono parents: diff changeset	1161 return _mm_slli_pi16 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1162 }
04ced10e8804 gcc 7 kono parents: diff changeset	1163
04ced10e8804 gcc 7 kono parents: diff changeset	1164 /* Shift two 32-bit values in M left by COUNT. */
04ced10e8804 gcc 7 kono parents: diff changeset	1165 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1166 _mm_sll_pi32 (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1167 {
04ced10e8804 gcc 7 kono parents: diff changeset	1168 __m64_union m, res;
04ced10e8804 gcc 7 kono parents: diff changeset	1169
04ced10e8804 gcc 7 kono parents: diff changeset	1170 m.as_m64 = __m;
04ced10e8804 gcc 7 kono parents: diff changeset	1171
04ced10e8804 gcc 7 kono parents: diff changeset	1172 res.as_int[0] = m.as_int[0] << __count;
04ced10e8804 gcc 7 kono parents: diff changeset	1173 res.as_int[1] = m.as_int[1] << __count;
04ced10e8804 gcc 7 kono parents: diff changeset	1174 return (res.as_m64);
04ced10e8804 gcc 7 kono parents: diff changeset	1175 }
04ced10e8804 gcc 7 kono parents: diff changeset	1176
04ced10e8804 gcc 7 kono parents: diff changeset	1177 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1178 _m_pslld (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1179 {
04ced10e8804 gcc 7 kono parents: diff changeset	1180 return _mm_sll_pi32 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1181 }
04ced10e8804 gcc 7 kono parents: diff changeset	1182
04ced10e8804 gcc 7 kono parents: diff changeset	1183 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1184 _mm_slli_pi32 (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1185 {
04ced10e8804 gcc 7 kono parents: diff changeset	1186 /* Promote int to long then invoke mm_sll_pi32. */
04ced10e8804 gcc 7 kono parents: diff changeset	1187 return _mm_sll_pi32 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1188 }
04ced10e8804 gcc 7 kono parents: diff changeset	1189
04ced10e8804 gcc 7 kono parents: diff changeset	1190 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1191 _m_pslldi (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1192 {
04ced10e8804 gcc 7 kono parents: diff changeset	1193 return _mm_slli_pi32 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1194 }
04ced10e8804 gcc 7 kono parents: diff changeset	1195
04ced10e8804 gcc 7 kono parents: diff changeset	1196 /* Shift four 16-bit values in M right by COUNT; shift in the sign bit. */
04ced10e8804 gcc 7 kono parents: diff changeset	1197 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1198 _mm_sra_pi16 (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1199 {
04ced10e8804 gcc 7 kono parents: diff changeset	1200 __vector signed short m, r;
04ced10e8804 gcc 7 kono parents: diff changeset	1201 __vector unsigned short c;
04ced10e8804 gcc 7 kono parents: diff changeset	1202
04ced10e8804 gcc 7 kono parents: diff changeset	1203 if (__count <= 15)
04ced10e8804 gcc 7 kono parents: diff changeset	1204 {
04ced10e8804 gcc 7 kono parents: diff changeset	1205 m = (__vector signed short)vec_splats (__m);
04ced10e8804 gcc 7 kono parents: diff changeset	1206 c = (__vector unsigned short)vec_splats ((unsigned short)__count);
04ced10e8804 gcc 7 kono parents: diff changeset	1207 r = vec_sra (m, (__vector unsigned short)c);
04ced10e8804 gcc 7 kono parents: diff changeset	1208 return (__builtin_unpack_vector_int128 ((__vector __int128_t)r, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1209 }
04ced10e8804 gcc 7 kono parents: diff changeset	1210 else
04ced10e8804 gcc 7 kono parents: diff changeset	1211 return (0);
04ced10e8804 gcc 7 kono parents: diff changeset	1212 }
04ced10e8804 gcc 7 kono parents: diff changeset	1213
04ced10e8804 gcc 7 kono parents: diff changeset	1214 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1215 _m_psraw (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1216 {
04ced10e8804 gcc 7 kono parents: diff changeset	1217 return _mm_sra_pi16 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1218 }
04ced10e8804 gcc 7 kono parents: diff changeset	1219
04ced10e8804 gcc 7 kono parents: diff changeset	1220 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1221 _mm_srai_pi16 (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1222 {
04ced10e8804 gcc 7 kono parents: diff changeset	1223 /* Promote int to long then invoke mm_sra_pi32. */
04ced10e8804 gcc 7 kono parents: diff changeset	1224 return _mm_sra_pi16 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1225 }
04ced10e8804 gcc 7 kono parents: diff changeset	1226
04ced10e8804 gcc 7 kono parents: diff changeset	1227 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1228 _m_psrawi (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1229 {
04ced10e8804 gcc 7 kono parents: diff changeset	1230 return _mm_srai_pi16 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1231 }
04ced10e8804 gcc 7 kono parents: diff changeset	1232
04ced10e8804 gcc 7 kono parents: diff changeset	1233 /* Shift two 32-bit values in M right by COUNT; shift in the sign bit. */
04ced10e8804 gcc 7 kono parents: diff changeset	1234 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1235 _mm_sra_pi32 (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1236 {
04ced10e8804 gcc 7 kono parents: diff changeset	1237 __m64_union m, res;
04ced10e8804 gcc 7 kono parents: diff changeset	1238
04ced10e8804 gcc 7 kono parents: diff changeset	1239 m.as_m64 = __m;
04ced10e8804 gcc 7 kono parents: diff changeset	1240
04ced10e8804 gcc 7 kono parents: diff changeset	1241 res.as_int[0] = m.as_int[0] >> __count;
04ced10e8804 gcc 7 kono parents: diff changeset	1242 res.as_int[1] = m.as_int[1] >> __count;
04ced10e8804 gcc 7 kono parents: diff changeset	1243 return (res.as_m64);
04ced10e8804 gcc 7 kono parents: diff changeset	1244 }
04ced10e8804 gcc 7 kono parents: diff changeset	1245
04ced10e8804 gcc 7 kono parents: diff changeset	1246 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1247 _m_psrad (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1248 {
04ced10e8804 gcc 7 kono parents: diff changeset	1249 return _mm_sra_pi32 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1250 }
04ced10e8804 gcc 7 kono parents: diff changeset	1251
04ced10e8804 gcc 7 kono parents: diff changeset	1252 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1253 _mm_srai_pi32 (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1254 {
04ced10e8804 gcc 7 kono parents: diff changeset	1255 /* Promote int to long then invoke mm_sra_pi32. */
04ced10e8804 gcc 7 kono parents: diff changeset	1256 return _mm_sra_pi32 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1257 }
04ced10e8804 gcc 7 kono parents: diff changeset	1258
04ced10e8804 gcc 7 kono parents: diff changeset	1259 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1260 _m_psradi (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1261 {
04ced10e8804 gcc 7 kono parents: diff changeset	1262 return _mm_srai_pi32 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1263 }
04ced10e8804 gcc 7 kono parents: diff changeset	1264
04ced10e8804 gcc 7 kono parents: diff changeset	1265 /* Shift four 16-bit values in M right by COUNT; shift in zeros. */
04ced10e8804 gcc 7 kono parents: diff changeset	1266 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1267 _mm_srl_pi16 (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1268 {
04ced10e8804 gcc 7 kono parents: diff changeset	1269 __vector unsigned short m, r;
04ced10e8804 gcc 7 kono parents: diff changeset	1270 __vector unsigned short c;
04ced10e8804 gcc 7 kono parents: diff changeset	1271
04ced10e8804 gcc 7 kono parents: diff changeset	1272 if (__count <= 15)
04ced10e8804 gcc 7 kono parents: diff changeset	1273 {
04ced10e8804 gcc 7 kono parents: diff changeset	1274 m = (__vector unsigned short)vec_splats (__m);
04ced10e8804 gcc 7 kono parents: diff changeset	1275 c = (__vector unsigned short)vec_splats ((unsigned short)__count);
04ced10e8804 gcc 7 kono parents: diff changeset	1276 r = vec_sr (m, (__vector unsigned short)c);
04ced10e8804 gcc 7 kono parents: diff changeset	1277 return (__builtin_unpack_vector_int128 ((__vector __int128_t)r, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1278 }
04ced10e8804 gcc 7 kono parents: diff changeset	1279 else
04ced10e8804 gcc 7 kono parents: diff changeset	1280 return (0);
04ced10e8804 gcc 7 kono parents: diff changeset	1281 }
04ced10e8804 gcc 7 kono parents: diff changeset	1282
04ced10e8804 gcc 7 kono parents: diff changeset	1283 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1284 _m_psrlw (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1285 {
04ced10e8804 gcc 7 kono parents: diff changeset	1286 return _mm_srl_pi16 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1287 }
04ced10e8804 gcc 7 kono parents: diff changeset	1288
04ced10e8804 gcc 7 kono parents: diff changeset	1289 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1290 _mm_srli_pi16 (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1291 {
04ced10e8804 gcc 7 kono parents: diff changeset	1292 /* Promote int to long then invoke mm_sra_pi32. */
04ced10e8804 gcc 7 kono parents: diff changeset	1293 return _mm_srl_pi16 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1294 }
04ced10e8804 gcc 7 kono parents: diff changeset	1295
04ced10e8804 gcc 7 kono parents: diff changeset	1296 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1297 _m_psrlwi (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1298 {
04ced10e8804 gcc 7 kono parents: diff changeset	1299 return _mm_srli_pi16 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1300 }
04ced10e8804 gcc 7 kono parents: diff changeset	1301
04ced10e8804 gcc 7 kono parents: diff changeset	1302 /* Shift two 32-bit values in M right by COUNT; shift in zeros. */
04ced10e8804 gcc 7 kono parents: diff changeset	1303 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1304 _mm_srl_pi32 (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1305 {
04ced10e8804 gcc 7 kono parents: diff changeset	1306 __m64_union m, res;
04ced10e8804 gcc 7 kono parents: diff changeset	1307
04ced10e8804 gcc 7 kono parents: diff changeset	1308 m.as_m64 = __m;
04ced10e8804 gcc 7 kono parents: diff changeset	1309
04ced10e8804 gcc 7 kono parents: diff changeset	1310 res.as_int[0] = (unsigned int)m.as_int[0] >> __count;
04ced10e8804 gcc 7 kono parents: diff changeset	1311 res.as_int[1] = (unsigned int)m.as_int[1] >> __count;
04ced10e8804 gcc 7 kono parents: diff changeset	1312 return (res.as_m64);
04ced10e8804 gcc 7 kono parents: diff changeset	1313 }
04ced10e8804 gcc 7 kono parents: diff changeset	1314
04ced10e8804 gcc 7 kono parents: diff changeset	1315 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1316 _m_psrld (__m64 __m, __m64 __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1317 {
04ced10e8804 gcc 7 kono parents: diff changeset	1318 return _mm_srl_pi32 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1319 }
04ced10e8804 gcc 7 kono parents: diff changeset	1320
04ced10e8804 gcc 7 kono parents: diff changeset	1321 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1322 _mm_srli_pi32 (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1323 {
04ced10e8804 gcc 7 kono parents: diff changeset	1324 /* Promote int to long then invoke mm_srl_pi32. */
04ced10e8804 gcc 7 kono parents: diff changeset	1325 return _mm_srl_pi32 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1326 }
04ced10e8804 gcc 7 kono parents: diff changeset	1327
04ced10e8804 gcc 7 kono parents: diff changeset	1328 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1329 _m_psrldi (__m64 __m, int __count)
04ced10e8804 gcc 7 kono parents: diff changeset	1330 {
04ced10e8804 gcc 7 kono parents: diff changeset	1331 return _mm_srli_pi32 (__m, __count);
04ced10e8804 gcc 7 kono parents: diff changeset	1332 }
04ced10e8804 gcc 7 kono parents: diff changeset	1333 #endif /* _ARCH_PWR8 */
04ced10e8804 gcc 7 kono parents: diff changeset	1334
04ced10e8804 gcc 7 kono parents: diff changeset	1335 /* Creates a vector of two 32-bit values; I0 is least significant. */
04ced10e8804 gcc 7 kono parents: diff changeset	1336 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1337 _mm_set_pi32 (int __i1, int __i0)
04ced10e8804 gcc 7 kono parents: diff changeset	1338 {
04ced10e8804 gcc 7 kono parents: diff changeset	1339 __m64_union res;
04ced10e8804 gcc 7 kono parents: diff changeset	1340
04ced10e8804 gcc 7 kono parents: diff changeset	1341 res.as_int[0] = __i0;
04ced10e8804 gcc 7 kono parents: diff changeset	1342 res.as_int[1] = __i1;
04ced10e8804 gcc 7 kono parents: diff changeset	1343 return (res.as_m64);
04ced10e8804 gcc 7 kono parents: diff changeset	1344 }
04ced10e8804 gcc 7 kono parents: diff changeset	1345
04ced10e8804 gcc 7 kono parents: diff changeset	1346 /* Creates a vector of four 16-bit values; W0 is least significant. */
04ced10e8804 gcc 7 kono parents: diff changeset	1347 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1348 _mm_set_pi16 (short __w3, short __w2, short __w1, short __w0)
04ced10e8804 gcc 7 kono parents: diff changeset	1349 {
04ced10e8804 gcc 7 kono parents: diff changeset	1350 __m64_union res;
04ced10e8804 gcc 7 kono parents: diff changeset	1351
04ced10e8804 gcc 7 kono parents: diff changeset	1352 res.as_short[0] = __w0;
04ced10e8804 gcc 7 kono parents: diff changeset	1353 res.as_short[1] = __w1;
04ced10e8804 gcc 7 kono parents: diff changeset	1354 res.as_short[2] = __w2;
04ced10e8804 gcc 7 kono parents: diff changeset	1355 res.as_short[3] = __w3;
04ced10e8804 gcc 7 kono parents: diff changeset	1356 return (res.as_m64);
04ced10e8804 gcc 7 kono parents: diff changeset	1357 }
04ced10e8804 gcc 7 kono parents: diff changeset	1358
04ced10e8804 gcc 7 kono parents: diff changeset	1359 /* Creates a vector of eight 8-bit values; B0 is least significant. */
04ced10e8804 gcc 7 kono parents: diff changeset	1360 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1361 _mm_set_pi8 (char __b7, char __b6, char __b5, char __b4,
04ced10e8804 gcc 7 kono parents: diff changeset	1362 char __b3, char __b2, char __b1, char __b0)
04ced10e8804 gcc 7 kono parents: diff changeset	1363 {
04ced10e8804 gcc 7 kono parents: diff changeset	1364 __m64_union res;
04ced10e8804 gcc 7 kono parents: diff changeset	1365
04ced10e8804 gcc 7 kono parents: diff changeset	1366 res.as_char[0] = __b0;
04ced10e8804 gcc 7 kono parents: diff changeset	1367 res.as_char[1] = __b1;
04ced10e8804 gcc 7 kono parents: diff changeset	1368 res.as_char[2] = __b2;
04ced10e8804 gcc 7 kono parents: diff changeset	1369 res.as_char[3] = __b3;
04ced10e8804 gcc 7 kono parents: diff changeset	1370 res.as_char[4] = __b4;
04ced10e8804 gcc 7 kono parents: diff changeset	1371 res.as_char[5] = __b5;
04ced10e8804 gcc 7 kono parents: diff changeset	1372 res.as_char[6] = __b6;
04ced10e8804 gcc 7 kono parents: diff changeset	1373 res.as_char[7] = __b7;
04ced10e8804 gcc 7 kono parents: diff changeset	1374 return (res.as_m64);
04ced10e8804 gcc 7 kono parents: diff changeset	1375 }
04ced10e8804 gcc 7 kono parents: diff changeset	1376
04ced10e8804 gcc 7 kono parents: diff changeset	1377 /* Similar, but with the arguments in reverse order. */
04ced10e8804 gcc 7 kono parents: diff changeset	1378 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1379 _mm_setr_pi32 (int __i0, int __i1)
04ced10e8804 gcc 7 kono parents: diff changeset	1380 {
04ced10e8804 gcc 7 kono parents: diff changeset	1381 __m64_union res;
04ced10e8804 gcc 7 kono parents: diff changeset	1382
04ced10e8804 gcc 7 kono parents: diff changeset	1383 res.as_int[0] = __i0;
04ced10e8804 gcc 7 kono parents: diff changeset	1384 res.as_int[1] = __i1;
04ced10e8804 gcc 7 kono parents: diff changeset	1385 return (res.as_m64);
04ced10e8804 gcc 7 kono parents: diff changeset	1386 }
04ced10e8804 gcc 7 kono parents: diff changeset	1387
04ced10e8804 gcc 7 kono parents: diff changeset	1388 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1389 _mm_setr_pi16 (short __w0, short __w1, short __w2, short __w3)
04ced10e8804 gcc 7 kono parents: diff changeset	1390 {
04ced10e8804 gcc 7 kono parents: diff changeset	1391 return _mm_set_pi16 (__w3, __w2, __w1, __w0);
04ced10e8804 gcc 7 kono parents: diff changeset	1392 }
04ced10e8804 gcc 7 kono parents: diff changeset	1393
04ced10e8804 gcc 7 kono parents: diff changeset	1394 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1395 _mm_setr_pi8 (char __b0, char __b1, char __b2, char __b3,
04ced10e8804 gcc 7 kono parents: diff changeset	1396 char __b4, char __b5, char __b6, char __b7)
04ced10e8804 gcc 7 kono parents: diff changeset	1397 {
04ced10e8804 gcc 7 kono parents: diff changeset	1398 return _mm_set_pi8 (__b7, __b6, __b5, __b4, __b3, __b2, __b1, __b0);
04ced10e8804 gcc 7 kono parents: diff changeset	1399 }
04ced10e8804 gcc 7 kono parents: diff changeset	1400
04ced10e8804 gcc 7 kono parents: diff changeset	1401 /* Creates a vector of two 32-bit values, both elements containing I. */
04ced10e8804 gcc 7 kono parents: diff changeset	1402 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1403 _mm_set1_pi32 (int __i)
04ced10e8804 gcc 7 kono parents: diff changeset	1404 {
04ced10e8804 gcc 7 kono parents: diff changeset	1405 __m64_union res;
04ced10e8804 gcc 7 kono parents: diff changeset	1406
04ced10e8804 gcc 7 kono parents: diff changeset	1407 res.as_int[0] = __i;
04ced10e8804 gcc 7 kono parents: diff changeset	1408 res.as_int[1] = __i;
04ced10e8804 gcc 7 kono parents: diff changeset	1409 return (res.as_m64);
04ced10e8804 gcc 7 kono parents: diff changeset	1410 }
04ced10e8804 gcc 7 kono parents: diff changeset	1411
04ced10e8804 gcc 7 kono parents: diff changeset	1412 /* Creates a vector of four 16-bit values, all elements containing W. */
04ced10e8804 gcc 7 kono parents: diff changeset	1413 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1414 _mm_set1_pi16 (short __w)
04ced10e8804 gcc 7 kono parents: diff changeset	1415 {
04ced10e8804 gcc 7 kono parents: diff changeset	1416 #if _ARCH_PWR9
04ced10e8804 gcc 7 kono parents: diff changeset	1417 __vector signed short w;
04ced10e8804 gcc 7 kono parents: diff changeset	1418
04ced10e8804 gcc 7 kono parents: diff changeset	1419 w = (__vector signed short)vec_splats (__w);
04ced10e8804 gcc 7 kono parents: diff changeset	1420 return (__builtin_unpack_vector_int128 ((__vector __int128_t)w, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1421 #else
04ced10e8804 gcc 7 kono parents: diff changeset	1422 __m64_union res;
04ced10e8804 gcc 7 kono parents: diff changeset	1423
04ced10e8804 gcc 7 kono parents: diff changeset	1424 res.as_short[0] = __w;
04ced10e8804 gcc 7 kono parents: diff changeset	1425 res.as_short[1] = __w;
04ced10e8804 gcc 7 kono parents: diff changeset	1426 res.as_short[2] = __w;
04ced10e8804 gcc 7 kono parents: diff changeset	1427 res.as_short[3] = __w;
04ced10e8804 gcc 7 kono parents: diff changeset	1428 return (res.as_m64);
04ced10e8804 gcc 7 kono parents: diff changeset	1429 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	1430 }
04ced10e8804 gcc 7 kono parents: diff changeset	1431
04ced10e8804 gcc 7 kono parents: diff changeset	1432 /* Creates a vector of eight 8-bit values, all elements containing B. */
04ced10e8804 gcc 7 kono parents: diff changeset	1433 extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
04ced10e8804 gcc 7 kono parents: diff changeset	1434 _mm_set1_pi8 (signed char __b)
04ced10e8804 gcc 7 kono parents: diff changeset	1435 {
04ced10e8804 gcc 7 kono parents: diff changeset	1436 #if _ARCH_PWR8
04ced10e8804 gcc 7 kono parents: diff changeset	1437 __vector signed char b;
04ced10e8804 gcc 7 kono parents: diff changeset	1438
04ced10e8804 gcc 7 kono parents: diff changeset	1439 b = (__vector signed char)vec_splats (__b);
04ced10e8804 gcc 7 kono parents: diff changeset	1440 return (__builtin_unpack_vector_int128 ((__vector __int128_t)b, 0));
04ced10e8804 gcc 7 kono parents: diff changeset	1441 #else
04ced10e8804 gcc 7 kono parents: diff changeset	1442 __m64_union res;
04ced10e8804 gcc 7 kono parents: diff changeset	1443
04ced10e8804 gcc 7 kono parents: diff changeset	1444 res.as_char[0] = __b;
04ced10e8804 gcc 7 kono parents: diff changeset	1445 res.as_char[1] = __b;
04ced10e8804 gcc 7 kono parents: diff changeset	1446 res.as_char[2] = __b;
04ced10e8804 gcc 7 kono parents: diff changeset	1447 res.as_char[3] = __b;
04ced10e8804 gcc 7 kono parents: diff changeset	1448 res.as_char[4] = __b;
04ced10e8804 gcc 7 kono parents: diff changeset	1449 res.as_char[5] = __b;
04ced10e8804 gcc 7 kono parents: diff changeset	1450 res.as_char[6] = __b;
04ced10e8804 gcc 7 kono parents: diff changeset	1451 res.as_char[7] = __b;
04ced10e8804 gcc 7 kono parents: diff changeset	1452 return (res.as_m64);
04ced10e8804 gcc 7 kono parents: diff changeset	1453 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	1454 }
04ced10e8804 gcc 7 kono parents: diff changeset	1455 #endif /* __powerpc64__ */
04ced10e8804 gcc 7 kono parents: diff changeset	1456 #endif /* _MMINTRIN_H_INCLUDED */

Mercurial > hg > CbC > CbC_gcc

annotate gcc/config/rs6000/mmintrin.h @ 111:04ced10e8804