CbC/CbC_gcc: gcc/config/i386/x86-tune.def annotate

annotate gcc/config/i386/x86-tune.def @ 131:84e7813d76e9

gcc-8.2

author	mir3636
date	Thu, 25 Oct 2018 07:37:49 +0900
parents	04ced10e8804
children	1830386684a0

rev	line source
111 04ced10e8804 gcc 7 kono parents: diff changeset	1 /* Definitions of x86 tunable features.
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	2 Copyright (C) 2013-2018 Free Software Foundation, Inc.
111 04ced10e8804 gcc 7 kono parents: diff changeset	3
04ced10e8804 gcc 7 kono parents: diff changeset	4 This file is part of GCC.
04ced10e8804 gcc 7 kono parents: diff changeset	5
04ced10e8804 gcc 7 kono parents: diff changeset	6 GCC is free software; you can redistribute it and/or modify
04ced10e8804 gcc 7 kono parents: diff changeset	7 it under the terms of the GNU General Public License as published by
04ced10e8804 gcc 7 kono parents: diff changeset	8 the Free Software Foundation; either version 3, or (at your option)
04ced10e8804 gcc 7 kono parents: diff changeset	9 any later version.
04ced10e8804 gcc 7 kono parents: diff changeset	10
04ced10e8804 gcc 7 kono parents: diff changeset	11 GCC is distributed in the hope that it will be useful,
04ced10e8804 gcc 7 kono parents: diff changeset	12 but WITHOUT ANY WARRANTY; without even the implied warranty of
04ced10e8804 gcc 7 kono parents: diff changeset	13 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
04ced10e8804 gcc 7 kono parents: diff changeset	14 GNU General Public License for more details.
04ced10e8804 gcc 7 kono parents: diff changeset	15
04ced10e8804 gcc 7 kono parents: diff changeset	16 You should have received a copy of the GNU General Public License and
04ced10e8804 gcc 7 kono parents: diff changeset	17 a copy of the GCC Runtime Library Exception along with this program;
04ced10e8804 gcc 7 kono parents: diff changeset	18 see the files COPYING3 and COPYING.RUNTIME respectively. If not, see
04ced10e8804 gcc 7 kono parents: diff changeset	19 <http://www.gnu.org/licenses/>. */
04ced10e8804 gcc 7 kono parents: diff changeset	20
04ced10e8804 gcc 7 kono parents: diff changeset	21 /* Tuning for a given CPU XXXX consists of:
04ced10e8804 gcc 7 kono parents: diff changeset	22 - adding new CPU into:
04ced10e8804 gcc 7 kono parents: diff changeset	23 - adding PROCESSOR_XXX to processor_type (in i386.h)
04ced10e8804 gcc 7 kono parents: diff changeset	24 - possibly adding XXX into CPU attribute in i386.md
04ced10e8804 gcc 7 kono parents: diff changeset	25 - adding XXX to processor_alias_table (in i386.c)
04ced10e8804 gcc 7 kono parents: diff changeset	26 - introducing ix86_XXX_cost in i386.c
04ced10e8804 gcc 7 kono parents: diff changeset	27 - Stringop generation table can be build based on test_stringop
04ced10e8804 gcc 7 kono parents: diff changeset	28 - script (once rest of tuning is complete)
04ced10e8804 gcc 7 kono parents: diff changeset	29 - designing a scheduler model in
04ced10e8804 gcc 7 kono parents: diff changeset	30 - XXXX.md file
04ced10e8804 gcc 7 kono parents: diff changeset	31 - Updating ix86_issue_rate and ix86_adjust_cost in i386.md
04ced10e8804 gcc 7 kono parents: diff changeset	32 - possibly updating ia32_multipass_dfa_lookahead, ix86_sched_reorder
04ced10e8804 gcc 7 kono parents: diff changeset	33 and ix86_sched_init_global if those tricks are needed.
04ced10e8804 gcc 7 kono parents: diff changeset	34 - Tunning the flags bellow. Those are split into sections and each
04ced10e8804 gcc 7 kono parents: diff changeset	35 section is very roughly ordered by importance. */
04ced10e8804 gcc 7 kono parents: diff changeset	36
04ced10e8804 gcc 7 kono parents: diff changeset	37 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	38 /* Scheduling flags. */
04ced10e8804 gcc 7 kono parents: diff changeset	39 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	40
04ced10e8804 gcc 7 kono parents: diff changeset	41 /* X86_TUNE_SCHEDULE: Enable scheduling. */
04ced10e8804 gcc 7 kono parents: diff changeset	42 DEF_TUNE (X86_TUNE_SCHEDULE, "schedule",
04ced10e8804 gcc 7 kono parents: diff changeset	43 m_PENT \| m_LAKEMONT \| m_PPRO \| m_CORE_ALL \| m_BONNELL \| m_SILVERMONT
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	44 \| m_INTEL \| m_KNL \| m_KNM \| m_K6_GEODE \| m_AMD_MULTIPLE \| m_GOLDMONT
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	45 \| m_GOLDMONT_PLUS \| m_TREMONT \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	46
04ced10e8804 gcc 7 kono parents: diff changeset	47 /* X86_TUNE_PARTIAL_REG_DEPENDENCY: Enable more register renaming
04ced10e8804 gcc 7 kono parents: diff changeset	48 on modern chips. Preffer stores affecting whole integer register
04ced10e8804 gcc 7 kono parents: diff changeset	49 over partial stores. For example preffer MOVZBL or MOVQ to load 8bit
04ced10e8804 gcc 7 kono parents: diff changeset	50 value over movb. */
04ced10e8804 gcc 7 kono parents: diff changeset	51 DEF_TUNE (X86_TUNE_PARTIAL_REG_DEPENDENCY, "partial_reg_dependency",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	52 m_P4_NOCONA \| m_CORE2 \| m_NEHALEM \| m_SANDYBRIDGE \| m_CORE_AVX2
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	53 \| m_BONNELL \| m_SILVERMONT \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_INTEL
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	54 \| m_KNL \| m_KNM \| m_AMD_MULTIPLE \| m_TREMONT
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	55 \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	56
04ced10e8804 gcc 7 kono parents: diff changeset	57 /* X86_TUNE_SSE_PARTIAL_REG_DEPENDENCY: This knob promotes all store
04ced10e8804 gcc 7 kono parents: diff changeset	58 destinations to be 128bit to allow register renaming on 128bit SSE units,
04ced10e8804 gcc 7 kono parents: diff changeset	59 but usually results in one extra microop on 64bit SSE units.
04ced10e8804 gcc 7 kono parents: diff changeset	60 Experimental results shows that disabling this option on P4 brings over 20%
04ced10e8804 gcc 7 kono parents: diff changeset	61 SPECfp regression, while enabling it on K8 brings roughly 2.4% regression
04ced10e8804 gcc 7 kono parents: diff changeset	62 that can be partly masked by careful scheduling of moves. */
04ced10e8804 gcc 7 kono parents: diff changeset	63 DEF_TUNE (X86_TUNE_SSE_PARTIAL_REG_DEPENDENCY, "sse_partial_reg_dependency",
04ced10e8804 gcc 7 kono parents: diff changeset	64 m_PPRO \| m_P4_NOCONA \| m_CORE_ALL \| m_BONNELL \| m_AMDFAM10
04ced10e8804 gcc 7 kono parents: diff changeset	65 \| m_BDVER \| m_ZNVER1 \| m_GENERIC)
04ced10e8804 gcc 7 kono parents: diff changeset	66
04ced10e8804 gcc 7 kono parents: diff changeset	67 /* X86_TUNE_SSE_SPLIT_REGS: Set for machines where the type and dependencies
04ced10e8804 gcc 7 kono parents: diff changeset	68 are resolved on SSE register parts instead of whole registers, so we may
04ced10e8804 gcc 7 kono parents: diff changeset	69 maintain just lower part of scalar values in proper format leaving the
04ced10e8804 gcc 7 kono parents: diff changeset	70 upper part undefined. */
04ced10e8804 gcc 7 kono parents: diff changeset	71 DEF_TUNE (X86_TUNE_SSE_SPLIT_REGS, "sse_split_regs", m_ATHLON_K8)
04ced10e8804 gcc 7 kono parents: diff changeset	72
04ced10e8804 gcc 7 kono parents: diff changeset	73 /* X86_TUNE_PARTIAL_FLAG_REG_STALL: this flag disables use of of flags
04ced10e8804 gcc 7 kono parents: diff changeset	74 set by instructions affecting just some flags (in particular shifts).
04ced10e8804 gcc 7 kono parents: diff changeset	75 This is because Core2 resolves dependencies on whole flags register
04ced10e8804 gcc 7 kono parents: diff changeset	76 and such sequences introduce false dependency on previous instruction
04ced10e8804 gcc 7 kono parents: diff changeset	77 setting full flags.
04ced10e8804 gcc 7 kono parents: diff changeset	78
04ced10e8804 gcc 7 kono parents: diff changeset	79 The flags does not affect generation of INC and DEC that is controlled
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	80 by X86_TUNE_USE_INCDEC. */
111 04ced10e8804 gcc 7 kono parents: diff changeset	81
04ced10e8804 gcc 7 kono parents: diff changeset	82 DEF_TUNE (X86_TUNE_PARTIAL_FLAG_REG_STALL, "partial_flag_reg_stall",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	83 m_CORE2)
111 04ced10e8804 gcc 7 kono parents: diff changeset	84
04ced10e8804 gcc 7 kono parents: diff changeset	85 /* X86_TUNE_MOVX: Enable to zero extend integer registers to avoid
04ced10e8804 gcc 7 kono parents: diff changeset	86 partial dependencies. */
04ced10e8804 gcc 7 kono parents: diff changeset	87 DEF_TUNE (X86_TUNE_MOVX, "movx",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	88 m_PPRO \| m_P4_NOCONA \| m_CORE2 \| m_NEHALEM \| m_SANDYBRIDGE
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	89 \| m_BONNELL \| m_SILVERMONT \| m_GOLDMONT \| m_KNL \| m_KNM \| m_INTEL
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	90 \| m_GOLDMONT_PLUS \| m_GEODE \| m_AMD_MULTIPLE
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	91 \| m_CORE_AVX2 \| m_TREMONT \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	92
04ced10e8804 gcc 7 kono parents: diff changeset	93 /* X86_TUNE_MEMORY_MISMATCH_STALL: Avoid partial stores that are followed by
04ced10e8804 gcc 7 kono parents: diff changeset	94 full sized loads. */
04ced10e8804 gcc 7 kono parents: diff changeset	95 DEF_TUNE (X86_TUNE_MEMORY_MISMATCH_STALL, "memory_mismatch_stall",
04ced10e8804 gcc 7 kono parents: diff changeset	96 m_P4_NOCONA \| m_CORE_ALL \| m_BONNELL \| m_SILVERMONT \| m_INTEL
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	97 \| m_KNL \| m_KNM \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_AMD_MULTIPLE
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	98 \| m_TREMONT \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	99
04ced10e8804 gcc 7 kono parents: diff changeset	100 /* X86_TUNE_FUSE_CMP_AND_BRANCH_32: Fuse compare with a subsequent
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	101 conditional jump instruction for 32 bit TARGET. */
111 04ced10e8804 gcc 7 kono parents: diff changeset	102 DEF_TUNE (X86_TUNE_FUSE_CMP_AND_BRANCH_32, "fuse_cmp_and_branch_32",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	103 m_CORE_ALL \| m_BDVER \| m_ZNVER1 \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	104
04ced10e8804 gcc 7 kono parents: diff changeset	105 /* X86_TUNE_FUSE_CMP_AND_BRANCH_64: Fuse compare with a subsequent
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	106 conditional jump instruction for TARGET_64BIT. */
111 04ced10e8804 gcc 7 kono parents: diff changeset	107 DEF_TUNE (X86_TUNE_FUSE_CMP_AND_BRANCH_64, "fuse_cmp_and_branch_64",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	108 m_NEHALEM \| m_SANDYBRIDGE \| m_CORE_AVX2 \| m_BDVER \| m_ZNVER1 \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	109
04ced10e8804 gcc 7 kono parents: diff changeset	110 /* X86_TUNE_FUSE_CMP_AND_BRANCH_SOFLAGS: Fuse compare with a
04ced10e8804 gcc 7 kono parents: diff changeset	111 subsequent conditional jump instruction when the condition jump
04ced10e8804 gcc 7 kono parents: diff changeset	112 check sign flag (SF) or overflow flag (OF). */
04ced10e8804 gcc 7 kono parents: diff changeset	113 DEF_TUNE (X86_TUNE_FUSE_CMP_AND_BRANCH_SOFLAGS, "fuse_cmp_and_branch_soflags",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	114 m_NEHALEM \| m_SANDYBRIDGE \| m_CORE_AVX2 \| m_BDVER \| m_ZNVER1 \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	115
04ced10e8804 gcc 7 kono parents: diff changeset	116 /* X86_TUNE_FUSE_ALU_AND_BRANCH: Fuse alu with a subsequent conditional
04ced10e8804 gcc 7 kono parents: diff changeset	117 jump instruction when the alu instruction produces the CCFLAG consumed by
04ced10e8804 gcc 7 kono parents: diff changeset	118 the conditional jump instruction. */
04ced10e8804 gcc 7 kono parents: diff changeset	119 DEF_TUNE (X86_TUNE_FUSE_ALU_AND_BRANCH, "fuse_alu_and_branch",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	120 m_SANDYBRIDGE \| m_CORE_AVX2 \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	121
04ced10e8804 gcc 7 kono parents: diff changeset	122
04ced10e8804 gcc 7 kono parents: diff changeset	123 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	124 /* Function prologue, epilogue and function calling sequences. */
04ced10e8804 gcc 7 kono parents: diff changeset	125 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	126
04ced10e8804 gcc 7 kono parents: diff changeset	127 /* X86_TUNE_ACCUMULATE_OUTGOING_ARGS: Allocate stack space for outgoing
04ced10e8804 gcc 7 kono parents: diff changeset	128 arguments in prologue/epilogue instead of separately for each call
04ced10e8804 gcc 7 kono parents: diff changeset	129 by push/pop instructions.
04ced10e8804 gcc 7 kono parents: diff changeset	130 This increase code size by about 5% in 32bit mode, less so in 64bit mode
04ced10e8804 gcc 7 kono parents: diff changeset	131 because parameters are passed in registers. It is considerable
04ced10e8804 gcc 7 kono parents: diff changeset	132 win for targets without stack engine that prevents multple push operations
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	133 to happen in parallel. */
111 04ced10e8804 gcc 7 kono parents: diff changeset	134
04ced10e8804 gcc 7 kono parents: diff changeset	135 DEF_TUNE (X86_TUNE_ACCUMULATE_OUTGOING_ARGS, "accumulate_outgoing_args",
04ced10e8804 gcc 7 kono parents: diff changeset	136 m_PPRO \| m_P4_NOCONA \| m_BONNELL \| m_SILVERMONT \| m_KNL \| m_KNM \| m_INTEL
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	137 \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_TREMONT \| m_ATHLON_K8)
111 04ced10e8804 gcc 7 kono parents: diff changeset	138
04ced10e8804 gcc 7 kono parents: diff changeset	139 /* X86_TUNE_PROLOGUE_USING_MOVE: Do not use push/pop in prologues that are
04ced10e8804 gcc 7 kono parents: diff changeset	140 considered on critical path. */
04ced10e8804 gcc 7 kono parents: diff changeset	141 DEF_TUNE (X86_TUNE_PROLOGUE_USING_MOVE, "prologue_using_move",
04ced10e8804 gcc 7 kono parents: diff changeset	142 m_PPRO \| m_ATHLON_K8)
04ced10e8804 gcc 7 kono parents: diff changeset	143
04ced10e8804 gcc 7 kono parents: diff changeset	144 /* X86_TUNE_PROLOGUE_USING_MOVE: Do not use push/pop in epilogues that are
04ced10e8804 gcc 7 kono parents: diff changeset	145 considered on critical path. */
04ced10e8804 gcc 7 kono parents: diff changeset	146 DEF_TUNE (X86_TUNE_EPILOGUE_USING_MOVE, "epilogue_using_move",
04ced10e8804 gcc 7 kono parents: diff changeset	147 m_PPRO \| m_ATHLON_K8)
04ced10e8804 gcc 7 kono parents: diff changeset	148
04ced10e8804 gcc 7 kono parents: diff changeset	149 /* X86_TUNE_USE_LEAVE: Use "leave" instruction in epilogues where it fits. */
04ced10e8804 gcc 7 kono parents: diff changeset	150 DEF_TUNE (X86_TUNE_USE_LEAVE, "use_leave",
04ced10e8804 gcc 7 kono parents: diff changeset	151 m_386 \| m_CORE_ALL \| m_K6_GEODE \| m_AMD_MULTIPLE \| m_GENERIC)
04ced10e8804 gcc 7 kono parents: diff changeset	152
04ced10e8804 gcc 7 kono parents: diff changeset	153 /* X86_TUNE_PUSH_MEMORY: Enable generation of "push mem" instructions.
04ced10e8804 gcc 7 kono parents: diff changeset	154 Some chips, like 486 and Pentium works faster with separate load
04ced10e8804 gcc 7 kono parents: diff changeset	155 and push instructions. */
04ced10e8804 gcc 7 kono parents: diff changeset	156 DEF_TUNE (X86_TUNE_PUSH_MEMORY, "push_memory",
04ced10e8804 gcc 7 kono parents: diff changeset	157 m_386 \| m_P4_NOCONA \| m_CORE_ALL \| m_K6_GEODE \| m_AMD_MULTIPLE
04ced10e8804 gcc 7 kono parents: diff changeset	158 \| m_GENERIC)
04ced10e8804 gcc 7 kono parents: diff changeset	159
04ced10e8804 gcc 7 kono parents: diff changeset	160 /* X86_TUNE_SINGLE_PUSH: Enable if single push insn is preferred
04ced10e8804 gcc 7 kono parents: diff changeset	161 over esp subtraction. */
04ced10e8804 gcc 7 kono parents: diff changeset	162 DEF_TUNE (X86_TUNE_SINGLE_PUSH, "single_push", m_386 \| m_486 \| m_PENT
04ced10e8804 gcc 7 kono parents: diff changeset	163 \| m_LAKEMONT \| m_K6_GEODE)
04ced10e8804 gcc 7 kono parents: diff changeset	164
04ced10e8804 gcc 7 kono parents: diff changeset	165 /* X86_TUNE_DOUBLE_PUSH. Enable if double push insn is preferred
04ced10e8804 gcc 7 kono parents: diff changeset	166 over esp subtraction. */
04ced10e8804 gcc 7 kono parents: diff changeset	167 DEF_TUNE (X86_TUNE_DOUBLE_PUSH, "double_push", m_PENT \| m_LAKEMONT
04ced10e8804 gcc 7 kono parents: diff changeset	168 \| m_K6_GEODE)
04ced10e8804 gcc 7 kono parents: diff changeset	169
04ced10e8804 gcc 7 kono parents: diff changeset	170 /* X86_TUNE_SINGLE_POP: Enable if single pop insn is preferred
04ced10e8804 gcc 7 kono parents: diff changeset	171 over esp addition. */
04ced10e8804 gcc 7 kono parents: diff changeset	172 DEF_TUNE (X86_TUNE_SINGLE_POP, "single_pop", m_386 \| m_486 \| m_PENT
04ced10e8804 gcc 7 kono parents: diff changeset	173 \| m_LAKEMONT \| m_PPRO)
04ced10e8804 gcc 7 kono parents: diff changeset	174
04ced10e8804 gcc 7 kono parents: diff changeset	175 /* X86_TUNE_DOUBLE_POP: Enable if double pop insn is preferred
04ced10e8804 gcc 7 kono parents: diff changeset	176 over esp addition. */
04ced10e8804 gcc 7 kono parents: diff changeset	177 DEF_TUNE (X86_TUNE_DOUBLE_POP, "double_pop", m_PENT \| m_LAKEMONT)
04ced10e8804 gcc 7 kono parents: diff changeset	178
04ced10e8804 gcc 7 kono parents: diff changeset	179 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	180 /* Branch predictor tuning */
04ced10e8804 gcc 7 kono parents: diff changeset	181 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	182
04ced10e8804 gcc 7 kono parents: diff changeset	183 /* X86_TUNE_PAD_SHORT_FUNCTION: Make every function to be at least 4
04ced10e8804 gcc 7 kono parents: diff changeset	184 instructions long. */
04ced10e8804 gcc 7 kono parents: diff changeset	185 DEF_TUNE (X86_TUNE_PAD_SHORT_FUNCTION, "pad_short_function", m_BONNELL)
04ced10e8804 gcc 7 kono parents: diff changeset	186
04ced10e8804 gcc 7 kono parents: diff changeset	187 /* X86_TUNE_PAD_RETURNS: Place NOP before every RET that is a destination
04ced10e8804 gcc 7 kono parents: diff changeset	188 of conditional jump or directly preceded by other jump instruction.
04ced10e8804 gcc 7 kono parents: diff changeset	189 This is important for AND K8-AMDFAM10 because the branch prediction
04ced10e8804 gcc 7 kono parents: diff changeset	190 architecture expect at most one jump per 2 byte window. Failing to
04ced10e8804 gcc 7 kono parents: diff changeset	191 pad returns leads to misaligned return stack. */
04ced10e8804 gcc 7 kono parents: diff changeset	192 DEF_TUNE (X86_TUNE_PAD_RETURNS, "pad_returns",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	193 m_ATHLON_K8 \| m_AMDFAM10)
111 04ced10e8804 gcc 7 kono parents: diff changeset	194
04ced10e8804 gcc 7 kono parents: diff changeset	195 /* X86_TUNE_FOUR_JUMP_LIMIT: Some CPU cores are not able to predict more
04ced10e8804 gcc 7 kono parents: diff changeset	196 than 4 branch instructions in the 16 byte window. */
04ced10e8804 gcc 7 kono parents: diff changeset	197 DEF_TUNE (X86_TUNE_FOUR_JUMP_LIMIT, "four_jump_limit",
04ced10e8804 gcc 7 kono parents: diff changeset	198 m_PPRO \| m_P4_NOCONA \| m_BONNELL \| m_SILVERMONT \| m_KNL \| m_KNM
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	199 \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_TREMONT \| m_INTEL \| m_ATHLON_K8
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	200 \| m_AMDFAM10)
111 04ced10e8804 gcc 7 kono parents: diff changeset	201
04ced10e8804 gcc 7 kono parents: diff changeset	202 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	203 /* Integer instruction selection tuning */
04ced10e8804 gcc 7 kono parents: diff changeset	204 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	205
04ced10e8804 gcc 7 kono parents: diff changeset	206 /* X86_TUNE_SOFTWARE_PREFETCHING_BENEFICIAL: Enable software prefetching
04ced10e8804 gcc 7 kono parents: diff changeset	207 at -O3. For the moment, the prefetching seems badly tuned for Intel
04ced10e8804 gcc 7 kono parents: diff changeset	208 chips. */
04ced10e8804 gcc 7 kono parents: diff changeset	209 DEF_TUNE (X86_TUNE_SOFTWARE_PREFETCHING_BENEFICIAL, "software_prefetching_beneficial",
04ced10e8804 gcc 7 kono parents: diff changeset	210 m_K6_GEODE \| m_ATHLON_K8 \| m_AMDFAM10 \| m_BDVER \| m_BTVER)
04ced10e8804 gcc 7 kono parents: diff changeset	211
04ced10e8804 gcc 7 kono parents: diff changeset	212 /* X86_TUNE_LCP_STALL: Avoid an expensive length-changing prefix stall
04ced10e8804 gcc 7 kono parents: diff changeset	213 on 16-bit immediate moves into memory on Core2 and Corei7. */
04ced10e8804 gcc 7 kono parents: diff changeset	214 DEF_TUNE (X86_TUNE_LCP_STALL, "lcp_stall", m_CORE_ALL \| m_GENERIC)
04ced10e8804 gcc 7 kono parents: diff changeset	215
04ced10e8804 gcc 7 kono parents: diff changeset	216 /* X86_TUNE_READ_MODIFY: Enable use of read-modify instructions such
04ced10e8804 gcc 7 kono parents: diff changeset	217 as "add mem, reg". */
04ced10e8804 gcc 7 kono parents: diff changeset	218 DEF_TUNE (X86_TUNE_READ_MODIFY, "read_modify", ~(m_PENT \| m_LAKEMONT \| m_PPRO))
04ced10e8804 gcc 7 kono parents: diff changeset	219
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	220 /* X86_TUNE_USE_INCDEC: Enable use of inc/dec instructions.
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	221
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	222 Core2 and nehalem has stall of 7 cycles for partial flag register stalls.
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	223 Sandy bridge and Ivy bridge generate extra uop. On Haswell this extra uop
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	224 is output only when the values needs to be really merged, which is not
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	225 done by GCC generated code. */
111 04ced10e8804 gcc 7 kono parents: diff changeset	226 DEF_TUNE (X86_TUNE_USE_INCDEC, "use_incdec",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	227 ~(m_P4_NOCONA \| m_CORE2 \| m_NEHALEM \| m_SANDYBRIDGE
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	228 \| m_BONNELL \| m_SILVERMONT \| m_INTEL \| m_KNL \| m_KNM \| m_GOLDMONT
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	229 \| m_GOLDMONT_PLUS \| m_TREMONT \| m_GENERIC))
111 04ced10e8804 gcc 7 kono parents: diff changeset	230
04ced10e8804 gcc 7 kono parents: diff changeset	231 /* X86_TUNE_INTEGER_DFMODE_MOVES: Enable if integer moves are preferred
04ced10e8804 gcc 7 kono parents: diff changeset	232 for DFmode copies */
04ced10e8804 gcc 7 kono parents: diff changeset	233 DEF_TUNE (X86_TUNE_INTEGER_DFMODE_MOVES, "integer_dfmode_moves",
04ced10e8804 gcc 7 kono parents: diff changeset	234 ~(m_PPRO \| m_P4_NOCONA \| m_CORE_ALL \| m_BONNELL \| m_SILVERMONT
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	235 \| m_KNL \| m_KNM \| m_INTEL \| m_GEODE \| m_AMD_MULTIPLE \| m_GOLDMONT
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	236 \| m_GOLDMONT_PLUS \| m_TREMONT \| m_GENERIC))
111 04ced10e8804 gcc 7 kono parents: diff changeset	237
04ced10e8804 gcc 7 kono parents: diff changeset	238 /* X86_TUNE_OPT_AGU: Optimize for Address Generation Unit. This flag
04ced10e8804 gcc 7 kono parents: diff changeset	239 will impact LEA instruction selection. */
04ced10e8804 gcc 7 kono parents: diff changeset	240 DEF_TUNE (X86_TUNE_OPT_AGU, "opt_agu", m_BONNELL \| m_SILVERMONT \| m_KNL
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	241 \| m_KNM \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_TREMONT \| m_INTEL)
111 04ced10e8804 gcc 7 kono parents: diff changeset	242
04ced10e8804 gcc 7 kono parents: diff changeset	243 /* X86_TUNE_AVOID_LEA_FOR_ADDR: Avoid lea for address computation. */
04ced10e8804 gcc 7 kono parents: diff changeset	244 DEF_TUNE (X86_TUNE_AVOID_LEA_FOR_ADDR, "avoid_lea_for_addr",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	245 m_BONNELL \| m_SILVERMONT \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_TREMONT
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	246 \| m_KNL \| m_KNM)
111 04ced10e8804 gcc 7 kono parents: diff changeset	247
04ced10e8804 gcc 7 kono parents: diff changeset	248 /* X86_TUNE_SLOW_IMUL_IMM32_MEM: Imul of 32-bit constant and memory is
04ced10e8804 gcc 7 kono parents: diff changeset	249 vector path on AMD machines.
04ced10e8804 gcc 7 kono parents: diff changeset	250 FIXME: Do we need to enable this for core? */
04ced10e8804 gcc 7 kono parents: diff changeset	251 DEF_TUNE (X86_TUNE_SLOW_IMUL_IMM32_MEM, "slow_imul_imm32_mem",
04ced10e8804 gcc 7 kono parents: diff changeset	252 m_K8 \| m_AMDFAM10)
04ced10e8804 gcc 7 kono parents: diff changeset	253
04ced10e8804 gcc 7 kono parents: diff changeset	254 /* X86_TUNE_SLOW_IMUL_IMM8: Imul of 8-bit constant is vector path on AMD
04ced10e8804 gcc 7 kono parents: diff changeset	255 machines.
04ced10e8804 gcc 7 kono parents: diff changeset	256 FIXME: Do we need to enable this for core? */
04ced10e8804 gcc 7 kono parents: diff changeset	257 DEF_TUNE (X86_TUNE_SLOW_IMUL_IMM8, "slow_imul_imm8",
04ced10e8804 gcc 7 kono parents: diff changeset	258 m_K8 \| m_AMDFAM10)
04ced10e8804 gcc 7 kono parents: diff changeset	259
04ced10e8804 gcc 7 kono parents: diff changeset	260 /* X86_TUNE_AVOID_MEM_OPND_FOR_CMOVE: Try to avoid memory operands for
04ced10e8804 gcc 7 kono parents: diff changeset	261 a conditional move. */
04ced10e8804 gcc 7 kono parents: diff changeset	262 DEF_TUNE (X86_TUNE_AVOID_MEM_OPND_FOR_CMOVE, "avoid_mem_opnd_for_cmove",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	263 m_BONNELL \| m_SILVERMONT \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_KNL
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	264 \| m_KNM \| m_TREMONT \| m_INTEL)
111 04ced10e8804 gcc 7 kono parents: diff changeset	265
04ced10e8804 gcc 7 kono parents: diff changeset	266 /* X86_TUNE_SINGLE_STRINGOP: Enable use of single string operations, such
04ced10e8804 gcc 7 kono parents: diff changeset	267 as MOVS and STOS (without a REP prefix) to move/set sequences of bytes. */
04ced10e8804 gcc 7 kono parents: diff changeset	268 DEF_TUNE (X86_TUNE_SINGLE_STRINGOP, "single_stringop", m_386 \| m_P4_NOCONA)
04ced10e8804 gcc 7 kono parents: diff changeset	269
04ced10e8804 gcc 7 kono parents: diff changeset	270 /* X86_TUNE_MISALIGNED_MOVE_STRING_PRO_EPILOGUES: Enable generation of
04ced10e8804 gcc 7 kono parents: diff changeset	271 compact prologues and epilogues by issuing a misaligned moves. This
04ced10e8804 gcc 7 kono parents: diff changeset	272 requires target to handle misaligned moves and partial memory stalls
04ced10e8804 gcc 7 kono parents: diff changeset	273 reasonably well.
04ced10e8804 gcc 7 kono parents: diff changeset	274 FIXME: This may actualy be a win on more targets than listed here. */
04ced10e8804 gcc 7 kono parents: diff changeset	275 DEF_TUNE (X86_TUNE_MISALIGNED_MOVE_STRING_PRO_EPILOGUES,
04ced10e8804 gcc 7 kono parents: diff changeset	276 "misaligned_move_string_pro_epilogues",
04ced10e8804 gcc 7 kono parents: diff changeset	277 m_386 \| m_486 \| m_CORE_ALL \| m_AMD_MULTIPLE \| m_GENERIC)
04ced10e8804 gcc 7 kono parents: diff changeset	278
04ced10e8804 gcc 7 kono parents: diff changeset	279 /* X86_TUNE_USE_SAHF: Controls use of SAHF. */
04ced10e8804 gcc 7 kono parents: diff changeset	280 DEF_TUNE (X86_TUNE_USE_SAHF, "use_sahf",
04ced10e8804 gcc 7 kono parents: diff changeset	281 m_PPRO \| m_P4_NOCONA \| m_CORE_ALL \| m_BONNELL \| m_SILVERMONT
04ced10e8804 gcc 7 kono parents: diff changeset	282 \| m_KNL \| m_KNM \| m_INTEL \| m_K6_GEODE \| m_K8 \| m_AMDFAM10 \| m_BDVER
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	283 \| m_BTVER \| m_ZNVER1 \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_TREMONT
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	284 \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	285
04ced10e8804 gcc 7 kono parents: diff changeset	286 /* X86_TUNE_USE_CLTD: Controls use of CLTD and CTQO instructions. */
04ced10e8804 gcc 7 kono parents: diff changeset	287 DEF_TUNE (X86_TUNE_USE_CLTD, "use_cltd",
04ced10e8804 gcc 7 kono parents: diff changeset	288 ~(m_PENT \| m_LAKEMONT \| m_BONNELL \| m_SILVERMONT \| m_KNL \| m_KNM \| m_INTEL
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	289 \| m_K6 \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_TREMONT))
111 04ced10e8804 gcc 7 kono parents: diff changeset	290
04ced10e8804 gcc 7 kono parents: diff changeset	291 /* X86_TUNE_USE_BT: Enable use of BT (bit test) instructions. */
04ced10e8804 gcc 7 kono parents: diff changeset	292 DEF_TUNE (X86_TUNE_USE_BT, "use_bt",
04ced10e8804 gcc 7 kono parents: diff changeset	293 m_CORE_ALL \| m_BONNELL \| m_SILVERMONT \| m_KNL \| m_KNM \| m_INTEL
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	294 \| m_LAKEMONT \| m_AMD_MULTIPLE \| m_GOLDMONT \| m_GOLDMONT_PLUS
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	295 \| m_TREMONT \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	296
04ced10e8804 gcc 7 kono parents: diff changeset	297 /* X86_TUNE_AVOID_FALSE_DEP_FOR_BMI: Avoid false dependency
04ced10e8804 gcc 7 kono parents: diff changeset	298 for bit-manipulation instructions. */
04ced10e8804 gcc 7 kono parents: diff changeset	299 DEF_TUNE (X86_TUNE_AVOID_FALSE_DEP_FOR_BMI, "avoid_false_dep_for_bmi",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	300 m_SANDYBRIDGE \| m_CORE_AVX2 \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	301
04ced10e8804 gcc 7 kono parents: diff changeset	302 /* X86_TUNE_ADJUST_UNROLL: This enables adjusting the unroll factor based
04ced10e8804 gcc 7 kono parents: diff changeset	303 on hardware capabilities. Bdver3 hardware has a loop buffer which makes
04ced10e8804 gcc 7 kono parents: diff changeset	304 unrolling small loop less important. For, such architectures we adjust
04ced10e8804 gcc 7 kono parents: diff changeset	305 the unroll factor so that the unrolled loop fits the loop buffer. */
04ced10e8804 gcc 7 kono parents: diff changeset	306 DEF_TUNE (X86_TUNE_ADJUST_UNROLL, "adjust_unroll_factor", m_BDVER3 \| m_BDVER4)
04ced10e8804 gcc 7 kono parents: diff changeset	307
04ced10e8804 gcc 7 kono parents: diff changeset	308 /* X86_TUNE_ONE_IF_CONV_INSNS: Restrict a number of cmov insns in
04ced10e8804 gcc 7 kono parents: diff changeset	309 if-converted sequence to one. */
04ced10e8804 gcc 7 kono parents: diff changeset	310 DEF_TUNE (X86_TUNE_ONE_IF_CONV_INSN, "one_if_conv_insn",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	311 m_SILVERMONT \| m_KNL \| m_KNM \| m_INTEL \| m_CORE_ALL \| m_GOLDMONT
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	312 \| m_GOLDMONT_PLUS \| m_TREMONT \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	313
04ced10e8804 gcc 7 kono parents: diff changeset	314 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	315 /* 387 instruction selection tuning */
04ced10e8804 gcc 7 kono parents: diff changeset	316 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	317
04ced10e8804 gcc 7 kono parents: diff changeset	318 /* X86_TUNE_USE_HIMODE_FIOP: Enables use of x87 instructions with 16bit
04ced10e8804 gcc 7 kono parents: diff changeset	319 integer operand.
04ced10e8804 gcc 7 kono parents: diff changeset	320 FIXME: Why this is disabled for modern chips? */
04ced10e8804 gcc 7 kono parents: diff changeset	321 DEF_TUNE (X86_TUNE_USE_HIMODE_FIOP, "use_himode_fiop",
04ced10e8804 gcc 7 kono parents: diff changeset	322 m_386 \| m_486 \| m_K6_GEODE)
04ced10e8804 gcc 7 kono parents: diff changeset	323
04ced10e8804 gcc 7 kono parents: diff changeset	324 /* X86_TUNE_USE_SIMODE_FIOP: Enables use of x87 instructions with 32bit
04ced10e8804 gcc 7 kono parents: diff changeset	325 integer operand. */
04ced10e8804 gcc 7 kono parents: diff changeset	326 DEF_TUNE (X86_TUNE_USE_SIMODE_FIOP, "use_simode_fiop",
04ced10e8804 gcc 7 kono parents: diff changeset	327 ~(m_PENT \| m_LAKEMONT \| m_PPRO \| m_CORE_ALL \| m_BONNELL
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	328 \| m_SILVERMONT \| m_KNL \| m_KNM \| m_INTEL \| m_AMD_MULTIPLE
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	329 \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_TREMONT \| m_GENERIC))
111 04ced10e8804 gcc 7 kono parents: diff changeset	330
04ced10e8804 gcc 7 kono parents: diff changeset	331 /* X86_TUNE_USE_FFREEP: Use freep instruction instead of fstp. */
04ced10e8804 gcc 7 kono parents: diff changeset	332 DEF_TUNE (X86_TUNE_USE_FFREEP, "use_ffreep", m_AMD_MULTIPLE)
04ced10e8804 gcc 7 kono parents: diff changeset	333
04ced10e8804 gcc 7 kono parents: diff changeset	334 /* X86_TUNE_EXT_80387_CONSTANTS: Use fancy 80387 constants, such as PI. */
04ced10e8804 gcc 7 kono parents: diff changeset	335 DEF_TUNE (X86_TUNE_EXT_80387_CONSTANTS, "ext_80387_constants",
04ced10e8804 gcc 7 kono parents: diff changeset	336 m_PPRO \| m_P4_NOCONA \| m_CORE_ALL \| m_BONNELL \| m_SILVERMONT
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	337 \| m_KNL \| m_KNM \| m_INTEL \| m_K6_GEODE \| m_ATHLON_K8 \| m_GOLDMONT
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	338 \| m_GOLDMONT_PLUS \| m_TREMONT \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	339
04ced10e8804 gcc 7 kono parents: diff changeset	340 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	341 /* SSE instruction selection tuning */
04ced10e8804 gcc 7 kono parents: diff changeset	342 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	343
04ced10e8804 gcc 7 kono parents: diff changeset	344 /* X86_TUNE_GENERAL_REGS_SSE_SPILL: Try to spill general regs to SSE
04ced10e8804 gcc 7 kono parents: diff changeset	345 regs instead of memory. */
04ced10e8804 gcc 7 kono parents: diff changeset	346 DEF_TUNE (X86_TUNE_GENERAL_REGS_SSE_SPILL, "general_regs_sse_spill",
04ced10e8804 gcc 7 kono parents: diff changeset	347 m_CORE_ALL)
04ced10e8804 gcc 7 kono parents: diff changeset	348
04ced10e8804 gcc 7 kono parents: diff changeset	349 /* X86_TUNE_SSE_UNALIGNED_LOAD_OPTIMAL: Use movups for misaligned loads instead
04ced10e8804 gcc 7 kono parents: diff changeset	350 of a sequence loading registers by parts. */
04ced10e8804 gcc 7 kono parents: diff changeset	351 DEF_TUNE (X86_TUNE_SSE_UNALIGNED_LOAD_OPTIMAL, "sse_unaligned_load_optimal",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	352 m_NEHALEM \| m_SANDYBRIDGE \| m_CORE_AVX2 \| m_SILVERMONT \| m_KNL \| m_KNM
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	353 \| m_INTEL \| m_GOLDMONT \| m_GOLDMONT_PLUS
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	354 \| m_TREMONT \| m_AMDFAM10 \| m_BDVER \| m_BTVER \| m_ZNVER1 \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	355
04ced10e8804 gcc 7 kono parents: diff changeset	356 /* X86_TUNE_SSE_UNALIGNED_STORE_OPTIMAL: Use movups for misaligned stores instead
04ced10e8804 gcc 7 kono parents: diff changeset	357 of a sequence loading registers by parts. */
04ced10e8804 gcc 7 kono parents: diff changeset	358 DEF_TUNE (X86_TUNE_SSE_UNALIGNED_STORE_OPTIMAL, "sse_unaligned_store_optimal",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	359 m_NEHALEM \| m_SANDYBRIDGE \| m_CORE_AVX2 \| m_SILVERMONT \| m_KNL \| m_KNM
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	360 \| m_INTEL \| m_GOLDMONT \| m_GOLDMONT_PLUS
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	361 \| m_TREMONT \| m_BDVER \| m_ZNVER1 \| m_GENERIC)
111 04ced10e8804 gcc 7 kono parents: diff changeset	362
04ced10e8804 gcc 7 kono parents: diff changeset	363 /* Use packed single precision instructions where posisble. I.e. movups instead
04ced10e8804 gcc 7 kono parents: diff changeset	364 of movupd. */
04ced10e8804 gcc 7 kono parents: diff changeset	365 DEF_TUNE (X86_TUNE_SSE_PACKED_SINGLE_INSN_OPTIMAL, "sse_packed_single_insn_optimal",
04ced10e8804 gcc 7 kono parents: diff changeset	366 m_BDVER \| m_ZNVER1)
04ced10e8804 gcc 7 kono parents: diff changeset	367
04ced10e8804 gcc 7 kono parents: diff changeset	368 /* X86_TUNE_SSE_TYPELESS_STORES: Always movaps/movups for 128bit stores. */
04ced10e8804 gcc 7 kono parents: diff changeset	369 DEF_TUNE (X86_TUNE_SSE_TYPELESS_STORES, "sse_typeless_stores",
04ced10e8804 gcc 7 kono parents: diff changeset	370 m_AMD_MULTIPLE \| m_CORE_ALL \| m_GENERIC)
04ced10e8804 gcc 7 kono parents: diff changeset	371
04ced10e8804 gcc 7 kono parents: diff changeset	372 /* X86_TUNE_SSE_LOAD0_BY_PXOR: Always use pxor to load0 as opposed to
04ced10e8804 gcc 7 kono parents: diff changeset	373 xorps/xorpd and other variants. */
04ced10e8804 gcc 7 kono parents: diff changeset	374 DEF_TUNE (X86_TUNE_SSE_LOAD0_BY_PXOR, "sse_load0_by_pxor",
04ced10e8804 gcc 7 kono parents: diff changeset	375 m_PPRO \| m_P4_NOCONA \| m_CORE_ALL \| m_BDVER \| m_BTVER \| m_ZNVER1
04ced10e8804 gcc 7 kono parents: diff changeset	376 \| m_GENERIC)
04ced10e8804 gcc 7 kono parents: diff changeset	377
04ced10e8804 gcc 7 kono parents: diff changeset	378 /* X86_TUNE_INTER_UNIT_MOVES_TO_VEC: Enable moves in from integer
04ced10e8804 gcc 7 kono parents: diff changeset	379 to SSE registers. If disabled, the moves will be done by storing
04ced10e8804 gcc 7 kono parents: diff changeset	380 the value to memory and reloading. */
04ced10e8804 gcc 7 kono parents: diff changeset	381 DEF_TUNE (X86_TUNE_INTER_UNIT_MOVES_TO_VEC, "inter_unit_moves_to_vec",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	382 ~(m_ATHLON_K8 \| m_AMDFAM10 \| m_BDVER \| m_BTVER \| m_GENERIC))
111 04ced10e8804 gcc 7 kono parents: diff changeset	383
04ced10e8804 gcc 7 kono parents: diff changeset	384 /* X86_TUNE_INTER_UNIT_MOVES_TO_VEC: Enable moves in from SSE
04ced10e8804 gcc 7 kono parents: diff changeset	385 to integer registers. If disabled, the moves will be done by storing
04ced10e8804 gcc 7 kono parents: diff changeset	386 the value to memory and reloading. */
04ced10e8804 gcc 7 kono parents: diff changeset	387 DEF_TUNE (X86_TUNE_INTER_UNIT_MOVES_FROM_VEC, "inter_unit_moves_from_vec",
04ced10e8804 gcc 7 kono parents: diff changeset	388 ~m_ATHLON_K8)
04ced10e8804 gcc 7 kono parents: diff changeset	389
04ced10e8804 gcc 7 kono parents: diff changeset	390 /* X86_TUNE_INTER_UNIT_CONVERSIONS: Enable float<->integer conversions
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	391 to use both SSE and integer registers at a same time. */
111 04ced10e8804 gcc 7 kono parents: diff changeset	392 DEF_TUNE (X86_TUNE_INTER_UNIT_CONVERSIONS, "inter_unit_conversions",
04ced10e8804 gcc 7 kono parents: diff changeset	393 ~(m_AMDFAM10 \| m_BDVER))
04ced10e8804 gcc 7 kono parents: diff changeset	394
04ced10e8804 gcc 7 kono parents: diff changeset	395 /* X86_TUNE_SPLIT_MEM_OPND_FOR_FP_CONVERTS: Try to split memory operand for
04ced10e8804 gcc 7 kono parents: diff changeset	396 fp converts to destination register. */
04ced10e8804 gcc 7 kono parents: diff changeset	397 DEF_TUNE (X86_TUNE_SPLIT_MEM_OPND_FOR_FP_CONVERTS, "split_mem_opnd_for_fp_converts",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	398 m_SILVERMONT \| m_KNL \| m_KNM \| m_GOLDMONT \| m_GOLDMONT_PLUS
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	399 \| m_TREMONT \| m_INTEL)
111 04ced10e8804 gcc 7 kono parents: diff changeset	400
04ced10e8804 gcc 7 kono parents: diff changeset	401 /* X86_TUNE_USE_VECTOR_FP_CONVERTS: Prefer vector packed SSE conversion
04ced10e8804 gcc 7 kono parents: diff changeset	402 from FP to FP. This form of instructions avoids partial write to the
04ced10e8804 gcc 7 kono parents: diff changeset	403 destination. */
04ced10e8804 gcc 7 kono parents: diff changeset	404 DEF_TUNE (X86_TUNE_USE_VECTOR_FP_CONVERTS, "use_vector_fp_converts",
04ced10e8804 gcc 7 kono parents: diff changeset	405 m_AMDFAM10)
04ced10e8804 gcc 7 kono parents: diff changeset	406
04ced10e8804 gcc 7 kono parents: diff changeset	407 /* X86_TUNE_USE_VECTOR_CONVERTS: Prefer vector packed SSE conversion
04ced10e8804 gcc 7 kono parents: diff changeset	408 from integer to FP. */
04ced10e8804 gcc 7 kono parents: diff changeset	409 DEF_TUNE (X86_TUNE_USE_VECTOR_CONVERTS, "use_vector_converts", m_AMDFAM10)
04ced10e8804 gcc 7 kono parents: diff changeset	410
04ced10e8804 gcc 7 kono parents: diff changeset	411 /* X86_TUNE_SLOW_SHUFB: Indicates tunings with slow pshufb instruction. */
04ced10e8804 gcc 7 kono parents: diff changeset	412 DEF_TUNE (X86_TUNE_SLOW_PSHUFB, "slow_pshufb",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	413 m_BONNELL \| m_SILVERMONT \| m_KNL \| m_KNM \| m_GOLDMONT
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	414 \| m_GOLDMONT_PLUS \| m_TREMONT \| m_INTEL)
111 04ced10e8804 gcc 7 kono parents: diff changeset	415
04ced10e8804 gcc 7 kono parents: diff changeset	416 /* X86_TUNE_AVOID_4BYTE_PREFIXES: Avoid instructions requiring 4+ bytes of prefixes. */
04ced10e8804 gcc 7 kono parents: diff changeset	417 DEF_TUNE (X86_TUNE_AVOID_4BYTE_PREFIXES, "avoid_4byte_prefixes",
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	418 m_SILVERMONT \| m_GOLDMONT \| m_GOLDMONT_PLUS \| m_TREMONT \| m_INTEL)
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	419
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	420 /* X86_TUNE_USE_GATHER: Use gather instructions. */
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	421 DEF_TUNE (X86_TUNE_USE_GATHER, "use_gather",
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	422 ~(m_ZNVER1 \| m_GENERIC))
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	423
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	424 /* X86_TUNE_AVOID_128FMA_CHAINS: Avoid creating loops with tight 128bit or
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	425 smaller FMA chain. */
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	426 DEF_TUNE (X86_TUNE_AVOID_128FMA_CHAINS, "avoid_fma_chains", m_ZNVER1)
111 04ced10e8804 gcc 7 kono parents: diff changeset	427
04ced10e8804 gcc 7 kono parents: diff changeset	428 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	429 /* AVX instruction selection tuning (some of SSE flags affects AVX, too) */
04ced10e8804 gcc 7 kono parents: diff changeset	430 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	431
04ced10e8804 gcc 7 kono parents: diff changeset	432 /* X86_TUNE_AVX256_UNALIGNED_LOAD_OPTIMAL: if false, unaligned loads are
04ced10e8804 gcc 7 kono parents: diff changeset	433 split. */
04ced10e8804 gcc 7 kono parents: diff changeset	434 DEF_TUNE (X86_TUNE_AVX256_UNALIGNED_LOAD_OPTIMAL, "256_unaligned_load_optimal",
04ced10e8804 gcc 7 kono parents: diff changeset	435 ~(m_NEHALEM \| m_SANDYBRIDGE \| m_GENERIC))
04ced10e8804 gcc 7 kono parents: diff changeset	436
04ced10e8804 gcc 7 kono parents: diff changeset	437 /* X86_TUNE_AVX256_UNALIGNED_STORE_OPTIMAL: if false, unaligned stores are
04ced10e8804 gcc 7 kono parents: diff changeset	438 split. */
04ced10e8804 gcc 7 kono parents: diff changeset	439 DEF_TUNE (X86_TUNE_AVX256_UNALIGNED_STORE_OPTIMAL, "256_unaligned_store_optimal",
04ced10e8804 gcc 7 kono parents: diff changeset	440 ~(m_NEHALEM \| m_SANDYBRIDGE \| m_BDVER \| m_ZNVER1 \| m_GENERIC))
04ced10e8804 gcc 7 kono parents: diff changeset	441
04ced10e8804 gcc 7 kono parents: diff changeset	442 /* X86_TUNE_AVX128_OPTIMAL: Enable 128-bit AVX instruction generation for
04ced10e8804 gcc 7 kono parents: diff changeset	443 the auto-vectorizer. */
04ced10e8804 gcc 7 kono parents: diff changeset	444 DEF_TUNE (X86_TUNE_AVX128_OPTIMAL, "avx128_optimal", m_BDVER \| m_BTVER2
04ced10e8804 gcc 7 kono parents: diff changeset	445 \| m_ZNVER1)
04ced10e8804 gcc 7 kono parents: diff changeset	446
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	447 /* X86_TUNE_AVX256_OPTIMAL: Use 256-bit AVX instructions instead of 512-bit AVX
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	448 instructions in the auto-vectorizer. */
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	449 DEF_TUNE (X86_TUNE_AVX256_OPTIMAL, "avx256_optimal", m_CORE_AVX512)
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	450
111 04ced10e8804 gcc 7 kono parents: diff changeset	451 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	452 /* Historical relics: tuning flags that helps a specific old CPU designs */
04ced10e8804 gcc 7 kono parents: diff changeset	453 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	454
04ced10e8804 gcc 7 kono parents: diff changeset	455 /* X86_TUNE_DOUBLE_WITH_ADD: Use add instead of sal to double value in
04ced10e8804 gcc 7 kono parents: diff changeset	456 an integer register. */
04ced10e8804 gcc 7 kono parents: diff changeset	457 DEF_TUNE (X86_TUNE_DOUBLE_WITH_ADD, "double_with_add", ~m_386)
04ced10e8804 gcc 7 kono parents: diff changeset	458
04ced10e8804 gcc 7 kono parents: diff changeset	459 /* X86_TUNE_ALWAYS_FANCY_MATH_387: controls use of fancy 387 operations,
04ced10e8804 gcc 7 kono parents: diff changeset	460 such as fsqrt, fprem, fsin, fcos, fsincos etc.
04ced10e8804 gcc 7 kono parents: diff changeset	461 Should be enabled for all targets that always has coprocesor. */
04ced10e8804 gcc 7 kono parents: diff changeset	462 DEF_TUNE (X86_TUNE_ALWAYS_FANCY_MATH_387, "always_fancy_math_387",
04ced10e8804 gcc 7 kono parents: diff changeset	463 ~(m_386 \| m_486 \| m_LAKEMONT))
04ced10e8804 gcc 7 kono parents: diff changeset	464
04ced10e8804 gcc 7 kono parents: diff changeset	465 /* X86_TUNE_UNROLL_STRLEN: Produce (quite lame) unrolled sequence for
04ced10e8804 gcc 7 kono parents: diff changeset	466 inline strlen. This affects only -minline-all-stringops mode. By
04ced10e8804 gcc 7 kono parents: diff changeset	467 default we always dispatch to a library since our internal strlen
04ced10e8804 gcc 7 kono parents: diff changeset	468 is bad. */
04ced10e8804 gcc 7 kono parents: diff changeset	469 DEF_TUNE (X86_TUNE_UNROLL_STRLEN, "unroll_strlen", ~m_386)
04ced10e8804 gcc 7 kono parents: diff changeset	470
04ced10e8804 gcc 7 kono parents: diff changeset	471 /* X86_TUNE_SHIFT1: Enables use of short encoding of "sal reg" instead of
04ced10e8804 gcc 7 kono parents: diff changeset	472 longer "sal $1, reg". */
04ced10e8804 gcc 7 kono parents: diff changeset	473 DEF_TUNE (X86_TUNE_SHIFT1, "shift1", ~m_486)
04ced10e8804 gcc 7 kono parents: diff changeset	474
04ced10e8804 gcc 7 kono parents: diff changeset	475 /* X86_TUNE_ZERO_EXTEND_WITH_AND: Use AND instruction instead
04ced10e8804 gcc 7 kono parents: diff changeset	476 of mozbl/movwl. */
04ced10e8804 gcc 7 kono parents: diff changeset	477 DEF_TUNE (X86_TUNE_ZERO_EXTEND_WITH_AND, "zero_extend_with_and",
04ced10e8804 gcc 7 kono parents: diff changeset	478 m_486 \| m_PENT)
04ced10e8804 gcc 7 kono parents: diff changeset	479
04ced10e8804 gcc 7 kono parents: diff changeset	480 /* X86_TUNE_PROMOTE_HIMODE_IMUL: Modern CPUs have same latency for HImode
04ced10e8804 gcc 7 kono parents: diff changeset	481 and SImode multiply, but 386 and 486 do HImode multiply faster. */
04ced10e8804 gcc 7 kono parents: diff changeset	482 DEF_TUNE (X86_TUNE_PROMOTE_HIMODE_IMUL, "promote_himode_imul",
04ced10e8804 gcc 7 kono parents: diff changeset	483 ~(m_386 \| m_486))
04ced10e8804 gcc 7 kono parents: diff changeset	484
04ced10e8804 gcc 7 kono parents: diff changeset	485 /* X86_TUNE_FAST_PREFIX: Enable demoting some 32bit or 64bit arithmetic
04ced10e8804 gcc 7 kono parents: diff changeset	486 into 16bit/8bit when resulting sequence is shorter. For example
04ced10e8804 gcc 7 kono parents: diff changeset	487 for "and $-65536, reg" to 16bit store of 0. */
04ced10e8804 gcc 7 kono parents: diff changeset	488 DEF_TUNE (X86_TUNE_FAST_PREFIX, "fast_prefix",
04ced10e8804 gcc 7 kono parents: diff changeset	489 ~(m_386 \| m_486 \| m_PENT \| m_LAKEMONT))
04ced10e8804 gcc 7 kono parents: diff changeset	490
04ced10e8804 gcc 7 kono parents: diff changeset	491 /* X86_TUNE_READ_MODIFY_WRITE: Enable use of read modify write instructions
04ced10e8804 gcc 7 kono parents: diff changeset	492 such as "add $1, mem". */
04ced10e8804 gcc 7 kono parents: diff changeset	493 DEF_TUNE (X86_TUNE_READ_MODIFY_WRITE, "read_modify_write",
04ced10e8804 gcc 7 kono parents: diff changeset	494 ~(m_PENT \| m_LAKEMONT))
04ced10e8804 gcc 7 kono parents: diff changeset	495
04ced10e8804 gcc 7 kono parents: diff changeset	496 /* X86_TUNE_MOVE_M1_VIA_OR: On pentiums, it is faster to load -1 via OR
04ced10e8804 gcc 7 kono parents: diff changeset	497 than a MOV. */
04ced10e8804 gcc 7 kono parents: diff changeset	498 DEF_TUNE (X86_TUNE_MOVE_M1_VIA_OR, "move_m1_via_or", m_PENT \| m_LAKEMONT)
04ced10e8804 gcc 7 kono parents: diff changeset	499
04ced10e8804 gcc 7 kono parents: diff changeset	500 /* X86_TUNE_NOT_UNPAIRABLE: NOT is not pairable on Pentium, while XOR is,
04ced10e8804 gcc 7 kono parents: diff changeset	501 but one byte longer. */
04ced10e8804 gcc 7 kono parents: diff changeset	502 DEF_TUNE (X86_TUNE_NOT_UNPAIRABLE, "not_unpairable", m_PENT \| m_LAKEMONT)
04ced10e8804 gcc 7 kono parents: diff changeset	503
04ced10e8804 gcc 7 kono parents: diff changeset	504 /* X86_TUNE_PARTIAL_REG_STALL: Pentium pro, unlike later chips, handled
04ced10e8804 gcc 7 kono parents: diff changeset	505 use of partial registers by renaming. This improved performance of 16bit
04ced10e8804 gcc 7 kono parents: diff changeset	506 code where upper halves of registers are not used. It also leads to
04ced10e8804 gcc 7 kono parents: diff changeset	507 an penalty whenever a 16bit store is followed by 32bit use. This flag
04ced10e8804 gcc 7 kono parents: diff changeset	508 disables production of such sequences in common cases.
04ced10e8804 gcc 7 kono parents: diff changeset	509 See also X86_TUNE_HIMODE_MATH.
04ced10e8804 gcc 7 kono parents: diff changeset	510
04ced10e8804 gcc 7 kono parents: diff changeset	511 In current implementation the partial register stalls are not eliminated
04ced10e8804 gcc 7 kono parents: diff changeset	512 very well - they can be introduced via subregs synthesized by combine
04ced10e8804 gcc 7 kono parents: diff changeset	513 and can happen in caller/callee saving sequences. */
04ced10e8804 gcc 7 kono parents: diff changeset	514 DEF_TUNE (X86_TUNE_PARTIAL_REG_STALL, "partial_reg_stall", m_PPRO)
04ced10e8804 gcc 7 kono parents: diff changeset	515
04ced10e8804 gcc 7 kono parents: diff changeset	516 /* X86_TUNE_PROMOTE_QIMODE: When it is cheap, turn 8bit arithmetic to
04ced10e8804 gcc 7 kono parents: diff changeset	517 corresponding 32bit arithmetic. */
04ced10e8804 gcc 7 kono parents: diff changeset	518 DEF_TUNE (X86_TUNE_PROMOTE_QIMODE, "promote_qimode",
04ced10e8804 gcc 7 kono parents: diff changeset	519 ~m_PPRO)
04ced10e8804 gcc 7 kono parents: diff changeset	520
04ced10e8804 gcc 7 kono parents: diff changeset	521 /* X86_TUNE_PROMOTE_HI_REGS: Same, but for 16bit artihmetic. Again we avoid
04ced10e8804 gcc 7 kono parents: diff changeset	522 partial register stalls on PentiumPro targets. */
04ced10e8804 gcc 7 kono parents: diff changeset	523 DEF_TUNE (X86_TUNE_PROMOTE_HI_REGS, "promote_hi_regs", m_PPRO)
04ced10e8804 gcc 7 kono parents: diff changeset	524
04ced10e8804 gcc 7 kono parents: diff changeset	525 /* X86_TUNE_HIMODE_MATH: Enable use of 16bit arithmetic.
04ced10e8804 gcc 7 kono parents: diff changeset	526 On PPro this flag is meant to avoid partial register stalls. */
04ced10e8804 gcc 7 kono parents: diff changeset	527 DEF_TUNE (X86_TUNE_HIMODE_MATH, "himode_math", ~m_PPRO)
04ced10e8804 gcc 7 kono parents: diff changeset	528
04ced10e8804 gcc 7 kono parents: diff changeset	529 /* X86_TUNE_SPLIT_LONG_MOVES: Avoid instructions moving immediates
04ced10e8804 gcc 7 kono parents: diff changeset	530 directly to memory. */
04ced10e8804 gcc 7 kono parents: diff changeset	531 DEF_TUNE (X86_TUNE_SPLIT_LONG_MOVES, "split_long_moves", m_PPRO)
04ced10e8804 gcc 7 kono parents: diff changeset	532
04ced10e8804 gcc 7 kono parents: diff changeset	533 /* X86_TUNE_USE_XCHGB: Use xchgb %rh,%rl instead of rolw/rorw $8,rx. */
04ced10e8804 gcc 7 kono parents: diff changeset	534 DEF_TUNE (X86_TUNE_USE_XCHGB, "use_xchgb", m_PENT4)
04ced10e8804 gcc 7 kono parents: diff changeset	535
04ced10e8804 gcc 7 kono parents: diff changeset	536 /* X86_TUNE_USE_MOV0: Use "mov $0, reg" instead of "xor reg, reg" to clear
04ced10e8804 gcc 7 kono parents: diff changeset	537 integer register. */
04ced10e8804 gcc 7 kono parents: diff changeset	538 DEF_TUNE (X86_TUNE_USE_MOV0, "use_mov0", m_K6)
04ced10e8804 gcc 7 kono parents: diff changeset	539
04ced10e8804 gcc 7 kono parents: diff changeset	540 /* X86_TUNE_NOT_VECTORMODE: On AMD K6, NOT is vector decoded with memory
04ced10e8804 gcc 7 kono parents: diff changeset	541 operand that cannot be represented using a modRM byte. The XOR
04ced10e8804 gcc 7 kono parents: diff changeset	542 replacement is long decoded, so this split helps here as well. */
04ced10e8804 gcc 7 kono parents: diff changeset	543 DEF_TUNE (X86_TUNE_NOT_VECTORMODE, "not_vectormode", m_K6)
04ced10e8804 gcc 7 kono parents: diff changeset	544
04ced10e8804 gcc 7 kono parents: diff changeset	545 /* X86_TUNE_AVOID_VECTOR_DECODE: Enable splitters that avoid vector decoded
04ced10e8804 gcc 7 kono parents: diff changeset	546 forms of instructions on K8 targets. */
04ced10e8804 gcc 7 kono parents: diff changeset	547 DEF_TUNE (X86_TUNE_AVOID_VECTOR_DECODE, "avoid_vector_decode",
04ced10e8804 gcc 7 kono parents: diff changeset	548 m_K8)
04ced10e8804 gcc 7 kono parents: diff changeset	549
04ced10e8804 gcc 7 kono parents: diff changeset	550 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	551 /* This never worked well before. */
04ced10e8804 gcc 7 kono parents: diff changeset	552 /*****************************************************************************/
04ced10e8804 gcc 7 kono parents: diff changeset	553
04ced10e8804 gcc 7 kono parents: diff changeset	554 /* X86_TUNE_BRANCH_PREDICTION_HINTS: Branch hints were put in P4 based
04ced10e8804 gcc 7 kono parents: diff changeset	555 on simulation result. But after P4 was made, no performance benefit
04ced10e8804 gcc 7 kono parents: diff changeset	556 was observed with branch hints. It also increases the code size.
04ced10e8804 gcc 7 kono parents: diff changeset	557 As a result, icc never generates branch hints. */
04ced10e8804 gcc 7 kono parents: diff changeset	558 DEF_TUNE (X86_TUNE_BRANCH_PREDICTION_HINTS, "branch_prediction_hints", 0U)
04ced10e8804 gcc 7 kono parents: diff changeset	559
04ced10e8804 gcc 7 kono parents: diff changeset	560 /* X86_TUNE_QIMODE_MATH: Enable use of 8bit arithmetic. */
04ced10e8804 gcc 7 kono parents: diff changeset	561 DEF_TUNE (X86_TUNE_QIMODE_MATH, "qimode_math", ~0U)
04ced10e8804 gcc 7 kono parents: diff changeset	562
04ced10e8804 gcc 7 kono parents: diff changeset	563 /* X86_TUNE_PROMOTE_QI_REGS: This enables generic code that promotes all 8bit
04ced10e8804 gcc 7 kono parents: diff changeset	564 arithmetic to 32bit via PROMOTE_MODE macro. This code generation scheme
04ced10e8804 gcc 7 kono parents: diff changeset	565 is usually used for RISC targets. */
04ced10e8804 gcc 7 kono parents: diff changeset	566 DEF_TUNE (X86_TUNE_PROMOTE_QI_REGS, "promote_qi_regs", 0U)
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	567
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	568 /* X86_TUNE_EMIT_VZEROUPPER: This enables vzeroupper instruction insertion
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	569 before a transfer of control flow out of the function. */
84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	570 DEF_TUNE (X86_TUNE_EMIT_VZEROUPPER, "emit_vzeroupper", ~m_KNL)

Mercurial > hg > CbC > CbC_gcc

annotate gcc/config/i386/x86-tune.def @ 131:84e7813d76e9