LLVM: lib/Target/AMDGPU/AMDGPURegBankLegalizeRules.cpp Source File

//===-- AMDGPURegBankLegalizeRules.cpp ------------------------------------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

/// Definitions of RegBankLegalize Rules for all opcodes.

/// Implementation of container for all the Rules and search.

/// Fast search for most common case when Rule.Predicate checks LLT and

/// uniformity of register in operand 0.

//

//===----------------------------------------------------------------------===//


#include "AMDGPURegBankLegalizeRules.h"

#include "AMDGPUInstrInfo.h"

#include "GCNSubtarget.h"

#include "llvm/CodeGen/GlobalISel/GenericMachineInstrs.h"

#include "llvm/CodeGen/MachineUniformityAnalysis.h"

#include "llvm/IR/IntrinsicsAMDGPU.h"

#include "llvm/Support/AMDGPUAddrSpace.h"


#define DEBUG_TYPE "amdgpu-regbanklegalize"


using namespace llvm;

using namespace AMDGPU;


bool AMDGPU::isAnyPtr(LLT Ty, unsigned Width) {

  return Ty.isPointer() && Ty.getSizeInBits() == Width;

}


RegBankLLTMapping::RegBankLLTMapping(

    std::initializer_list<RegBankLLTMappingApplyID> DstOpMappingList,

    std::initializer_list<RegBankLLTMappingApplyID> SrcOpMappingList,

    LoweringMethodID LoweringMethod)

    : DstOpMapping(DstOpMappingList), SrcOpMapping(SrcOpMappingList),

      LoweringMethod(LoweringMethod) {}


PredicateMapping::PredicateMapping(

    std::initializer_list<UniformityLLTOpPredicateID> OpList,

    std::function<bool(const MachineInstr &)> TestFunc)

    : OpUniformityAndTypes(OpList), TestFunc(TestFunc) {}


bool matchUniformityAndLLT(Register Reg, UniformityLLTOpPredicateID UniID,

                           const MachineUniformityInfo &MUI,

                           const MachineRegisterInfo &MRI) {

  switch (UniID) {

  case S1:

    return MRI.getType(Reg) == LLT::scalar(1);

  case S16:

    return MRI.getType(Reg) == LLT::scalar(16);

  case S32:

    return MRI.getType(Reg) == LLT::scalar(32);

  case S64:

    return MRI.getType(Reg) == LLT::scalar(64);

  case S128:

    return MRI.getType(Reg) == LLT::scalar(128);

  case P0:

    return MRI.getType(Reg) == LLT::pointer(0, 64);

  case P1:

    return MRI.getType(Reg) == LLT::pointer(1, 64);

  case P3:

    return MRI.getType(Reg) == LLT::pointer(3, 32);

  case P4:

    return MRI.getType(Reg) == LLT::pointer(4, 64);

  case P5:

    return MRI.getType(Reg) == LLT::pointer(5, 32);

  case Ptr32:

    return isAnyPtr(MRI.getType(Reg), 32);

  case Ptr64:

    return isAnyPtr(MRI.getType(Reg), 64);

  case Ptr128:

    return isAnyPtr(MRI.getType(Reg), 128);

  case V2S32:

    return MRI.getType(Reg) == LLT::fixed_vector(2, 32);

  case V4S32:

    return MRI.getType(Reg) == LLT::fixed_vector(4, 32);

  case B32:

    return MRI.getType(Reg).getSizeInBits() == 32;

  case B64:

    return MRI.getType(Reg).getSizeInBits() == 64;

  case B96:

    return MRI.getType(Reg).getSizeInBits() == 96;

  case B128:

    return MRI.getType(Reg).getSizeInBits() == 128;

  case B256:

    return MRI.getType(Reg).getSizeInBits() == 256;

  case B512:

    return MRI.getType(Reg).getSizeInBits() == 512;

  case UniS1:

    return MRI.getType(Reg) == LLT::scalar(1) && MUI.isUniform(Reg);

  case UniS16:

    return MRI.getType(Reg) == LLT::scalar(16) && MUI.isUniform(Reg);

  case UniS32:

    return MRI.getType(Reg) == LLT::scalar(32) && MUI.isUniform(Reg);

  case UniS64:

    return MRI.getType(Reg) == LLT::scalar(64) && MUI.isUniform(Reg);

  case UniS128:

    return MRI.getType(Reg) == LLT::scalar(128) && MUI.isUniform(Reg);

  case UniP0:

    return MRI.getType(Reg) == LLT::pointer(0, 64) && MUI.isUniform(Reg);

  case UniP1:

    return MRI.getType(Reg) == LLT::pointer(1, 64) && MUI.isUniform(Reg);

  case UniP3:

    return MRI.getType(Reg) == LLT::pointer(3, 32) && MUI.isUniform(Reg);

  case UniP4:

    return MRI.getType(Reg) == LLT::pointer(4, 64) && MUI.isUniform(Reg);

  case UniP5:

    return MRI.getType(Reg) == LLT::pointer(5, 32) && MUI.isUniform(Reg);

  case UniPtr32:

    return isAnyPtr(MRI.getType(Reg), 32) && MUI.isUniform(Reg);

  case UniPtr64:

    return isAnyPtr(MRI.getType(Reg), 64) && MUI.isUniform(Reg);

  case UniPtr128:

    return isAnyPtr(MRI.getType(Reg), 128) && MUI.isUniform(Reg);

  case UniV2S16:

    return MRI.getType(Reg) == LLT::fixed_vector(2, 16) && MUI.isUniform(Reg);

  case UniB32:

    return MRI.getType(Reg).getSizeInBits() == 32 && MUI.isUniform(Reg);

  case UniB64:

    return MRI.getType(Reg).getSizeInBits() == 64 && MUI.isUniform(Reg);

  case UniB96:

    return MRI.getType(Reg).getSizeInBits() == 96 && MUI.isUniform(Reg);

  case UniB128:

    return MRI.getType(Reg).getSizeInBits() == 128 && MUI.isUniform(Reg);

  case UniB256:

    return MRI.getType(Reg).getSizeInBits() == 256 && MUI.isUniform(Reg);

  case UniB512:

    return MRI.getType(Reg).getSizeInBits() == 512 && MUI.isUniform(Reg);

  case DivS1:

    return MRI.getType(Reg) == LLT::scalar(1) && MUI.isDivergent(Reg);

  case DivS16:

    return MRI.getType(Reg) == LLT::scalar(16) && MUI.isDivergent(Reg);

  case DivS32:

    return MRI.getType(Reg) == LLT::scalar(32) && MUI.isDivergent(Reg);

  case DivS64:

    return MRI.getType(Reg) == LLT::scalar(64) && MUI.isDivergent(Reg);

  case DivS128:

    return MRI.getType(Reg) == LLT::scalar(128) && MUI.isDivergent(Reg);

  case DivP0:

    return MRI.getType(Reg) == LLT::pointer(0, 64) && MUI.isDivergent(Reg);

  case DivP1:

    return MRI.getType(Reg) == LLT::pointer(1, 64) && MUI.isDivergent(Reg);

  case DivP3:

    return MRI.getType(Reg) == LLT::pointer(3, 32) && MUI.isDivergent(Reg);

  case DivP4:

    return MRI.getType(Reg) == LLT::pointer(4, 64) && MUI.isDivergent(Reg);

  case DivP5:

    return MRI.getType(Reg) == LLT::pointer(5, 32) && MUI.isDivergent(Reg);

  case DivPtr32:

    return isAnyPtr(MRI.getType(Reg), 32) && MUI.isDivergent(Reg);

  case DivPtr64:

    return isAnyPtr(MRI.getType(Reg), 64) && MUI.isDivergent(Reg);

  case DivPtr128:

    return isAnyPtr(MRI.getType(Reg), 128) && MUI.isDivergent(Reg);

  case DivV2S16:

    return MRI.getType(Reg) == LLT::fixed_vector(2, 16) && MUI.isDivergent(Reg);

  case DivB32:

    return MRI.getType(Reg).getSizeInBits() == 32 && MUI.isDivergent(Reg);

  case DivB64:

    return MRI.getType(Reg).getSizeInBits() == 64 && MUI.isDivergent(Reg);

  case DivB96:

    return MRI.getType(Reg).getSizeInBits() == 96 && MUI.isDivergent(Reg);

  case DivB128:

    return MRI.getType(Reg).getSizeInBits() == 128 && MUI.isDivergent(Reg);

  case DivB256:

    return MRI.getType(Reg).getSizeInBits() == 256 && MUI.isDivergent(Reg);

  case DivB512:

    return MRI.getType(Reg).getSizeInBits() == 512 && MUI.isDivergent(Reg);

  case _:

    return true;

  default:

    llvm_unreachable("missing matchUniformityAndLLT");

  }

}


bool PredicateMapping::match(const MachineInstr &MI,

                             const MachineUniformityInfo &MUI,

                             const MachineRegisterInfo &MRI) const {

  // Check LLT signature.

  for (unsigned i = 0; i < OpUniformityAndTypes.size(); ++i) {

    if (OpUniformityAndTypes[i] == _) {

      if (MI.getOperand(i).isReg())

        return false;

      continue;

    }


    // Remaining IDs check registers.

    if (!MI.getOperand(i).isReg())

      return false;


    if (!matchUniformityAndLLT(MI.getOperand(i).getReg(),

                               OpUniformityAndTypes[i], MUI, MRI))

      return false;

  }


  // More complex check.

  if (TestFunc)

    return TestFunc(MI);


  return true;

}


SetOfRulesForOpcode::SetOfRulesForOpcode() {}


SetOfRulesForOpcode::SetOfRulesForOpcode(FastRulesTypes FastTypes)

    : FastTypes(FastTypes) {}


UniformityLLTOpPredicateID LLTToId(LLT Ty) {

  if (Ty == LLT::scalar(16))

    return S16;

  if (Ty == LLT::scalar(32))

    return S32;

  if (Ty == LLT::scalar(64))

    return S64;

  if (Ty == LLT::fixed_vector(2, 16))

    return V2S16;

  if (Ty == LLT::fixed_vector(2, 32))

    return V2S32;

  if (Ty == LLT::fixed_vector(3, 32))

    return V3S32;

  if (Ty == LLT::fixed_vector(4, 32))

    return V4S32;

  return _;

}


UniformityLLTOpPredicateID LLTToBId(LLT Ty) {

  if (Ty == LLT::scalar(32) || Ty == LLT::fixed_vector(2, 16) ||

      isAnyPtr(Ty, 32))

    return B32;

  if (Ty == LLT::scalar(64) || Ty == LLT::fixed_vector(2, 32) ||

      Ty == LLT::fixed_vector(4, 16) || isAnyPtr(Ty, 64))

    return B64;

  if (Ty == LLT::fixed_vector(3, 32))

    return B96;

  if (Ty == LLT::fixed_vector(4, 32) || isAnyPtr(Ty, 128))

    return B128;

  return _;

}


const RegBankLLTMapping &

SetOfRulesForOpcode::findMappingForMI(const MachineInstr &MI,

                                      const MachineRegisterInfo &MRI,

                                      const MachineUniformityInfo &MUI) const {

  // Search in "Fast Rules".

  // Note: if fast rules are enabled, RegBankLLTMapping must be added in each

  // slot that could "match fast Predicate". If not, InvalidMapping is

  // returned which results in failure, does not search "Slow Rules".

  if (FastTypes != NoFastRules) {

    Register Reg = MI.getOperand(0).getReg();

    int Slot;

    if (FastTypes == StandardB)

      Slot = getFastPredicateSlot(LLTToBId(MRI.getType(Reg)));

    else

      Slot = getFastPredicateSlot(LLTToId(MRI.getType(Reg)));


    if (Slot != -1)

      return MUI.isUniform(Reg) ? Uni[Slot] : Div[Slot];

  }


  // Slow search for more complex rules.

  for (const RegBankLegalizeRule &Rule : Rules) {

    if (Rule.Predicate.match(MI, MUI, MRI))

      return Rule.OperandMapping;

  }


  LLVM_DEBUG(dbgs() << "MI: "; MI.dump(););

  llvm_unreachable("None of the rules defined for MI's opcode matched MI");

}


void SetOfRulesForOpcode::addRule(RegBankLegalizeRule Rule) {

  Rules.push_back(Rule);

}


void SetOfRulesForOpcode::addFastRuleDivergent(UniformityLLTOpPredicateID Ty,

                                               RegBankLLTMapping RuleApplyIDs) {

  int Slot = getFastPredicateSlot(Ty);

  assert(Slot != -1 && "Ty unsupported in this FastRulesTypes");

  Div[Slot] = RuleApplyIDs;

}


void SetOfRulesForOpcode::addFastRuleUniform(UniformityLLTOpPredicateID Ty,

                                             RegBankLLTMapping RuleApplyIDs) {

  int Slot = getFastPredicateSlot(Ty);

  assert(Slot != -1 && "Ty unsupported in this FastRulesTypes");

  Uni[Slot] = RuleApplyIDs;

}


int SetOfRulesForOpcode::getFastPredicateSlot(

    UniformityLLTOpPredicateID Ty) const {

  switch (FastTypes) {

  case Standard: {

    switch (Ty) {

    case S32:

      return 0;

    case S16:

      return 1;

    case S64:

      return 2;

    case V2S16:

      return 3;

    default:

      return -1;

    }

  }

  case StandardB: {

    switch (Ty) {

    case B32:

      return 0;

    case B64:

      return 1;

    case B96:

      return 2;

    case B128:

      return 3;

    default:

      return -1;

    }

  }

  case Vector: {

    switch (Ty) {

    case S32:

      return 0;

    case V2S32:

      return 1;

    case V3S32:

      return 2;

    case V4S32:

      return 3;

    default:

      return -1;

    }

  }

  default:

    return -1;

  }

}


RegBankLegalizeRules::RuleSetInitializer

RegBankLegalizeRules::addRulesForGOpcs(std::initializer_list<unsigned> OpcList,

                                       FastRulesTypes FastTypes) {

  return RuleSetInitializer(OpcList, GRulesAlias, GRules, FastTypes);

}


RegBankLegalizeRules::RuleSetInitializer

RegBankLegalizeRules::addRulesForIOpcs(std::initializer_list<unsigned> OpcList,

                                       FastRulesTypes FastTypes) {

  return RuleSetInitializer(OpcList, IRulesAlias, IRules, FastTypes);

}


const SetOfRulesForOpcode &

RegBankLegalizeRules::getRulesForOpc(MachineInstr &MI) const {

  unsigned Opc = MI.getOpcode();

  if (Opc == AMDGPU::G_INTRINSIC || Opc == AMDGPU::G_INTRINSIC_CONVERGENT ||

      Opc == AMDGPU::G_INTRINSIC_W_SIDE_EFFECTS ||

      Opc == AMDGPU::G_INTRINSIC_CONVERGENT_W_SIDE_EFFECTS) {

    unsigned IntrID = cast<GIntrinsic>(MI).getIntrinsicID();

    auto IRAIt = IRulesAlias.find(IntrID);

    if (IRAIt == IRulesAlias.end()) {

      LLVM_DEBUG(dbgs() << "MI: "; MI.dump(););

      llvm_unreachable("No rules defined for intrinsic opcode");

    }

    return IRules.at(IRAIt->second);

  }


  auto GRAIt = GRulesAlias.find(Opc);

  if (GRAIt == GRulesAlias.end()) {

    LLVM_DEBUG(dbgs() << "MI: "; MI.dump(););

    llvm_unreachable("No rules defined for generic opcode");

  }

  return GRules.at(GRAIt->second);

}


// Syntactic sugar wrapper for predicate lambda that enables '&&', '||' and '!'.

class Predicate {

private:

  struct Elt {

    // Save formula composed of Pred, '&&', '||' and '!' as a jump table.

    // Sink ! to Pred. For example !((A && !B) || C) -> (!A || B) && !C

    // Sequences of && and || will be represented by jumps, for example:

    // (A && B && ... X) or (A && B && ... X) || Y

    //   A == true jump to B

    //   A == false jump to end or Y, result is A(false) or Y

    // (A || B || ... X) or (A || B || ... X) && Y

    //   A == true jump to end or Y, result is A(true) or Y

    //   A == false jump to B

    // Notice that when negating expression, we simply flip Neg on each Pred

    // and swap TJumpOffset and FJumpOffset (&& becomes ||, || becomes &&).

    std::function<bool(const MachineInstr &)> Pred;

    bool Neg; // Neg of Pred is calculated before jump

    unsigned TJumpOffset;

    unsigned FJumpOffset;

  };


  SmallVector<Elt, 8> Expression;


  Predicate(SmallVectorImpl<Elt> &&Expr) { Expression.swap(Expr); };


public:

  Predicate(std::function<bool(const MachineInstr &)> Pred) {

    Expression.push_back({Pred, false, 1, 1});

  };


  bool operator()(const MachineInstr &MI) const {

    unsigned Idx = 0;

    unsigned ResultIdx = Expression.size();

    bool Result;

    do {

      Result = Expression[Idx].Pred(MI);

      Result = Expression[Idx].Neg ? !Result : Result;

      if (Result) {

        Idx += Expression[Idx].TJumpOffset;

      } else {

        Idx += Expression[Idx].FJumpOffset;

      }

    } while ((Idx != ResultIdx));


    return Result;

  };


  Predicate operator!() const {

    SmallVector<Elt, 8> NegExpression;

    for (const Elt &ExprElt : Expression) {

      NegExpression.push_back({ExprElt.Pred, !ExprElt.Neg, ExprElt.FJumpOffset,

                               ExprElt.TJumpOffset});

    }

    return Predicate(std::move(NegExpression));

  };


  Predicate operator&&(const Predicate &RHS) const {

    SmallVector<Elt, 8> AndExpression = Expression;


    unsigned RHSSize = RHS.Expression.size();

    unsigned ResultIdx = Expression.size();

    for (unsigned i = 0; i < ResultIdx; ++i) {

      // LHS results in false, whole expression results in false.

      if (i + AndExpression[i].FJumpOffset == ResultIdx)

        AndExpression[i].FJumpOffset += RHSSize;

    }


    AndExpression.append(RHS.Expression);


    return Predicate(std::move(AndExpression));

  }


  Predicate operator||(const Predicate &RHS) const {

    SmallVector<Elt, 8> OrExpression = Expression;


    unsigned RHSSize = RHS.Expression.size();

    unsigned ResultIdx = Expression.size();

    for (unsigned i = 0; i < ResultIdx; ++i) {

      // LHS results in true, whole expression results in true.

      if (i + OrExpression[i].TJumpOffset == ResultIdx)

        OrExpression[i].TJumpOffset += RHSSize;

    }


    OrExpression.append(RHS.Expression);


    return Predicate(std::move(OrExpression));

  }

};


// Initialize rules

RegBankLegalizeRules::RegBankLegalizeRules(const GCNSubtarget &_ST,

                                           MachineRegisterInfo &_MRI)

    : ST(&_ST), MRI(&_MRI) {


  addRulesForGOpcs({G_ADD, G_SUB}, Standard)

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}});


  addRulesForGOpcs({G_MUL}, Standard).Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}});


  addRulesForGOpcs({G_XOR, G_OR, G_AND}, StandardB)

      .Any({{UniS1}, {{Sgpr32Trunc}, {Sgpr32AExt, Sgpr32AExt}}})

      .Any({{DivS1}, {{Vcc}, {Vcc, Vcc}}})

      .Any({{UniS16}, {{Sgpr16}, {Sgpr16, Sgpr16}}})

      .Any({{DivS16}, {{Vgpr16}, {Vgpr16, Vgpr16}}})

      .Uni(B32, {{SgprB32}, {SgprB32, SgprB32}})

      .Div(B32, {{VgprB32}, {VgprB32, VgprB32}})

      .Uni(B64, {{SgprB64}, {SgprB64, SgprB64}})

      .Div(B64, {{VgprB64}, {VgprB64, VgprB64}, SplitTo32});


  addRulesForGOpcs({G_SHL}, Standard)

      .Uni(S16, {{Sgpr32Trunc}, {Sgpr32AExt, Sgpr32ZExt}})

      .Div(S16, {{Vgpr16}, {Vgpr16, Vgpr16}})

      .Uni(V2S16, {{SgprV2S16}, {SgprV2S16, SgprV2S16}, UnpackBitShift})

      .Div(V2S16, {{VgprV2S16}, {VgprV2S16, VgprV2S16}})

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}})

      .Uni(S64, {{Sgpr64}, {Sgpr64, Sgpr32}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}})

      .Div(S64, {{Vgpr64}, {Vgpr64, Vgpr32}});


  addRulesForGOpcs({G_LSHR}, Standard)

      .Uni(S16, {{Sgpr32Trunc}, {Sgpr32ZExt, Sgpr32ZExt}})

      .Div(S16, {{Vgpr16}, {Vgpr16, Vgpr16}})

      .Uni(V2S16, {{SgprV2S16}, {SgprV2S16, SgprV2S16}, UnpackBitShift})

      .Div(V2S16, {{VgprV2S16}, {VgprV2S16, VgprV2S16}})

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}})

      .Uni(S64, {{Sgpr64}, {Sgpr64, Sgpr32}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}})

      .Div(S64, {{Vgpr64}, {Vgpr64, Vgpr32}});


  addRulesForGOpcs({G_ASHR}, Standard)

      .Uni(S16, {{Sgpr32Trunc}, {Sgpr32SExt, Sgpr32ZExt}})

      .Div(S16, {{Vgpr16}, {Vgpr16, Vgpr16}})

      .Uni(V2S16, {{SgprV2S16}, {SgprV2S16, SgprV2S16}, UnpackBitShift})

      .Div(V2S16, {{VgprV2S16}, {VgprV2S16, VgprV2S16}})

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}})

      .Uni(S64, {{Sgpr64}, {Sgpr64, Sgpr32}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}})

      .Div(S64, {{Vgpr64}, {Vgpr64, Vgpr32}});


  addRulesForGOpcs({G_FRAME_INDEX}).Any({{UniP5, _}, {{SgprP5}, {None}}});


  addRulesForGOpcs({G_UBFX, G_SBFX}, Standard)

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32, Sgpr32}, S_BFE})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32, Vgpr32}})

      .Uni(S64, {{Sgpr64}, {Sgpr64, Sgpr32, Sgpr32}, S_BFE})

      .Div(S64, {{Vgpr64}, {Vgpr64, Vgpr32, Vgpr32}, V_BFE});


  // Note: we only write S1 rules for G_IMPLICIT_DEF, G_CONSTANT, G_FCONSTANT

  // and G_FREEZE here, rest is trivially regbankselected earlier

  addRulesForGOpcs({G_IMPLICIT_DEF}).Any({{UniS1}, {{Sgpr32Trunc}, {}}});

  addRulesForGOpcs({G_CONSTANT})

      .Any({{UniS1, _}, {{Sgpr32Trunc}, {None}, UniCstExt}});

  addRulesForGOpcs({G_FREEZE}).Any({{DivS1}, {{Vcc}, {Vcc}}});


  addRulesForGOpcs({G_ICMP})

      .Any({{UniS1, _, S32}, {{Sgpr32Trunc}, {None, Sgpr32, Sgpr32}}})

      .Any({{DivS1, _, S32}, {{Vcc}, {None, Vgpr32, Vgpr32}}})

      .Any({{DivS1, _, S64}, {{Vcc}, {None, Vgpr64, Vgpr64}}});


  addRulesForGOpcs({G_FCMP})

      .Any({{UniS1, _, S32}, {{UniInVcc}, {None, Vgpr32, Vgpr32}}})

      .Any({{DivS1, _, S32}, {{Vcc}, {None, Vgpr32, Vgpr32}}});


  addRulesForGOpcs({G_BRCOND})

      .Any({{UniS1}, {{}, {Sgpr32AExtBoolInReg}}})

      .Any({{DivS1}, {{}, {Vcc}}});


  addRulesForGOpcs({G_BR}).Any({{_}, {{}, {None}}});


  addRulesForGOpcs({G_SELECT}, StandardB)

      .Any({{DivS16}, {{Vgpr16}, {Vcc, Vgpr16, Vgpr16}}})

      .Any({{UniS16}, {{Sgpr16}, {Sgpr32AExtBoolInReg, Sgpr16, Sgpr16}}})

      .Div(B32, {{VgprB32}, {Vcc, VgprB32, VgprB32}})

      .Uni(B32, {{SgprB32}, {Sgpr32AExtBoolInReg, SgprB32, SgprB32}})

      .Div(B64, {{VgprB64}, {Vcc, VgprB64, VgprB64}, SplitTo32Select})

      .Uni(B64, {{SgprB64}, {Sgpr32AExtBoolInReg, SgprB64, SgprB64}});


  addRulesForGOpcs({G_ANYEXT})

      .Any({{UniS16, S1}, {{None}, {None}}}) // should be combined away

      .Any({{UniS32, S1}, {{None}, {None}}}) // should be combined away

      .Any({{UniS64, S1}, {{None}, {None}}}) // should be combined away

      .Any({{DivS16, S1}, {{Vgpr16}, {Vcc}, VccExtToSel}})

      .Any({{DivS32, S1}, {{Vgpr32}, {Vcc}, VccExtToSel}})

      .Any({{DivS64, S1}, {{Vgpr64}, {Vcc}, VccExtToSel}})

      .Any({{UniS64, S32}, {{Sgpr64}, {Sgpr32}, Ext32To64}})

      .Any({{DivS64, S32}, {{Vgpr64}, {Vgpr32}, Ext32To64}})

      .Any({{UniS32, S16}, {{Sgpr32}, {Sgpr16}}})

      .Any({{DivS32, S16}, {{Vgpr32}, {Vgpr16}}});


  // In global-isel G_TRUNC in-reg is treated as no-op, inst selected into COPY.

  // It is up to user to deal with truncated bits.

  addRulesForGOpcs({G_TRUNC})

      .Any({{UniS1, UniS16}, {{None}, {None}}}) // should be combined away

      .Any({{UniS1, UniS32}, {{None}, {None}}}) // should be combined away

      .Any({{UniS1, UniS64}, {{None}, {None}}}) // should be combined away

      .Any({{UniS16, S32}, {{Sgpr16}, {Sgpr32}}})

      .Any({{DivS16, S32}, {{Vgpr16}, {Vgpr32}}})

      .Any({{UniS32, S64}, {{Sgpr32}, {Sgpr64}}})

      .Any({{DivS32, S64}, {{Vgpr32}, {Vgpr64}}})

      .Any({{UniV2S16, V2S32}, {{SgprV2S16}, {SgprV2S32}}})

      .Any({{DivV2S16, V2S32}, {{VgprV2S16}, {VgprV2S32}}})

      // This is non-trivial. VgprToVccCopy is done using compare instruction.

      .Any({{DivS1, DivS16}, {{Vcc}, {Vgpr16}, VgprToVccCopy}})

      .Any({{DivS1, DivS32}, {{Vcc}, {Vgpr32}, VgprToVccCopy}})

      .Any({{DivS1, DivS64}, {{Vcc}, {Vgpr64}, VgprToVccCopy}});


  addRulesForGOpcs({G_ZEXT})

      .Any({{UniS16, S1}, {{Sgpr32Trunc}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{UniS32, S1}, {{Sgpr32}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{UniS64, S1}, {{Sgpr64}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{DivS16, S1}, {{Vgpr16}, {Vcc}, VccExtToSel}})

      .Any({{DivS32, S1}, {{Vgpr32}, {Vcc}, VccExtToSel}})

      .Any({{DivS64, S1}, {{Vgpr64}, {Vcc}, VccExtToSel}})

      .Any({{UniS64, S32}, {{Sgpr64}, {Sgpr32}, Ext32To64}})

      .Any({{DivS64, S32}, {{Vgpr64}, {Vgpr32}, Ext32To64}})

      // not extending S16 to S32 is questionable.

      .Any({{UniS64, S16}, {{Sgpr64}, {Sgpr32ZExt}, Ext32To64}})

      .Any({{DivS64, S16}, {{Vgpr64}, {Vgpr32ZExt}, Ext32To64}})

      .Any({{UniS32, S16}, {{Sgpr32}, {Sgpr16}}})

      .Any({{DivS32, S16}, {{Vgpr32}, {Vgpr16}}});


  addRulesForGOpcs({G_SEXT})

      .Any({{UniS16, S1}, {{Sgpr32Trunc}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{UniS32, S1}, {{Sgpr32}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{UniS64, S1}, {{Sgpr64}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{DivS16, S1}, {{Vgpr16}, {Vcc}, VccExtToSel}})

      .Any({{DivS32, S1}, {{Vgpr32}, {Vcc}, VccExtToSel}})

      .Any({{DivS64, S1}, {{Vgpr64}, {Vcc}, VccExtToSel}})

      .Any({{UniS64, S32}, {{Sgpr64}, {Sgpr32}, Ext32To64}})

      .Any({{DivS64, S32}, {{Vgpr64}, {Vgpr32}, Ext32To64}})

      // not extending S16 to S32 is questionable.

      .Any({{UniS64, S16}, {{Sgpr64}, {Sgpr32SExt}, Ext32To64}})

      .Any({{DivS64, S16}, {{Vgpr64}, {Vgpr32SExt}, Ext32To64}})

      .Any({{UniS32, S16}, {{Sgpr32}, {Sgpr16}}})

      .Any({{DivS32, S16}, {{Vgpr32}, {Vgpr16}}});


  addRulesForGOpcs({G_SEXT_INREG})

      .Any({{UniS32, S32}, {{Sgpr32}, {Sgpr32}}})

      .Any({{DivS32, S32}, {{Vgpr32}, {Vgpr32}}})

      .Any({{UniS64, S64}, {{Sgpr64}, {Sgpr64}}})

      .Any({{DivS64, S64}, {{Vgpr64}, {Vgpr64}, SplitTo32SExtInReg}});


  bool hasUnalignedLoads = ST->getGeneration() >= AMDGPUSubtarget::GFX12;

  bool hasSMRDSmall = ST->hasScalarSubwordLoads();


  Predicate isAlign16([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->getAlign() >= Align(16);

  });


  Predicate isAlign4([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->getAlign() >= Align(4);

  });


  Predicate isAtomicMMO([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->isAtomic();

  });


  Predicate isUniMMO([](const MachineInstr &MI) -> bool {

    return AMDGPU::isUniformMMO(*MI.memoperands_begin());

  });


  Predicate isConst([](const MachineInstr &MI) -> bool {

    // Address space in MMO be different then address space on pointer.

    const MachineMemOperand *MMO = *MI.memoperands_begin();

    const unsigned AS = MMO->getAddrSpace();

    return AS == AMDGPUAS::CONSTANT_ADDRESS ||

           AS == AMDGPUAS::CONSTANT_ADDRESS_32BIT;

  });


  Predicate isVolatileMMO([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->isVolatile();

  });


  Predicate isInvMMO([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->isInvariant();

  });


  Predicate isNoClobberMMO([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->getFlags() & MONoClobber;

  });


  Predicate isNaturalAlignedSmall([](const MachineInstr &MI) -> bool {

    const MachineMemOperand *MMO = *MI.memoperands_begin();

    const unsigned MemSize = 8 * MMO->getSize().getValue();

    return (MemSize == 16 && MMO->getAlign() >= Align(2)) ||

           (MemSize == 8 && MMO->getAlign() >= Align(1));

  });


  auto isUL = !isAtomicMMO && isUniMMO && (isConst || !isVolatileMMO) &&

              (isConst || isInvMMO || isNoClobberMMO);


  // clang-format off

  addRulesForGOpcs({G_LOAD})

      .Any({{DivB32, DivP0}, {{VgprB32}, {VgprP0}}})

      .Any({{DivB32, UniP0}, {{VgprB32}, {VgprP0}}})


      .Any({{DivB32, DivP1}, {{VgprB32}, {VgprP1}}})

      .Any({{{UniB256, UniP1}, isAlign4 && isUL}, {{SgprB256}, {SgprP1}}})

      .Any({{{UniB512, UniP1}, isAlign4 && isUL}, {{SgprB512}, {SgprP1}}})

      .Any({{{UniB32, UniP1}, !isAlign4 || !isUL}, {{UniInVgprB32}, {SgprP1}}})

      .Any({{{UniB64, UniP1}, !isAlign4 || !isUL}, {{UniInVgprB64}, {SgprP1}}})

      .Any({{{UniB96, UniP1}, !isAlign4 || !isUL}, {{UniInVgprB96}, {SgprP1}}})

      .Any({{{UniB128, UniP1}, !isAlign4 || !isUL}, {{UniInVgprB128}, {SgprP1}}})

      .Any({{{UniB256, UniP1}, !isAlign4 || !isUL}, {{UniInVgprB256}, {VgprP1}, SplitLoad}})

      .Any({{{UniB512, UniP1}, !isAlign4 || !isUL}, {{UniInVgprB512}, {VgprP1}, SplitLoad}})


      .Any({{DivB32, UniP3}, {{VgprB32}, {VgprP3}}})

      .Any({{{UniB32, UniP3}, isAlign4 && isUL}, {{SgprB32}, {SgprP3}}})

      .Any({{{UniB32, UniP3}, !isAlign4 || !isUL}, {{UniInVgprB32}, {VgprP3}}})


      .Any({{{DivB256, DivP4}}, {{VgprB256}, {VgprP4}, SplitLoad}})

      .Any({{{UniB32, UniP4}, isNaturalAlignedSmall && isUL}, {{SgprB32}, {SgprP4}}}, hasSMRDSmall) // i8 and i16 load

      .Any({{{UniB32, UniP4}, isAlign4 && isUL}, {{SgprB32}, {SgprP4}}})

      .Any({{{UniB96, UniP4}, isAlign16 && isUL}, {{SgprB96}, {SgprP4}, WidenLoad}}, !hasUnalignedLoads)

      .Any({{{UniB96, UniP4}, isAlign4 && !isAlign16 && isUL}, {{SgprB96}, {SgprP4}, SplitLoad}}, !hasUnalignedLoads)

      .Any({{{UniB96, UniP4}, isAlign4 && isUL}, {{SgprB96}, {SgprP4}}}, hasUnalignedLoads)

      .Any({{{UniB128, UniP4}, isAlign4 && isUL}, {{SgprB128}, {SgprP4}}})

      .Any({{{UniB256, UniP4}, isAlign4 && isUL}, {{SgprB256}, {SgprP4}}})

      .Any({{{UniB512, UniP4}, isAlign4 && isUL}, {{SgprB512}, {SgprP4}}})

      .Any({{{UniB32, UniP4}, !isNaturalAlignedSmall || !isUL}, {{UniInVgprB32}, {VgprP4}}}, hasSMRDSmall) // i8 and i16 load

      .Any({{{UniB32, UniP4}, !isAlign4 || !isUL}, {{UniInVgprB32}, {VgprP4}}})

      .Any({{{UniB256, UniP4}, !isAlign4 || !isUL}, {{UniInVgprB256}, {VgprP4}, SplitLoad}})

      .Any({{{UniB512, UniP4}, !isAlign4 || !isUL}, {{UniInVgprB512}, {VgprP4}, SplitLoad}})


      .Any({{DivB32, P5}, {{VgprB32}, {VgprP5}}});


  addRulesForGOpcs({G_ZEXTLOAD}) // i8 and i16 zero-extending loads

      .Any({{{UniB32, UniP3}, !isAlign4 || !isUL}, {{UniInVgprB32}, {VgprP3}}})

      .Any({{{UniB32, UniP4}, !isAlign4 || !isUL}, {{UniInVgprB32}, {VgprP4}}});

  // clang-format on


  addRulesForGOpcs({G_AMDGPU_BUFFER_LOAD}, StandardB)

      .Div(B32, {{VgprB32}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Uni(B32, {{UniInVgprB32}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Div(B64, {{VgprB64}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Uni(B64, {{UniInVgprB64}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Div(B96, {{VgprB96}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Uni(B96, {{UniInVgprB96}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Div(B128, {{VgprB128}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Uni(B128, {{UniInVgprB128}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}});


  addRulesForGOpcs({G_STORE})

      .Any({{S32, P0}, {{}, {Vgpr32, VgprP0}}})

      .Any({{S32, P1}, {{}, {Vgpr32, VgprP1}}})

      .Any({{S64, P1}, {{}, {Vgpr64, VgprP1}}})

      .Any({{V4S32, P1}, {{}, {VgprV4S32, VgprP1}}});


  addRulesForGOpcs({G_AMDGPU_BUFFER_STORE})

      .Any({{S32}, {{}, {Vgpr32, SgprV4S32, Vgpr32, Vgpr32, Sgpr32}}});


  addRulesForGOpcs({G_PTR_ADD})

      .Any({{UniPtr32}, {{SgprPtr32}, {SgprPtr32, Sgpr32}}})

      .Any({{DivPtr32}, {{VgprPtr32}, {VgprPtr32, Vgpr32}}})

      .Any({{UniPtr64}, {{SgprPtr64}, {SgprPtr64, Sgpr64}}})

      .Any({{DivPtr64}, {{VgprPtr64}, {VgprPtr64, Vgpr64}}});


  addRulesForGOpcs({G_INTTOPTR})

      .Any({{UniPtr32}, {{SgprPtr32}, {Sgpr32}}})

      .Any({{DivPtr32}, {{VgprPtr32}, {Vgpr32}}})

      .Any({{UniPtr64}, {{SgprPtr64}, {Sgpr64}}})

      .Any({{DivPtr64}, {{VgprPtr64}, {Vgpr64}}})

      .Any({{UniPtr128}, {{SgprPtr128}, {Sgpr128}}})

      .Any({{DivPtr128}, {{VgprPtr128}, {Vgpr128}}});


  addRulesForGOpcs({G_PTRTOINT})

      .Any({{UniS32}, {{Sgpr32}, {SgprPtr32}}})

      .Any({{DivS32}, {{Vgpr32}, {VgprPtr32}}})

      .Any({{UniS64}, {{Sgpr64}, {SgprPtr64}}})

      .Any({{DivS64}, {{Vgpr64}, {VgprPtr64}}})

      .Any({{UniS128}, {{Sgpr128}, {SgprPtr128}}})

      .Any({{DivS128}, {{Vgpr128}, {VgprPtr128}}});


  addRulesForGOpcs({G_ABS}, Standard).Uni(S16, {{Sgpr32Trunc}, {Sgpr32SExt}});


  bool hasSALUFloat = ST->hasSALUFloatInsts();


  addRulesForGOpcs({G_FADD}, Standard)

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}}, hasSALUFloat)

      .Uni(S32, {{UniInVgprS32}, {Vgpr32, Vgpr32}}, !hasSALUFloat)

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}});


  addRulesForGOpcs({G_FPTOUI})

      .Any({{UniS32, S32}, {{Sgpr32}, {Sgpr32}}}, hasSALUFloat)

      .Any({{UniS32, S32}, {{UniInVgprS32}, {Vgpr32}}}, !hasSALUFloat);


  addRulesForGOpcs({G_UITOFP})

      .Any({{DivS32, S32}, {{Vgpr32}, {Vgpr32}}})

      .Any({{UniS32, S32}, {{Sgpr32}, {Sgpr32}}}, hasSALUFloat)

      .Any({{UniS32, S32}, {{UniInVgprS32}, {Vgpr32}}}, !hasSALUFloat);


  using namespace Intrinsic;


  addRulesForIOpcs({amdgcn_s_getpc}).Any({{UniS64, _}, {{Sgpr64}, {None}}});


  // This is "intrinsic lane mask" it was set to i32/i64 in llvm-ir.

  addRulesForIOpcs({amdgcn_end_cf}).Any({{_, S32}, {{}, {None, Sgpr32}}});


  addRulesForIOpcs({amdgcn_if_break}, Standard)

      .Uni(S32, {{Sgpr32}, {IntrId, Vcc, Sgpr32}});


  addRulesForIOpcs({amdgcn_mbcnt_lo, amdgcn_mbcnt_hi}, Standard)

      .Div(S32, {{}, {Vgpr32, None, Vgpr32, Vgpr32}});


  addRulesForIOpcs({amdgcn_readfirstlane})

      .Any({{UniS32, _, DivS32}, {{}, {Sgpr32, None, Vgpr32}}})

      // this should not exist in the first place, it is from call lowering

      // readfirstlaning just in case register is not in sgpr.

      .Any({{UniS32, _, UniS32}, {{}, {Sgpr32, None, Vgpr32}}});


} // end initialize rules

MRI
unsigned const MachineRegisterInfo * MRI
Definition: AArch64AdvSIMDScalarPass.cpp:103

assert
assert(UImm &&(UImm !=~static_cast< T >(0)) &&"Invalid immediate!")

AMDGPUAddrSpace.h
AMDGPU address space definition.

AMDGPUInstrInfo.h
Contains the definition of a TargetInstrInfo class that is common to all AMD GPUs.

LLTToBId
UniformityLLTOpPredicateID LLTToBId(LLT Ty)
Definition: AMDGPURegBankLegalizeRules.cpp:228

matchUniformityAndLLT
bool matchUniformityAndLLT(Register Reg, UniformityLLTOpPredicateID UniID, const MachineUniformityInfo &MUI, const MachineRegisterInfo &MRI)
Definition: AMDGPURegBankLegalizeRules.cpp:45

LLTToId
UniformityLLTOpPredicateID LLTToId(LLT Ty)
Definition: AMDGPURegBankLegalizeRules.cpp:210

AMDGPURegBankLegalizeRules.h

Idx
Returns the sub type a function will return at a given Idx Should correspond to the result type of an ExtractValue instruction executed with just that one unsigned Idx
Definition: DeadArgumentElimination.cpp:347

GCNSubtarget.h
AMD GCN specific subclass of TargetSubtarget.

GenericMachineInstrs.h
Declares convenience wrapper classes for interpreting MachineInstr instances as specific generic oper...

MI
IRTranslator LLVM IR MI
Definition: IRTranslator.cpp:110

MachineUniformityAnalysis.h
Machine IR instance of the generic uniformity analysis.

Opc
auto Opc
Definition: RISCVRedundantCopyElimination.cpp:75

LLVM_DEBUG
#define LLVM_DEBUG(...)
Definition: Debug.h:119

RHS
Value * RHS
Definition: X86PartialReduction.cpp:74

Predicate
Definition: AMDGPURegBankLegalizeRules.cpp:376

Predicate::operator()
bool operator()(const MachineInstr &MI) const
Definition: AMDGPURegBankLegalizeRules.cpp:405

Predicate::operator||
Predicate operator||(const Predicate &RHS) const
Definition: AMDGPURegBankLegalizeRules.cpp:447

Predicate::operator&&
Predicate operator&&(const Predicate &RHS) const
Definition: AMDGPURegBankLegalizeRules.cpp:431

Predicate::Predicate
Predicate(std::function< bool(const MachineInstr &)> Pred)
Definition: AMDGPURegBankLegalizeRules.cpp:401

Predicate::operator!
Predicate operator!() const
Definition: AMDGPURegBankLegalizeRules.cpp:422

bool

llvm::AMDGPUSubtarget::GFX12
@ GFX12
Definition: AMDGPUSubtarget.h:44

llvm::AMDGPU::RegBankLegalizeRules::RegBankLegalizeRules
RegBankLegalizeRules(const GCNSubtarget &ST, MachineRegisterInfo &MRI)
Definition: AMDGPURegBankLegalizeRules.cpp:465

llvm::AMDGPU::RegBankLegalizeRules::getRulesForOpc
const SetOfRulesForOpcode & getRulesForOpc(MachineInstr &MI) const
Definition: AMDGPURegBankLegalizeRules.cpp:353

llvm::AMDGPU::SetOfRulesForOpcode
Definition: AMDGPURegBankLegalizeRules.h:259

llvm::AMDGPU::SetOfRulesForOpcode::SetOfRulesForOpcode
SetOfRulesForOpcode()
Definition: AMDGPURegBankLegalizeRules.cpp:205

llvm::AMDGPU::SetOfRulesForOpcode::addRule
void addRule(RegBankLegalizeRule Rule)
Definition: AMDGPURegBankLegalizeRules.cpp:272

llvm::AMDGPU::SetOfRulesForOpcode::findMappingForMI
const RegBankLLTMapping & findMappingForMI(const MachineInstr &MI, const MachineRegisterInfo &MRI, const MachineUniformityInfo &MUI) const
Definition: AMDGPURegBankLegalizeRules.cpp:243

llvm::AMDGPU::SetOfRulesForOpcode::addFastRuleDivergent
void addFastRuleDivergent(UniformityLLTOpPredicateID Ty, RegBankLLTMapping RuleApplyIDs)
Definition: AMDGPURegBankLegalizeRules.cpp:276

llvm::AMDGPU::SetOfRulesForOpcode::addFastRuleUniform
void addFastRuleUniform(UniformityLLTOpPredicateID Ty, RegBankLLTMapping RuleApplyIDs)
Definition: AMDGPURegBankLegalizeRules.cpp:283

llvm::Any
Definition: Any.h:28

llvm::DenseMapBase::find
iterator find(const_arg_type_t< KeyT > Val)
Definition: DenseMap.h:177

llvm::DenseMapBase::end
iterator end()
Definition: DenseMap.h:87

llvm::Expression
Class representing an expression and its matching format.
Definition: FileCheckImpl.h:195

llvm::GCNSubtarget
Definition: GCNSubtarget.h:34

llvm::GCNSubtarget::hasScalarSubwordLoads
bool hasScalarSubwordLoads() const
Definition: GCNSubtarget.h:500

llvm::GCNSubtarget::getGeneration
Generation getGeneration() const
Definition: GCNSubtarget.h:356

llvm::GCNSubtarget::hasSALUFloatInsts
bool hasSALUFloatInsts() const
Definition: GCNSubtarget.h:1395

llvm::GenericUniformityInfo< MachineSSAContext >

llvm::GenericUniformityInfo::isDivergent
bool isDivergent(ConstValueRefT V) const
Whether V is divergent at its definition.
Definition: GenericUniformityImpl.h:1273

llvm::GenericUniformityInfo::isUniform
bool isUniform(ConstValueRefT V) const
Whether V is uniform/non-divergent.
Definition: GenericUniformityInfo.h:67

llvm::LLT
Definition: LowLevelType.h:40

llvm::LLT::scalar
static constexpr LLT scalar(unsigned SizeInBits)
Get a low-level scalar or aggregate "bag of bits".
Definition: LowLevelType.h:43

llvm::LLT::pointer
static constexpr LLT pointer(unsigned AddressSpace, unsigned SizeInBits)
Get a low-level pointer in the given address space.
Definition: LowLevelType.h:58

llvm::LLT::getSizeInBits
constexpr TypeSize getSizeInBits() const
Returns the total size of the type. Must only be called on sized types.
Definition: LowLevelType.h:191

llvm::LLT::isPointer
constexpr bool isPointer() const
Definition: LowLevelType.h:150

llvm::LLT::fixed_vector
static constexpr LLT fixed_vector(unsigned NumElements, unsigned ScalarSizeInBits)
Get a low-level fixed-width vector of some number of elements and element width.
Definition: LowLevelType.h:101

llvm::MachineInstr
Representation of each machine instruction.
Definition: MachineInstr.h:72

llvm::MachineMemOperand
A description of a memory reference used in the backend.
Definition: MachineMemOperand.h:130

llvm::MachineMemOperand::getSize
LocationSize getSize() const
Return the size in bytes of the memory reference.
Definition: MachineMemOperand.h:243

llvm::MachineMemOperand::getAddrSpace
unsigned getAddrSpace() const
Definition: MachineMemOperand.h:236

llvm::MachineMemOperand::getAlign
LLVM_ABI Align getAlign() const
Return the minimum known alignment in bytes of the actual memory reference.
Definition: MachineOperand.cpp:1138

llvm::MachineRegisterInfo
MachineRegisterInfo - Keep track of information for virtual and physical registers,...
Definition: MachineRegisterInfo.h:53

llvm::Pass::dump
void dump() const
Definition: Pass.cpp:146

llvm::Register
Wrapper class representing virtual and physical registers.
Definition: Register.h:19

llvm::SmallVectorBase::size
size_t size() const
Definition: SmallVector.h:79

llvm::SmallVectorImpl
This class consists of common code factored out of the SmallVector class to reduce code duplication b...
Definition: SmallVector.h:574

llvm::SmallVectorImpl::append
void append(ItTy in_start, ItTy in_end)
Add the specified range to the end of the SmallVector.
Definition: SmallVector.h:684

llvm::SmallVectorTemplateBase::push_back
void push_back(const T &Elt)
Definition: SmallVector.h:414

llvm::SmallVector
This is a 'vector' (really, a variable-sized array), optimized for the case when the array is small.
Definition: SmallVector.h:1197

llvm_unreachable
#define llvm_unreachable(msg)
Marks that the current location is not supposed to be reachable.
Definition: ErrorHandling.h:164

llvm::AMDGPUAS::CONSTANT_ADDRESS_32BIT
@ CONSTANT_ADDRESS_32BIT
Address space for 32-bit constant memory.
Definition: AMDGPUAddrSpace.h:38

llvm::AMDGPUAS::CONSTANT_ADDRESS
@ CONSTANT_ADDRESS
Address space for constant memory (VTX2).
Definition: AMDGPUAddrSpace.h:35

llvm::AMDGPU::Sgpr32Trunc
@ Sgpr32Trunc
Definition: AMDGPURegBankLegalizeRules.h:189

llvm::AMDGPU::Vgpr64
@ Vgpr64
Definition: AMDGPURegBankLegalizeRules.h:157

llvm::AMDGPU::Sgpr16
@ Sgpr16
Definition: AMDGPURegBankLegalizeRules.h:133

llvm::AMDGPU::VgprV4S32
@ VgprV4S32
Definition: AMDGPURegBankLegalizeRules.h:175

llvm::AMDGPU::UniInVgprB128
@ UniInVgprB128
Definition: AMDGPURegBankLegalizeRules.h:185

llvm::AMDGPU::Vgpr32
@ Vgpr32
Definition: AMDGPURegBankLegalizeRules.h:156

llvm::AMDGPU::VgprV2S32
@ VgprV2S32
Definition: AMDGPURegBankLegalizeRules.h:168

llvm::AMDGPU::IntrId
@ IntrId
Definition: AMDGPURegBankLegalizeRules.h:128

llvm::AMDGPU::SgprV2S32
@ SgprV2S32
Definition: AMDGPURegBankLegalizeRules.h:146

llvm::AMDGPU::VgprV2S16
@ VgprV2S16
Definition: AMDGPURegBankLegalizeRules.h:167

llvm::AMDGPU::VgprPtr64
@ VgprPtr64
Definition: AMDGPURegBankLegalizeRules.h:165

llvm::AMDGPU::VgprB64
@ VgprB64
Definition: AMDGPURegBankLegalizeRules.h:170

llvm::AMDGPU::SgprPtr32
@ SgprPtr32
Definition: AMDGPURegBankLegalizeRules.h:141

llvm::AMDGPU::UniInVgprB32
@ UniInVgprB32
Definition: AMDGPURegBankLegalizeRules.h:182

llvm::AMDGPU::VgprP1
@ VgprP1
Definition: AMDGPURegBankLegalizeRules.h:160

llvm::AMDGPU::SgprPtr128
@ SgprPtr128
Definition: AMDGPURegBankLegalizeRules.h:143

llvm::AMDGPU::UniInVgprB96
@ UniInVgprB96
Definition: AMDGPURegBankLegalizeRules.h:184

llvm::AMDGPU::SgprB64
@ SgprB64
Definition: AMDGPURegBankLegalizeRules.h:148

llvm::AMDGPU::Vgpr32ZExt
@ Vgpr32ZExt
Definition: AMDGPURegBankLegalizeRules.h:201

llvm::AMDGPU::SgprB512
@ SgprB512
Definition: AMDGPURegBankLegalizeRules.h:152

llvm::AMDGPU::UniInVgprB512
@ UniInVgprB512
Definition: AMDGPURegBankLegalizeRules.h:187

llvm::AMDGPU::Vgpr16
@ Vgpr16
Definition: AMDGPURegBankLegalizeRules.h:155

llvm::AMDGPU::VgprB96
@ VgprB96
Definition: AMDGPURegBankLegalizeRules.h:171

llvm::AMDGPU::Sgpr32AExtBoolInReg
@ Sgpr32AExtBoolInReg
Definition: AMDGPURegBankLegalizeRules.h:197

llvm::AMDGPU::Vcc
@ Vcc
Definition: AMDGPURegBankLegalizeRules.h:130

llvm::AMDGPU::SgprV4S32_WF
@ SgprV4S32_WF
Definition: AMDGPURegBankLegalizeRules.h:193

llvm::AMDGPU::UniInVgprB256
@ UniInVgprB256
Definition: AMDGPURegBankLegalizeRules.h:186

llvm::AMDGPU::SgprP1
@ SgprP1
Definition: AMDGPURegBankLegalizeRules.h:137

llvm::AMDGPU::SgprB96
@ SgprB96
Definition: AMDGPURegBankLegalizeRules.h:149

llvm::AMDGPU::Sgpr32AExt
@ Sgpr32AExt
Definition: AMDGPURegBankLegalizeRules.h:196

llvm::AMDGPU::UniInVgprB64
@ UniInVgprB64
Definition: AMDGPURegBankLegalizeRules.h:183

llvm::AMDGPU::Sgpr32ZExt
@ Sgpr32ZExt
Definition: AMDGPURegBankLegalizeRules.h:199

llvm::AMDGPU::SgprP5
@ SgprP5
Definition: AMDGPURegBankLegalizeRules.h:140

llvm::AMDGPU::SgprB256
@ SgprB256
Definition: AMDGPURegBankLegalizeRules.h:151

llvm::AMDGPU::VgprP5
@ VgprP5
Definition: AMDGPURegBankLegalizeRules.h:163

llvm::AMDGPU::SgprP4
@ SgprP4
Definition: AMDGPURegBankLegalizeRules.h:139

llvm::AMDGPU::SgprV4S32
@ SgprV4S32
Definition: AMDGPURegBankLegalizeRules.h:145

llvm::AMDGPU::Sgpr128
@ Sgpr128
Definition: AMDGPURegBankLegalizeRules.h:136

llvm::AMDGPU::VgprB128
@ VgprB128
Definition: AMDGPURegBankLegalizeRules.h:172

llvm::AMDGPU::UniInVgprS32
@ UniInVgprS32
Definition: AMDGPURegBankLegalizeRules.h:179

llvm::AMDGPU::VgprB256
@ VgprB256
Definition: AMDGPURegBankLegalizeRules.h:173

llvm::AMDGPU::Sgpr64
@ Sgpr64
Definition: AMDGPURegBankLegalizeRules.h:135

llvm::AMDGPU::VgprPtr32
@ VgprPtr32
Definition: AMDGPURegBankLegalizeRules.h:164

llvm::AMDGPU::SgprPtr64
@ SgprPtr64
Definition: AMDGPURegBankLegalizeRules.h:142

llvm::AMDGPU::Sgpr32SExt
@ Sgpr32SExt
Definition: AMDGPURegBankLegalizeRules.h:198

llvm::AMDGPU::None
@ None
Definition: AMDGPURegBankLegalizeRules.h:127

llvm::AMDGPU::VgprP3
@ VgprP3
Definition: AMDGPURegBankLegalizeRules.h:161

llvm::AMDGPU::Vgpr128
@ Vgpr128
Definition: AMDGPURegBankLegalizeRules.h:158

llvm::AMDGPU::SgprB128
@ SgprB128
Definition: AMDGPURegBankLegalizeRules.h:150

llvm::AMDGPU::SgprV2S16
@ SgprV2S16
Definition: AMDGPURegBankLegalizeRules.h:144

llvm::AMDGPU::SgprP3
@ SgprP3
Definition: AMDGPURegBankLegalizeRules.h:138

llvm::AMDGPU::VgprP4
@ VgprP4
Definition: AMDGPURegBankLegalizeRules.h:162

llvm::AMDGPU::VgprB32
@ VgprB32
Definition: AMDGPURegBankLegalizeRules.h:169

llvm::AMDGPU::SgprB32
@ SgprB32
Definition: AMDGPURegBankLegalizeRules.h:147

llvm::AMDGPU::VgprP0
@ VgprP0
Definition: AMDGPURegBankLegalizeRules.h:159

llvm::AMDGPU::Sgpr32
@ Sgpr32
Definition: AMDGPURegBankLegalizeRules.h:134

llvm::AMDGPU::Sgpr32_WF
@ Sgpr32_WF
Definition: AMDGPURegBankLegalizeRules.h:192

llvm::AMDGPU::UniInVcc
@ UniInVcc
Definition: AMDGPURegBankLegalizeRules.h:178

llvm::AMDGPU::VgprPtr128
@ VgprPtr128
Definition: AMDGPURegBankLegalizeRules.h:166

llvm::AMDGPU::Vgpr32SExt
@ Vgpr32SExt
Definition: AMDGPURegBankLegalizeRules.h:200

llvm::AMDGPU::isAnyPtr
bool isAnyPtr(LLT Ty, unsigned Width)
Definition: AMDGPURegBankLegalizeRules.cpp:29

llvm::AMDGPU::UniformityLLTOpPredicateID
UniformityLLTOpPredicateID
Definition: AMDGPURegBankLegalizeRules.h:39

llvm::AMDGPU::UniS128
@ UniS128
Definition: AMDGPURegBankLegalizeRules.h:52

llvm::AMDGPU::DivP3
@ DivP3
Definition: AMDGPURegBankLegalizeRules.h:81

llvm::AMDGPU::DivB128
@ DivB128
Definition: AMDGPURegBankLegalizeRules.h:116

llvm::AMDGPU::P1
@ P1
Definition: AMDGPURegBankLegalizeRules.h:62

llvm::AMDGPU::DivS128
@ DivS128
Definition: AMDGPURegBankLegalizeRules.h:58

llvm::AMDGPU::Ptr128
@ Ptr128
Definition: AMDGPURegBankLegalizeRules.h:68

llvm::AMDGPU::V3S32
@ V3S32
Definition: AMDGPURegBankLegalizeRules.h:91

llvm::AMDGPU::Ptr32
@ Ptr32
Definition: AMDGPURegBankLegalizeRules.h:66

llvm::AMDGPU::DivV2S16
@ DivV2S16
Definition: AMDGPURegBankLegalizeRules.h:96

llvm::AMDGPU::S64
@ S64
Definition: AMDGPURegBankLegalizeRules.h:45

llvm::AMDGPU::DivPtr128
@ DivPtr128
Definition: AMDGPURegBankLegalizeRules.h:86

llvm::AMDGPU::DivS16
@ DivS16
Definition: AMDGPURegBankLegalizeRules.h:55

llvm::AMDGPU::UniS32
@ UniS32
Definition: AMDGPURegBankLegalizeRules.h:50

llvm::AMDGPU::DivP1
@ DivP1
Definition: AMDGPURegBankLegalizeRules.h:80

llvm::AMDGPU::B512
@ B512
Definition: AMDGPURegBankLegalizeRules.h:104

llvm::AMDGPU::S16
@ S16
Definition: AMDGPURegBankLegalizeRules.h:43

llvm::AMDGPU::UniB512
@ UniB512
Definition: AMDGPURegBankLegalizeRules.h:111

llvm::AMDGPU::DivB512
@ DivB512
Definition: AMDGPURegBankLegalizeRules.h:118

llvm::AMDGPU::UniV2S16
@ UniV2S16
Definition: AMDGPURegBankLegalizeRules.h:94

llvm::AMDGPU::P5
@ P5
Definition: AMDGPURegBankLegalizeRules.h:65

llvm::AMDGPU::UniB64
@ UniB64
Definition: AMDGPURegBankLegalizeRules.h:107

llvm::AMDGPU::DivS64
@ DivS64
Definition: AMDGPURegBankLegalizeRules.h:57

llvm::AMDGPU::UniS64
@ UniS64
Definition: AMDGPURegBankLegalizeRules.h:51

llvm::AMDGPU::UniB32
@ UniB32
Definition: AMDGPURegBankLegalizeRules.h:106

llvm::AMDGPU::UniB128
@ UniB128
Definition: AMDGPURegBankLegalizeRules.h:109

llvm::AMDGPU::V2S32
@ V2S32
Definition: AMDGPURegBankLegalizeRules.h:90

llvm::AMDGPU::V2S16
@ V2S16
Definition: AMDGPURegBankLegalizeRules.h:89

llvm::AMDGPU::B64
@ B64
Definition: AMDGPURegBankLegalizeRules.h:100

llvm::AMDGPU::S32
@ S32
Definition: AMDGPURegBankLegalizeRules.h:44

llvm::AMDGPU::DivP0
@ DivP0
Definition: AMDGPURegBankLegalizeRules.h:79

llvm::AMDGPU::DivB64
@ DivB64
Definition: AMDGPURegBankLegalizeRules.h:114

llvm::AMDGPU::P0
@ P0
Definition: AMDGPURegBankLegalizeRules.h:61

llvm::AMDGPU::UniS1
@ UniS1
Definition: AMDGPURegBankLegalizeRules.h:48

llvm::AMDGPU::P4
@ P4
Definition: AMDGPURegBankLegalizeRules.h:64

llvm::AMDGPU::B128
@ B128
Definition: AMDGPURegBankLegalizeRules.h:102

llvm::AMDGPU::UniPtr128
@ UniPtr128
Definition: AMDGPURegBankLegalizeRules.h:77

llvm::AMDGPU::UniPtr32
@ UniPtr32
Definition: AMDGPURegBankLegalizeRules.h:75

llvm::AMDGPU::UniP1
@ UniP1
Definition: AMDGPURegBankLegalizeRules.h:71

llvm::AMDGPU::DivB32
@ DivB32
Definition: AMDGPURegBankLegalizeRules.h:113

llvm::AMDGPU::DivS32
@ DivS32
Definition: AMDGPURegBankLegalizeRules.h:56

llvm::AMDGPU::UniB96
@ UniB96
Definition: AMDGPURegBankLegalizeRules.h:108

llvm::AMDGPU::S1
@ S1
Definition: AMDGPURegBankLegalizeRules.h:42

llvm::AMDGPU::B32
@ B32
Definition: AMDGPURegBankLegalizeRules.h:99

llvm::AMDGPU::DivPtr32
@ DivPtr32
Definition: AMDGPURegBankLegalizeRules.h:84

llvm::AMDGPU::_
@ _
Definition: AMDGPURegBankLegalizeRules.h:40

llvm::AMDGPU::B256
@ B256
Definition: AMDGPURegBankLegalizeRules.h:103

llvm::AMDGPU::V4S32
@ V4S32
Definition: AMDGPURegBankLegalizeRules.h:92

llvm::AMDGPU::UniPtr64
@ UniPtr64
Definition: AMDGPURegBankLegalizeRules.h:76

llvm::AMDGPU::DivP4
@ DivP4
Definition: AMDGPURegBankLegalizeRules.h:82

llvm::AMDGPU::DivB256
@ DivB256
Definition: AMDGPURegBankLegalizeRules.h:117

llvm::AMDGPU::Ptr64
@ Ptr64
Definition: AMDGPURegBankLegalizeRules.h:67

llvm::AMDGPU::DivPtr64
@ DivPtr64
Definition: AMDGPURegBankLegalizeRules.h:85

llvm::AMDGPU::UniP0
@ UniP0
Definition: AMDGPURegBankLegalizeRules.h:70

llvm::AMDGPU::UniP5
@ UniP5
Definition: AMDGPURegBankLegalizeRules.h:74

llvm::AMDGPU::UniS16
@ UniS16
Definition: AMDGPURegBankLegalizeRules.h:49

llvm::AMDGPU::B96
@ B96
Definition: AMDGPURegBankLegalizeRules.h:101

llvm::AMDGPU::DivP5
@ DivP5
Definition: AMDGPURegBankLegalizeRules.h:83

llvm::AMDGPU::UniP3
@ UniP3
Definition: AMDGPURegBankLegalizeRules.h:72

llvm::AMDGPU::UniP4
@ UniP4
Definition: AMDGPURegBankLegalizeRules.h:73

llvm::AMDGPU::S128
@ S128
Definition: AMDGPURegBankLegalizeRules.h:46

llvm::AMDGPU::DivB96
@ DivB96
Definition: AMDGPURegBankLegalizeRules.h:115

llvm::AMDGPU::UniB256
@ UniB256
Definition: AMDGPURegBankLegalizeRules.h:110

llvm::AMDGPU::P3
@ P3
Definition: AMDGPURegBankLegalizeRules.h:63

llvm::AMDGPU::DivS1
@ DivS1
Definition: AMDGPURegBankLegalizeRules.h:54

llvm::AMDGPU::isUniformMMO
bool isUniformMMO(const MachineMemOperand *MMO)
Definition: AMDGPUInstrInfo.cpp:30

llvm::AMDGPU::FastRulesTypes
FastRulesTypes
Definition: AMDGPURegBankLegalizeRules.h:226

llvm::AMDGPU::StandardB
@ StandardB
Definition: AMDGPURegBankLegalizeRules.h:229

llvm::AMDGPU::Vector
@ Vector
Definition: AMDGPURegBankLegalizeRules.h:230

llvm::AMDGPU::NoFastRules
@ NoFastRules
Definition: AMDGPURegBankLegalizeRules.h:227

llvm::AMDGPU::Standard
@ Standard
Definition: AMDGPURegBankLegalizeRules.h:228

llvm::AMDGPU::LoweringMethodID
LoweringMethodID
Definition: AMDGPURegBankLegalizeRules.h:209

llvm::AMDGPU::SplitTo32SExtInReg
@ SplitTo32SExtInReg
Definition: AMDGPURegBankLegalizeRules.h:219

llvm::AMDGPU::WidenLoad
@ WidenLoad
Definition: AMDGPURegBankLegalizeRules.h:223

llvm::AMDGPU::S_BFE
@ S_BFE
Definition: AMDGPURegBankLegalizeRules.h:214

llvm::AMDGPU::Ext32To64
@ Ext32To64
Definition: AMDGPURegBankLegalizeRules.h:220

llvm::AMDGPU::SplitLoad
@ SplitLoad
Definition: AMDGPURegBankLegalizeRules.h:222

llvm::AMDGPU::SplitTo32Select
@ SplitTo32Select
Definition: AMDGPURegBankLegalizeRules.h:218

llvm::AMDGPU::VgprToVccCopy
@ VgprToVccCopy
Definition: AMDGPURegBankLegalizeRules.h:216

llvm::AMDGPU::UniCstExt
@ UniCstExt
Definition: AMDGPURegBankLegalizeRules.h:221

llvm::AMDGPU::UnpackBitShift
@ UnpackBitShift
Definition: AMDGPURegBankLegalizeRules.h:213

llvm::AMDGPU::SplitTo32
@ SplitTo32
Definition: AMDGPURegBankLegalizeRules.h:217

llvm::AMDGPU::VccExtToSel
@ VccExtToSel
Definition: AMDGPURegBankLegalizeRules.h:211

llvm::AMDGPU::V_BFE
@ V_BFE
Definition: AMDGPURegBankLegalizeRules.h:215

llvm::AMDGPU::UniExtToSel
@ UniExtToSel
Definition: AMDGPURegBankLegalizeRules.h:212

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition: AddressRanges.h:18

llvm::MONoClobber
static const MachineMemOperand::Flags MONoClobber
Mark the MMO of a uniform load if there are no potentially clobbering stores on any path from the sta...
Definition: SIInstrInfo.h:44

llvm::dbgs
LLVM_ABI raw_ostream & dbgs()
dbgs() - This returns a reference to a raw_ostream for debugging messages.
Definition: Debug.cpp:207

llvm::AMDGPU::PredicateMapping::OpUniformityAndTypes
SmallVector< UniformityLLTOpPredicateID, 4 > OpUniformityAndTypes
Definition: AMDGPURegBankLegalizeRules.h:244

llvm::AMDGPU::PredicateMapping::PredicateMapping
PredicateMapping(std::initializer_list< UniformityLLTOpPredicateID > OpList, std::function< bool(const MachineInstr &)> TestFunc=nullptr)
Definition: AMDGPURegBankLegalizeRules.cpp:40

llvm::AMDGPU::PredicateMapping::match
bool match(const MachineInstr &MI, const MachineUniformityInfo &MUI, const MachineRegisterInfo &MRI) const
Definition: AMDGPURegBankLegalizeRules.cpp:178

llvm::AMDGPU::PredicateMapping::TestFunc
std::function< bool(const MachineInstr &)> TestFunc
Definition: AMDGPURegBankLegalizeRules.h:245

llvm::AMDGPU::RegBankLLTMapping
Definition: AMDGPURegBankLegalizeRules.h:233

llvm::AMDGPU::RegBankLLTMapping::RegBankLLTMapping
RegBankLLTMapping(std::initializer_list< RegBankLLTMappingApplyID > DstOpMappingList, std::initializer_list< RegBankLLTMappingApplyID > SrcOpMappingList, LoweringMethodID LoweringMethod=DoNotLower)
Definition: AMDGPURegBankLegalizeRules.cpp:33

llvm::AMDGPU::RegBankLegalizeRule
Definition: AMDGPURegBankLegalizeRules.h:254

llvm::Align
This struct is a compact representation of a valid (non-zero power of two) alignment.
Definition: Alignment.h:39