LLVM: lib/Target/NVPTX/NVPTXISelLowering.h Source File

//===-- NVPTXISelLowering.h - NVPTX DAG Lowering Interface ------*- C++ -*-===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

// This file defines the interfaces that NVPTX uses to lower LLVM code into a

// selection DAG.

//

//===----------------------------------------------------------------------===//


#ifndef LLVM_LIB_TARGET_NVPTX_NVPTXISELLOWERING_H

#define LLVM_LIB_TARGET_NVPTX_NVPTXISELLOWERING_H


#include "NVPTX.h"

#include "llvm/CodeGen/SelectionDAG.h"

#include "llvm/CodeGen/TargetLowering.h"

#include "llvm/Support/AtomicOrdering.h"


namespace llvm {


namespace NVPTXISD {


enum NodeType : unsigned {

  // Start the numbering from where ISD NodeType finishes.

  FIRST_NUMBER = ISD::BUILTIN_OP_END,

  RET_GLUE,


  /// These nodes represent a parameter declaration. In PTX this will look like:

  ///   .param .align 16 .b8 param0[1024];

  ///   .param .b32 retval0;

  ///

  /// DeclareArrayParam(Chain, Externalsym, Align, Size, Glue)

  /// DeclareScalarParam(Chain, Externalsym, Size, Glue)

  DeclareScalarParam,

  DeclareArrayParam,


  /// This node represents a PTX call instruction. It's operands are as follows:

  ///

  /// CALL(Chain, IsConvergent, IsIndirectCall/IsUniform, NumReturns,

  ///      NumParams, Callee, Proto)

  CALL,


  MoveParam,

  CallPrototype,

  ProxyReg,

  FSHL_CLAMP,

  FSHR_CLAMP,

  MUL_WIDE_SIGNED,

  MUL_WIDE_UNSIGNED,

  SETP_F16X2,

  SETP_BF16X2,

  BFI,

  PRMT,


  /// This node is similar to ISD::BUILD_VECTOR except that the output may be

  /// implicitly bitcast to a scalar. This allows for the representation of

  /// packing move instructions for vector types which are not legal i.e. v2i32

  BUILD_VECTOR,


  /// This node is the inverse of NVPTX::BUILD_VECTOR. It takes a single value

  /// which may be a scalar and unpacks it into multiple values by implicitly

  /// converting it to a vector.

  UNPACK_VECTOR,


  FCOPYSIGN,

  FMAXNUM3,

  FMINNUM3,

  FMAXIMUM3,

  FMINIMUM3,


  DYNAMIC_STACKALLOC,

  STACKRESTORE,

  STACKSAVE,

  BrxStart,

  BrxItem,

  BrxEnd,

  CLUSTERLAUNCHCONTROL_QUERY_CANCEL_IS_CANCELED,

  CLUSTERLAUNCHCONTROL_QUERY_CANCEL_GET_FIRST_CTAID_X,

  CLUSTERLAUNCHCONTROL_QUERY_CANCEL_GET_FIRST_CTAID_Y,

  CLUSTERLAUNCHCONTROL_QUERY_CANCEL_GET_FIRST_CTAID_Z,


  FIRST_MEMORY_OPCODE,


  /// These nodes are used to lower atomic instructions with i128 type. They are

  /// similar to the generic nodes, but the input and output values are split

  /// into two 64-bit values.

  /// ValLo, ValHi, OUTCHAIN = ATOMIC_CMP_SWAP_B128(INCHAIN, ptr, cmpLo, cmpHi,

  ///                                               swapLo, swapHi)

  /// ValLo, ValHi, OUTCHAIN = ATOMIC_SWAP_B128(INCHAIN, ptr, amtLo, amtHi)

  ATOMIC_CMP_SWAP_B128 = FIRST_MEMORY_OPCODE,

  ATOMIC_SWAP_B128,


  LoadV2,

  LoadV4,

  LoadV8,

  LDUV2, // LDU.v2

  LDUV4, // LDU.v4

  StoreV2,

  StoreV4,

  StoreV8,

  TCGEN05_MMA_SHARED_DISABLE_OUTPUT_LANE_CG1,

  TCGEN05_MMA_SHARED_DISABLE_OUTPUT_LANE_CG2,

  TCGEN05_MMA_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG1,

  TCGEN05_MMA_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG2,

  TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG1,

  TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG2,

  TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1,

  TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2,

  TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG1_ASHIFT,

  TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG2_ASHIFT,

  TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1_ASHIFT,

  TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2_ASHIFT,

  TCGEN05_MMA_SP_SHARED_DISABLE_OUTPUT_LANE_CG1,

  TCGEN05_MMA_SP_SHARED_DISABLE_OUTPUT_LANE_CG2,

  TCGEN05_MMA_SP_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG1,

  TCGEN05_MMA_SP_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG2,

  TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG1,

  TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG2,

  TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG1_ASHIFT,

  TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG2_ASHIFT,

  TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1,

  TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2,

  TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1_ASHIFT,

  TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2_ASHIFT,

  LAST_MEMORY_OPCODE =

      TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2_ASHIFT,

};


}


class NVPTXSubtarget;


//===--------------------------------------------------------------------===//

// TargetLowering Implementation

//===--------------------------------------------------------------------===//


class NVPTXTargetLowering : public TargetLowering {

public:

  explicit NVPTXTargetLowering(const NVPTXTargetMachine &TM,

                               const NVPTXSubtarget &STI);

  SDValue LowerOperation(SDValue Op, SelectionDAG &DAG) const override;


  const char *getTargetNodeName(unsigned Opcode) const override;


  bool getTgtMemIntrinsic(IntrinsicInfo &Info, const CallInst &I,

                          MachineFunction &MF,

                          unsigned Intrinsic) const override;


  Align getFunctionArgumentAlignment(const Function *F, Type *Ty, unsigned Idx,

                                     const DataLayout &DL) const;


  /// getFunctionParamOptimizedAlign - since function arguments are passed via

  /// .param space, we may want to increase their alignment in a way that

  /// ensures that we can effectively vectorize their loads & stores. We can

  /// increase alignment only if the function has internal or has private

  /// linkage as for other linkage types callers may already rely on default

  /// alignment. To allow using 128-bit vectorized loads/stores, this function

  /// ensures that alignment is 16 or greater.

  Align getFunctionParamOptimizedAlign(const Function *F, Type *ArgTy,

                                       const DataLayout &DL) const;


  /// Helper for computing alignment of a device function byval parameter.

  Align getFunctionByValParamAlign(const Function *F, Type *ArgTy,

                                   Align InitialAlign,

                                   const DataLayout &DL) const;


  // Helper for getting a function parameter name. Name is composed from

  // its index and the function name. Negative index corresponds to special

  // parameter (unsized array) used for passing variable arguments.

  std::string getParamName(const Function *F, int Idx) const;


  /// isLegalAddressingMode - Return true if the addressing mode represented

  /// by AM is legal for this target, for a load/store of the specified type

  /// Used to guide target specific optimizations, like loop strength

  /// reduction (LoopStrengthReduce.cpp) and memory optimization for

  /// address mode (CodeGenPrepare.cpp)

  bool isLegalAddressingMode(const DataLayout &DL, const AddrMode &AM, Type *Ty,

                             unsigned AS,

                             Instruction *I = nullptr) const override;


  bool isTruncateFree(Type *SrcTy, Type *DstTy) const override {

    // Truncating 64-bit to 32-bit is free in SASS.

    if (!SrcTy->isIntegerTy() || !DstTy->isIntegerTy())

      return false;

    return SrcTy->getPrimitiveSizeInBits() == 64 &&

           DstTy->getPrimitiveSizeInBits() == 32;

  }


  EVT getSetCCResultType(const DataLayout &DL, LLVMContext &Ctx,

                         EVT VT) const override {

    if (VT.isVector())

      return EVT::getVectorVT(Ctx, MVT::i1, VT.getVectorNumElements());

    return MVT::i1;

  }


  ConstraintType getConstraintType(StringRef Constraint) const override;

  std::pair<unsigned, const TargetRegisterClass *>

  getRegForInlineAsmConstraint(const TargetRegisterInfo *TRI,

                               StringRef Constraint, MVT VT) const override;


  SDValue LowerFormalArguments(SDValue Chain, CallingConv::ID CallConv,

                               bool isVarArg,

                               const SmallVectorImpl<ISD::InputArg> &Ins,

                               const SDLoc &dl, SelectionDAG &DAG,

                               SmallVectorImpl<SDValue> &InVals) const override;


  SDValue LowerCall(CallLoweringInfo &CLI,

                    SmallVectorImpl<SDValue> &InVals) const override;


  SDValue LowerDYNAMIC_STACKALLOC(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerSTACKSAVE(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerSTACKRESTORE(SDValue Op, SelectionDAG &DAG) const;


  std::string getPrototype(const DataLayout &DL, Type *, const ArgListTy &,

                           const SmallVectorImpl<ISD::OutputArg> &,

                           std::optional<unsigned> FirstVAArg,

                           const CallBase &CB, unsigned UniqueCallSite) const;


  SDValue LowerReturn(SDValue Chain, CallingConv::ID CallConv, bool isVarArg,

                      const SmallVectorImpl<ISD::OutputArg> &Outs,

                      const SmallVectorImpl<SDValue> &OutVals, const SDLoc &dl,

                      SelectionDAG &DAG) const override;


  void LowerAsmOperandForConstraint(SDValue Op, StringRef Constraint,

                                    std::vector<SDValue> &Ops,

                                    SelectionDAG &DAG) const override;


  const NVPTXTargetMachine *nvTM;


  // PTX always uses 32-bit shift amounts


  MVT getScalarShiftAmountTy(const DataLayout &, EVT) const override {

    return MVT::i32;

  }


  TargetLoweringBase::LegalizeTypeAction

  getPreferredVectorAction(MVT VT) const override;


  // Get the degree of precision we want from 32-bit floating point division

  // operations.

  NVPTX::DivPrecisionLevel getDivF32Level(const MachineFunction &MF,

                                          const SDNode &N) const;


  // Get whether we should use a precise or approximate 32-bit floating point

  // sqrt instruction.

  bool usePrecSqrtF32(const SDNode *N = nullptr) const;


  // Get whether we should use instructions that flush floating-point denormals

  // to sign-preserving zero.

  bool useF32FTZ(const MachineFunction &MF) const;


  SDValue getSqrtEstimate(SDValue Operand, SelectionDAG &DAG, int Enabled,

                          int &ExtraSteps, bool &UseOneConst,

                          bool Reciprocal) const override;


  unsigned combineRepeatedFPDivisors() const override { return 2; }


  bool allowFMA(MachineFunction &MF, CodeGenOptLevel OptLevel) const;


  bool isFMAFasterThanFMulAndFAdd(const MachineFunction &MF,

                                  EVT) const override {

    return true;

  }


  // The default is the same as pointer type, but brx.idx only accepts i32

  MVT getJumpTableRegTy(const DataLayout &) const override { return MVT::i32; }


  unsigned getJumpTableEncoding() const override;


  bool enableAggressiveFMAFusion(EVT VT) const override { return true; }


  // The default is to transform llvm.ctlz(x, false) (where false indicates that

  // x == 0 is not undefined behavior) into a branch that checks whether x is 0

  // and avoids calling ctlz in that case.  We have a dedicated ctlz

  // instruction, so we say that ctlz is cheap to speculate.

  bool isCheapToSpeculateCtlz(Type *Ty) const override { return true; }


  AtomicExpansionKind shouldCastAtomicLoadInIR(LoadInst *LI) const override {

    return AtomicExpansionKind::None;

  }


  AtomicExpansionKind shouldCastAtomicStoreInIR(StoreInst *SI) const override {

    return AtomicExpansionKind::None;

  }


  AtomicExpansionKind

  shouldExpandAtomicRMWInIR(AtomicRMWInst *AI) const override;


  bool aggressivelyPreferBuildVectorSources(EVT VecVT) const override {

    // There's rarely any point of packing something into a vector type if we

    // already have the source data.

    return true;

  }


  bool shouldInsertFencesForAtomic(const Instruction *) const override;


  AtomicOrdering

  atomicOperationOrderAfterFenceSplit(const Instruction *I) const override;


  Instruction *emitLeadingFence(IRBuilderBase &Builder, Instruction *Inst,

                                AtomicOrdering Ord) const override;

  Instruction *emitTrailingFence(IRBuilderBase &Builder, Instruction *Inst,

                                 AtomicOrdering Ord) const override;


  unsigned getPreferredFPToIntOpcode(unsigned Op, EVT FromVT,

                                     EVT ToVT) const override;


  void computeKnownBitsForTargetNode(const SDValue Op, KnownBits &Known,

                                     const APInt &DemandedElts,

                                     const SelectionDAG &DAG,

                                     unsigned Depth = 0) const override;

  bool SimplifyDemandedBitsForTargetNode(SDValue Op, const APInt &DemandedBits,

                                         const APInt &DemandedElts,

                                         KnownBits &Known,

                                         TargetLoweringOpt &TLO,

                                         unsigned Depth = 0) const override;


private:

  const NVPTXSubtarget &STI; // cache the subtarget here

  mutable unsigned GlobalUniqueCallSite;


  SDValue getParamSymbol(SelectionDAG &DAG, int I, EVT T) const;

  SDValue getCallParamSymbol(SelectionDAG &DAG, int I, EVT T) const;

  SDValue LowerADDRSPACECAST(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerBITCAST(SDValue Op, SelectionDAG &DAG) const;


  SDValue LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerCONCAT_VECTORS(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerVECREDUCE(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerEXTRACT_VECTOR_ELT(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerINSERT_VECTOR_ELT(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerVECTOR_SHUFFLE(SDValue Op, SelectionDAG &DAG) const;


  SDValue LowerFCOPYSIGN(SDValue Op, SelectionDAG &DAG) const;


  SDValue LowerFROUND(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerFROUND32(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerFROUND64(SDValue Op, SelectionDAG &DAG) const;


  SDValue PromoteBinOpIfF32FTZ(SDValue Op, SelectionDAG &DAG) const;


  SDValue LowerINT_TO_FP(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerFP_TO_INT(SDValue Op, SelectionDAG &DAG) const;


  SDValue LowerFP_ROUND(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerFP_EXTEND(SDValue Op, SelectionDAG &DAG) const;


  SDValue LowerLOAD(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerSTORE(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerSTOREi1(SDValue Op, SelectionDAG &DAG) const;


  SDValue LowerShiftRightParts(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerShiftLeftParts(SDValue Op, SelectionDAG &DAG) const;


  SDValue LowerBR_JT(SDValue Op, SelectionDAG &DAG) const;


  SDValue LowerVAARG(SDValue Op, SelectionDAG &DAG) const;

  SDValue LowerVASTART(SDValue Op, SelectionDAG &DAG) const;


  SDValue LowerCopyToReg_128(SDValue Op, SelectionDAG &DAG) const;

  unsigned getNumRegisters(LLVMContext &Context, EVT VT,

                           std::optional<MVT> RegisterVT) const override;

  bool

  splitValueIntoRegisterParts(SelectionDAG &DAG, const SDLoc &DL, SDValue Val,

                              SDValue *Parts, unsigned NumParts, MVT PartVT,

                              std::optional<CallingConv::ID> CC) const override;


  void ReplaceNodeResults(SDNode *N, SmallVectorImpl<SDValue> &Results,

                          SelectionDAG &DAG) const override;

  SDValue PerformDAGCombine(SDNode *N, DAGCombinerInfo &DCI) const override;


  Align getArgumentAlignment(const CallBase *CB, Type *Ty, unsigned Idx,

                             const DataLayout &DL) const;

};


} // namespace llvm


#endif

LowerADDRSPACECAST
static SDValue LowerADDRSPACECAST(SDValue Op, SelectionDAG &DAG)
Definition AArch64ISelLowering.cpp:7059

LowerVASTART
static SDValue LowerVASTART(SDValue Op, SelectionDAG &DAG)
Definition ARCISelLowering.cpp:756

LowerVECTOR_SHUFFLE
static SDValue LowerVECTOR_SHUFFLE(SDValue Op, SelectionDAG &DAG, const ARMSubtarget *ST)
Definition ARMISelLowering.cpp:8717

LowerCONCAT_VECTORS
static SDValue LowerCONCAT_VECTORS(SDValue Op, SelectionDAG &DAG, const ARMSubtarget *ST)
Definition ARMISelLowering.cpp:9129

LowerEXTRACT_VECTOR_ELT
static SDValue LowerEXTRACT_VECTOR_ELT(SDValue Op, SelectionDAG &DAG, const ARMSubtarget *ST)
Definition ARMISelLowering.cpp:9026

LowerSTORE
static SDValue LowerSTORE(SDValue Op, SelectionDAG &DAG, const ARMSubtarget *Subtarget)
Definition ARMISelLowering.cpp:10117

DL
MachineBasicBlock MachineBasicBlock::iterator DebugLoc DL
Definition ARMSLSHardening.cpp:73

Results
Function Alias Analysis Results
Definition AliasAnalysis.cpp:734

AtomicOrdering.h
Atomic ordering constants.

Info
Analysis containing CSE Info
Definition CSEInfo.cpp:27

Ops
const AbstractManglingParser< Derived, Alloc >::OperatorInfo AbstractManglingParser< Derived, Alloc >::Ops[]
Definition ItaniumDemangle.h:3368

F
#define F(x, y, z)
Definition MD5.cpp:55

I
#define I(x, y, z)
Definition MD5.cpp:58

TRI
Register const TargetRegisterInfo * TRI
Definition MachineSink.cpp:2118

T
#define T
Definition Mips16ISelLowering.cpp:353

NVPTX.h

SelectionDAG.h

LowerLOAD
static SDValue LowerLOAD(SDValue Op, SelectionDAG &DAG)
Definition SparcISelLowering.cpp:2952

LowerVAARG
static SDValue LowerVAARG(SDValue Op, SelectionDAG &DAG)
Definition SparcISelLowering.cpp:2700

Enabled
static bool Enabled
Definition Statistic.cpp:46

TargetLowering.h
This file describes how to lower LLVM code to machine code.

LowerBITCAST
static SDValue LowerBITCAST(SDValue Op, const X86Subtarget &Subtarget, SelectionDAG &DAG)
Definition X86ISelLowering.cpp:32392

LowerFROUND
static SDValue LowerFROUND(SDValue Op, SelectionDAG &DAG)
ISD::FROUND is defined to round to nearest with ties rounding away from 0.
Definition X86ISelLowering.cpp:22582

LowerFCOPYSIGN
static SDValue LowerFCOPYSIGN(SDValue Op, SelectionDAG &DAG)
Definition X86ISelLowering.cpp:22665

llvm::APInt
Class for arbitrary precision integers.
Definition APInt.h:78

llvm::AtomicRMWInst
an instruction that atomically reads a memory location, combines it with another value,...
Definition Instructions.h:709

llvm::CallBase
Base class for all callable instructions (InvokeInst and CallInst) Holds everything related to callin...
Definition InstrTypes.h:1116

llvm::CallInst
This class represents a function call, abstracting a target machine's calling convention.
Definition Instructions.h:1510

llvm::DataLayout
A parsed version of the target data layout string in and methods for querying it.
Definition DataLayout.h:63

llvm::DemandedBits
Definition DemandedBits.h:41

llvm::Function
Definition Function.h:64

llvm::IRBuilderBase
Common base class shared among various IRBuilders.
Definition IRBuilder.h:114

llvm::Instruction
Definition Instruction.h:69

llvm::LLVMContext
This is an important class for using LLVM in a threaded context.
Definition LLVMContext.h:68

llvm::LoadInst
An instruction for reading from memory.
Definition Instructions.h:180

llvm::MVT
Machine Value Type.
Definition MachineValueType.h:36

llvm::MachineFunction
Definition MachineFunction.h:286

llvm::NVPTXSubtarget
Definition NVPTXSubtarget.h:31

llvm::NVPTXTargetLowering::atomicOperationOrderAfterFenceSplit
AtomicOrdering atomicOperationOrderAfterFenceSplit(const Instruction *I) const override
Definition NVPTXISelLowering.cpp:6750

llvm::NVPTXTargetLowering::enableAggressiveFMAFusion
bool enableAggressiveFMAFusion(EVT VT) const override
Return true if target always benefits from combining into FMA for a given value type.
Definition NVPTXISelLowering.h:268

llvm::NVPTXTargetLowering::getConstraintType
ConstraintType getConstraintType(StringRef Constraint) const override
getConstraintType - Given a constraint letter, return the type of constraint it is for this target.
Definition NVPTXISelLowering.cpp:5120

llvm::NVPTXTargetLowering::LowerOperation
SDValue LowerOperation(SDValue Op, SelectionDAG &DAG) const override
This callback is invoked for operations that are unsupported by the target, which are registered to u...
Definition NVPTXISelLowering.cpp:3104

llvm::NVPTXTargetLowering::nvTM
const NVPTXTargetMachine * nvTM
Definition NVPTXISelLowering.h:227

llvm::NVPTXTargetLowering::SimplifyDemandedBitsForTargetNode
bool SimplifyDemandedBitsForTargetNode(SDValue Op, const APInt &DemandedBits, const APInt &DemandedElts, KnownBits &Known, TargetLoweringOpt &TLO, unsigned Depth=0) const override
Attempt to simplify any target nodes based on the demanded bits/elts, returning true on success.
Definition NVPTXISelLowering.cpp:6980

llvm::NVPTXTargetLowering::NVPTXTargetLowering
NVPTXTargetLowering(const NVPTXTargetMachine &TM, const NVPTXSubtarget &STI)
Definition NVPTXISelLowering.cpp:513

llvm::NVPTXTargetLowering::getPrototype
std::string getPrototype(const DataLayout &DL, Type *, const ArgListTy &, const SmallVectorImpl< ISD::OutputArg > &, std::optional< unsigned > FirstVAArg, const CallBase &CB, unsigned UniqueCallSite) const
Definition NVPTXISelLowering.cpp:1242

llvm::NVPTXTargetLowering::getJumpTableRegTy
MVT getJumpTableRegTy(const DataLayout &) const override
Definition NVPTXISelLowering.h:264

llvm::NVPTXTargetLowering::getPreferredFPToIntOpcode
unsigned getPreferredFPToIntOpcode(unsigned Op, EVT FromVT, EVT ToVT) const override
Definition NVPTXISelLowering.cpp:6803

llvm::NVPTXTargetLowering::useF32FTZ
bool useF32FTZ(const MachineFunction &MF) const
Definition NVPTXISelLowering.cpp:149

llvm::NVPTXTargetLowering::LowerSTACKSAVE
SDValue LowerSTACKSAVE(SDValue Op, SelectionDAG &DAG) const
Definition NVPTXISelLowering.cpp:1890

llvm::NVPTXTargetLowering::combineRepeatedFPDivisors
unsigned combineRepeatedFPDivisors() const override
Indicate whether this target prefers to combine FDIVs with the same divisor.
Definition NVPTXISelLowering.h:254

llvm::NVPTXTargetLowering::getFunctionArgumentAlignment
Align getFunctionArgumentAlignment(const Function *F, Type *Ty, unsigned Idx, const DataLayout &DL) const
Definition NVPTXISelLowering.cpp:1346

llvm::NVPTXTargetLowering::getSqrtEstimate
SDValue getSqrtEstimate(SDValue Operand, SelectionDAG &DAG, int Enabled, int &ExtraSteps, bool &UseOneConst, bool Reciprocal) const override
Hooks for building estimates in place of slower divisions and square roots.
Definition NVPTXISelLowering.cpp:1193

llvm::NVPTXTargetLowering::LowerReturn
SDValue LowerReturn(SDValue Chain, CallingConv::ID CallConv, bool isVarArg, const SmallVectorImpl< ISD::OutputArg > &Outs, const SmallVectorImpl< SDValue > &OutVals, const SDLoc &dl, SelectionDAG &DAG) const override
This hook must be implemented to lower outgoing return values, described by the Outs array,...
Definition NVPTXISelLowering.cpp:3789

llvm::NVPTXTargetLowering::LowerFormalArguments
SDValue LowerFormalArguments(SDValue Chain, CallingConv::ID CallConv, bool isVarArg, const SmallVectorImpl< ISD::InputArg > &Ins, const SDLoc &dl, SelectionDAG &DAG, SmallVectorImpl< SDValue > &InVals) const override
This hook must be implemented to lower the incoming (formal) arguments, described by the Ins array,...
Definition NVPTXISelLowering.cpp:3669

llvm::NVPTXTargetLowering::shouldCastAtomicLoadInIR
AtomicExpansionKind shouldCastAtomicLoadInIR(LoadInst *LI) const override
Returns how the given (atomic) load should be cast by the IR-level AtomicExpand pass.
Definition NVPTXISelLowering.h:276

llvm::NVPTXTargetLowering::shouldCastAtomicStoreInIR
AtomicExpansionKind shouldCastAtomicStoreInIR(StoreInst *SI) const override
Returns how the given (atomic) store should be cast by the IR-level AtomicExpand pass into.
Definition NVPTXISelLowering.h:280

llvm::NVPTXTargetLowering::LowerAsmOperandForConstraint
void LowerAsmOperandForConstraint(SDValue Op, StringRef Constraint, std::vector< SDValue > &Ops, SelectionDAG &DAG) const override
Lower the specified operand into the Ops vector.
Definition NVPTXISelLowering.cpp:3853

llvm::NVPTXTargetLowering::LowerSTACKRESTORE
SDValue LowerSTACKRESTORE(SDValue Op, SelectionDAG &DAG) const
Definition NVPTXISelLowering.cpp:1868

llvm::NVPTXTargetLowering::aggressivelyPreferBuildVectorSources
bool aggressivelyPreferBuildVectorSources(EVT VecVT) const override
Definition NVPTXISelLowering.h:287

llvm::NVPTXTargetLowering::emitTrailingFence
Instruction * emitTrailingFence(IRBuilderBase &Builder, Instruction *Inst, AtomicOrdering Ord) const override
Definition NVPTXISelLowering.cpp:6779

llvm::NVPTXTargetLowering::isTruncateFree
bool isTruncateFree(Type *SrcTy, Type *DstTy) const override
Return true if it's free to truncate a value of type FromTy to type ToTy.
Definition NVPTXISelLowering.h:180

llvm::NVPTXTargetLowering::getParamName
std::string getParamName(const Function *F, int Idx) const
Definition NVPTXISelLowering.cpp:5060

llvm::NVPTXTargetLowering::getPreferredVectorAction
TargetLoweringBase::LegalizeTypeAction getPreferredVectorAction(MVT VT) const override
Return the preferred vector type legalization action.
Definition NVPTXISelLowering.cpp:1186

llvm::NVPTXTargetLowering::getDivF32Level
NVPTX::DivPrecisionLevel getDivF32Level(const MachineFunction &MF, const SDNode &N) const
Definition NVPTXISelLowering.cpp:122

llvm::NVPTXTargetLowering::shouldInsertFencesForAtomic
bool shouldInsertFencesForAtomic(const Instruction *) const override
Whether AtomicExpandPass should automatically insert fences and reduce ordering for this atomic.
Definition NVPTXISelLowering.cpp:6733

llvm::NVPTXTargetLowering::getFunctionParamOptimizedAlign
Align getFunctionParamOptimizedAlign(const Function *F, Type *ArgTy, const DataLayout &DL) const
getFunctionParamOptimizedAlign - since function arguments are passed via .param space,...
Definition NVPTXISelLowering.cpp:5013

llvm::NVPTXTargetLowering::LowerDYNAMIC_STACKALLOC
SDValue LowerDYNAMIC_STACKALLOC(SDValue Op, SelectionDAG &DAG) const
Definition NVPTXISelLowering.cpp:1828

llvm::NVPTXTargetLowering::getScalarShiftAmountTy
MVT getScalarShiftAmountTy(const DataLayout &, EVT) const override
Return the type to use for a scalar shift opcode, given the shifted amount type.
Definition NVPTXISelLowering.h:230

llvm::NVPTXTargetLowering::getSetCCResultType
EVT getSetCCResultType(const DataLayout &DL, LLVMContext &Ctx, EVT VT) const override
Return the ValueType of the result of SETCC operations.
Definition NVPTXISelLowering.h:188

llvm::NVPTXTargetLowering::getRegForInlineAsmConstraint
std::pair< unsigned, const TargetRegisterClass * > getRegForInlineAsmConstraint(const TargetRegisterInfo *TRI, StringRef Constraint, MVT VT) const override
Given a physical register constraint (e.g.
Definition NVPTXISelLowering.cpp:5142

llvm::NVPTXTargetLowering::isLegalAddressingMode
bool isLegalAddressingMode(const DataLayout &DL, const AddrMode &AM, Type *Ty, unsigned AS, Instruction *I=nullptr) const override
isLegalAddressingMode - Return true if the addressing mode represented by AM is legal for this target...
Definition NVPTXISelLowering.cpp:5079

llvm::NVPTXTargetLowering::emitLeadingFence
Instruction * emitLeadingFence(IRBuilderBase &Builder, Instruction *Inst, AtomicOrdering Ord) const override
Inserts in the IR a target-specific intrinsic specifying a fence.
Definition NVPTXISelLowering.cpp:6761

llvm::NVPTXTargetLowering::shouldExpandAtomicRMWInIR
AtomicExpansionKind shouldExpandAtomicRMWInIR(AtomicRMWInst *AI) const override
Returns how the IR-level AtomicExpand pass should expand the given AtomicRMW, if at all.
Definition NVPTXISelLowering.cpp:6647

llvm::NVPTXTargetLowering::isCheapToSpeculateCtlz
bool isCheapToSpeculateCtlz(Type *Ty) const override
Return true if it is cheap to speculate a call to intrinsic ctlz.
Definition NVPTXISelLowering.h:274

llvm::NVPTXTargetLowering::getFunctionByValParamAlign
Align getFunctionByValParamAlign(const Function *F, Type *ArgTy, Align InitialAlign, const DataLayout &DL) const
Helper for computing alignment of a device function byval parameter.
Definition NVPTXISelLowering.cpp:5034

llvm::NVPTXTargetLowering::getTgtMemIntrinsic
bool getTgtMemIntrinsic(IntrinsicInfo &Info, const CallInst &I, MachineFunction &MF, unsigned Intrinsic) const override
Given an intrinsic, checks if on the target the intrinsic will need to map to a MemIntrinsicNode (tou...
Definition NVPTXISelLowering.cpp:3866

llvm::NVPTXTargetLowering::getTargetNodeName
const char * getTargetNodeName(unsigned Opcode) const override
This method returns the name of a target specific DAG node.
Definition NVPTXISelLowering.cpp:1099

llvm::NVPTXTargetLowering::allowFMA
bool allowFMA(MachineFunction &MF, CodeGenOptLevel OptLevel) const
Definition NVPTXISelLowering.cpp:5174

llvm::NVPTXTargetLowering::usePrecSqrtF32
bool usePrecSqrtF32(const SDNode *N=nullptr) const
Definition NVPTXISelLowering.cpp:135

llvm::NVPTXTargetLowering::getJumpTableEncoding
unsigned getJumpTableEncoding() const override
Return the entry encoding for a jump table in the current function.
Definition NVPTXISelLowering.cpp:3241

llvm::NVPTXTargetLowering::isFMAFasterThanFMulAndFAdd
bool isFMAFasterThanFMulAndFAdd(const MachineFunction &MF, EVT) const override
Return true if an FMA operation is faster than a pair of fmul and fadd instructions.
Definition NVPTXISelLowering.h:258

llvm::NVPTXTargetLowering::LowerCall
SDValue LowerCall(CallLoweringInfo &CLI, SmallVectorImpl< SDValue > &InVals) const override
This hook must be implemented to lower calls into the specified DAG.
Definition NVPTXISelLowering.cpp:1439

llvm::NVPTXTargetLowering::computeKnownBitsForTargetNode
void computeKnownBitsForTargetNode(const SDValue Op, KnownBits &Known, const APInt &DemandedElts, const SelectionDAG &DAG, unsigned Depth=0) const override
Determine which of the bits specified in Mask are known to be either zero or one and return them in t...
Definition NVPTXISelLowering.cpp:6883

llvm::NVPTXTargetMachine
NVPTXTargetMachine.
Definition NVPTXTargetMachine.h:25

llvm::SDLoc
Wrapper class for IR location info (IR ordering and DebugLoc) to be passed into SDNode creation funct...
Definition SelectionDAGNodes.h:1225

llvm::SDNode
Represents one node in the SelectionDAG.
Definition SelectionDAGNodes.h:501

llvm::SDValue
Unlike LLVM values, Selection DAG nodes may return multiple values as the result of a computation.
Definition SelectionDAGNodes.h:147

llvm::SelectionDAG
This is used to represent a portion of an LLVM function in a low-level Data Dependence DAG representa...
Definition SelectionDAG.h:229

llvm::SmallVectorImpl
This class consists of common code factored out of the SmallVector class to reduce code duplication b...
Definition SmallVector.h:576

llvm::StoreInst
An instruction for storing to memory.
Definition Instructions.h:296

llvm::StringRef
StringRef - Represent a constant reference to a string, i.e.
Definition StringRef.h:55

llvm::TargetLoweringBase::LegalizeTypeAction
LegalizeTypeAction
This enum indicates whether a types are legal for a target, and if not, what action should be used to...
Definition TargetLowering.h:212

llvm::TargetLoweringBase::AtomicExpansionKind
AtomicExpansionKind
Enum that specifies what an atomic load/AtomicRMWInst is expanded to, if at all.
Definition TargetLowering.h:256

llvm::TargetLoweringBase::AtomicExpansionKind::None
@ None
Definition TargetLowering.h:257

llvm::TargetLowering::TargetLowering
TargetLowering(const TargetLowering &)=delete

llvm::TargetRegisterInfo
TargetRegisterInfo base class - We assume that the target defines a static array of TargetRegisterDes...
Definition TargetRegisterInfo.h:237

llvm::Type
The instances of the Type class are immutable: once they are created, they are never changed.
Definition Type.h:45

llvm::Type::getPrimitiveSizeInBits
LLVM_ABI TypeSize getPrimitiveSizeInBits() const LLVM_READONLY
Return the basic size of this type if it is a primitive type.
Definition Type.cpp:198

llvm::Type::isIntegerTy
bool isIntegerTy() const
True if this is an instance of IntegerType.
Definition Type.h:240

llvm::CallingConv::ID
unsigned ID
LLVM IR allows to use arbitrary numbers as calling convention identifiers.
Definition CallingConv.h:24

llvm::ISD::BUILTIN_OP_END
@ BUILTIN_OP_END
BUILTIN_OP_END - This must be the last enum value in this list.
Definition ISDOpcodes.h:1574

llvm::Intrinsic
This namespace contains an enum with a value for every intrinsic/builtin function known by LLVM.
Definition GenericSSAContext.h:27

llvm::NVPTXISD
Definition NVPTXISelLowering.h:23

llvm::NVPTXISD::NodeType
NodeType
Definition NVPTXISelLowering.h:24

llvm::NVPTXISD::TCGEN05_MMA_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG2
@ TCGEN05_MMA_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG2
Definition NVPTXISelLowering.h:105

llvm::NVPTXISD::TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2_ASHIFT
@ TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2_ASHIFT
Definition NVPTXISelLowering.h:125

llvm::NVPTXISD::TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1
@ TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1
Definition NVPTXISelLowering.h:108

llvm::NVPTXISD::STACKSAVE
@ STACKSAVE
Definition NVPTXISelLowering.h:74

llvm::NVPTXISD::PRMT
@ PRMT
Definition NVPTXISelLowering.h:54

llvm::NVPTXISD::DeclareArrayParam
@ DeclareArrayParam
Definition NVPTXISelLowering.h:36

llvm::NVPTXISD::CLUSTERLAUNCHCONTROL_QUERY_CANCEL_IS_CANCELED
@ CLUSTERLAUNCHCONTROL_QUERY_CANCEL_IS_CANCELED
Definition NVPTXISelLowering.h:78

llvm::NVPTXISD::LoadV8
@ LoadV8
Definition NVPTXISelLowering.h:96

llvm::NVPTXISD::TCGEN05_MMA_SP_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG2
@ TCGEN05_MMA_SP_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG2
Definition NVPTXISelLowering.h:117

llvm::NVPTXISD::MoveParam
@ MoveParam
Definition NVPTXISelLowering.h:44

llvm::NVPTXISD::CALL
@ CALL
This node represents a PTX call instruction.
Definition NVPTXISelLowering.h:42

llvm::NVPTXISD::TCGEN05_MMA_SP_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG1
@ TCGEN05_MMA_SP_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG1
Definition NVPTXISelLowering.h:116

llvm::NVPTXISD::BrxItem
@ BrxItem
Definition NVPTXISelLowering.h:76

llvm::NVPTXISD::TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG2_ASHIFT
@ TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG2_ASHIFT
Definition NVPTXISelLowering.h:121

llvm::NVPTXISD::StoreV2
@ StoreV2
Definition NVPTXISelLowering.h:99

llvm::NVPTXISD::TCGEN05_MMA_SP_SHARED_DISABLE_OUTPUT_LANE_CG1
@ TCGEN05_MMA_SP_SHARED_DISABLE_OUTPUT_LANE_CG1
Definition NVPTXISelLowering.h:114

llvm::NVPTXISD::TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1
@ TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1
Definition NVPTXISelLowering.h:122

llvm::NVPTXISD::TCGEN05_MMA_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG1
@ TCGEN05_MMA_SHARED_SCALE_D_DISABLE_OUTPUT_LANE_CG1
Definition NVPTXISelLowering.h:104

llvm::NVPTXISD::FIRST_NUMBER
@ FIRST_NUMBER
Definition NVPTXISelLowering.h:26

llvm::NVPTXISD::TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG2
@ TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG2
Definition NVPTXISelLowering.h:107

llvm::NVPTXISD::LDUV2
@ LDUV2
Definition NVPTXISelLowering.h:97

llvm::NVPTXISD::TCGEN05_MMA_SHARED_DISABLE_OUTPUT_LANE_CG2
@ TCGEN05_MMA_SHARED_DISABLE_OUTPUT_LANE_CG2
Definition NVPTXISelLowering.h:103

llvm::NVPTXISD::MUL_WIDE_SIGNED
@ MUL_WIDE_SIGNED
Definition NVPTXISelLowering.h:49

llvm::NVPTXISD::FSHL_CLAMP
@ FSHL_CLAMP
Definition NVPTXISelLowering.h:47

llvm::NVPTXISD::SETP_F16X2
@ SETP_F16X2
Definition NVPTXISelLowering.h:51

llvm::NVPTXISD::ProxyReg
@ ProxyReg
Definition NVPTXISelLowering.h:46

llvm::NVPTXISD::StoreV8
@ StoreV8
Definition NVPTXISelLowering.h:101

llvm::NVPTXISD::LAST_MEMORY_OPCODE
@ LAST_MEMORY_OPCODE
Definition NVPTXISelLowering.h:126

llvm::NVPTXISD::StoreV4
@ StoreV4
Definition NVPTXISelLowering.h:100

llvm::NVPTXISD::FMINIMUM3
@ FMINIMUM3
Definition NVPTXISelLowering.h:70

llvm::NVPTXISD::BrxEnd
@ BrxEnd
Definition NVPTXISelLowering.h:77

llvm::NVPTXISD::FMAXNUM3
@ FMAXNUM3
Definition NVPTXISelLowering.h:67

llvm::NVPTXISD::TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2
@ TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2
Definition NVPTXISelLowering.h:109

llvm::NVPTXISD::TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2
@ TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2
Definition NVPTXISelLowering.h:123

llvm::NVPTXISD::CLUSTERLAUNCHCONTROL_QUERY_CANCEL_GET_FIRST_CTAID_X
@ CLUSTERLAUNCHCONTROL_QUERY_CANCEL_GET_FIRST_CTAID_X
Definition NVPTXISelLowering.h:79

llvm::NVPTXISD::TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG1
@ TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG1
Definition NVPTXISelLowering.h:118

llvm::NVPTXISD::CallPrototype
@ CallPrototype
Definition NVPTXISelLowering.h:45

llvm::NVPTXISD::TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1_ASHIFT
@ TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1_ASHIFT
Definition NVPTXISelLowering.h:112

llvm::NVPTXISD::TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1_ASHIFT
@ TCGEN05_MMA_SP_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG1_ASHIFT
Definition NVPTXISelLowering.h:124

llvm::NVPTXISD::DYNAMIC_STACKALLOC
@ DYNAMIC_STACKALLOC
Definition NVPTXISelLowering.h:72

llvm::NVPTXISD::UNPACK_VECTOR
@ UNPACK_VECTOR
This node is the inverse of NVPTX::BUILD_VECTOR.
Definition NVPTXISelLowering.h:64

llvm::NVPTXISD::LoadV2
@ LoadV2
Definition NVPTXISelLowering.h:94

llvm::NVPTXISD::CLUSTERLAUNCHCONTROL_QUERY_CANCEL_GET_FIRST_CTAID_Y
@ CLUSTERLAUNCHCONTROL_QUERY_CANCEL_GET_FIRST_CTAID_Y
Definition NVPTXISelLowering.h:80

llvm::NVPTXISD::BrxStart
@ BrxStart
Definition NVPTXISelLowering.h:75

llvm::NVPTXISD::BFI
@ BFI
Definition NVPTXISelLowering.h:53

llvm::NVPTXISD::FIRST_MEMORY_OPCODE
@ FIRST_MEMORY_OPCODE
Definition NVPTXISelLowering.h:83

llvm::NVPTXISD::STACKRESTORE
@ STACKRESTORE
Definition NVPTXISelLowering.h:73

llvm::NVPTXISD::TCGEN05_MMA_SHARED_DISABLE_OUTPUT_LANE_CG1
@ TCGEN05_MMA_SHARED_DISABLE_OUTPUT_LANE_CG1
Definition NVPTXISelLowering.h:102

llvm::NVPTXISD::SETP_BF16X2
@ SETP_BF16X2
Definition NVPTXISelLowering.h:52

llvm::NVPTXISD::LDUV4
@ LDUV4
Definition NVPTXISelLowering.h:98

llvm::NVPTXISD::ATOMIC_SWAP_B128
@ ATOMIC_SWAP_B128
Definition NVPTXISelLowering.h:92

llvm::NVPTXISD::TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG2_ASHIFT
@ TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG2_ASHIFT
Definition NVPTXISelLowering.h:111

llvm::NVPTXISD::TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2_ASHIFT
@ TCGEN05_MMA_TENSOR_SCALE_D_DISABLE_OUTPUT_LANE_CG2_ASHIFT
Definition NVPTXISelLowering.h:113

llvm::NVPTXISD::FMINNUM3
@ FMINNUM3
Definition NVPTXISelLowering.h:68

llvm::NVPTXISD::FSHR_CLAMP
@ FSHR_CLAMP
Definition NVPTXISelLowering.h:48

llvm::NVPTXISD::DeclareScalarParam
@ DeclareScalarParam
These nodes represent a parameter declaration.
Definition NVPTXISelLowering.h:35

llvm::NVPTXISD::RET_GLUE
@ RET_GLUE
Definition NVPTXISelLowering.h:27

llvm::NVPTXISD::CLUSTERLAUNCHCONTROL_QUERY_CANCEL_GET_FIRST_CTAID_Z
@ CLUSTERLAUNCHCONTROL_QUERY_CANCEL_GET_FIRST_CTAID_Z
Definition NVPTXISelLowering.h:81

llvm::NVPTXISD::FMAXIMUM3
@ FMAXIMUM3
Definition NVPTXISelLowering.h:69

llvm::NVPTXISD::FCOPYSIGN
@ FCOPYSIGN
Definition NVPTXISelLowering.h:66

llvm::NVPTXISD::ATOMIC_CMP_SWAP_B128
@ ATOMIC_CMP_SWAP_B128
These nodes are used to lower atomic instructions with i128 type.
Definition NVPTXISelLowering.h:91

llvm::NVPTXISD::BUILD_VECTOR
@ BUILD_VECTOR
This node is similar to ISD::BUILD_VECTOR except that the output may be implicitly bitcast to a scala...
Definition NVPTXISelLowering.h:59

llvm::NVPTXISD::TCGEN05_MMA_SP_SHARED_DISABLE_OUTPUT_LANE_CG2
@ TCGEN05_MMA_SP_SHARED_DISABLE_OUTPUT_LANE_CG2
Definition NVPTXISelLowering.h:115

llvm::NVPTXISD::TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG1_ASHIFT
@ TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG1_ASHIFT
Definition NVPTXISelLowering.h:110

llvm::NVPTXISD::TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG1_ASHIFT
@ TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG1_ASHIFT
Definition NVPTXISelLowering.h:120

llvm::NVPTXISD::MUL_WIDE_UNSIGNED
@ MUL_WIDE_UNSIGNED
Definition NVPTXISelLowering.h:50

llvm::NVPTXISD::LoadV4
@ LoadV4
Definition NVPTXISelLowering.h:95

llvm::NVPTXISD::TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG1
@ TCGEN05_MMA_TENSOR_DISABLE_OUTPUT_LANE_CG1
Definition NVPTXISelLowering.h:106

llvm::NVPTXISD::TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG2
@ TCGEN05_MMA_SP_TENSOR_DISABLE_OUTPUT_LANE_CG2
Definition NVPTXISelLowering.h:119

llvm::NVPTX::DivPrecisionLevel
DivPrecisionLevel
Definition NVPTX.h:251

llvm::SI
Definition SIInstrInfo.h:1722

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition AddressRanges.h:18

llvm::Depth
@ Depth
Definition SIMachineScheduler.h:36

llvm::CodeGenOptLevel
CodeGenOptLevel
Code generation optimization level.
Definition CodeGen.h:82

llvm::AtomicOrdering
AtomicOrdering
Atomic ordering for LLVM's memory model.
Definition AtomicOrdering.h:56

llvm::Op
DWARFExpression::Operation Op
Definition DWARFExpressionPrinter.cpp:22

N
#define N

llvm::Align
This struct is a compact representation of a valid (non-zero power of two) alignment.
Definition Alignment.h:39

llvm::EVT
Extended Value Type.
Definition ValueTypes.h:35

llvm::EVT::getVectorVT
static EVT getVectorVT(LLVMContext &Context, EVT VT, unsigned NumElements, bool IsScalable=false)
Returns the EVT that represents a vector NumElements in length, where each element is of type VT.
Definition ValueTypes.h:74

llvm::EVT::isVector
bool isVector() const
Return true if this is a vector value type.
Definition ValueTypes.h:168

llvm::EVT::getVectorNumElements
unsigned getVectorNumElements() const
Given a vector type, return the number of elements it contains.
Definition ValueTypes.h:336

llvm::KnownBits
Definition KnownBits.h:24

llvm::TargetLoweringBase::AddrMode
This represents an addressing mode of: BaseGV + BaseOffs + BaseReg + Scale*ScaleReg + ScalableOffset*...
Definition TargetLowering.h:2899

llvm::TargetLoweringBase::IntrinsicInfo
Definition TargetLowering.h:1226