plain/21.02/_neon_workload_factory_8cpp_source.xhtml

 //
 // Copyright © 2017 Arm Ltd and Contributors. All rights reserved.
 // SPDX-License-Identifier: MIT
 //

 #include "NeonBackendId.hpp"
 #include "NeonBackendModelContext.hpp"
 #include "NeonTensorHandle.hpp"
 #include "NeonWorkloadFactory.hpp"

 #include <Layer.hpp>

 #include <armnn/Utils.hpp>
 #include <armnn/utility/IgnoreUnused.hpp>
 #include <armnn/utility/NumericCast.hpp>
 #include <armnn/utility/PolymorphicDowncast.hpp>

 #include <backendsCommon/CpuTensorHandle.hpp>
 #include <backendsCommon/MakeWorkloadHelper.hpp>
 #include <backendsCommon/MemCopyWorkload.hpp>
 #include <backendsCommon/MemImportWorkload.hpp>

 #include <neon/workloads/NeonWorkloadUtils.hpp>
 #include <neon/workloads/NeonWorkloads.hpp>

 namespace armnn
 {

 namespace
 {
 static const BackendId s_Id{NeonBackendId()};
 }

 bool NeonWorkloadFactory::IsLayerSupported(const Layer& layer,
                                            Optional<DataType> dataType,
                                            std::string& outReasonIfUnsupported)
 {
     return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported);
 }

 bool NeonWorkloadFactory::IsLayerSupported(const IConnectableLayer& layer,
                                            Optional<DataType> dataType,
                                            std::string& outReasonIfUnsupported,
                                            const ModelOptions& modelOptions)
 {
     return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported, modelOptions);
 }

 const BackendId& NeonWorkloadFactory::GetBackendId() const
 {
     return s_Id;
 }

 void NeonWorkloadFactory::SetNumberOfThreads()
 {
     if (m_ModelContextPtr)
     {
         const unsigned int MIN_THREADS = 1;
         const unsigned int MAX_THREADS = 64;

         // Set the number of threads to be used if the user has set NumberOfThreads param
         // Only set if within limit or valid input
         auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());
         auto numberOfThreads = modelOptions->GetNumberOfThreads();

         if (numberOfThreads != 0 && numberOfThreads >= MIN_THREADS && numberOfThreads <= MAX_THREADS)
         {
             arm_compute::Scheduler::get().set_num_threads(numberOfThreads);
         }
     }
 }

 NeonWorkloadFactory::NeonWorkloadFactory(const std::shared_ptr<NeonMemoryManager>& memoryManager)
     : m_MemoryManager(memoryManager), m_ModelContextPtr(IBackendInternal::IBackendSpecificModelContextPtr{})
 {
     SetNumberOfThreads();
 }

 NeonWorkloadFactory::NeonWorkloadFactory(const std::shared_ptr<NeonMemoryManager>& memoryManager,
                                          const IBackendInternal::IBackendSpecificModelContextPtr& modelContextPtr)
     : m_MemoryManager(memoryManager), m_ModelContextPtr(modelContextPtr)
 {
     SetNumberOfThreads();
 }

 std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateSubTensorHandle(ITensorHandle& parent,
     TensorShape const& subTensorShape,
     unsigned int const* subTensorOrigin) const
 {
     const arm_compute::TensorShape shape = armcomputetensorutils::BuildArmComputeTensorShape(subTensorShape);

     arm_compute::Coordinates coords;
     coords.set_num_dimensions(subTensorShape.GetNumDimensions());
     for (unsigned int i = 0; i < subTensorShape.GetNumDimensions(); i++)
     {
         // Arm compute indexes tensor coords in reverse order.
         unsigned int revertedIndex = subTensorShape.GetNumDimensions() - i - 1;
         coords.set(i, armnn::numeric_cast<int>(subTensorOrigin[revertedIndex]));
     }

     const arm_compute::TensorShape parentShape = armcomputetensorutils::BuildArmComputeTensorShape(parent.GetShape());
     if (!::arm_compute::error_on_invalid_subtensor(__func__, __FILE__, __LINE__, parentShape, coords, shape))
     {
         return nullptr;
     }

     return std::make_unique<NeonSubTensorHandle>(
         PolymorphicDowncast<IAclTensorHandle*>(&parent), shape, coords);
 }

 std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,
                                                                        const bool IsMemoryManaged) const
 {
     auto tensorHandle = std::make_unique<NeonTensorHandle>(tensorInfo);
     if (IsMemoryManaged)
     {
         tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());
     }
     return tensorHandle;
 }

 std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,
                                                                        DataLayout dataLayout,
                                                                        const bool IsMemoryManaged) const
 {
     auto tensorHandle = std::make_unique<NeonTensorHandle>(tensorInfo, dataLayout);
     if (IsMemoryManaged)
     {
         tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());
     }
     return tensorHandle;
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateAbs(const AbsQueueDescriptor& descriptor,
                                                           const WorkloadInfo& info) const
 {
     IgnoreUnused(descriptor);

     ElementwiseUnaryQueueDescriptor elementwiseUnaryDescriptor;
     elementwiseUnaryDescriptor.m_Parameters = ElementwiseUnaryDescriptor(UnaryOperation::Abs);

     return CreateElementwiseUnary(elementwiseUnaryDescriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateActivation(const ActivationQueueDescriptor& descriptor,
                                                                  const WorkloadInfo&              info) const
 {
     return std::make_unique<NeonActivationWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateAddition(const AdditionQueueDescriptor& descriptor,
                                                                       const WorkloadInfo&            info) const
 {
     return std::make_unique<NeonAdditionWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateArgMinMax(const ArgMinMaxQueueDescriptor& descriptor,
                                                                 const WorkloadInfo& info) const
 {
     return std::make_unique<NeonArgMinMaxWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateBatchNormalization(
     const BatchNormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<NeonBatchNormalizationWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateBatchToSpaceNd(const BatchToSpaceNdQueueDescriptor& descriptor,
                                                                      const WorkloadInfo& info) const
 {
     return std::make_unique<NeonBatchToSpaceNdWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateComparison(const ComparisonQueueDescriptor& descriptor,
                                                                  const WorkloadInfo& info) const
 {
     return std::make_unique<NeonComparisonWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConcat(const ConcatQueueDescriptor& descriptor,
                                                                     const WorkloadInfo&          info) const
 {
     return std::make_unique<NeonConcatWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConstant(const ConstantQueueDescriptor& descriptor,
                                                                const WorkloadInfo& info) const
 {
     return std::make_unique<NeonConstantWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertBf16ToFp32(
     const ConvertBf16ToFp32QueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<NeonConvertBf16ToFp32Workload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp16ToFp32(
     const ConvertFp16ToFp32QueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<NeonConvertFp16ToFp32Workload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp32ToBf16(
     const ConvertFp32ToBf16QueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<NeonConvertFp32ToBf16Workload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp32ToFp16(
     const ConvertFp32ToFp16QueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<NeonConvertFp32ToFp16Workload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConvolution2d(
     const Convolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     bool isFastMathEnabled = false;
     if (m_ModelContextPtr)
     {
         if (m_ModelContextPtr.get() != nullptr)
         {
             auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());
             if (modelOptions)
             {
                 isFastMathEnabled = modelOptions->IsFastMathEnabled();
             }
         }
     }
     return std::make_unique<NeonConvolution2dWorkload>(descriptor,
                                                        info,
                                                        m_MemoryManager->GetIntraLayerManager(),
                                                        isFastMathEnabled);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDebug(const DebugQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDepthToSpace(const DepthToSpaceQueueDescriptor& descriptor,
                                                                    const WorkloadInfo& info) const
 {
     return std::make_unique<NeonDepthToSpaceWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDepthwiseConvolution2d(
     const DepthwiseConvolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<NeonDepthwiseConvolutionWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDequantize(const DequantizeQueueDescriptor& descriptor,
                                                                  const WorkloadInfo& info) const
 {
     return std::make_unique<NeonDequantizeWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDetectionPostProcess(
     const armnn::DetectionPostProcessQueueDescriptor& descriptor, const armnn::WorkloadInfo& info) const
 {
     return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateDivision(
     const DivisionQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<NeonDivisionWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateElementwiseUnary(
     const ElementwiseUnaryQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     switch(descriptor.m_Parameters.m_Operation)
     {
         case UnaryOperation::Abs:
         {
             AbsQueueDescriptor absQueueDescriptor;
             absQueueDescriptor.m_Inputs  = descriptor.m_Inputs;
             absQueueDescriptor.m_Outputs = descriptor.m_Outputs;

             return std::make_unique<NeonAbsWorkload>(absQueueDescriptor, info);
         }
         case UnaryOperation::Rsqrt:
         {
             RsqrtQueueDescriptor rsqrtQueueDescriptor;
             rsqrtQueueDescriptor.m_Inputs  = descriptor.m_Inputs;
             rsqrtQueueDescriptor.m_Outputs = descriptor.m_Outputs;

             return std::make_unique<NeonRsqrtWorkload>(rsqrtQueueDescriptor, info);
         }
         case UnaryOperation::Neg:
             return std::make_unique<NeonNegWorkload>(descriptor, info);
         case UnaryOperation::Exp:
             return std::make_unique<NeonExpWorkload>(descriptor, info);
         case UnaryOperation::LogicalNot:
             return std::make_unique<NeonLogicalNotWorkload>(descriptor, info);
         default:
             return nullptr;
     }
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateEqual(const EqualQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     IgnoreUnused(descriptor);

     ComparisonQueueDescriptor comparisonDescriptor;
     comparisonDescriptor.m_Parameters = ComparisonDescriptor(ComparisonOperation::Equal);

     return CreateComparison(comparisonDescriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateFill(const FillQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return std::make_unique<NeonFillWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateFloor(const FloorQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return MakeWorkloadHelper<NeonFloorFloatWorkload, NullWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateFullyConnected(
     const FullyConnectedQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<NeonFullyConnectedWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateGather(const armnn::GatherQueueDescriptor& descriptor,
                                                              const armnn::WorkloadInfo& info) const
 {
     return std::make_unique<NeonGatherWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateGreater(const GreaterQueueDescriptor& descriptor,
                                                               const WorkloadInfo& info) const
 {
     IgnoreUnused(descriptor);

     ComparisonQueueDescriptor comparisonDescriptor;
     comparisonDescriptor.m_Parameters = ComparisonDescriptor(ComparisonOperation::Greater);

     return CreateComparison(comparisonDescriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateInput(const InputQueueDescriptor& descriptor,
                                                             const WorkloadInfo&        info) const
 {
     return std::make_unique<CopyMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateInstanceNormalization(
     const InstanceNormalizationQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<NeonInstanceNormalizationWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateL2Normalization(const L2NormalizationQueueDescriptor& descriptor,
                                                                       const WorkloadInfo& info) const
 {
     return MakeWorkloadHelper<NeonL2NormalizationFloatWorkload, NullWorkload>(descriptor, info,
                                                                               m_MemoryManager->GetIntraLayerManager());
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLogSoftmax(const LogSoftmaxQueueDescriptor& descriptor,
                                                                  const WorkloadInfo& info) const
 {
     return std::make_unique<NeonLogSoftmaxWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLogicalBinary(const LogicalBinaryQueueDescriptor& descriptor,
                                                                     const WorkloadInfo& info) const
 {
     switch(descriptor.m_Parameters.m_Operation)
     {
         case LogicalBinaryOperation::LogicalAnd:
             return std::make_unique<NeonLogicalAndWorkload>(descriptor, info);
         case LogicalBinaryOperation::LogicalOr:
             return std::make_unique<NeonLogicalOrWorkload>(descriptor, info);
         default:
             return nullptr;
     }
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLstm(const LstmQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return MakeWorkloadHelper<NeonLstmFloatWorkload, NullWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMaximum(const MaximumQueueDescriptor& descriptor,
                                                               const WorkloadInfo& info) const
 {
     return std::make_unique<NeonMaximumWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMean(const MeanQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return std::make_unique<NeonMeanWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMemCopy(const MemCopyQueueDescriptor& descriptor,
                                                                      const WorkloadInfo&        info) const
 {
     if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])
     {
         throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemCopy workload");
     }

     return MakeWorkloadHelper<CopyMemGenericWorkload, CopyMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMemImport(const MemImportQueueDescriptor& descriptor,
                                                                        const WorkloadInfo&        info) const
 {
     if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])
     {
         throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemImport workload");
     }

     return std::make_unique<ImportMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMerger(const MergerQueueDescriptor& descriptor,
                                                                     const WorkloadInfo&          info) const
 {
     return CreateConcat(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMinimum(const MinimumQueueDescriptor& descriptor,
                                                               const WorkloadInfo& info) const
 {
     return std::make_unique<NeonMinimumWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMultiplication(
     const MultiplicationQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<NeonMultiplicationWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateNormalization(
     const NormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return MakeWorkloadHelper<NeonNormalizationFloatWorkload, NullWorkload>(descriptor, info,
                                                                             m_MemoryManager->GetIntraLayerManager());
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateOutput(const OutputQueueDescriptor& descriptor,
                                                              const WorkloadInfo& info) const
 {
     return std::make_unique<CopyMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreatePad(const PadQueueDescriptor& descriptor,
                                                           const WorkloadInfo& info) const
 {
     return std::make_unique<NeonPadWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePermute(const PermuteQueueDescriptor& descriptor,
                                                                      const WorkloadInfo& info) const
 {
     return std::make_unique<NeonPermuteWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePooling2d(const Pooling2dQueueDescriptor& descriptor,
                                                                        const WorkloadInfo& info) const
 {
     return std::make_unique<NeonPooling2dWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreatePreCompiled(const PreCompiledQueueDescriptor& descriptor,
                                                                   const WorkloadInfo& info) const
 {
     return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePrelu(const armnn::PreluQueueDescriptor &descriptor,
                                                                    const armnn::WorkloadInfo &info) const
 {
     return std::make_unique<NeonPreluWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateQLstm(const QLstmQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return std::make_unique<NeonQLstmWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateQuantize(const QuantizeQueueDescriptor& descriptor,
                                                                       const WorkloadInfo& info) const
 {
     return std::make_unique<NeonQuantizeWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateQuantizedLstm(const QuantizedLstmQueueDescriptor& descriptor,
                                                                     const WorkloadInfo& info) const
 {
     return std::make_unique<NeonQuantizedLstmWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateRank(const RankQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return std::make_unique<NeonRankWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateReduce(const ReduceQueueDescriptor& descriptor,
                                                              const WorkloadInfo& info) const
 {
     return std::make_unique<NeonReduceWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateReshape(const ReshapeQueueDescriptor& descriptor,
                                                               const WorkloadInfo& info) const
 {
     return std::make_unique<NeonReshapeWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateResize(const ResizeQueueDescriptor& descriptor,
                                                              const WorkloadInfo& info) const
 {
     return std::make_unique<NeonResizeWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateResizeBilinear(
     const ResizeBilinearQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     ResizeQueueDescriptor resizeDescriptor;
     resizeDescriptor.m_Inputs  = descriptor.m_Inputs;
     resizeDescriptor.m_Outputs = descriptor.m_Outputs;

     resizeDescriptor.m_Parameters.m_DataLayout   = descriptor.m_Parameters.m_DataLayout;
     resizeDescriptor.m_Parameters.m_TargetWidth  = descriptor.m_Parameters.m_TargetWidth;
     resizeDescriptor.m_Parameters.m_TargetHeight = descriptor.m_Parameters.m_TargetHeight;

     return CreateResize(resizeDescriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateRsqrt(const RsqrtQueueDescriptor &descriptor,
                                                             const WorkloadInfo &info) const
 {
     IgnoreUnused(descriptor);

     ElementwiseUnaryQueueDescriptor elementwiseUnaryDescriptor;
     elementwiseUnaryDescriptor.m_Parameters = ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt);

     return CreateElementwiseUnary(elementwiseUnaryDescriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSlice(const SliceQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return std::make_unique<NeonSliceWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSoftmax(const SoftmaxQueueDescriptor& descriptor,
                                                               const WorkloadInfo& info) const
 {
     return std::make_unique<NeonSoftmaxWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSpaceToBatchNd(const SpaceToBatchNdQueueDescriptor& descriptor,
                                                                      const WorkloadInfo& info) const
 {
     return std::make_unique<NeonSpaceToBatchNdWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSpaceToDepth(const SpaceToDepthQueueDescriptor& descriptor,
                                                                    const WorkloadInfo& info) const
 {
     return std::make_unique<NeonSpaceToDepthWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSplitter(const SplitterQueueDescriptor& descriptor,
                                                                const WorkloadInfo&            info) const
 {
     return std::make_unique<NeonSplitterWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateStack(const StackQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return std::make_unique<NeonStackWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateStridedSlice(const StridedSliceQueueDescriptor& descriptor,
                                                                    const WorkloadInfo& info) const
 {
     return std::make_unique<NeonStridedSliceWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateSubtraction(
     const SubtractionQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<NeonSubtractionWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateTranspose(const TransposeQueueDescriptor& descriptor,
                                                                        const WorkloadInfo& info) const
 {
     return std::make_unique<NeonTransposeWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateTransposeConvolution2d(
     const TransposeConvolution2dQueueDescriptor &descriptor,
     const WorkloadInfo &info) const
 {
     return std::make_unique<NeonTransposeConvolution2dWorkload>(descriptor, info,
                                                                 m_MemoryManager->GetIntraLayerManager());
 }

 } // namespace armnn
armnn::MultiplicationQueueDescriptor
Definition: WorkloadData.hpp:246

armnn::NeonWorkloadFactory::CreateDepthToSpace
std::unique_ptr< IWorkload > CreateDepthToSpace(const DepthToSpaceQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:248

MemCopyWorkload.hpp

armnn::InstanceNormalizationQueueDescriptor
Definition: WorkloadData.hpp:340

armnn::NeonWorkloadFactory::CreateDebug
std::unique_ptr< IWorkload > CreateDebug(const DebugQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:242

armnn::PermuteQueueDescriptor
Definition: WorkloadData.hpp:180

armnn::NeonWorkloadFactory::CreateLstm
std::unique_ptr< IWorkload > CreateLstm(const LstmQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:396

IgnoreUnused.hpp

armnn::ComparisonOperation::Greater

armnn::ElementwiseUnaryDescriptor::m_Operation
UnaryOperation m_Operation
Specifies the elementwiseUnary operation to execute.
Definition: Descriptors.hpp:114

armnn::QuantizeQueueDescriptor
Definition: WorkloadData.hpp:281

armnn::IConnectableLayer
Interface for a layer that is connectable to other layers via InputSlots and OutputSlots.
Definition: INetwork.hpp:62

armnn::NeonWorkloadFactory::CreateLogSoftmax
std::unique_ptr< IWorkload > CreateLogSoftmax(const LogSoftmaxQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:376

armnn::DataLayout
DataLayout
Definition: Types.hpp:50

armnn::MaximumQueueDescriptor
Definition: WorkloadData.hpp:264

armnn::DetectionPostProcessQueueDescriptor
Definition: WorkloadData.hpp:221

armnn::NeonWorkloadFactory::CreateGather
std::unique_ptr< IWorkload > CreateGather(const GatherQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:339

Utils.hpp

armnn::GatherQueueDescriptor
Definition: WorkloadData.hpp:497

armnn::NeonWorkloadFactory::CreateNormalization
std::unique_ptr< IWorkload > CreateNormalization(const NormalizationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:454

NeonWorkloads.hpp

armnn::Optional
Definition: Optional.hpp:270

armnn::ComparisonOperation::Equal

armnn::IBackendInternal
Definition: IBackendInternal.hpp:68

armnn::SplitterQueueDescriptor
Definition: WorkloadData.hpp:101

armnn::ConstantQueueDescriptor
Definition: WorkloadData.hpp:355

armnn::NeonWorkloadFactory::CreateFullyConnected
std::unique_ptr< IWorkload > CreateFullyConnected(const FullyConnectedQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:333

armnn::QuantizedLstmQueueDescriptor
Definition: WorkloadData.hpp:604

armnn::NeonWorkloadFactory::CreateComparison
std::unique_ptr< IWorkload > CreateComparison(const ComparisonQueueDescriptor &descriptor, const WorkloadInfo &Info) const override
Definition: NeonWorkloadFactory.cpp:175

armnn::NeonWorkloadFactory::CreateRsqrt
std::unique_ptr< IWorkload > CreateRsqrt(const RsqrtQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:554

armnn::NeonWorkloadFactory::CreatePad
std::unique_ptr< IWorkload > CreatePad(const PadQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:467

armnn::TensorInfo
Definition: Tensor.hpp:152

armnn::NeonWorkloadFactory::CreateTransposeConvolution2d
std::unique_ptr< IWorkload > CreateTransposeConvolution2d(const TransposeConvolution2dQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:619

armnn::ComparisonDescriptor
A ComparisonDescriptor for the ComparisonLayer.
Definition: Descriptors.hpp:78

armnn::ResizeBilinearDescriptor::m_TargetWidth
uint32_t m_TargetWidth
Target width value.
Definition: Descriptors.hpp:782

armnn::ResizeBilinearDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:786

armnn::ModelOptions
std::vector< BackendOptions > ModelOptions
Definition: BackendOptions.hpp:17

armnn::NeonWorkloadFactory::CreateGreater
std::unique_ptr< IWorkload > CreateGreater(const GreaterQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:345

armnn::LogicalBinaryOperation::LogicalAnd

armnn::ConvertBf16ToFp32QueueDescriptor
Definition: WorkloadData.hpp:439

armnn::NeonWorkloadFactory::CreateMemImport
std::unique_ptr< IWorkload > CreateMemImport(const MemImportQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:425

armnn::Coordinates
std::array< unsigned int, MaxNumOfTensorDimensions > Coordinates
Definition: InternalTypes.hpp:14

armnn::NeonBackendId
constexpr const char * NeonBackendId()
Definition: NeonBackendId.hpp:10

armnn::NeonWorkloadFactory::CreateL2Normalization
std::unique_ptr< IWorkload > CreateL2Normalization(const L2NormalizationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:369

armnn::NeonWorkloadFactory::CreateConvertFp16ToFp32
std::unique_ptr< IWorkload > CreateConvertFp16ToFp32(const ConvertFp16ToFp32QueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:200

armnn::NeonWorkloadFactory::CreateStridedSlice
std::unique_ptr< IWorkload > CreateStridedSlice(const StridedSliceQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:601

armnn::NeonWorkloadFactory::CreateMinimum
std::unique_ptr< IWorkload > CreateMinimum(const MinimumQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:442

NeonTensorHandle.hpp

armnn::StackQueueDescriptor
Definition: WorkloadData.hpp:142

armnn::NeonWorkloadFactory::CreateMultiplication
std::unique_ptr< IWorkload > CreateMultiplication(const MultiplicationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:448

armnn::ActivationFunction::Abs

armnn::RsqrtQueueDescriptor
Definition: WorkloadData.hpp:492

armnn::NeonWorkloadFactory::CreateQuantize
std::unique_ptr< IWorkload > CreateQuantize(const QuantizeQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:503

armnn::NeonBackendModelContext::IsFastMathEnabled
bool IsFastMathEnabled() const
Definition: NeonBackendModelContext.cpp:53

armnn::AdditionQueueDescriptor
Definition: WorkloadData.hpp:240

armnn::MinimumQueueDescriptor
Definition: WorkloadData.hpp:470

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_software_tools.dox:6

armnn::FullyConnectedQueueDescriptor
Definition: WorkloadData.hpp:165

MakeWorkloadHelper.hpp

armnn::IgnoreUnused
void IgnoreUnused(Ts &&...)
Definition: IgnoreUnused.hpp:14

armnn::NeonWorkloadFactory::CreateSubTensorHandle
std::unique_ptr< ITensorHandle > CreateSubTensorHandle(ITensorHandle &parent, TensorShape const &subTensorShape, unsigned int const *subTensorOrigin) const override
Definition: NeonWorkloadFactory.cpp:86

armnn::PreluQueueDescriptor
Definition: WorkloadData.hpp:529

armnn::EqualQueueDescriptor
Definition: WorkloadData.hpp:287

armnn::UnaryOperation::Neg

armnn::TensorShape
Definition: Tensor.hpp:20

armnn::NeonWorkloadFactory::CreateConvolution2d
std::unique_ptr< IWorkload > CreateConvolution2d(const Convolution2dQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:221

armnn::BatchToSpaceNdQueueDescriptor
Definition: WorkloadData.hpp:459

armnn::SoftmaxQueueDescriptor
Definition: WorkloadData.hpp:95

armnn::DivisionQueueDescriptor
Definition: WorkloadData.hpp:252

armnn::NeonBackendModelContext::GetNumberOfThreads
unsigned int GetNumberOfThreads() const
Definition: NeonBackendModelContext.cpp:58

armnn::QueueDescriptorWithParameters::m_Parameters
LayerDescriptor m_Parameters
Definition: WorkloadData.hpp:57

armnn::LogicalBinaryDescriptor::m_Operation
LogicalBinaryOperation m_Operation
Specifies the logical operation to execute.
Definition: Descriptors.hpp:1300

armnn::SubtractionQueueDescriptor
Definition: WorkloadData.hpp:258

armnn::NeonBackendModelContext
The NeonBackendModelContext is used to pass in Neon specific backend ModelOptions.
Definition: NeonBackendModelContext.hpp:19

armnn::PadQueueDescriptor
Definition: WorkloadData.hpp:276

armnn::ConcatQueueDescriptor
Definition: WorkloadData.hpp:120

armnn::UnaryOperation::LogicalNot

NumericCast.hpp

MemImportWorkload.hpp

armnn::SpaceToDepthQueueDescriptor
Definition: WorkloadData.hpp:377

armnn::NeonWorkloadFactory::NeonWorkloadFactory
NeonWorkloadFactory(const std::shared_ptr< NeonMemoryManager > &memoryManager)
Definition: NeonWorkloadFactory.cpp:73

armnn::AbsQueueDescriptor
Definition: WorkloadData.hpp:641

armnn::NeonWorkloadFactory::CreateReshape
std::unique_ptr< IWorkload > CreateReshape(const ReshapeQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:527

armnn::ResizeQueueDescriptor
Definition: WorkloadData.hpp:321

PolymorphicDowncast.hpp

armnn::NeonWorkloadFactory::IsLayerSupported
static bool IsLayerSupported(const Layer &layer, Optional< DataType > dataType, std::string &outReasonIfUnsupported)
Definition: NeonWorkloadFactory.cpp:34

armnn::SpaceToBatchNdQueueDescriptor
Definition: WorkloadData.hpp:372

armnn::NeonWorkloadFactory::CreateAbs
std::unique_ptr< IWorkload > CreateAbs(const AbsQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:134

armnn::FloorQueueDescriptor
Definition: WorkloadData.hpp:382

armnn::NeonWorkloadFactory::CreateConvertFp32ToFp16
std::unique_ptr< IWorkload > CreateConvertFp32ToFp16(const ConvertFp32ToFp16QueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:214

NeonBackendModelContext.hpp

armnn::NeonWorkloadFactory::CreateSoftmax
std::unique_ptr< IWorkload > CreateSoftmax(const SoftmaxQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:571

armnn::NeonWorkloadFactory::CreateResizeBilinear
std::unique_ptr< IWorkload > CreateResizeBilinear(const ResizeBilinearQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:539

armnn::ResizeBilinearQueueDescriptor
Definition: WorkloadData.hpp:316

armnn::LstmQueueDescriptor
Definition: WorkloadData.hpp:387

armnn::NeonWorkloadFactory::CreateEqual
std::unique_ptr< IWorkload > CreateEqual(const EqualQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:310

armnn::NeonWorkloadFactory::CreateSlice
std::unique_ptr< IWorkload > CreateSlice(const SliceQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:565

armnn::IBackendInternal::IBackendSpecificModelContextPtr
std::shared_ptr< IBackendModelContext > IBackendSpecificModelContextPtr
Definition: IBackendInternal.hpp:89

armnn::NeonWorkloadFactory::CreateQuantizedLstm
std::unique_ptr< IWorkload > CreateQuantizedLstm(const QuantizedLstmQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:509

armnn::GreaterQueueDescriptor
Definition: WorkloadData.hpp:476

armnn::ITensorHandle
Definition: ITensorHandle.hpp:15

armnn::ComparisonQueueDescriptor
Definition: WorkloadData.hpp:656

armnn::ResizeDescriptor::m_TargetWidth
uint32_t m_TargetWidth
Target width value.
Definition: Descriptors.hpp:816

armnn::NeonWorkloadFactory::GetBackendId
const BackendId & GetBackendId() const override
Definition: NeonWorkloadFactory.cpp:49

armnn::NeonWorkloadFactory::CreateSplitter
std::unique_ptr< IWorkload > CreateSplitter(const SplitterQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:589

armnn::ConvertFp16ToFp32QueueDescriptor
Definition: WorkloadData.hpp:449

armnn::NeonWorkloadFactory::CreateFill
std::unique_ptr< IWorkload > CreateFill(const FillQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:321

NeonWorkloadUtils.hpp

armnn::NeonWorkloadFactory::CreateDequantize
std::unique_ptr< IWorkload > CreateDequantize(const DequantizeQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:260

armnn::NeonWorkloadFactory::CreateMemCopy
std::unique_ptr< IWorkload > CreateMemCopy(const MemCopyQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:414

armnn::IWorkloadFactory::IsLayerSupported
static bool IsLayerSupported(const BackendId &backendId, const IConnectableLayer &layer, Optional< DataType > dataType, std::string &outReasonIfUnsupported)
Definition: WorkloadFactory.cpp:1246

armnn::ReduceQueueDescriptor
Definition: WorkloadData.hpp:671

armnn::InvalidArgumentException
Definition: Exceptions.hpp:80

armnn::ITensorHandle::GetShape
virtual TensorShape GetShape() const =0
Get the number of elements for each dimension ordered from slowest iterating dimension to fastest ite...

armnn::NeonWorkloadFactory::CreateInstanceNormalization
std::unique_ptr< IWorkload > CreateInstanceNormalization(const InstanceNormalizationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:362

armnn::ResizeBilinearDescriptor::m_TargetHeight
uint32_t m_TargetHeight
Target height value.
Definition: Descriptors.hpp:784

armnn::RankQueueDescriptor
Definition: WorkloadData.hpp:311

armnn::ResizeDescriptor::m_TargetHeight
uint32_t m_TargetHeight
Target height value.
Definition: Descriptors.hpp:818

armnn::LogicalBinaryQueueDescriptor
Definition: WorkloadData.hpp:666

armnn::NeonWorkloadFactory::CreatePreCompiled
std::unique_ptr< IWorkload > CreatePreCompiled(const PreCompiledQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:485

armnn::NeonWorkloadFactory::CreateLogicalBinary
std::unique_ptr< IWorkload > CreateLogicalBinary(const LogicalBinaryQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:382

armnn::NeonWorkloadFactory::CreateOutput
std::unique_ptr< IWorkload > CreateOutput(const OutputQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:461

armnn::ConvertFp32ToFp16QueueDescriptor
Definition: WorkloadData.hpp:454

armnn::NeonWorkloadFactory::CreateConvertFp32ToBf16
std::unique_ptr< IWorkload > CreateConvertFp32ToBf16(const ConvertFp32ToBf16QueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:207

armnn::NeonWorkloadFactory::CreateConstant
std::unique_ptr< IWorkload > CreateConstant(const ConstantQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:187

armnn::NeonWorkloadFactory::CreateStack
std::unique_ptr< IWorkload > CreateStack(const StackQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:595

armnn::NeonWorkloadFactory::CreateFloor
std::unique_ptr< IWorkload > CreateFloor(const FloorQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:327

NeonBackendId.hpp

CpuTensorHandle.hpp

armnn::TransposeConvolution2dQueueDescriptor
Definition: WorkloadData.hpp:534

armnn::Convolution2dQueueDescriptor
Definition: WorkloadData.hpp:192

armnn::NeonWorkloadFactory::CreateActivation
std::unique_ptr< IWorkload > CreateActivation(const ActivationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:145

armnn::NeonWorkloadFactory::CreateDepthwiseConvolution2d
std::unique_ptr< IWorkload > CreateDepthwiseConvolution2d(const DepthwiseConvolution2dQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:254

armnn::MemCopyQueueDescriptor
Definition: WorkloadData.hpp:76

armnn::FillQueueDescriptor
Definition: WorkloadData.hpp:159

armnn::SliceQueueDescriptor
Definition: WorkloadData.hpp:646

Layer.hpp

armnn::ElementwiseUnaryDescriptor
A ElementwiseUnaryDescriptor for the ElementwiseUnaryLayer.
Definition: Descriptors.hpp:98

armnn::DepthToSpaceQueueDescriptor
Definition: WorkloadData.hpp:651

armnn::L2NormalizationQueueDescriptor
Definition: WorkloadData.hpp:345

armnn::TransposeQueueDescriptor
Definition: WorkloadData.hpp:547

armnn::QueueDescriptor::m_Outputs
std::vector< ITensorHandle * > m_Outputs
Definition: WorkloadData.hpp:31

armnn::StridedSliceQueueDescriptor
Definition: WorkloadData.hpp:464

armnn::QLstmQueueDescriptor
Definition: WorkloadData.hpp:552

armnn::NeonWorkloadFactory::CreateMerger
std::unique_ptr< IWorkload > CreateMerger(const MergerQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:436

armnn::BoostLogSeverityMapping::info

armnn::ArgMinMaxQueueDescriptor
Definition: WorkloadData.hpp:153

armnn::NeonWorkloadFactory::CreateDivision
std::unique_ptr< IWorkload > CreateDivision(const DivisionQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:272

armnn::TensorShape::GetNumDimensions
unsigned int GetNumDimensions() const
Function that returns the tensor rank.
Definition: Tensor.cpp:174

armnn::NeonWorkloadFactory::CreateReduce
std::unique_ptr< IWorkload > CreateReduce(const ReduceQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:521

armnn::NeonWorkloadFactory::CreateInput
std::unique_ptr< IWorkload > CreateInput(const InputQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:356

armnn::BatchNormalizationQueueDescriptor
Definition: WorkloadData.hpp:293

armnn::MemImportQueueDescriptor
Definition: WorkloadData.hpp:84

armnn::NeonWorkloadFactory::CreateQLstm
std::unique_ptr< IWorkload > CreateQLstm(const QLstmQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:497

armnn::ConvertFp32ToBf16QueueDescriptor
Definition: WorkloadData.hpp:444

armnn::NeonWorkloadFactory::CreateBatchNormalization
std::unique_ptr< IWorkload > CreateBatchNormalization(const BatchNormalizationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:163

armnn::NeonWorkloadFactory::CreateElementwiseUnary
std::unique_ptr< IWorkload > CreateElementwiseUnary(const ElementwiseUnaryQueueDescriptor &descriptor, const WorkloadInfo &Info) const override
Definition: NeonWorkloadFactory.cpp:278

armnn::WorkloadInfo
Contains information about inputs and outputs to a layer.
Definition: WorkloadInfo.hpp:16

armnn::NeonWorkloadFactory::CreateResize
std::unique_ptr< IWorkload > CreateResize(const ResizeQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:533

armnn::LogicalBinaryOperation::LogicalOr

armnn::QueueDescriptor::m_Inputs
std::vector< ITensorHandle * > m_Inputs
Definition: WorkloadData.hpp:30

armnn::NeonWorkloadFactory::CreateConcat
std::unique_ptr< IWorkload > CreateConcat(const ConcatQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:181

armnn::NeonWorkloadFactory::CreatePooling2d
std::unique_ptr< IWorkload > CreatePooling2d(const Pooling2dQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:479

NeonWorkloadFactory.hpp

armnn::PreCompiledQueueDescriptor
Definition: WorkloadData.hpp:502

armnn::NeonWorkloadFactory::CreateBatchToSpaceNd
std::unique_ptr< IWorkload > CreateBatchToSpaceNd(const BatchToSpaceNdQueueDescriptor &descriptor, const WorkloadInfo &Info) const override
Definition: NeonWorkloadFactory.cpp:169

armnn::NeonWorkloadFactory::CreateAddition
std::unique_ptr< IWorkload > CreateAddition(const AdditionQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:151

armnn::NeonWorkloadFactory::CreateDetectionPostProcess
std::unique_ptr< IWorkload > CreateDetectionPostProcess(const DetectionPostProcessQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:266

armnn::DequantizeQueueDescriptor
Definition: WorkloadData.hpp:514

armnn::Pooling2dQueueDescriptor
Definition: WorkloadData.hpp:186

armnn::NeonWorkloadFactory::CreateSubtraction
std::unique_ptr< IWorkload > CreateSubtraction(const SubtractionQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:607

armnn::NeonWorkloadFactory::CreateMaximum
std::unique_ptr< IWorkload > CreateMaximum(const MaximumQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:402

armnn::UnaryOperation::Exp

armnn::UnaryOperation::Rsqrt

armnn::ResizeDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:823

armnn::NeonWorkloadFactory::CreateMean
std::unique_ptr< IWorkload > CreateMean(const MeanQueueDescriptor &descriptor, const WorkloadInfo &Info) const override
Definition: NeonWorkloadFactory.cpp:408

armnn::MeanQueueDescriptor
Definition: WorkloadData.hpp:270

armnn::NeonWorkloadFactory::CreateConvertBf16ToFp32
std::unique_ptr< IWorkload > CreateConvertBf16ToFp32(const ConvertBf16ToFp32QueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:193

armnn::LogSoftmaxQueueDescriptor
Definition: WorkloadData.hpp:350

armnn::NeonWorkloadFactory::CreateRank
std::unique_ptr< IWorkload > CreateRank(const RankQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:515

armnn::NeonWorkloadFactory::CreateArgMinMax
std::unique_ptr< IWorkload > CreateArgMinMax(const ArgMinMaxQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:157

armnn::NeonWorkloadFactory::CreatePrelu
std::unique_ptr< IWorkload > CreatePrelu(const PreluQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:491

armnn::ReshapeQueueDescriptor
Definition: WorkloadData.hpp:367

armnn::DebugQueueDescriptor
Definition: WorkloadData.hpp:481

armnn::ElementwiseUnaryQueueDescriptor
Definition: WorkloadData.hpp:661

armnn::NeonWorkloadFactory::CreateTranspose
std::unique_ptr< IWorkload > CreateTranspose(const TransposeQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:613

armnn::NeonWorkloadFactory::CreateSpaceToBatchNd
std::unique_ptr< IWorkload > CreateSpaceToBatchNd(const SpaceToBatchNdQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:577

armnn::Layer
Definition: Layer.hpp:210

armnn::DepthwiseConvolution2dQueueDescriptor
Definition: WorkloadData.hpp:207

armnn::ActivationQueueDescriptor
Definition: WorkloadData.hpp:148

armnn::NeonWorkloadFactory::CreateSpaceToDepth
std::unique_ptr< IWorkload > CreateSpaceToDepth(const SpaceToDepthQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:583

armnn::NeonWorkloadFactory::CreatePermute
std::unique_ptr< IWorkload > CreatePermute(const PermuteQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: NeonWorkloadFactory.cpp:473

armnn::NeonWorkloadFactory::CreateTensorHandle
std::unique_ptr< ITensorHandle > CreateTensorHandle(const TensorInfo &tensorInfo, const bool IsMemoryManaged=true) const override
Definition: NeonWorkloadFactory.cpp:111

armnn::BackendId
Definition: BackendId.hpp:75

armnn::NormalizationQueueDescriptor
Definition: WorkloadData.hpp:234