plain/21.11/_cl_workload_factory_8cpp_source.xhtml

 //
 // Copyright © 2017 Arm Ltd and Contributors. All rights reserved.
 // SPDX-License-Identifier: MIT
 //
 #include "ClWorkloadFactory.hpp"
 #include "ClBackendId.hpp"
 #include "ClBackendModelContext.hpp"
 #include "ClContextDeserializer.hpp"
 #include "ClContextSerializer.hpp"

 #include <Layer.hpp>

 #include <armnn/Exceptions.hpp>
 #include <armnn/Logging.hpp>
 #include <armnn/Utils.hpp>
 #include <armnn/utility/IgnoreUnused.hpp>
 #include <armnn/utility/NumericCast.hpp>
 #include <armnn/utility/PolymorphicDowncast.hpp>

 #include <backendsCommon/MakeWorkloadHelper.hpp>
 #include <backendsCommon/MemCopyWorkload.hpp>
 #include <backendsCommon/MemImportWorkload.hpp>
 #include <backendsCommon/TensorHandle.hpp>

 #include <cl/ClTensorHandle.hpp>
 #include <cl/workloads/ClWorkloads.hpp>
 #include <cl/workloads/ClWorkloadUtils.hpp>

 #include <arm_compute/core/CL/CLKernelLibrary.h>
 #include <arm_compute/runtime/CL/CLBufferAllocator.h>
 #include <arm_compute/runtime/CL/CLScheduler.h>

 #include <armnnUtils/Filesystem.hpp>
 #include <fstream>

 #include <sys/stat.h>

 namespace armnn
 {

 namespace
 {
 static const BackendId s_Id{ClBackendId()};
 }

 bool ClWorkloadFactory::IsLayerSupported(const Layer& layer,
                                          Optional<DataType> dataType,
                                          std::string& outReasonIfUnsupported)
 {
     return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported);
 }

 bool ClWorkloadFactory::IsLayerSupported(const IConnectableLayer& layer,
                                          Optional<DataType> dataType,
                                          std::string& outReasonIfUnsupported,
                                          const ModelOptions& modelOptions)
 {
     return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported, modelOptions);
 }

 const BackendId& ClWorkloadFactory::GetBackendId() const
 {
     return s_Id;
 }

 void ClWorkloadFactory::AfterWorkloadsCreated()
 {
     if(m_ModelContextPtr)
     {
         auto modelOptions = dynamic_cast<ClBackendModelContext*>(m_ModelContextPtr.get());
         if (modelOptions->SaveCachedNetwork())
         {
             ClContextSerializer serializer;
             serializer.Serialize(m_CLCompileContext);
             auto cachedFd = modelOptions->GetCachedFileDescriptor();
             if (cachedFd != -1)
             {
                 std::vector<uint8_t> compiledContextData;
                 std::stringstream stream;
                 bool serialized = serializer.SaveSerializedToStream(stream);
                 if (serialized)
                 {
                     std::string const serializedString{stream.str()};
                     std::copy(serializedString.begin(),
                               serializedString.end(),
                               std::back_inserter(compiledContextData));
                     auto success = write(cachedFd, compiledContextData.data(), compiledContextData.size());
                     if (success == -1)
                     {
                         ARMNN_LOG(info) << "ClWorkloadFactory:: Could not cache the compiled context!";
                     }
                 }
             }

             // Save map to a filepath provided in ModelOptions
             auto filePath = modelOptions->GetCachedNetworkFilePath();
             if (filePath != "" && fs::exists(filePath) && fs::is_regular_file(filePath))
             {
                 // Serialize ClContext to the file specified
                 std::ofstream file(filePath, std::ios::out | std::ios::binary);
                 serializer.SaveSerializedToStream(file);
             }
         }
     }
 }

 template <typename FloatWorkload, typename Uint8Workload, typename QueueDescriptorType, typename... Args>
 std::unique_ptr<IWorkload> ClWorkloadFactory::MakeWorkload(const QueueDescriptorType& descriptor,
                                                            const WorkloadInfo& info,
                                                            Args&&... args)
 {
     try
     {
         return MakeWorkloadHelper<FloatWorkload, Uint8Workload>(descriptor, info, std::forward<Args>(args)...);
     }
     catch (const cl::Error& clError)
     {
         throw WrapClError(clError, CHECK_LOCATION());
     }
 }

 template <typename Workload, typename QueueDescriptorType, typename... Args>
 std::unique_ptr<IWorkload> ClWorkloadFactory::MakeWorkload(const QueueDescriptorType& descriptor,
                                                            const WorkloadInfo& info,
                                                            Args&&... args)
 {
     try
     {
         return std::make_unique<Workload>(descriptor, info, std::forward<Args>(args)...);
     }
     catch (const cl::Error& clError)
     {
         throw WrapClError(clError, CHECK_LOCATION());
     }
 }

 void ClWorkloadFactory::InitializeCLCompileContext()
 {
     // Initialize our m_CLCompileContext using default device and context
     auto context = arm_compute::CLKernelLibrary::get().context();
     auto device  = arm_compute::CLKernelLibrary::get().get_device();
     m_CLCompileContext = arm_compute::CLCompileContext(context, device);

     if (m_ModelContextPtr)
     {
         // Load saved programs if the user has set a filepath
         auto modelOptions = dynamic_cast<ClBackendModelContext*>(m_ModelContextPtr.get());
         auto filePath = modelOptions->GetCachedNetworkFilePath();
         if (!(modelOptions->SaveCachedNetwork()))
         {
             ClContextDeserializer deserializer;
             auto cachedFd = modelOptions->GetCachedFileDescriptor();
             if (cachedFd != -1)
             {
                 struct stat statBuffer;
                 if (fstat(cachedFd, &statBuffer) == 0)
                 {
                     long dataSize = static_cast<long>(statBuffer.st_size);
                     if( dataSize > 0)
                     {
                         auto offset = lseek(cachedFd, 0, SEEK_CUR);
                         if (offset == 0)
                         {
                             std::vector <uint8_t> compiledContextData(static_cast<unsigned int>(dataSize));
                             auto success = pread(cachedFd, compiledContextData.data(), compiledContextData.size(), 0);
                             if (success != -1)
                             {
                                 deserializer.DeserializeFromBinary(m_CLCompileContext,
                                                                    context,
                                                                    device,
                                                                    compiledContextData);
                             }
                         }
                     }

                 }
             }

             if (filePath != "" && fs::exists(filePath) && fs::is_regular_file(filePath))
             {
                 // Deserialize binary file and load into m_CLCompileContext
                 deserializer.Deserialize(m_CLCompileContext, context, device, filePath);
             }
         }
     }
 }

 ClWorkloadFactory::ClWorkloadFactory(const std::shared_ptr<ClMemoryManager>& memoryManager)
     : m_MemoryManager(memoryManager), m_ModelContextPtr(IBackendInternal::IBackendSpecificModelContextPtr{})
 {
     InitializeCLCompileContext();
 }

 ClWorkloadFactory::ClWorkloadFactory(const std::shared_ptr<ClMemoryManager>& memoryManager,
                                      const IBackendInternal::IBackendSpecificModelContextPtr& modelContextPtr)
     : m_MemoryManager(memoryManager), m_ModelContextPtr(modelContextPtr)
 {
     InitializeCLCompileContext();
 }

 std::unique_ptr<ITensorHandle> ClWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,
                                                                      const bool IsMemoryManaged) const
 {
     IgnoreUnused(IsMemoryManaged);
     std::unique_ptr<ClTensorHandle> tensorHandle = std::make_unique<ClTensorHandle>(tensorInfo);
     tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());

     return tensorHandle;
 }

 std::unique_ptr<ITensorHandle> ClWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,
                                                                      DataLayout dataLayout,
                                                                      const bool IsMemoryManaged) const
 {
     IgnoreUnused(IsMemoryManaged);
     std::unique_ptr<ClTensorHandle> tensorHandle = std::make_unique<ClTensorHandle>(tensorInfo, dataLayout);
     tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());

     return tensorHandle;
 }

 std::unique_ptr<ITensorHandle> ClWorkloadFactory::CreateSubTensorHandle(ITensorHandle& parent,
                                                                         TensorShape const& subTensorShape,
                                                                         unsigned int const* subTensorOrigin) const
 {
     arm_compute::Coordinates coords;
     arm_compute::TensorShape shape = armcomputetensorutils::BuildArmComputeTensorShape(subTensorShape);

     coords.set_num_dimensions(subTensorShape.GetNumDimensions());
     for (unsigned int i = 0; i < subTensorShape.GetNumDimensions(); i++)
     {
         // Arm compute indexes tensor coords in reverse order.
         unsigned int revertedIndex = subTensorShape.GetNumDimensions() - i - 1;
         coords.set(i, armnn::numeric_cast<int>(subTensorOrigin[revertedIndex]));
     }

     const arm_compute::TensorShape parentShape = armcomputetensorutils::BuildArmComputeTensorShape(parent.GetShape());
     if (!::arm_compute::error_on_invalid_subtensor(__func__, __FILE__, __LINE__, parentShape, coords, shape))
     {
         return nullptr;
     }

     return std::make_unique<ClSubTensorHandle>(
         PolymorphicDowncast<IClTensorHandle*>(&parent), shape, coords);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateActivation(const ActivationQueueDescriptor& descriptor,
                                                                const WorkloadInfo& info) const
 {
     return MakeWorkload<ClActivationWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateAddition(const AdditionQueueDescriptor& descriptor,
                                                              const WorkloadInfo& info) const
 {
     return MakeWorkload<ClAdditionWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateArgMinMax(const ArgMinMaxQueueDescriptor& descriptor,
                                                               const WorkloadInfo& info) const
 {
     return std::make_unique<ClArgMinMaxWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateBatchNormalization(
     const BatchNormalizationQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return MakeWorkload<ClBatchNormalizationFloatWorkload, NullWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateBatchToSpaceNd(const BatchToSpaceNdQueueDescriptor& descriptor,
                                                                    const WorkloadInfo& info) const
 {
     return MakeWorkload<ClBatchToSpaceNdWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateCast(const CastQueueDescriptor& descriptor,
                                                          const WorkloadInfo& info) const
 {
     return MakeWorkload<ClCastWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateChannelShuffle(const ChannelShuffleQueueDescriptor& descriptor,
                                                                    const WorkloadInfo& info) const
 {
     return MakeWorkload<ClChannelShuffleWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateComparison(const ComparisonQueueDescriptor& descriptor,
                                                                const WorkloadInfo& info) const
 {
     return MakeWorkload<ClComparisonWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateConcat(const ConcatQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return MakeWorkload<ClConcatWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateConstant(const ConstantQueueDescriptor& descriptor,
                                                              const WorkloadInfo& info) const
 {
     return MakeWorkload<ClConstantWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateConvertFp16ToFp32(
     const ConvertFp16ToFp32QueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return MakeWorkload<ClConvertFp16ToFp32Workload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateConvertFp32ToFp16(
     const ConvertFp32ToFp16QueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return MakeWorkload<ClConvertFp32ToFp16Workload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateConvolution2d(const Convolution2dQueueDescriptor& descriptor,
                                                                   const WorkloadInfo& info) const
 {
     bool isFastMathEnabled = false;
     if (m_ModelContextPtr)
     {
         if (m_ModelContextPtr.get() != nullptr)
         {
             auto modelOptions = dynamic_cast<ClBackendModelContext*>(m_ModelContextPtr.get());
             if (modelOptions)
             {
                 isFastMathEnabled = modelOptions->IsFastMathEnabled();
             }
         }
     }
     return MakeWorkload<ClConvolution2dWorkload>(descriptor,
                                                  info,
                                                  m_MemoryManager->GetIntraLayerManager(),
                                                  m_CLCompileContext,
                                                  isFastMathEnabled);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateConvolution3d(const Convolution3dQueueDescriptor& descriptor,
                                                                   const WorkloadInfo& info) const
 {
     bool isFastMathEnabled = false;
     if (m_ModelContextPtr)
     {
         if (m_ModelContextPtr.get() != nullptr)
         {
             auto modelOptions = dynamic_cast<ClBackendModelContext*>(m_ModelContextPtr.get());
             if (modelOptions)
             {
                 isFastMathEnabled = modelOptions->IsFastMathEnabled();
             }
         }
     }
     return MakeWorkload<ClConvolution3dWorkload>(descriptor,
                                                  info,
                                                  m_MemoryManager->GetIntraLayerManager(),
                                                  m_CLCompileContext,
                                                  isFastMathEnabled);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateDebug(const DebugQueueDescriptor& descriptor,
                                                           const WorkloadInfo& info) const
 {
     return MakeWorkload<NullWorkload, NullWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateDepthToSpace(const DepthToSpaceQueueDescriptor& descriptor,
                                                                  const WorkloadInfo& info) const
 {
     return MakeWorkload<ClDepthToSpaceWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateDepthwiseConvolution2d(
     const DepthwiseConvolution2dQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return MakeWorkload<ClDepthwiseConvolutionWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateDequantize(const DequantizeQueueDescriptor& descriptor,
                                                                const WorkloadInfo& info) const
 {
     return MakeWorkload<ClDequantizeWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateDetectionPostProcess(
     const DetectionPostProcessQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return MakeWorkload<NullWorkload, NullWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateDivision(const DivisionQueueDescriptor& descriptor,
                                                              const WorkloadInfo& info) const
 {
     return std::make_unique<ClDivisionWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateElementwiseUnary(const ElementwiseUnaryQueueDescriptor& descriptor,
                                                                      const WorkloadInfo& info) const
 {
     switch(descriptor.m_Parameters.m_Operation)
     {
         case UnaryOperation::Abs:
         {
             AbsQueueDescriptor absQueueDescriptor;
             absQueueDescriptor.m_Inputs  = descriptor.m_Inputs;
             absQueueDescriptor.m_Outputs = descriptor.m_Outputs;

             return  std::make_unique<ClAbsWorkload>(absQueueDescriptor, info, m_CLCompileContext);
         }
         case UnaryOperation::Exp:
             return std::make_unique<ClExpWorkload>(descriptor, info, m_CLCompileContext);
          case UnaryOperation::Log:
             return std::make_unique<ClLogWorkload>(descriptor, info, m_CLCompileContext);
         case UnaryOperation::LogicalNot:
             return std::make_unique<ClLogicalNotWorkload>(descriptor, info, m_CLCompileContext);
         case UnaryOperation::Neg:
             return std::make_unique<ClNegWorkload>(descriptor, info, m_CLCompileContext);
         case UnaryOperation::Rsqrt:
         {
             RsqrtQueueDescriptor rsqrtQueueDescriptor;
             rsqrtQueueDescriptor.m_Inputs  = descriptor.m_Inputs;
             rsqrtQueueDescriptor.m_Outputs = descriptor.m_Outputs;

             return std::make_unique<ClRsqrtWorkload>(rsqrtQueueDescriptor, info, m_CLCompileContext);
         }
         case UnaryOperation::Sin:
             return std::make_unique<ClSinWorkload>(descriptor, info, m_CLCompileContext);
         default:
             return nullptr;
     }
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateFill(const FillQueueDescriptor& descriptor,
                                                          const WorkloadInfo& info) const
 {
     return std::make_unique<ClFillWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateFloor(const FloorQueueDescriptor& descriptor,
                                                           const WorkloadInfo& info) const
 {
     return MakeWorkload<ClFloorFloatWorkload, NullWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateFullyConnected(const FullyConnectedQueueDescriptor& descriptor,
                                                                    const WorkloadInfo& info) const
 {
     return MakeWorkload<ClFullyConnectedWorkload>(descriptor,
                                                   info,
                                                   m_MemoryManager->GetIntraLayerManager(),
                                                   m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateGather(const GatherQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return MakeWorkload<ClGatherWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateInput(const InputQueueDescriptor& descriptor,
                                                           const WorkloadInfo& info) const
 {
     return std::make_unique<CopyMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateInstanceNormalization(
     const InstanceNormalizationQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return MakeWorkload<ClInstanceNormalizationWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateL2Normalization(const L2NormalizationQueueDescriptor& descriptor,
                                                                     const WorkloadInfo& info) const
 {
     return MakeWorkload<ClL2NormalizationFloatWorkload, NullWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateLogicalBinary(const LogicalBinaryQueueDescriptor& descriptor,
                                                                   const WorkloadInfo& info) const
 {
     switch(descriptor.m_Parameters.m_Operation)
     {
         case LogicalBinaryOperation::LogicalAnd:
             return std::make_unique<ClLogicalAndWorkload>(descriptor, info, m_CLCompileContext);
         case LogicalBinaryOperation::LogicalOr:
             return std::make_unique<ClLogicalOrWorkload>(descriptor, info, m_CLCompileContext);
         default:
             return nullptr;
     }
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateLogSoftmax(const LogSoftmaxQueueDescriptor& descriptor,
                                                                const WorkloadInfo& info) const
 {
     return MakeWorkload<ClLogSoftmaxWorkload>(descriptor,
                                               info,
                                               m_MemoryManager->GetIntraLayerManager(),
                                               m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateLstm(const LstmQueueDescriptor& descriptor,
                                                          const WorkloadInfo& info) const
 {
     return MakeWorkload<ClLstmFloatWorkload, NullWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateMaximum(const MaximumQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return MakeWorkload<ClMaximumWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateMean(const MeanQueueDescriptor& descriptor,
                                                          const WorkloadInfo& info) const
 {
     return MakeWorkload<ClMeanWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateMemCopy(const MemCopyQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])
     {
         throw InvalidArgumentException("ClWorkloadFactory: Invalid null input for MemCopy workload");
     }

     return MakeWorkload<CopyMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateMemImport(const MemImportQueueDescriptor& descriptor,
                                                               const WorkloadInfo& info) const
 {
     if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])
     {
         throw InvalidArgumentException("ClWorkloadFactory: Invalid null input for MemImport workload");
     }

     return std::make_unique<ImportMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateMinimum(const MinimumQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return MakeWorkload<ClMinimumWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateMultiplication(const MultiplicationQueueDescriptor& descriptor,
                                                                    const WorkloadInfo& info) const
 {
     return MakeWorkload<ClMultiplicationWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateNormalization(const NormalizationQueueDescriptor& descriptor,
                                                                   const WorkloadInfo& info) const
 {
     return MakeWorkload<ClNormalizationFloatWorkload, NullWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateOutput(const OutputQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return std::make_unique<CopyMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreatePad(const PadQueueDescriptor& descriptor,
                                                         const WorkloadInfo& info) const
 {
     return MakeWorkload<ClPadWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreatePermute(const PermuteQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return MakeWorkload<ClPermuteWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreatePooling2d(const Pooling2dQueueDescriptor& descriptor,
                                                               const WorkloadInfo& info) const
 {
     return MakeWorkload<ClPooling2dWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreatePreCompiled(const PreCompiledQueueDescriptor& descriptor,
                                                                 const WorkloadInfo& info) const
 {
     return MakeWorkload<NullWorkload, NullWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreatePrelu(const PreluQueueDescriptor &descriptor,
                                                           const WorkloadInfo &info) const
 {
     return MakeWorkload<ClPreluWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateQLstm(const QLstmQueueDescriptor& descriptor,
                                                           const WorkloadInfo& info) const
 {
     return std::make_unique<ClQLstmWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateQuantize(const QuantizeQueueDescriptor& descriptor,
                                                              const WorkloadInfo& info) const
 {
     return MakeWorkload<ClQuantizeWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateQuantizedLstm(const QuantizedLstmQueueDescriptor& descriptor,
                                                                   const WorkloadInfo& info) const
 {
     return MakeWorkload<ClQuantizedLstmWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateRank(const RankQueueDescriptor& descriptor,
                                                          const WorkloadInfo& info) const
 {
     return std::make_unique<ClRankWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateReduce(const ReduceQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return std::make_unique<ClReduceWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateReshape(const ReshapeQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return MakeWorkload<ClReshapeWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateResize(const ResizeQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return MakeWorkload<ClResizeWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateSlice(const SliceQueueDescriptor& descriptor,
                                                           const WorkloadInfo& info) const
 {
     return MakeWorkload<ClSliceWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateSoftmax(const SoftmaxQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return std::make_unique<ClSoftmaxWorkload>(descriptor,
                                                info,
                                                m_MemoryManager->GetIntraLayerManager(),
                                                m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateSpaceToBatchNd(const SpaceToBatchNdQueueDescriptor& descriptor,
                                                                    const WorkloadInfo& info) const
 {
     return MakeWorkload<ClSpaceToBatchNdWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateSpaceToDepth(const SpaceToDepthQueueDescriptor& descriptor,
                                                                  const WorkloadInfo& info) const
 {
     return MakeWorkload<ClSpaceToDepthWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateSplitter(const SplitterQueueDescriptor& descriptor,
                                                              const WorkloadInfo& info) const
 {
     return MakeWorkload<ClSplitterWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateStack(const StackQueueDescriptor& descriptor,
                                                           const WorkloadInfo& info) const
 {
     return MakeWorkload<ClStackWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateStridedSlice(const StridedSliceQueueDescriptor& descriptor,
                                                                  const WorkloadInfo& info) const
 {
     return MakeWorkload<ClStridedSliceWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateSubtraction(const SubtractionQueueDescriptor& descriptor,
                                                                 const WorkloadInfo& info) const
 {
     return MakeWorkload<ClSubtractionWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateTranspose(const TransposeQueueDescriptor& descriptor,
                                                               const WorkloadInfo& info) const
 {
     return MakeWorkload<ClTransposeWorkload>(descriptor, info, m_CLCompileContext);
 }

 std::unique_ptr<IWorkload> ClWorkloadFactory::CreateTransposeConvolution2d(
     const TransposeConvolution2dQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return MakeWorkload<ClTransposeConvolution2dWorkload>(descriptor,
                                                           info,
                                                           m_MemoryManager->GetIntraLayerManager(),
                                                           m_CLCompileContext);
 }

 } // namespace armnn
armnn::MultiplicationQueueDescriptor
Definition: WorkloadData.hpp:269

armnn::CastQueueDescriptor
Definition: WorkloadData.hpp:158

MemCopyWorkload.hpp

armnn::InstanceNormalizationQueueDescriptor
Definition: WorkloadData.hpp:368

armnn::ClContextDeserializer
Definition: ClContextDeserializer.hpp:13

armnn::PermuteQueueDescriptor
Definition: WorkloadData.hpp:185

IgnoreUnused.hpp

armnn::ClWorkloadFactory::CreateDetectionPostProcess
std::unique_ptr< IWorkload > CreateDetectionPostProcess(const DetectionPostProcessQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:391

armnn::ClWorkloadFactory::CreateSubTensorHandle
std::unique_ptr< ITensorHandle > CreateSubTensorHandle(ITensorHandle &parent, TensorShape const &subTensorShape, unsigned int const *subTensorOrigin) const override
Definition: ClWorkloadFactory.cpp:222

armnn::ClWorkloadFactory::CreateComparison
std::unique_ptr< IWorkload > CreateComparison(const ComparisonQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:290

armnn::ClWorkloadFactory::CreateGather
std::unique_ptr< IWorkload > CreateGather(const GatherQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:461

armnn::ClWorkloadFactory::ClWorkloadFactory
ClWorkloadFactory(const std::shared_ptr< ClMemoryManager > &memoryManager)
Definition: ClWorkloadFactory.cpp:188

armnn::ElementwiseUnaryDescriptor::m_Operation
UnaryOperation m_Operation
Specifies the elementwiseUnary operation to execute.
Definition: Descriptors.hpp:114

armnn::QuantizeQueueDescriptor
Definition: WorkloadData.hpp:304

armnn::IConnectableLayer
Interface for a layer that is connectable to other layers via InputSlots and OutputSlots.
Definition: INetwork.hpp:61

armnn::ClWorkloadFactory::CreateDebug
std::unique_ptr< IWorkload > CreateDebug(const DebugQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:366

armnn::ClContextSerializer
Definition: ClContextSerializer.hpp:15

armnn::DataLayout
DataLayout
Definition: Types.hpp:49

armnn::ClWorkloadFactory::CreateReshape
std::unique_ptr< IWorkload > CreateReshape(const ReshapeQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:633

armnn::ClWorkloadFactory::CreateConvolution3d
std::unique_ptr< IWorkload > CreateConvolution3d(const Convolution3dQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:344

armnn::MaximumQueueDescriptor
Definition: WorkloadData.hpp:287

armnn::DetectionPostProcessQueueDescriptor
Definition: WorkloadData.hpp:244

Utils.hpp

armnn::GatherQueueDescriptor
Definition: WorkloadData.hpp:525

armnn::ClWorkloadFactory::AfterWorkloadsCreated
void AfterWorkloadsCreated() override
Definition: ClWorkloadFactory.cpp:66

armnn::UnaryOperation::Log

armnn::Optional
Definition: Optional.hpp:270

armnn::IBackendInternal
Definition: IBackendInternal.hpp:75

armnn::SplitterQueueDescriptor
Definition: WorkloadData.hpp:101

armnn::ConstantQueueDescriptor
Definition: WorkloadData.hpp:383

armnn::ClWorkloadFactory::CreateConvertFp32ToFp16
std::unique_ptr< IWorkload > CreateConvertFp32ToFp16(const ConvertFp32ToFp16QueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:315

armnn::QuantizedLstmQueueDescriptor
Definition: WorkloadData.hpp:632

armnnSerializer
Definition: ISerializer.hpp:11

armnn::ClWorkloadFactory::CreateSpaceToBatchNd
std::unique_ptr< IWorkload > CreateSpaceToBatchNd(const SpaceToBatchNdQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:660

TensorHandle.hpp

armnn::TensorInfo
Definition: Tensor.hpp:152

armnn::ClWorkloadFactory::CreateDivision
std::unique_ptr< IWorkload > CreateDivision(const DivisionQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:398

armnn::ClBackendId
constexpr const char * ClBackendId()
Definition: ClBackendId.hpp:10

armnn::ModelOptions
std::vector< BackendOptions > ModelOptions
Definition: BackendOptions.hpp:17

armnn::LogicalBinaryOperation::LogicalAnd

armnn::ClWorkloadFactory::CreateStridedSlice
std::unique_ptr< IWorkload > CreateStridedSlice(const StridedSliceQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:684

armnn::ClWorkloadFactory::CreateConvertFp16ToFp32
std::unique_ptr< IWorkload > CreateConvertFp16ToFp32(const ConvertFp16ToFp32QueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:308

armnn::ClWorkloadFactory::CreateQuantize
std::unique_ptr< IWorkload > CreateQuantize(const QuantizeQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:609

armnn::Coordinates
std::array< unsigned int, MaxNumOfTensorDimensions > Coordinates
Definition: InternalTypes.hpp:15

armnn::ClWorkloadFactory::CreateInput
std::unique_ptr< IWorkload > CreateInput(const InputQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:467

armnn::ClWorkloadFactory::CreateStack
std::unique_ptr< IWorkload > CreateStack(const StackQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:678

ClWorkloads.hpp

armnn::ClWorkloadFactory::CreateFullyConnected
std::unique_ptr< IWorkload > CreateFullyConnected(const FullyConnectedQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:452

armnn::ClWorkloadFactory::CreateSlice
std::unique_ptr< IWorkload > CreateSlice(const SliceQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:645

armnn::ClWorkloadFactory::CreateTensorHandle
std::unique_ptr< ITensorHandle > CreateTensorHandle(const TensorInfo &tensorInfo, const bool IsMemoryManaged=true) const override
Definition: ClWorkloadFactory.cpp:201

armnn::Convolution3dQueueDescriptor
Definition: WorkloadData.hpp:212

armnn::ClWorkloadFactory::CreateQuantizedLstm
std::unique_ptr< IWorkload > CreateQuantizedLstm(const QuantizedLstmQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:615

armnn::ClWorkloadFactory::CreateRank
std::unique_ptr< IWorkload > CreateRank(const RankQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:621

armnn::ClWorkloadFactory::GetBackendId
const BackendId & GetBackendId() const override
Definition: ClWorkloadFactory.cpp:61

armnn::StackQueueDescriptor
Definition: WorkloadData.hpp:142

armnn::ActivationFunction::Abs

armnn::RsqrtQueueDescriptor
Definition: WorkloadData.hpp:520

ARMNN_LOG
#define ARMNN_LOG(severity)
Definition: Logging.hpp:202

armnn::AdditionQueueDescriptor
Definition: WorkloadData.hpp:263

ClWorkloadFactory.hpp

armnn::MinimumQueueDescriptor
Definition: WorkloadData.hpp:498

armnn::ClContextSerializer::SaveSerializedToStream
bool SaveSerializedToStream(std::ostream &stream)
Serializes the ClContext to the stream.
Definition: ClContextSerializer.cpp:49

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_quick_start.dox:6

armnn::FullyConnectedQueueDescriptor
Definition: WorkloadData.hpp:170

MakeWorkloadHelper.hpp

armnn::IgnoreUnused
void IgnoreUnused(Ts &&...)
Definition: IgnoreUnused.hpp:14

armnn::PreluQueueDescriptor
Definition: WorkloadData.hpp:557

armnn::FloatWorkload
TypedWorkload< QueueDescriptor, armnn::DataType::Float16, armnn::DataType::Float32 > FloatWorkload
Definition: Workload.hpp:170

armnn::UnaryOperation::Neg

armnn::TensorShape
Definition: Tensor.hpp:20

armnn::BatchToSpaceNdQueueDescriptor
Definition: WorkloadData.hpp:487

armnn::SoftmaxQueueDescriptor
Definition: WorkloadData.hpp:95

armnn::DivisionQueueDescriptor
Definition: WorkloadData.hpp:275

armnn::ClWorkloadFactory::CreateLstm
std::unique_ptr< IWorkload > CreateLstm(const LstmQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:509

armnn::QueueDescriptorWithParameters::m_Parameters
LayerDescriptor m_Parameters
Definition: WorkloadData.hpp:57

armnn::LogicalBinaryDescriptor::m_Operation
LogicalBinaryOperation m_Operation
Specifies the logical operation to execute.
Definition: Descriptors.hpp:1392

Filesystem.hpp

armnn::SubtractionQueueDescriptor
Definition: WorkloadData.hpp:281

armnn::ClContextDeserializer::DeserializeFromBinary
void DeserializeFromBinary(arm_compute::CLCompileContext &clCompileContext, cl::Context &context, cl::Device &device, const std::vector< uint8_t > &binaryContent)
Deserializes the CLCompileContext built-in programs from binary file contents.
Definition: ClContextDeserializer.cpp:44

armnn::PadQueueDescriptor
Definition: WorkloadData.hpp:299

armnn::ConcatQueueDescriptor
Definition: WorkloadData.hpp:120

armnn::UnaryOperation::LogicalNot

NumericCast.hpp

MemImportWorkload.hpp

armnn::ClWorkloadFactory::CreateLogicalBinary
std::unique_ptr< IWorkload > CreateLogicalBinary(const LogicalBinaryQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:486

armnn::ClWorkloadFactory::CreateLogSoftmax
std::unique_ptr< IWorkload > CreateLogSoftmax(const LogSoftmaxQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:500

armnn::SpaceToDepthQueueDescriptor
Definition: WorkloadData.hpp:405

armnn::ClWorkloadFactory::CreateMean
std::unique_ptr< IWorkload > CreateMean(const MeanQueueDescriptor &descriptor, const WorkloadInfo &Info) const override
Definition: ClWorkloadFactory.cpp:521

armnn::UnaryOperation::Sin

armnn::AbsQueueDescriptor
Definition: WorkloadData.hpp:669

armnn::ClWorkloadFactory::CreateReduce
std::unique_ptr< IWorkload > CreateReduce(const ReduceQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:627

armnn::ResizeQueueDescriptor
Definition: WorkloadData.hpp:349

PolymorphicDowncast.hpp

armnn::ClWorkloadFactory::CreateMinimum
std::unique_ptr< IWorkload > CreateMinimum(const MinimumQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:549

armnn::ClWorkloadFactory::CreateTransposeConvolution2d
std::unique_ptr< IWorkload > CreateTransposeConvolution2d(const TransposeConvolution2dQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:702

armnn::ClWorkloadFactory::CreateFill
std::unique_ptr< IWorkload > CreateFill(const FillQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:440

armnn::SpaceToBatchNdQueueDescriptor
Definition: WorkloadData.hpp:400

armnn::FloorQueueDescriptor
Definition: WorkloadData.hpp:410

armnn::ClWorkloadFactory::CreateCast
std::unique_ptr< IWorkload > CreateCast(const CastQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:278

armnn::ClWorkloadFactory::IsLayerSupported
static bool IsLayerSupported(const Layer &layer, Optional< DataType > dataType, std::string &outReasonIfUnsupported)
Definition: ClWorkloadFactory.cpp:46

armnn::LogSeverity::Error

armnn::ClWorkloadFactory::CreateQLstm
std::unique_ptr< IWorkload > CreateQLstm(const QLstmQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:603

armnn::ClWorkloadFactory::CreateDepthwiseConvolution2d
std::unique_ptr< IWorkload > CreateDepthwiseConvolution2d(const DepthwiseConvolution2dQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:378

armnn::ClWorkloadFactory::CreateDepthToSpace
std::unique_ptr< IWorkload > CreateDepthToSpace(const DepthToSpaceQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:372

armnn::ClWorkloadFactory::CreateChannelShuffle
std::unique_ptr< IWorkload > CreateChannelShuffle(const ChannelShuffleQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:284

armnn::LstmQueueDescriptor
Definition: WorkloadData.hpp:415

armnn::IBackendInternal::IBackendSpecificModelContextPtr
std::shared_ptr< IBackendModelContext > IBackendSpecificModelContextPtr
Definition: IBackendInternal.hpp:96

armnn::ITensorHandle
Definition: ITensorHandle.hpp:15

armnn::ClWorkloadFactory::CreateResize
std::unique_ptr< IWorkload > CreateResize(const ResizeQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:639

armnn::ClWorkloadFactory::CreatePermute
std::unique_ptr< IWorkload > CreatePermute(const PermuteQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:579

armnn::ComparisonQueueDescriptor
Definition: WorkloadData.hpp:684

armnn::ClContextSerializer::Serialize
void Serialize(const arm_compute::CLCompileContext &clCompileContext)
Serializes the CLCompileContext built-in programs.
Definition: ClContextSerializer.cpp:23

armnn::ClWorkloadFactory::CreateMemCopy
std::unique_ptr< IWorkload > CreateMemCopy(const MemCopyQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:527

armnn::ClWorkloadFactory::CreateBatchToSpaceNd
std::unique_ptr< IWorkload > CreateBatchToSpaceNd(const BatchToSpaceNdQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:272

armnn::ClWorkloadFactory::CreateSoftmax
std::unique_ptr< IWorkload > CreateSoftmax(const SoftmaxQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:651

armnn::ClWorkloadFactory::CreateMaximum
std::unique_ptr< IWorkload > CreateMaximum(const MaximumQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:515

armnn::WrapClError
RuntimeException WrapClError(const cl::Error &clError, const CheckLocation &location)
Definition: ClWorkloadUtils.hpp:147

armnn::ConvertFp16ToFp32QueueDescriptor
Definition: WorkloadData.hpp:477

armnn::ClWorkloadFactory::CreateElementwiseUnary
std::unique_ptr< IWorkload > CreateElementwiseUnary(const ElementwiseUnaryQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:404

armnn::ClBackendModelContext::IsFastMathEnabled
bool IsFastMathEnabled() const
Definition: ClBackendModelContext.cpp:66

armnn::ClWorkloadFactory::CreateFloor
std::unique_ptr< IWorkload > CreateFloor(const FloorQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:446

armnn::ClWorkloadFactory::CreatePreCompiled
std::unique_ptr< IWorkload > CreatePreCompiled(const PreCompiledQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:591

armnn::ClWorkloadFactory::CreateSubtraction
std::unique_ptr< IWorkload > CreateSubtraction(const SubtractionQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:690

armnn::IWorkloadFactory::IsLayerSupported
static bool IsLayerSupported(const BackendId &backendId, const IConnectableLayer &layer, Optional< DataType > dataType, std::string &outReasonIfUnsupported)
Definition: WorkloadFactory.cpp:1464

armnn::ClWorkloadFactory::CreateMultiplication
std::unique_ptr< IWorkload > CreateMultiplication(const MultiplicationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:555

armnn::ClWorkloadFactory::CreateAddition
std::unique_ptr< IWorkload > CreateAddition(const AdditionQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:253

armnn::ClWorkloadFactory::CreatePooling2d
std::unique_ptr< IWorkload > CreatePooling2d(const Pooling2dQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:585

armnn::ReduceQueueDescriptor
Definition: WorkloadData.hpp:699

armnn::InvalidArgumentException
Definition: Exceptions.hpp:80

CHECK_LOCATION
#define CHECK_LOCATION()
Definition: Exceptions.hpp:209

armnn::ITensorHandle::GetShape
virtual TensorShape GetShape() const =0
Get the number of elements for each dimension ordered from slowest iterating dimension to fastest ite...

armnn::RankQueueDescriptor
Definition: WorkloadData.hpp:334

armnn::LogicalBinaryQueueDescriptor
Definition: WorkloadData.hpp:694

armnn::ConvertFp32ToFp16QueueDescriptor
Definition: WorkloadData.hpp:482

Logging.hpp

armnn::TransposeConvolution2dQueueDescriptor
Definition: WorkloadData.hpp:562

armnn::Convolution2dQueueDescriptor
Definition: WorkloadData.hpp:197

armnn::ClContextDeserializer::Deserialize
void Deserialize(arm_compute::CLCompileContext &clCompileContext, cl::Context &context, cl::Device &device, const std::string &filePath)
Deserializes the CLCompileContext built-in programs from a binary file.
Definition: ClContextDeserializer.cpp:24

armnn::MemCopyQueueDescriptor
Definition: WorkloadData.hpp:76

armnn::FillQueueDescriptor
Definition: WorkloadData.hpp:164

armnn::Uint8Workload
TypedWorkload< QueueDescriptor, armnn::DataType::QAsymmU8 > Uint8Workload
Definition: Workload.hpp:176

armnn::ClWorkloadFactory::CreateSplitter
std::unique_ptr< IWorkload > CreateSplitter(const SplitterQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:672

armnn::SliceQueueDescriptor
Definition: WorkloadData.hpp:674

Layer.hpp

armnn::DepthToSpaceQueueDescriptor
Definition: WorkloadData.hpp:679

armnn::L2NormalizationQueueDescriptor
Definition: WorkloadData.hpp:373

armnn::ClWorkloadFactory::CreateL2Normalization
std::unique_ptr< IWorkload > CreateL2Normalization(const L2NormalizationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:480

ClTensorHandle.hpp

armnn::ClWorkloadFactory::CreateActivation
std::unique_ptr< IWorkload > CreateActivation(const ActivationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:247

ClContextSerializer.hpp

armnn::TransposeQueueDescriptor
Definition: WorkloadData.hpp:575

armnn::QueueDescriptor::m_Outputs
std::vector< ITensorHandle * > m_Outputs
Definition: WorkloadData.hpp:31

armnn::ClWorkloadFactory::CreatePad
std::unique_ptr< IWorkload > CreatePad(const PadQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:573

armnn::StridedSliceQueueDescriptor
Definition: WorkloadData.hpp:492

armnn::QLstmQueueDescriptor
Definition: WorkloadData.hpp:580

armnn::BoostLogSeverityMapping::info

Exceptions.hpp

armnn::ArgMinMaxQueueDescriptor
Definition: WorkloadData.hpp:153

armnn::TensorShape::GetNumDimensions
unsigned int GetNumDimensions() const
Function that returns the tensor rank.
Definition: Tensor.cpp:174

armnn::BatchNormalizationQueueDescriptor
Definition: WorkloadData.hpp:316

armnn::MemImportQueueDescriptor
Definition: WorkloadData.hpp:84

armnn::ClWorkloadFactory::CreateSpaceToDepth
std::unique_ptr< IWorkload > CreateSpaceToDepth(const SpaceToDepthQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:666

armnn::ClWorkloadFactory::CreateNormalization
std::unique_ptr< IWorkload > CreateNormalization(const NormalizationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:561

ClBackendId.hpp

armnn::ClWorkloadFactory::CreateInstanceNormalization
std::unique_ptr< IWorkload > CreateInstanceNormalization(const InstanceNormalizationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:473

armnn::ClWorkloadFactory::CreateTranspose
std::unique_ptr< IWorkload > CreateTranspose(const TransposeQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:696

armnn::WorkloadInfo
Contains information about TensorInfos of a layer.
Definition: WorkloadInfo.hpp:16

armnn::LogicalBinaryOperation::LogicalOr

armnn::ChannelShuffleQueueDescriptor
Definition: WorkloadData.hpp:761

armnn::QueueDescriptor::m_Inputs
std::vector< ITensorHandle * > m_Inputs
Definition: WorkloadData.hpp:30

armnn::ClWorkloadFactory::CreateBatchNormalization
std::unique_ptr< IWorkload > CreateBatchNormalization(const BatchNormalizationQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:265

armnn::ClWorkloadFactory::CreateConcat
std::unique_ptr< IWorkload > CreateConcat(const ConcatQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:296

armnn::PreCompiledQueueDescriptor
Definition: WorkloadData.hpp:530

ClBackendModelContext.hpp

armnn::DequantizeQueueDescriptor
Definition: WorkloadData.hpp:542

armnn::Pooling2dQueueDescriptor
Definition: WorkloadData.hpp:191

armnn::ClWorkloadFactory::CreateMemImport
std::unique_ptr< IWorkload > CreateMemImport(const MemImportQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:538

armnn::UnaryOperation::Exp

ClContextDeserializer.hpp

armnn::UnaryOperation::Rsqrt

armnn::ClBackendModelContext
The ClBackendModelContext is used to pass in CL specific backend ModelOptions.
Definition: ClBackendModelContext.hpp:28

armnn::ClWorkloadFactory::CreatePrelu
std::unique_ptr< IWorkload > CreatePrelu(const PreluQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:597

armnn::MeanQueueDescriptor
Definition: WorkloadData.hpp:293

armnn::LogSoftmaxQueueDescriptor
Definition: WorkloadData.hpp:378

ClWorkloadUtils.hpp

armnn::ClWorkloadFactory::CreateDequantize
std::unique_ptr< IWorkload > CreateDequantize(const DequantizeQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:385

armnn::ClWorkloadFactory::CreateConstant
std::unique_ptr< IWorkload > CreateConstant(const ConstantQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:302

armnn::ClWorkloadFactory::CreateConvolution2d
std::unique_ptr< IWorkload > CreateConvolution2d(const Convolution2dQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:322

armnn::ClWorkloadFactory::CreateArgMinMax
std::unique_ptr< IWorkload > CreateArgMinMax(const ArgMinMaxQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:259

armnn::ClBackendModelContext::GetCachedNetworkFilePath
std::string GetCachedNetworkFilePath() const
Definition: ClBackendModelContext.cpp:61

armnn::ReshapeQueueDescriptor
Definition: WorkloadData.hpp:395

armnn::DebugQueueDescriptor
Definition: WorkloadData.hpp:509

armnn::ElementwiseUnaryQueueDescriptor
Definition: WorkloadData.hpp:689

armnn::Layer
Definition: Layer.hpp:210

armnn::DepthwiseConvolution2dQueueDescriptor
Depthwise Convolution 2D layer workload data.
Definition: WorkloadData.hpp:230

armnn::ActivationQueueDescriptor
Definition: WorkloadData.hpp:148

armnn::ClWorkloadFactory::CreateOutput
std::unique_ptr< IWorkload > CreateOutput(const OutputQueueDescriptor &descriptor, const WorkloadInfo &info) const override
Definition: ClWorkloadFactory.cpp:567

armnn::BackendId
Definition: BackendId.hpp:75

armnn::NormalizationQueueDescriptor
Definition: WorkloadData.hpp:257