plain/21.02/_cl_workload_utils_8hpp_source.xhtml

 //
 // Copyright © 2017 Arm Ltd. All rights reserved.
 // SPDX-License-Identifier: MIT
 //
 #pragma once

 #include <Half.hpp>

 #include <aclCommon/ArmComputeTensorUtils.hpp>
 #include <cl/OpenClTimer.hpp>
 #include <backendsCommon/CpuTensorHandle.hpp>

 #include <armnn/Utils.hpp>

 #include <arm_compute/runtime/CL/CLTensor.h>
 #include <arm_compute/runtime/IFunction.h>

 #include <sstream>

 #define ARMNN_SCOPED_PROFILING_EVENT_CL(name) \
     ARMNN_SCOPED_PROFILING_EVENT_WITH_INSTRUMENTS(armnn::Compute::GpuAcc, \
                                                   name, \
                                                   armnn::OpenClTimer(), \
                                                   armnn::WallClockTimer())

 namespace armnn
 {

 template <typename T>
 void CopyArmComputeClTensorData(arm_compute::CLTensor& dstTensor, const T* srcData)
 {
     {
         ARMNN_SCOPED_PROFILING_EVENT_CL("MapClTensorForWriting");
         dstTensor.map(true);
     }

     {
         ARMNN_SCOPED_PROFILING_EVENT_CL("CopyToClTensor");
         armcomputetensorutils::CopyArmComputeITensorData<T>(srcData, dstTensor);
     }

     dstTensor.unmap();
 }

 inline auto SetClStridedSliceData(const std::vector<int>& m_begin,
                                   const std::vector<int>& m_end,
                                   const std::vector<int>& m_stride)
 {
     arm_compute::Coordinates starts;
     arm_compute::Coordinates ends;
     arm_compute::Coordinates strides;

     unsigned int num_dims = static_cast<unsigned int>(m_begin.size());

     for (unsigned int i = 0; i < num_dims; i++) {
         unsigned int revertedIndex = num_dims - i - 1;

         starts.set(i, static_cast<int>(m_begin[revertedIndex]));
         ends.set(i, static_cast<int>(m_end[revertedIndex]));
         strides.set(i, static_cast<int>(m_stride[revertedIndex]));
     }

     return std::make_tuple(starts, ends, strides);
 }

 inline auto SetClSliceData(const std::vector<unsigned int>& m_begin,
                            const std::vector<unsigned int>& m_size)
 {
     // This function must translate the size vector given to an end vector
     // expected by the ACL NESlice workload
     arm_compute::Coordinates starts;
     arm_compute::Coordinates ends;

     unsigned int num_dims = static_cast<unsigned int>(m_begin.size());

     // For strided slices, we have the relationship size = (end - begin) / stride
     // For slice, we assume stride to be a vector of all ones, yielding the formula
     // size = (end - begin) therefore we know end = size + begin
     for (unsigned int i = 0; i < num_dims; i++)
     {
         unsigned int revertedIndex = num_dims - i - 1;

         starts.set(i, static_cast<int>(m_begin[revertedIndex]));
         ends.set(i, static_cast<int>(m_begin[revertedIndex] + m_size[revertedIndex]));
     }

     return std::make_tuple(starts, ends);
 }

 inline void InitializeArmComputeClTensorData(arm_compute::CLTensor& clTensor,
                                              const ConstCpuTensorHandle* handle)
 {
     ARMNN_ASSERT(handle);

     armcomputetensorutils::InitialiseArmComputeTensorEmpty(clTensor);
     switch(handle->GetTensorInfo().GetDataType())
     {
         case DataType::Float16:
             CopyArmComputeClTensorData(clTensor, handle->GetConstTensor<armnn::Half>());
             break;
         case DataType::Float32:
             CopyArmComputeClTensorData(clTensor, handle->GetConstTensor<float>());
             break;
         case DataType::QAsymmU8:
             CopyArmComputeClTensorData(clTensor, handle->GetConstTensor<uint8_t>());
             break;
         ARMNN_NO_DEPRECATE_WARN_BEGIN
         case DataType::QuantizedSymm8PerAxis:
             ARMNN_FALLTHROUGH;
         case DataType::QAsymmS8:
         case DataType::QSymmS8:
             CopyArmComputeClTensorData(clTensor, handle->GetConstTensor<int8_t>());
             break;
         case DataType::QSymmS16:
             CopyArmComputeClTensorData(clTensor, handle->GetConstTensor<int16_t>());
             break;
         ARMNN_NO_DEPRECATE_WARN_END
         case DataType::Signed32:
             CopyArmComputeClTensorData(clTensor, handle->GetConstTensor<int32_t>());
             break;
         default:
             ARMNN_ASSERT_MSG(false, "Unexpected tensor type.");
     }
 };

 inline RuntimeException WrapClError(const cl::Error& clError, const CheckLocation& location)
 {
     std::stringstream message;
     message << "CL error: " << clError.what() << ". Error code: " << clError.err();

     return RuntimeException(message.str(), location);
 }

 inline void RunClFunction(arm_compute::IFunction& function, const CheckLocation& location)
 {
     try
     {
         function.run();
     }
     catch (cl::Error& error)
     {
         throw WrapClError(error, location);
     }
 }

 template <typename DataType, typename PayloadType>
 DataType* GetOutputTensorData(unsigned int idx, const PayloadType& data)
 {
     ITensorHandle* tensorHandle = data.m_Outputs[idx];
     return reinterpret_cast<DataType*>(tensorHandle->Map());
 }

 } //namespace armnn
Utils.hpp

armnn::InitializeArmComputeClTensorData
void InitializeArmComputeClTensorData(arm_compute::CLTensor &clTensor, const ConstCpuTensorHandle *handle)
Definition: ClWorkloadUtils.hpp:90

ARMNN_NO_DEPRECATE_WARN_BEGIN
#define ARMNN_NO_DEPRECATE_WARN_BEGIN
Definition: Deprecated.hpp:33

armnn::DataType::QuantizedSymm8PerAxis

ARMNN_SCOPED_PROFILING_EVENT_CL
#define ARMNN_SCOPED_PROFILING_EVENT_CL(name)
Definition: ClWorkloadUtils.hpp:20

armnn::RunClFunction
void RunClFunction(arm_compute::IFunction &function, const CheckLocation &location)
Definition: ClWorkloadUtils.hpp:134

armnn::DataType::Signed32

armnn::Coordinates
std::array< unsigned int, MaxNumOfTensorDimensions > Coordinates
Definition: InternalTypes.hpp:14

armnn::ConstCpuTensorHandle
Definition: CpuTensorHandle.hpp:27

armnn::Exception::what
virtual const char * what() const noexcept override
Definition: Exceptions.cpp:32

ArmComputeTensorUtils.hpp

armnn::DataType::QAsymmS8

armnn::DataType::QSymmS16

armnn::ConstCpuTensorHandle::GetConstTensor
const T * GetConstTensor() const
Definition: CpuTensorHandle.hpp:31

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_software_tools.dox:6

armnn::BoostLogSeverityMapping::error

OpenClTimer.hpp

armnn::LogSeverity::Error

armnn::DataType
DataType
Definition: Types.hpp:32

ARMNN_NO_DEPRECATE_WARN_END
#define ARMNN_NO_DEPRECATE_WARN_END
Definition: Deprecated.hpp:34

ARMNN_ASSERT_MSG
#define ARMNN_ASSERT_MSG(COND, MSG)
Definition: Assert.hpp:15

armnn::ITensorHandle
Definition: ITensorHandle.hpp:15

armnn::TensorInfo::GetDataType
DataType GetDataType() const
Definition: Tensor.hpp:194

armnn::DataType::QAsymmU8

armnn::CheckLocation
Definition: Exceptions.hpp:14

armnn::DataType::Float16

ARMNN_FALLTHROUGH
#define ARMNN_FALLTHROUGH
Definition: Utils.hpp:36

armnn::WrapClError
RuntimeException WrapClError(const cl::Error &clError, const CheckLocation &location)
Definition: ClWorkloadUtils.hpp:126

ARMNN_ASSERT
#define ARMNN_ASSERT(COND)
Definition: Assert.hpp:14

armnn::RuntimeException
Definition: Exceptions.hpp:120

armnn::SetClSliceData
auto SetClSliceData(const std::vector< unsigned int > &m_begin, const std::vector< unsigned int > &m_size)
Definition: ClWorkloadUtils.hpp:66

CpuTensorHandle.hpp

Half.hpp

armnn::ITensorHandle::Map
virtual const void * Map(bool blocking=true) const =0
Map the tensor data for access.

armnn::CopyArmComputeClTensorData
void CopyArmComputeClTensorData(arm_compute::CLTensor &dstTensor, const T *srcData)
Definition: ClWorkloadUtils.hpp:30

armnn::GetOutputTensorData
DataType * GetOutputTensorData(unsigned int idx, const PayloadType &data)
Definition: ClWorkloadUtils.hpp:147

armnn::DataType::Float32

armnn::DataType::QSymmS8

armnn::Half
half_float::half Half
Definition: Half.hpp:16

armnn::SetClStridedSliceData
auto SetClStridedSliceData(const std::vector< int > &m_begin, const std::vector< int > &m_end, const std::vector< int > &m_stride)
Definition: ClWorkloadUtils.hpp:45

armnn::ConstCpuTensorHandle::GetTensorInfo
const TensorInfo & GetTensorInfo() const
Definition: CpuTensorHandle.hpp:37