plain/22.11/_neon_tensor_handle_8hpp_source.xhtml

 //
 // Copyright © 2017 Arm Ltd. All rights reserved.
 // SPDX-License-Identifier: MIT
 //
 #pragma once

 #include <BFloat16.hpp>
 #include <Half.hpp>

 #include <armnn/utility/Assert.hpp>

 #include <aclCommon/ArmComputeTensorHandle.hpp>
 #include <aclCommon/ArmComputeTensorUtils.hpp>
 #include <armnn/utility/PolymorphicDowncast.hpp>

 #include <arm_compute/runtime/MemoryGroup.h>
 #include <arm_compute/runtime/IMemoryGroup.h>
 #include <arm_compute/runtime/Tensor.h>
 #include <arm_compute/runtime/SubTensor.h>
 #include <arm_compute/core/TensorShape.h>
 #include <arm_compute/core/Coordinates.h>

 namespace armnn
 {

 class NeonTensorHandle : public IAclTensorHandle
 {
 public:
     NeonTensorHandle(const TensorInfo& tensorInfo)
                      : m_ImportFlags(static_cast<MemorySourceFlags>(MemorySource::Malloc)),
                        m_Imported(false),
                        m_IsImportEnabled(false),
                        m_TypeAlignment(GetDataTypeSize(tensorInfo.GetDataType()))
     {
         armnn::armcomputetensorutils::BuildArmComputeTensor(m_Tensor, tensorInfo);
     }

     NeonTensorHandle(const TensorInfo& tensorInfo,
                      DataLayout dataLayout,
                      MemorySourceFlags importFlags = static_cast<MemorySourceFlags>(MemorySource::Malloc))
                      : m_ImportFlags(importFlags),
                        m_Imported(false),
                        m_IsImportEnabled(false),
                        m_TypeAlignment(GetDataTypeSize(tensorInfo.GetDataType()))


     {
         armnn::armcomputetensorutils::BuildArmComputeTensor(m_Tensor, tensorInfo, dataLayout);
     }

     arm_compute::ITensor& GetTensor() override { return m_Tensor; }
     arm_compute::ITensor const& GetTensor() const override { return m_Tensor; }

     virtual void Allocate() override
     {
         // If we have enabled Importing, don't Allocate the tensor
         if (!m_IsImportEnabled)
         {
             armnn::armcomputetensorutils::InitialiseArmComputeTensorEmpty(m_Tensor);
         }
     };

     virtual void Manage() override
     {
         // If we have enabled Importing, don't manage the tensor
         if (!m_IsImportEnabled)
         {
             ARMNN_ASSERT(m_MemoryGroup != nullptr);
             m_MemoryGroup->manage(&m_Tensor);
         }
     }

     virtual ITensorHandle* GetParent() const override { return nullptr; }

     virtual arm_compute::DataType GetDataType() const override
     {
         return m_Tensor.info()->data_type();
     }

     virtual void SetMemoryGroup(const std::shared_ptr<arm_compute::IMemoryGroup>& memoryGroup) override
     {
         m_MemoryGroup = PolymorphicPointerDowncast<arm_compute::MemoryGroup>(memoryGroup);
     }

     virtual const void* Map(bool /* blocking = true */) const override
     {
         return static_cast<const void*>(m_Tensor.buffer() + m_Tensor.info()->offset_first_element_in_bytes());
     }

     virtual void Unmap() const override {}

     TensorShape GetStrides() const override
     {
         return armcomputetensorutils::GetStrides(m_Tensor.info()->strides_in_bytes());
     }

     TensorShape GetShape() const override
     {
         return armcomputetensorutils::GetShape(m_Tensor.info()->tensor_shape());
     }

     void SetImportFlags(MemorySourceFlags importFlags)
     {
         m_ImportFlags = importFlags;
     }

     MemorySourceFlags GetImportFlags() const override
     {
         return m_ImportFlags;
     }

     void SetImportEnabledFlag(bool importEnabledFlag)
     {
         m_IsImportEnabled = importEnabledFlag;
     }

     bool CanBeImported(void* memory, MemorySource source) override
     {
         if (source != MemorySource::Malloc || reinterpret_cast<uintptr_t>(memory) % m_TypeAlignment)
         {
             return false;
         }
         return true;
     }

     virtual bool Import(void* memory, MemorySource source) override
     {
         if (m_ImportFlags & static_cast<MemorySourceFlags>(source))
         {
             if (source == MemorySource::Malloc && m_IsImportEnabled)
             {
                 if (!CanBeImported(memory, source))
                 {
                     throw MemoryImportException("NeonTensorHandle::Import Attempting to import unaligned memory");
                 }

                 // m_Tensor not yet Allocated
                 if (!m_Imported && !m_Tensor.buffer())
                 {
                     arm_compute::Status status = m_Tensor.allocator()->import_memory(memory);
                     // Use the overloaded bool operator of Status to check if it worked, if not throw an exception
                     // with the Status error message
                     m_Imported = bool(status);
                     if (!m_Imported)
                     {
                         throw MemoryImportException(status.error_description());
                     }
                     return m_Imported;
                 }

                 // m_Tensor.buffer() initially allocated with Allocate().
                 if (!m_Imported && m_Tensor.buffer())
                 {
                     throw MemoryImportException(
                         "NeonTensorHandle::Import Attempting to import on an already allocated tensor");
                 }

                 // m_Tensor.buffer() previously imported.
                 if (m_Imported)
                 {
                     arm_compute::Status status = m_Tensor.allocator()->import_memory(memory);
                     // Use the overloaded bool operator of Status to check if it worked, if not throw an exception
                     // with the Status error message
                     m_Imported = bool(status);
                     if (!m_Imported)
                     {
                         throw MemoryImportException(status.error_description());
                     }
                     return m_Imported;
                 }
             }
             else
             {
                 throw MemoryImportException("NeonTensorHandle::Import is disabled");
             }
         }
         else
         {
             throw MemoryImportException("NeonTensorHandle::Incorrect import flag");
         }
         return false;
     }

 private:
     // Only used for testing
     void CopyOutTo(void* memory) const override
     {
         switch (this->GetDataType())
         {
             case arm_compute::DataType::F32:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<float*>(memory));
                 break;
             case arm_compute::DataType::U8:
             case arm_compute::DataType::QASYMM8:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<uint8_t*>(memory));
                 break;
             case arm_compute::DataType::QSYMM8:
             case arm_compute::DataType::QASYMM8_SIGNED:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<int8_t*>(memory));
                 break;
             case arm_compute::DataType::BFLOAT16:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<armnn::BFloat16*>(memory));
                 break;
             case arm_compute::DataType::F16:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<armnn::Half*>(memory));
                 break;
             case arm_compute::DataType::S16:
             case arm_compute::DataType::QSYMM16:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<int16_t*>(memory));
                 break;
             case arm_compute::DataType::S32:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<int32_t*>(memory));
                 break;
             default:
             {
                 throw armnn::UnimplementedException();
             }
         }
     }

     // Only used for testing
     void CopyInFrom(const void* memory) override
     {
         switch (this->GetDataType())
         {
             case arm_compute::DataType::F32:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const float*>(memory),
                                                                  this->GetTensor());
                 break;
             case arm_compute::DataType::U8:
             case arm_compute::DataType::QASYMM8:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const uint8_t*>(memory),
                                                                  this->GetTensor());
                 break;
             case arm_compute::DataType::QSYMM8:
             case arm_compute::DataType::QASYMM8_SIGNED:
             case arm_compute::DataType::QSYMM8_PER_CHANNEL:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int8_t*>(memory),
                                                                  this->GetTensor());
                 break;
             case arm_compute::DataType::BFLOAT16:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const armnn::BFloat16*>(memory),
                                                                  this->GetTensor());
                 break;
             case arm_compute::DataType::F16:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const armnn::Half*>(memory),
                                                                  this->GetTensor());
                 break;
             case arm_compute::DataType::S16:
             case arm_compute::DataType::QSYMM16:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int16_t*>(memory),
                                                                  this->GetTensor());
                 break;
             case arm_compute::DataType::S32:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int32_t*>(memory),
                                                                  this->GetTensor());
                 break;
             default:
             {
                 throw armnn::UnimplementedException();
             }
         }
     }

     arm_compute::Tensor m_Tensor;
     std::shared_ptr<arm_compute::MemoryGroup> m_MemoryGroup;
     MemorySourceFlags m_ImportFlags;
     bool m_Imported;
     bool m_IsImportEnabled;
     const uintptr_t m_TypeAlignment;
 };

 class NeonSubTensorHandle : public IAclTensorHandle
 {
 public:
     NeonSubTensorHandle(IAclTensorHandle* parent,
                         const arm_compute::TensorShape& shape,
                         const arm_compute::Coordinates& coords)
      : m_Tensor(&parent->GetTensor(), shape, coords)
     {
         parentHandle = parent;
     }

     arm_compute::ITensor& GetTensor() override { return m_Tensor; }
     arm_compute::ITensor const& GetTensor() const override { return m_Tensor; }

     virtual void Allocate() override {}
     virtual void Manage() override {}

     virtual ITensorHandle* GetParent() const override { return parentHandle; }

     virtual arm_compute::DataType GetDataType() const override
     {
         return m_Tensor.info()->data_type();
     }

     virtual void SetMemoryGroup(const std::shared_ptr<arm_compute::IMemoryGroup>&) override {}

     virtual const void* Map(bool /* blocking = true */) const override
     {
         return static_cast<const void*>(m_Tensor.buffer() + m_Tensor.info()->offset_first_element_in_bytes());
     }
     virtual void Unmap() const override {}

     TensorShape GetStrides() const override
     {
         return armcomputetensorutils::GetStrides(m_Tensor.info()->strides_in_bytes());
     }

     TensorShape GetShape() const override
     {
         return armcomputetensorutils::GetShape(m_Tensor.info()->tensor_shape());
     }

 private:
     // Only used for testing
     void CopyOutTo(void* memory) const override
     {
         switch (this->GetDataType())
         {
             case arm_compute::DataType::F32:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<float*>(memory));
                 break;
             case arm_compute::DataType::U8:
             case arm_compute::DataType::QASYMM8:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<uint8_t*>(memory));
                 break;
             case arm_compute::DataType::QSYMM8:
             case arm_compute::DataType::QASYMM8_SIGNED:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<int8_t*>(memory));
                 break;
             case arm_compute::DataType::S16:
             case arm_compute::DataType::QSYMM16:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<int16_t*>(memory));
                 break;
             case arm_compute::DataType::S32:
                 armcomputetensorutils::CopyArmComputeITensorData(this->GetTensor(),
                                                                  static_cast<int32_t*>(memory));
                 break;
             default:
             {
                 throw armnn::UnimplementedException();
             }
         }
     }

     // Only used for testing
     void CopyInFrom(const void* memory) override
     {
         switch (this->GetDataType())
         {
             case arm_compute::DataType::F32:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const float*>(memory),
                                                                  this->GetTensor());
                 break;
             case arm_compute::DataType::U8:
             case arm_compute::DataType::QASYMM8:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const uint8_t*>(memory),
                                                                  this->GetTensor());
                 break;
             case arm_compute::DataType::QSYMM8:
             case arm_compute::DataType::QASYMM8_SIGNED:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int8_t*>(memory),
                                                                  this->GetTensor());
                 break;
             case arm_compute::DataType::S16:
             case arm_compute::DataType::QSYMM16:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int16_t*>(memory),
                                                                  this->GetTensor());
                 break;
             case arm_compute::DataType::S32:
                 armcomputetensorutils::CopyArmComputeITensorData(static_cast<const int32_t*>(memory),
                                                                  this->GetTensor());
                 break;
             default:
             {
                 throw armnn::UnimplementedException();
             }
         }
     }

     arm_compute::SubTensor m_Tensor;
     ITensorHandle* parentHandle = nullptr;
 };

 } // namespace armnn
armnn::NeonTensorHandle::GetShape
TensorShape GetShape() const override
Get the number of elements for each dimension ordered from slowest iterating dimension to fastest ite...
Definition: NeonTensorHandle.hpp:97

armnn::NeonTensorHandle::CanBeImported
bool CanBeImported(void *memory, MemorySource source) override
Implementations must determine if this memory block can be imported.
Definition: NeonTensorHandle.hpp:117

armnn::NeonSubTensorHandle::GetStrides
TensorShape GetStrides() const override
Get the strides for each dimension ordered from largest to smallest where the smallest value is the s...
Definition: NeonTensorHandle.hpp:312

armnn::NeonTensorHandle::Allocate
virtual void Allocate() override
Indicate to the memory manager that this resource is no longer active.
Definition: NeonTensorHandle.hpp:54

armnn::NeonSubTensorHandle::SetMemoryGroup
virtual void SetMemoryGroup(const std::shared_ptr< arm_compute::IMemoryGroup > &) override
Definition: NeonTensorHandle.hpp:304

armnn::DataLayout
DataLayout
Definition: Types.hpp:62

armnn::NeonTensorHandle::GetDataType
virtual arm_compute::DataType GetDataType() const override
Definition: NeonTensorHandle.hpp:75

armnn::TensorInfo
Definition: Tensor.hpp:152

armnn::NeonTensorHandle::SetMemoryGroup
virtual void SetMemoryGroup(const std::shared_ptr< arm_compute::IMemoryGroup > &memoryGroup) override
Definition: NeonTensorHandle.hpp:80

armnn::NeonSubTensorHandle::GetDataType
virtual arm_compute::DataType GetDataType() const override
Definition: NeonTensorHandle.hpp:299

armnn::Coordinates
std::array< unsigned int, MaxNumOfTensorDimensions > Coordinates
Definition: InternalTypes.hpp:15

armnn::NeonSubTensorHandle::Manage
virtual void Manage() override
Indicate to the memory manager that this resource is active.
Definition: NeonTensorHandle.hpp:295

armnn::NeonTensorHandle
Definition: NeonTensorHandle.hpp:26

armnn::NeonTensorHandle::Unmap
virtual void Unmap() const override
Unmap the tensor data.
Definition: NeonTensorHandle.hpp:90

armnn::NeonTensorHandle::GetTensor
arm_compute::ITensor const  & GetTensor() const override
Definition: NeonTensorHandle.hpp:52

armnn::NeonSubTensorHandle::GetParent
virtual ITensorHandle * GetParent() const override
Get the parent tensor if this is a subtensor.
Definition: NeonTensorHandle.hpp:297

armnn::UnimplementedException
Definition: Exceptions.hpp:98

ArmComputeTensorUtils.hpp

armnn::MemorySourceFlags
unsigned int MemorySourceFlags
Definition: MemorySources.hpp:15

armnn::NeonSubTensorHandle::GetTensor
arm_compute::ITensor const  & GetTensor() const override
Definition: NeonTensorHandle.hpp:292

armnn::NeonSubTensorHandle::Unmap
virtual void Unmap() const override
Unmap the tensor data.
Definition: NeonTensorHandle.hpp:310

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_quick_start.dox:6

armnn::NeonTensorHandle::Import
virtual bool Import(void *memory, MemorySource source) override
Import externally allocated memory.
Definition: NeonTensorHandle.hpp:126

armnn::IAclTensorHandle
Definition: ArmComputeTensorHandle.hpp:16

armnn::TensorShape
Definition: Tensor.hpp:20

PolymorphicDowncast.hpp

armnn::DataType
DataType
Definition: Types.hpp:48

armnn::ITensorHandle
Definition: ITensorHandle.hpp:15

armnn::NeonSubTensorHandle::GetShape
TensorShape GetShape() const override
Get the number of elements for each dimension ordered from slowest iterating dimension to fastest ite...
Definition: NeonTensorHandle.hpp:317

armnn::NeonSubTensorHandle::NeonSubTensorHandle
NeonSubTensorHandle(IAclTensorHandle *parent, const arm_compute::TensorShape &shape, const arm_compute::Coordinates &coords)
Definition: NeonTensorHandle.hpp:283

armnn::Status
Status
enumeration
Definition: Types.hpp:42

ARMNN_ASSERT
#define ARMNN_ASSERT(COND)
Definition: Assert.hpp:14

armnn::NeonSubTensorHandle::GetTensor
arm_compute::ITensor & GetTensor() override
Definition: NeonTensorHandle.hpp:291

armnn::NeonTensorHandle::GetImportFlags
MemorySourceFlags GetImportFlags() const override
Get flags describing supported import sources.
Definition: NeonTensorHandle.hpp:107

armnn::MemorySource::Malloc

armnn::NeonTensorHandle::GetStrides
TensorShape GetStrides() const override
Get the strides for each dimension ordered from largest to smallest where the smallest value is the s...
Definition: NeonTensorHandle.hpp:92

armnn::NeonSubTensorHandle::Map
virtual const void * Map(bool) const override
Map the tensor data for access.
Definition: NeonTensorHandle.hpp:306

Half.hpp

armnn::NeonTensorHandle::NeonTensorHandle
NeonTensorHandle(const TensorInfo &tensorInfo, DataLayout dataLayout, MemorySourceFlags importFlags=static_cast< MemorySourceFlags >(MemorySource::Malloc))
Definition: NeonTensorHandle.hpp:38

Assert.hpp

armnn::NeonTensorHandle::GetParent
virtual ITensorHandle * GetParent() const override
Get the parent tensor if this is a subtensor.
Definition: NeonTensorHandle.hpp:73

armnn::MemorySource
MemorySource
Define the Memory Source to reduce copies.
Definition: Types.hpp:230

armnn::MemoryImportException
Definition: Exceptions.hpp:125

armnn::NeonSubTensorHandle::Allocate
virtual void Allocate() override
Indicate to the memory manager that this resource is no longer active.
Definition: NeonTensorHandle.hpp:294

ArmComputeTensorHandle.hpp

armnn::NeonTensorHandle::NeonTensorHandle
NeonTensorHandle(const TensorInfo &tensorInfo)
Definition: NeonTensorHandle.hpp:29

armnn::NeonTensorHandle::Map
virtual const void * Map(bool) const override
Map the tensor data for access.
Definition: NeonTensorHandle.hpp:85

BFloat16.hpp

armnn::NeonTensorHandle::SetImportFlags
void SetImportFlags(MemorySourceFlags importFlags)
Definition: NeonTensorHandle.hpp:102

armnn::NeonSubTensorHandle
Definition: NeonTensorHandle.hpp:280

armnn::NeonTensorHandle::GetTensor
arm_compute::ITensor & GetTensor() override
Definition: NeonTensorHandle.hpp:51

armnn::NeonTensorHandle::SetImportEnabledFlag
void SetImportEnabledFlag(bool importEnabledFlag)
Definition: NeonTensorHandle.hpp:112

armnn::GetDataTypeSize
constexpr unsigned int GetDataTypeSize(DataType dataType)
Definition: TypesUtils.hpp:151

armnn::NeonTensorHandle::Manage
virtual void Manage() override
Indicate to the memory manager that this resource is active.
Definition: NeonTensorHandle.hpp:63