plain/20.02/_cl_convert_fp32_to_fp16_workload_8cpp_source.xhtml

 //
 // Copyright © 2017 Arm Ltd. All rights reserved.
 // SPDX-License-Identifier: MIT
 //

 #include "ClConvertFp32ToFp16Workload.hpp"
 #include <cl/ClTensorHandle.hpp>

 #include "ClWorkloadUtils.hpp"

 namespace armnn
 {
 using namespace armcomputetensorutils;

 static constexpr arm_compute::ConvertPolicy g_AclConvertPolicy = arm_compute::ConvertPolicy::SATURATE;

 ClConvertFp32ToFp16Workload::ClConvertFp32ToFp16Workload(
     const ConvertFp32ToFp16QueueDescriptor& descriptor, const WorkloadInfo& info) :
     Float32ToFloat16Workload<ConvertFp32ToFp16QueueDescriptor>(descriptor, info)
 {
     this->m_Data.ValidateInputsOutputs("ClConvertFp32ToFp16Workload", 1, 1);

     arm_compute::ICLTensor& input = static_cast<IClTensorHandle*>(this->m_Data.m_Inputs[0])->GetTensor();
     arm_compute::ICLTensor& output = static_cast<IClTensorHandle*>(this->m_Data.m_Outputs[0])->GetTensor();

     m_Layer.configure(&input, &output, g_AclConvertPolicy, 0);
 }

 void ClConvertFp32ToFp16Workload::Execute() const
 {
     ARMNN_SCOPED_PROFILING_EVENT_CL("ClConvertFp32ToFp16Workload_Execute");
     RunClFunction(m_Layer, CHECK_LOCATION());
 }

 arm_compute::Status ClConvertFp32ToFp16WorkloadValidate(const TensorInfo& input, const TensorInfo& output)
 {
     if (input.GetDataType() != DataType::Float32)
     {
         return arm_compute::Status(arm_compute::ErrorCode::RUNTIME_ERROR, "Input should be Float32");
     }
     if (output.GetDataType() != DataType::Float16)
     {
         return arm_compute::Status(arm_compute::ErrorCode::RUNTIME_ERROR, "Output should be Float16");
     }

     const arm_compute::TensorInfo aclInputInfo = BuildArmComputeTensorInfo(input);
     const arm_compute::TensorInfo aclOutputInfo = BuildArmComputeTensorInfo(output);

     const arm_compute::Status aclStatus = arm_compute::CLDepthConvertLayer::validate(
         &aclInputInfo, &aclOutputInfo, g_AclConvertPolicy, 0);

     return aclStatus;
 }


 } //namespace armnn
armnn::ClConvertFp32ToFp16WorkloadValidate
arm_compute::Status ClConvertFp32ToFp16WorkloadValidate(const TensorInfo &input, const TensorInfo &output)
Definition: ClConvertFp32ToFp16Workload.cpp:35

armnn::TensorInfo
Definition: Tensor.hpp:53

ARMNN_SCOPED_PROFILING_EVENT_CL
#define ARMNN_SCOPED_PROFILING_EVENT_CL(name)
Definition: ClWorkloadUtils.hpp:20

armnn::RunClFunction
void RunClFunction(arm_compute::IFunction &function, const CheckLocation &location)
Definition: ClWorkloadUtils.hpp:131

armnn::BaseWorkload::m_Data
const QueueDescriptor m_Data
Definition: Workload.hpp:46

armnn::QueueDescriptor::ValidateInputsOutputs
void ValidateInputsOutputs(const std::string &descName, unsigned int numExpectedIn, unsigned int numExpectedOut) const
Definition: WorkloadData.cpp:461

armnn
Copyright (c) 2020 ARM Limited.
Definition: 00_introduction.dox:25

armnn::ClConvertFp32ToFp16Workload::ClConvertFp32ToFp16Workload
ClConvertFp32ToFp16Workload(const ConvertFp32ToFp16QueueDescriptor &descriptor, const WorkloadInfo &info)
Definition: ClConvertFp32ToFp16Workload.cpp:17

armnn::MultiTypedWorkload
Definition: Workload.hpp:105

armnn::TensorInfo::GetDataType
DataType GetDataType() const
Definition: Tensor.hpp:95

armnn::DataType::Float16

armnn::Status
Status
enumeration
Definition: Types.hpp:26

ClConvertFp32ToFp16Workload.hpp

CHECK_LOCATION
#define CHECK_LOCATION()
Definition: Exceptions.hpp:192

armnn::ClConvertFp32ToFp16Workload::Execute
virtual void Execute() const override
Definition: ClConvertFp32ToFp16Workload.cpp:29

armnn::ConvertFp32ToFp16QueueDescriptor
Definition: WorkloadData.hpp:415

ClTensorHandle.hpp

armnn::QueueDescriptor::m_Outputs
std::vector< ITensorHandle * > m_Outputs
Definition: WorkloadData.hpp:31

armnn::BoostLogSeverityMapping::info

armnn::IClTensorHandle
Definition: ClTensorHandle.hpp:25

armnn::DataType::Float32

armnn::WorkloadInfo
Contains information about inputs and outputs to a layer.
Definition: WorkloadInfo.hpp:16

armnn::QueueDescriptor::m_Inputs
std::vector< ITensorHandle * > m_Inputs
Definition: WorkloadData.hpp:30

ClWorkloadUtils.hpp