#include <NeonConvertFp32ToBf16Workload.hpp>

Inheritance diagram for NeonConvertFp32ToBf16Workload:

Public Member Functions
	NeonConvertFp32ToBf16Workload (const ConvertFp32ToBf16QueueDescriptor &descriptor, const WorkloadInfo &info)

virtual void	Execute () const override

void	ReplaceInputTensorHandle (ITensorHandle *tensorHandle, unsigned int slot) override

void	ReplaceOutputTensorHandle (ITensorHandle *tensorHandle, unsigned int slot) override

Public Member Functions inherited from MultiTypedWorkload< QueueDescriptor, InputDataType, OutputDataType >
	MultiTypedWorkload (const QueueDescriptor &descriptor, const WorkloadInfo &info)

Public Member Functions inherited from BaseWorkload< QueueDescriptor >
	BaseWorkload (const QueueDescriptor &descriptor, const WorkloadInfo &info)

void	ExecuteAsync (WorkingMemDescriptor &workingMemDescriptor) override

void	PostAllocationConfigure () override

const QueueDescriptor &	GetData () const

arm::pipe::ProfilingGuid	GetGuid () const final

virtual bool	SupportsTensorHandleReplacement () const override

Public Member Functions inherited from IWorkload
virtual	~IWorkload ()

virtual void	RegisterDebugCallback (const DebugCallbackFunction &)

Additional Inherited Members
Protected Attributes inherited from BaseWorkload< QueueDescriptor >
QueueDescriptor	m_Data

const arm::pipe::ProfilingGuid	m_Guid

Detailed Description

Definition at line 15 of file NeonConvertFp32ToBf16Workload.hpp.

Constructor & Destructor Documentation

◆ NeonConvertFp32ToBf16Workload()

NeonConvertFp32ToBf16Workload	(	const ConvertFp32ToBf16QueueDescriptor &	descriptor,
		const WorkloadInfo &	info
	)

Definition at line 18 of file NeonConvertFp32ToBf16Workload.cpp.

References armnn::GatherTensorHandlePairs(), BaseWorkload< QueueDescriptor >::m_Data, and QueueDescriptor::ValidateInputsOutputs().

     : Float32ToBFloat16Workload<ConvertFp32ToBf16QueueDescriptor>(descriptor, info)
 {
     this->m_Data.ValidateInputsOutputs("NeonConvertFp32ToBf16Workload", 1, 1);
     GatherTensorHandlePairs(descriptor, m_TensorHandlePairs);
 }

Member Function Documentation

◆ Execute()

void Execute ( ) const

overridevirtual

Implements IWorkload.

Definition at line 26 of file NeonConvertFp32ToBf16Workload.cpp.

References ARMNN_SCOPED_PROFILING_EVENT_NEON_GUID, FloatingPointConverter::ConvertFloat32ToBFloat16(), armnn::CopyTensorContentsGeneric(), and BaseWorkload< QueueDescriptor >::GetGuid().

 {
     ARMNN_SCOPED_PROFILING_EVENT_NEON_GUID("NeonConvertFp32ToBf16Workload_Execute", this->GetGuid());
 
     auto convertFunc = [](uint8_t* dst, const uint8_t* src, size_t size)
         {
             auto input = reinterpret_cast<const float*>(src);
             auto output = reinterpret_cast<BFloat16*>(dst);
             size_t numElements = size/2; // 2 bytes per bf16
             armnnUtils::FloatingPointConverter::ConvertFloat32ToBFloat16(input, numElements, output);
         };
 
     for (const auto& pair : m_TensorHandlePairs)
     {
         CopyTensorContentsGeneric(pair.first, pair.second, convertFunc);
     }
 }

◆ ReplaceInputTensorHandle()

void ReplaceInputTensorHandle	(	ITensorHandle *	tensorHandle,
		unsigned int	slot
	)

overridevirtual

Reimplemented from BaseWorkload< QueueDescriptor >.

Definition at line 44 of file NeonConvertFp32ToBf16Workload.cpp.

References BaseWorkload< QueueDescriptor >::m_Data, and QueueDescriptor::m_Inputs.

 {
     ITensorHandle* backupHandle = this->m_Data.m_Inputs[slot];
     this->m_Data.m_Inputs[slot] = tensorHandle;
     try
     {
         Reconfigure();
     }
     catch(armnn::UnimplementedException& e)
     {
         // Cannot reconfigure, revert the slot back and throw the exception.
         this->m_Data.m_Inputs[slot] = backupHandle;
         throw e;
     }
 }

◆ ReplaceOutputTensorHandle()

void ReplaceOutputTensorHandle	(	ITensorHandle *	tensorHandle,
		unsigned int	slot
	)

overridevirtual

Reimplemented from BaseWorkload< QueueDescriptor >.

Definition at line 61 of file NeonConvertFp32ToBf16Workload.cpp.

References BaseWorkload< QueueDescriptor >::m_Data, and QueueDescriptor::m_Inputs.

 {
     ITensorHandle* backupHandle = this->m_Data.m_Inputs[slot];
     this->m_Data.m_Inputs[slot] = tensorHandle;
     try
     {
         Reconfigure();
     }
     catch(armnn::UnimplementedException& e)
     {
         // Cannot reconfigure, revert the slot back and throw the exception.
         this->m_Data.m_Inputs[slot] = backupHandle;
         throw e;
     }
 }

The documentation for this class was generated from the following files:

src/backends/neon/workloads/NeonConvertFp32ToBf16Workload.hpp
src/backends/neon/workloads/NeonConvertFp32ToBf16Workload.cpp

Public Member Functions

Additional Inherited Members

Detailed Description

Constructor & Destructor Documentation

◆ NeonConvertFp32ToBf16Workload()

Member Function Documentation

◆ Execute()

◆ ReplaceInputTensorHandle()

◆ ReplaceOutputTensorHandle()