plain/22.11/_fuse_convert_fp32_to_bf16_into_const_layers_8hpp_source.xhtml

 //
 // Copyright © 2022 Arm Ltd and Contributors. All rights reserved.
 // SPDX-License-Identifier: MIT
 //

 #pragma once

 #include "Optimization.hpp"
 #include <armnnUtils/Permute.hpp>
 #include <ResolveType.hpp>

 namespace armnn
 {
 namespace optimizations
 {

 class FuseConvertFp32ToBf16IntoConstLayers
 {
 public:
     void Run(Graph& graph, InputSlot& connection) const
     {
         Layer& base = connection.GetConnectedOutputSlot()->GetOwningLayer();
         Layer& child = connection.GetOwningLayer();

         ARMNN_ASSERT(base.GetType() == LayerType::Constant);
         ARMNN_ASSERT(child.GetType() == LayerType::ConvertFp32ToBf16);

         auto dataType = base.GetDataType();
         switch (dataType)
         {
             case DataType::Float32:
                 ReplaceConvertFp32ToBf16Layer<DataType::BFloat16>(
                         graph,
                         PolymorphicDowncast<ConstantLayer*>(&base),
                         PolymorphicDowncast<ConvertFp32ToBf16Layer*>(&child));
                 break;
             default:
                 throw InvalidArgumentException(GetDataTypeName(dataType) +
                                                std::string(" Constant Layer cannot be fused into ")  +
                                                GetDataTypeName(child.GetDataType()) +
                                                std::string(" conversion layer."));
         }
     }
 protected:
     FuseConvertFp32ToBf16IntoConstLayers()  = default;
     ~FuseConvertFp32ToBf16IntoConstLayers() = default;
 private:
     template<armnn::DataType ArmnnType,
              typename T = armnn::ResolveType<ArmnnType>>
     static void ReplaceConvertFp32ToBf16Layer(Graph& graph,
                                               ConstantLayer* constantLayer,
                                               ConvertFp32ToBf16Layer* convertFp32ToBf16layer)
     {
         IgnoreUnused(graph);
         /**
          * This optimisation is to find situations where a constant set of inputs is being provided to a
          * ConvertFp32ToBf16 layer. In this case we don't want the overhead of Converting the values on
          * every inference, instead we want to Convert them once and store them in a Const layer to be
          * used everytime as they will not change.
          */
         TensorInfo outputConvertFp32ToBf16Info = convertFp32ToBf16layer->GetOutputSlot(0).GetTensorInfo();
         std::vector<T> newValues(outputConvertFp32ToBf16Info.GetNumElements());

         armnnUtils::FloatingPointConverter::ConvertFloat32ToBFloat16(
                 constantLayer->m_LayerOutput->GetConstTensor<float>(),
                 outputConvertFp32ToBf16Info.GetNumElements(),
                 newValues.data());
         TensorInfo newInfo = outputConvertFp32ToBf16Info;
         newInfo.SetConstant(true);
         ConstTensor newInput(newInfo, newValues);

         constantLayer->m_LayerOutput.reset(new ScopedTensorHandle(newInput));

         // Moves connections in convertFp32ToBf16layer output slot to the constant layer.
         // ConvertFp32ToBf16layer layer will be removed if left unconnected.
         convertFp32ToBf16layer->GetOutputSlot().MoveAllConnections(constantLayer->GetOutputSlot());

         // Updating the output tensor
         constantLayer->GetOutputSlot(0).SetTensorInfo(newInfo);
         ARMNN_ASSERT(constantLayer->GetOutputSlot(0).GetTensorInfo().IsConstant() == true);
     }
 };

 using FuseConversionLayersIntoConstLayers = OptimizeForConnection<ConstantLayer,
                                                                   ConvertFp32ToBf16Layer,
                                                                   FuseConvertFp32ToBf16IntoConstLayers>;

 } // namespace optimizations
 } // namespace armnn
armnn::ConstantLayer
A layer that the constant data can be bound to.
Definition: ConstantLayer.hpp:15

armnn::TensorInfo::IsConstant
bool IsConstant() const
Definition: Tensor.cpp:509

armnn::TensorInfo
Definition: Tensor.hpp:152

armnn::ConstantLayer::m_LayerOutput
std::shared_ptr< ConstTensorHandle > m_LayerOutput
Definition: ConstantLayer.hpp:44

armnn::optimizations::FuseConvertFp32ToBf16IntoConstLayers
Definition: FuseConvertFp32ToBf16IntoConstLayers.hpp:17

armnn::OutputSlot::GetOwningLayer
Layer & GetOwningLayer() const
Definition: Layer.hpp:119

armnn::ResolveType
typename ResolveTypeImpl< DT >::Type ResolveType
Definition: ResolveType.hpp:79

ResolveType.hpp

armnn::InputSlot
Definition: Layer.hpp:42

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_quick_start.dox:6

armnn::IgnoreUnused
void IgnoreUnused(Ts &&...)
Definition: IgnoreUnused.hpp:14

armnn::GetDataTypeName
constexpr const char * GetDataTypeName(DataType dataType)
Definition: TypesUtils.hpp:202

armnn::optimizations::FuseConvertFp32ToBf16IntoConstLayers::Run
void Run(Graph &graph, InputSlot &connection) const
Definition: FuseConvertFp32ToBf16IntoConstLayers.hpp:20

Permute.hpp

armnn::LayerType::ConvertFp32ToBf16

armnn::DataType
DataType
Definition: Types.hpp:48

armnn::ConstTensor
A tensor defined by a TensorInfo (shape and data type) and an immutable backing store.
Definition: Tensor.hpp:327

armnn::ScopedTensorHandle
Definition: TensorHandle.hpp:115

armnn::Layer::GetType
LayerType GetType() const override
Returns the armnn::LayerType of this layer.
Definition: Layer.hpp:273

ARMNN_ASSERT
#define ARMNN_ASSERT(COND)
Definition: Assert.hpp:14

armnn::InputSlot::GetConnectedOutputSlot
const OutputSlot * GetConnectedOutputSlot() const
Definition: Layer.hpp:56

armnn::InputSlot::GetOwningLayer
Layer & GetOwningLayer() const
Definition: Layer.hpp:53

armnn::InvalidArgumentException
Definition: Exceptions.hpp:80

armnn::OptimizeForConnection
Definition: Optimization.hpp:118

armnn::Graph
Definition: Graph.hpp:30

armnnUtils::FloatingPointConverter::ConvertFloat32ToBFloat16
static void ConvertFloat32ToBFloat16(const float *srcFloat32Buffer, size_t numElements, void *dstBFloat16Buffer)
Definition: FloatingPointConverter.cpp:46

armnn::optimizations::FuseConvertFp32ToBf16IntoConstLayers::FuseConvertFp32ToBf16IntoConstLayers
FuseConvertFp32ToBf16IntoConstLayers()=default

armnn::OutputSlot::SetTensorInfo
void SetTensorInfo(const TensorInfo &tensorInfo) override
Definition: Layer.cpp:87

armnn::TensorInfo::SetConstant
void SetConstant(const bool IsConstant=true)
Marks the data corresponding to this tensor info as constant.
Definition: Tensor.cpp:514

armnn::Layer::GetDataType
DataType GetDataType() const
Definition: Layer.cpp:313

armnn::Layer::GetOutputSlot
const OutputSlot & GetOutputSlot(unsigned int index=0) const override
Get the const output slot handle by slot index.
Definition: Layer.hpp:326

armnn::DataType::Float32

armnn::ConvertFp32ToBf16Layer
This layer converts data type Float32 to BFloat16.
Definition: ConvertFp32ToBf16Layer.hpp:14

Optimization.hpp

armnn::PaddingMode::Constant

armnn::OutputSlot::GetTensorInfo
const TensorInfo & GetTensorInfo() const override
Definition: Layer.cpp:92

armnn::OutputSlot::MoveAllConnections
void MoveAllConnections(OutputSlot &destination)
Moves all connections to another OutputSlot.
Definition: Layer.cpp:145

armnn::Layer
Definition: Layer.hpp:217

armnn::TensorInfo::GetNumElements
unsigned int GetNumElements() const
Definition: Tensor.hpp:196

armnn::optimizations::FuseConvertFp32ToBf16IntoConstLayers::~FuseConvertFp32ToBf16IntoConstLayers
~FuseConvertFp32ToBf16IntoConstLayers()=default