patch/21.02/_convert_fp32_network_to_bf16_8hpp_source.xhtml

 //
 // Copyright © 2020 Arm Ltd. All rights reserved.
 // SPDX-License-Identifier: MIT
 //
 #pragma once

 #include "NetworkUtils.hpp"
 #include "Optimization.hpp"

 #include <armnn/utility/PolymorphicDowncast.hpp>

 namespace armnn
 {
 namespace optimizations
 {

 template <typename LayerT>
 inline LayerT* ConvertWeight(Layer* l)
 {
     LayerT* layer = PolymorphicDowncast<LayerT*>(l);
     if ((layer->GetType() == LayerType::Convolution2d || layer->GetType() == LayerType::FullyConnected)
          && layer->m_Weight)
     {
         const TensorInfo& info = layer->m_Weight->GetTensorInfo();

         if (info.GetDataType() == DataType::Float32)
         {
             std::vector<BFloat16> newValues(info.GetNumElements());

             armnnUtils::FloatingPointConverter::ConvertFloat32ToBFloat16(layer->m_Weight->template GetTensor<float>(),
                                                                          info.GetNumElements(),
                                                                          newValues.data());

             TensorInfo newInfo(info);
             newInfo.SetDataType(DataType::BFloat16);
             ConstTensor newInput(newInfo, newValues);
             layer->m_Weight.reset(new ScopedCpuTensorHandle(newInput));
         }
     }
     return layer;
 }

 class ConvertFp32NetworkToBf16Impl
 {
 public:

     void Run(Graph& graph, Layer& layer) const
     {
         // Only convert Float32 To BFloat16 for the Input of Convolution2d layer and FullyConnected layer.
         // And also convert weight data type from Float32 to Bfloat16.
         // Do not convert bias data type.
         if (layer.GetType() == LayerType::Convolution2d)
         {
             if (layer.GetDataType() == DataType::Float32)
             {
                 InsertConvertFp32ToBf16LayersBefore(graph,layer);
                 ConvertWeight<Convolution2dLayer>(&layer);
             }
         }
         else if (layer.GetType() == LayerType::FullyConnected)
         {
             if (layer.GetDataType() == DataType::Float32)
             {
                 InsertConvertFp32ToBf16LayersBefore(graph,layer);
                 ConvertWeight<FullyConnectedLayer>(&layer);
             }
         }
     }

 protected:
     ConvertFp32NetworkToBf16Impl() = default;
     ~ConvertFp32NetworkToBf16Impl() = default;
 };

 using Fp32NetworkToBf16Converter = OptimizeForType<Layer, ConvertFp32NetworkToBf16Impl>;

 } // namespace optimizations
 } // namespace armnn
armnn::optimizations::ConvertFp32NetworkToBf16Impl::~ConvertFp32NetworkToBf16Impl
~ConvertFp32NetworkToBf16Impl()=default

+armnn::TensorInfo
Definition: Tensor.hpp:152

+armnn::OptimizeForType
Definition: Optimization.hpp:67

+armnn::LayerType::FullyConnected

+armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_software_tools.dox:6

+PolymorphicDowncast.hpp

+armnn::optimizations::ConvertWeight
LayerT * ConvertWeight(Layer *l)
Definition: ConvertFp32NetworkToBf16.hpp:18

+armnn::optimizations::ConvertFp32NetworkToBf16Impl
Definition: ConvertFp32NetworkToBf16.hpp:43

+armnn::TensorInfo::GetDataType
DataType GetDataType() const
Definition: Tensor.hpp:194

+armnn::ConstTensor
A tensor defined by a TensorInfo (shape and data type) and an immutable backing store.
Definition: Tensor.hpp:314

+armnn::Layer::GetType
LayerType GetType() const override
Returns the armnn::LayerType of this layer.
Definition: Layer.hpp:265

+NetworkUtils.hpp

+armnn::LayerType::Convolution2d

+armnn::DataType::BFloat16

+armnn::Graph
Definition: Graph.hpp:29

+armnn::ScopedCpuTensorHandle
Definition: CpuTensorHandle.hpp:106

+armnnUtils::FloatingPointConverter::ConvertFloat32ToBFloat16
static void ConvertFloat32ToBFloat16(const float *srcFloat32Buffer, size_t numElements, void *dstBFloat16Buffer)
Definition: FloatingPointConverter.cpp:46

+armnn::BoostLogSeverityMapping::info

+armnn::InsertConvertFp32ToBf16LayersBefore
std::vector< ConvertFp32ToBf16Layer * > InsertConvertFp32ToBf16LayersBefore(Graph &graph, Layer &layer, bool expectCorrectInputType)
Definition: NetworkUtils.cpp:90

+armnn::optimizations::ConvertFp32NetworkToBf16Impl::ConvertFp32NetworkToBf16Impl
ConvertFp32NetworkToBf16Impl()=default

+armnn::Layer::GetDataType
DataType GetDataType() const
Definition: Layer.cpp:283

+armnn::DataType::Float32

+Optimization.hpp

+armnn::optimizations::ConvertFp32NetworkToBf16Impl::Run
void Run(Graph &graph, Layer &layer) const
Definition: ConvertFp32NetworkToBf16.hpp:47

+armnn::Layer
Definition: Layer.hpp:210

+armnn::TensorInfo::GetNumElements
unsigned int GetNumElements() const
Definition: Tensor.hpp:192

+