plain/20.05/_convert_fp32_network_to_fp16_8hpp_source.xhtml

 //
 // Copyright © 2017 Arm Ltd. All rights reserved.
 // SPDX-License-Identifier: MIT
 //
 #pragma once

 #include "Optimization.hpp"
 #include "NetworkUtils.hpp"

 namespace armnn
 {
 namespace optimizations
 {

 class ConvertFp32NetworkToFp16Impl
 {
 public:
     void Run(Graph& graph, Layer& layer) const
     {
         if(layer.GetType() == LayerType::Input)
         {
             // if the outputs of this layer are DataType::Float32
             // add a ConvertFloat32ToFloat16 layer after each of the outputs
             if (layer.GetDataType() == DataType::Float32)
             {
                 InsertConvertFp32ToFp16LayersAfter(graph, layer);
             }
         }
         else if (layer.GetType() == LayerType::Output)
         {
             // if the inputs of this layer are DataType::Float32
             // add a ConvertFloat16ToFloat32 layer before each of the inputs
             if (layer.GetDataType() == DataType::Float32)
             {
                 // NOTE: We need to call InsertConvertFp16ToFp32LayersBefore with expectCorrectInputType = false
                 // here, otherwise it will expect the inputs to be DataType::Float16
                 InsertConvertFp16ToFp32LayersBefore(graph, layer, false);
             }
         }
         else if (layer.GetType() != LayerType::ConvertFp32ToFp16 && layer.GetType() != LayerType::ConvertFp16ToFp32)
         {
             // if the inputs/outputs of this layer are DataType::Float32
             // change the data type for all inputs and outputs to DataType::Float16
             for (auto&& input = layer.BeginInputSlots(); input != layer.EndInputSlots(); ++input)
             {
                 // if it is connected to OutputSlot of the InputLayer do not change the DataType of connection
                 // InputSlots of the current layer will be updated when conversion layer is inserted after InputLayer
                 Layer& base = input->GetConnectedOutputSlot()->GetOwningLayer();
                 if (base.GetType() != LayerType::Input)
                 {
                     TensorInfo convertInfo = input->GetConnection()->GetTensorInfo();
                     if (convertInfo.GetDataType() == DataType::Float32)
                     {
                         convertInfo.SetDataType(DataType::Float16);
                         input->GetConnection()->SetTensorInfo(convertInfo);
                     }
                 }
             }

             // change outputs to DataType::Float16
             for (auto&& output = layer.BeginOutputSlots(); output != layer.EndOutputSlots(); ++output)
             {
                 TensorInfo convertInfo = output->GetTensorInfo();
                 if (convertInfo.GetDataType() == DataType::Float32)
                 {
                     convertInfo.SetDataType(DataType::Float16);
                     output->SetTensorInfo(convertInfo);
                 }
             }
         }
     }

 protected:
     ConvertFp32NetworkToFp16Impl() = default;
     ~ConvertFp32NetworkToFp16Impl() = default;
 };

 using Fp32NetworkToFp16Converter = OptimizeForType<Layer, ConvertFp32NetworkToFp16Impl>;

 } // namespace optimizations
 } // namespace armnn
armnn::Layer::EndInputSlots
std::vector< InputSlot >::iterator EndInputSlots()
Definition: Layer.hpp:236

armnn::InsertConvertFp32ToFp16LayersAfter
std::vector< ConvertFp32ToFp16Layer * > InsertConvertFp32ToFp16LayersAfter(Graph &graph, Layer &layer)
Definition: NetworkUtils.cpp:201

armnn::InsertConvertFp16ToFp32LayersBefore
std::vector< ConvertFp16ToFp32Layer * > InsertConvertFp16ToFp32LayersBefore(Graph &graph, Layer &layer, bool expectCorrectInputType)
Definition: NetworkUtils.cpp:129

armnn::TensorInfo
Definition: Tensor.hpp:53

armnn::LayerType::Output

armnn::OptimizeForType
Definition: Optimization.hpp:67

armnn::LayerType::ConvertFp32ToFp16

armnn::optimizations::ConvertFp32NetworkToFp16Impl::ConvertFp32NetworkToFp16Impl
ConvertFp32NetworkToFp16Impl()=default

armnn
Copyright (c) 2020 ARM Limited.
Definition: 00_introduction.dox:25

armnn::Layer::BeginInputSlots
std::vector< InputSlot >::iterator BeginInputSlots()
Definition: Layer.hpp:235

armnn::LayerType::ConvertFp16ToFp32

armnn::TensorInfo::GetDataType
DataType GetDataType() const
Definition: Tensor.hpp:95

NetworkUtils.hpp

armnn::DataType::Float16

armnn::optimizations::ConvertFp32NetworkToFp16Impl::Run
void Run(Graph &graph, Layer &layer) const
Definition: ConvertFp32NetworkToFp16.hpp:18

armnn::optimizations::ConvertFp32NetworkToFp16Impl::~ConvertFp32NetworkToFp16Impl
~ConvertFp32NetworkToFp16Impl()=default

armnn::optimizations::ConvertFp32NetworkToFp16Impl
Definition: ConvertFp32NetworkToFp16.hpp:15

armnn::TensorInfo::SetDataType
void SetDataType(DataType type)
Definition: Tensor.hpp:96

armnn::Graph
Definition: Graph.hpp:30

armnn::Layer::BeginOutputSlots
std::vector< OutputSlot >::iterator BeginOutputSlots()
Definition: Layer.hpp:239

armnn::LayerType::Input

armnn::Layer::EndOutputSlots
std::vector< OutputSlot >::iterator EndOutputSlots()
Definition: Layer.hpp:240

armnn::Layer::GetDataType
DataType GetDataType() const
Definition: Layer.cpp:274

armnn::Layer::GetType
LayerType GetType() const
Definition: Layer.hpp:259

armnn::DataType::Float32

Optimization.hpp

armnn::Layer
Definition: Layer.hpp:209