plain/22.08/_fuse_convert_f32_b_f16_into_const_layer_tests_8cpp_source.xhtml

 //
 // Copyright © 2022 Arm Ltd and Contributors. All rights reserved.
 // SPDX-License-Identifier: MIT
 //

 #include <LayersFwd.hpp>
 #include <Network.hpp>
 #include <NetworkUtils.hpp>
 #include <Optimizer.hpp>
 #include <TestUtils.hpp>

 #include <armnn/backends/TensorHandle.hpp>

 #include <doctest/doctest.h>

 TEST_SUITE("Optimizer")
 {
 using namespace armnn;
 using namespace armnn::optimizations;

 TEST_CASE("FuseConvertFp32Fp16intoConst")
 {
     Graph graph;
     const unsigned int shape[] = {1, 2, 2, 3};

     const TensorInfo constTensorInfo(4, shape, DataType::Float32, 1.0, 0, true);
     const TensorInfo outputConvertInfo(4, shape, DataType::BFloat16, 1.0, 0, true);

     ConstantLayer* constantLayer = graph.AddLayer<ConstantLayer>("constant");
     std::vector<float> constantValues(constTensorInfo.GetNumElements(), 3.1416f);
     ConstTensor constTensor(constTensorInfo, constantValues.data());
     constantLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(constTensor);
     constantLayer->GetOutputSlot().SetTensorInfo(constTensorInfo);

     ConvertFp32ToBf16Layer* convertLayer = graph.AddLayer<ConvertFp32ToBf16Layer>("convert");
     convertLayer->GetOutputSlot().SetTensorInfo(outputConvertInfo);

     OutputLayer* output = graph.AddLayer<OutputLayer>(0, "output");

     // Connect up constant -> convert -> output
     constantLayer->GetOutputSlot().Connect(convertLayer->GetInputSlot(0));
     convertLayer->GetOutputSlot().Connect(output->GetInputSlot(0));

     auto checkConstantFloat32 = [](const armnn::Layer *const layer) -> bool {
         return IsLayerOfType<ConstantLayer>(layer) &&
                (layer->GetDataType() == DataType::Float32);
     };
     auto checkConstantBFloat16 = [](const armnn::Layer *const layer) -> bool {
         return IsLayerOfType<ConstantLayer>(layer) &&
                (layer->GetDataType() == DataType::BFloat16);
     };

     CHECK(CheckSequence(graph.cbegin(), graph.cend(),
                         checkConstantFloat32,
                         &IsLayerOfType<ConvertFp32ToBf16Layer>,
                         &IsLayerOfType<OutputLayer>));

     armnn::Optimizer::Pass(graph, MakeOptimizations(FuseConversionLayersIntoConstLayers()));

     CHECK(CheckSequence(graph.cbegin(), graph.cend(),
                         checkConstantBFloat16,
                         &IsLayerOfType<OutputLayer>));
 }

 TEST_CASE("RevertConstantWeightsToFP32")
 {
     Graph graph;
     const unsigned int shape[] = {1, 2, 2, 3};

     const TensorInfo constTensorInfo(4, shape, DataType::Float32, 1.0, 0, true);
     const TensorInfo outputConvertInfo(4, shape, DataType::BFloat16, 1.0, 0, true);

     TensorInfo inputInfo(4, shape, DataType::Float32);
     auto* input = graph.AddLayer<InputLayer>(0, "input0");
     input->GetOutputSlot().SetTensorInfo(inputInfo);

     auto* constantLayer = graph.AddLayer<ConstantLayer>("constant");
     std::vector<float> constantValues(constTensorInfo.GetNumElements(), 3.1416f);
     ConstTensor constTensor(constTensorInfo, constantValues.data());
     constantLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(constTensor);
     constantLayer->GetOutputSlot().SetTensorInfo(constTensorInfo);

     ConvertFp32ToBf16Layer* convertLayerInputs = graph.AddLayer<ConvertFp32ToBf16Layer>("convert");
     convertLayerInputs->GetOutputSlot().SetTensorInfo(outputConvertInfo);
     ConvertFp32ToBf16Layer* convertLayerWeights = graph.AddLayer<ConvertFp32ToBf16Layer>("convert2");
     convertLayerWeights->GetOutputSlot().SetTensorInfo(outputConvertInfo);
     ConvertFp32ToBf16Layer* convertLayerBiases = graph.AddLayer<ConvertFp32ToBf16Layer>("convert3");
     convertLayerBiases->GetOutputSlot().SetTensorInfo(outputConvertInfo);

     auto* biases  = graph.AddLayer<armnn::ConstantLayer>("Biases");
     biases->m_LayerOutput  = std::make_unique<armnn::ScopedTensorHandle>(constTensor);
     biases->GetOutputSlot().SetTensorInfo(constTensorInfo);

     armnn::Convolution2dDescriptor descriptor;
     descriptor.m_BiasEnabled = true;
     auto* conv = graph.AddLayer<armnn::Convolution2dLayer>(descriptor, "conv2d");
     const armnn::TensorInfo infoFP32({ 2, 3, 8, 1 }, armnn::DataType::Float32);
     conv->GetOutputSlot().SetTensorInfo(infoFP32);

     auto* output = graph.AddLayer<OutputLayer>(0, "output");

     // Connect up Input    -> Convert ->
     //            Constant -> Convert -> Conv2d -> Output
     //            Constant -> Convert ->
     input->GetOutputSlot().Connect(convertLayerInputs->GetInputSlot(0));
     constantLayer->GetOutputSlot().Connect(convertLayerWeights->GetInputSlot(0));
     biases->GetOutputSlot().Connect(convertLayerBiases->GetInputSlot(0));

     convertLayerInputs->GetOutputSlot().Connect(conv->GetInputSlot(0));
     convertLayerWeights->GetOutputSlot().Connect(conv->GetInputSlot(1));
     convertLayerBiases->GetOutputSlot().Connect(conv->GetInputSlot(2));

     conv->GetOutputSlot().Connect(output->GetInputSlot(0));

     auto checkConstantFloat32 = [](const armnn::Layer *const layer) -> bool {
         return IsLayerOfType<ConstantLayer>(layer) &&
                (layer->GetDataType() == DataType::Float32);
     };
     auto checkConstantBFloat16 = [](const armnn::Layer *const layer) -> bool {
         return IsLayerOfType<ConstantLayer>(layer) &&
                (layer->GetDataType() == DataType::BFloat16);
     };

     CHECK(CheckSequence(graph.cbegin(), graph.cend(),
                         &IsLayerOfType<InputLayer>,
                         checkConstantFloat32,
                         checkConstantFloat32,
                         &IsLayerOfType<ConvertFp32ToBf16Layer>,
                         &IsLayerOfType<ConvertFp32ToBf16Layer>,
                         &IsLayerOfType<ConvertFp32ToBf16Layer>,
                         &IsLayerOfType<Convolution2dLayer>,
                         &IsLayerOfType<OutputLayer>));

     armnn::Optimizer::Pass(graph, MakeOptimizations(FuseConversionLayersIntoConstLayers()));

     bool revert = RevertConstantWeightsToFP32(conv);

     // Erase unconnected layer as occurs during Topological Sort.
     graph.EraseLayer(convertLayerInputs);

     CHECK(revert);
     CHECK(constantLayer->GetDataType() == DataType::Float32);

     CHECK(CheckSequence(graph.cbegin(), graph.cend(),
                         &IsLayerOfType<InputLayer>,
                         checkConstantBFloat16,
                         checkConstantFloat32,
                         &IsLayerOfType<Convolution2dLayer>,
                         &IsLayerOfType<OutputLayer>));
 }
 }
armnn::ConstantLayer
A layer that the constant data can be bound to.
Definition: ConstantLayer.hpp:15

armnn::Convolution2dDescriptor::m_BiasEnabled
bool m_BiasEnabled
Enable/disable bias.
Definition: Descriptors.hpp:543

TEST_SUITE
TEST_SUITE("Optimizer")
Definition: FuseConvertF32BF16IntoConstLayerTests.cpp:16

armnn::MakeOptimizations
Optimizer::Optimizations MakeOptimizations(Args &&... args)
Definition: Optimizer.hpp:43

CheckSequence
bool CheckSequence(const armnn::Graph::ConstIterator first, const armnn::Graph::ConstIterator last)
Definition: TestUtils.hpp:21

armnn::TensorInfo
Definition: Tensor.hpp:152

armnn::optimizations
Definition: AddBroadcastReshapeLayer.hpp:15

armnn::ConstantLayer::m_LayerOutput
std::shared_ptr< ConstTensorHandle > m_LayerOutput
Definition: ConstantLayer.hpp:44

armnn::Graph::AddLayer
LayerT * AddLayer(Args &&... args)
Adds a new layer, of type LayerType, to the graph constructed with the arguments passed.
Definition: Graph.hpp:456

armnn::Graph::cbegin
ConstIterator cbegin() const
Returns const iterator pointing to the beginning of the list. Lowercase for range-based for loops...
Definition: Graph.hpp:179

armnn::Convolution2dDescriptor
A Convolution2dDescriptor for the Convolution2dLayer.
Definition: Descriptors.hpp:495

armnn::OutputSlot::Connect
int Connect(InputSlot &destination)
Definition: Layer.cpp:112

armnn::Graph::EraseLayer
void EraseLayer(Iterator pos)
Deletes the layer at the specified position.
Definition: Graph.hpp:504

armnn::Optimizer::Pass
static void Pass(Graph &graph, const Optimizations &optimizations)
Definition: Optimizer.cpp:16

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_quick_start.dox:6

Optimizer.hpp

armnn::Layer::GetInputSlot
const InputSlot & GetInputSlot(unsigned int index) const override
Get a const input slot handle by slot index.
Definition: Layer.hpp:324

armnn::OutputLayer
A layer user-provided data can be bound to (e.g. inputs, outputs).
Definition: OutputLayer.hpp:13

armnn::ConstTensor
A tensor defined by a TensorInfo (shape and data type) and an immutable backing store.
Definition: Tensor.hpp:327

armnn::RevertConstantWeightsToFP32
bool RevertConstantWeightsToFP32(Layer *layer)
Definition: NetworkUtils.cpp:277

NetworkUtils.hpp

TensorHandle.hpp

armnn::DataType::BFloat16

armnn::Graph
Definition: Graph.hpp:30

armnn::InputLayer
A layer user-provided data can be bound to (e.g. inputs, outputs).
Definition: InputLayer.hpp:13

Network.hpp

armnn::OutputSlot::SetTensorInfo
void SetTensorInfo(const TensorInfo &tensorInfo) override
Definition: Layer.cpp:87

armnn::Layer::GetOutputSlot
const OutputSlot & GetOutputSlot(unsigned int index=0) const override
Get the const output slot handle by slot index.
Definition: Layer.hpp:326

armnn::DataType::Float32

LayersFwd.hpp

armnn::Graph::cend
ConstIterator cend() const
Returns const iterator pointing to the end of the list. Lowercase for range-based for loops...
Definition: Graph.hpp:181

armnn::Convolution2dLayer
This layer represents a convolution 2d operation.
Definition: Convolution2dLayer.hpp:15

armnn::ConvertFp32ToBf16Layer
This layer converts data type Float32 to BFloat16.
Definition: ConvertFp32ToBf16Layer.hpp:14

armnn::optimizations::FuseConversionLayersIntoConstLayers
OptimizeForConnection< ConstantLayer, ConvertFp32ToBf16Layer, FuseConvertFp32ToBf16IntoConstLayers > FuseConversionLayersIntoConstLayers
Definition: FuseConvertFp32ToBf16IntoConstLayers.hpp:86

armnn::Layer
Definition: Layer.hpp:217

armnn::TensorInfo::GetNumElements
unsigned int GetNumElements() const
Definition: Tensor.hpp:196