plain/21.05/_optimizer_tests_8cpp_source.xhtml

 //
 // Copyright © 2017 Arm Ltd and Contributors. All rights reserved.
 // SPDX-License-Identifier: MIT
 //

 #include "TestUtils.hpp"

 #include <BackendSettings.hpp>
 #include <Graph.hpp>
 #include <Network.hpp>
 #include <Optimizer.hpp>

 #include <armnn/BackendHelper.hpp>
 #include <armnn/BackendRegistry.hpp>
 #include <armnn/INetwork.hpp>
 #include <armnn/LayerVisitorBase.hpp>

 #include <armnn/utility/PolymorphicDowncast.hpp>
 #include <armnnUtils/FloatingPointConverter.hpp>

 #include <backendsCommon/IBackendInternal.hpp>
 #include <backendsCommon/LayerSupportBase.hpp>
 #include <backendsCommon/TensorHandle.hpp>

 #include <boost/test/unit_test.hpp>

 using namespace armnn;

 namespace
 {

 void CreateLSTMLayerHelper(Graph &graph, bool CifgEnabled)
 {
     LstmDescriptor layerDesc;
     layerDesc.m_ActivationFunc = 4;
     layerDesc.m_ClippingThresCell = 0.2f;
     layerDesc.m_ClippingThresProj = 0.4f;
     layerDesc.m_CifgEnabled = CifgEnabled;
     layerDesc.m_PeepholeEnabled = false;
     layerDesc.m_ProjectionEnabled = false;

     LstmLayer* const layer = graph.AddLayer<LstmLayer>(layerDesc, "layer");
     unsigned int batchSize = 3;
     unsigned int inputSize = 2;
     unsigned int numUnits = 4;
     unsigned int outputSize = 4;

     layer->m_BasicParameters.m_InputToForgetWeights = std::make_unique<ScopedTensorHandle>
             (TensorInfo({ numUnits, inputSize }, DataType::Float32));
     layer->m_BasicParameters.m_InputToCellWeights = std::make_unique<ScopedTensorHandle>
             (TensorInfo({ numUnits, inputSize }, DataType::Float32));
     layer->m_BasicParameters.m_InputToOutputWeights = std::make_unique<ScopedTensorHandle>
             (TensorInfo({ numUnits, inputSize }, DataType::Float32));
     layer->m_BasicParameters.m_RecurrentToForgetWeights = std::make_unique<ScopedTensorHandle>
             (TensorInfo({ numUnits, outputSize }, DataType::Float32));
     layer->m_BasicParameters.m_RecurrentToCellWeights = std::make_unique<ScopedTensorHandle>
             (TensorInfo({ numUnits, outputSize }, DataType::Float32));
     layer->m_BasicParameters.m_RecurrentToOutputWeights = std::make_unique<ScopedTensorHandle>
             (TensorInfo({ numUnits, outputSize }, DataType::Float32));
     layer->m_BasicParameters.m_ForgetGateBias = std::make_unique<ScopedTensorHandle>
             (TensorInfo({ numUnits }, DataType::Float32));
     layer->m_BasicParameters.m_CellBias = std::make_unique<ScopedTensorHandle>
             (TensorInfo({ numUnits }, DataType::Float32));
     layer->m_BasicParameters.m_OutputGateBias = std::make_unique<ScopedTensorHandle>
             (TensorInfo({ numUnits }, DataType::Float32));

     layer->m_BasicParameters.m_InputToForgetWeights->Allocate();
     layer->m_BasicParameters.m_InputToCellWeights->Allocate();
     layer->m_BasicParameters.m_InputToOutputWeights->Allocate();
     layer->m_BasicParameters.m_RecurrentToForgetWeights->Allocate();
     layer->m_BasicParameters.m_RecurrentToCellWeights->Allocate();
     layer->m_BasicParameters.m_RecurrentToOutputWeights->Allocate();
     layer->m_BasicParameters.m_ForgetGateBias->Allocate();
     layer->m_BasicParameters.m_CellBias->Allocate();
     layer->m_BasicParameters.m_OutputGateBias->Allocate();

     if (!layerDesc.m_CifgEnabled)
     {
         layer->m_CifgParameters.m_InputToInputWeights = std::make_unique<ScopedTensorHandle>
                 (TensorInfo({ numUnits, inputSize }, DataType::Float32));
         layer->m_CifgParameters.m_RecurrentToInputWeights = std::make_unique<ScopedTensorHandle>
                 (TensorInfo({ numUnits, outputSize }, DataType::Float32));
         layer->m_CifgParameters.m_InputGateBias = std::make_unique<ScopedTensorHandle>
                 (TensorInfo({ numUnits }, DataType::Float32));
         layer->m_CifgParameters.m_InputToInputWeights->Allocate();
         layer->m_CifgParameters.m_RecurrentToInputWeights->Allocate();
         layer->m_CifgParameters.m_InputGateBias->Allocate();
     }

     if (layerDesc.m_ProjectionEnabled)
     {
         layer->m_ProjectionParameters.m_ProjectionWeights = std::make_unique<ScopedTensorHandle>
                 (TensorInfo({ outputSize, numUnits }, DataType::Float32));
         layer->m_ProjectionParameters.m_ProjectionBias = std::make_unique<ScopedTensorHandle>
                 (TensorInfo({ outputSize }, DataType::Float32));
         layer->m_ProjectionParameters.m_ProjectionWeights->Allocate();
         layer->m_ProjectionParameters.m_ProjectionBias->Allocate();
     }

     if (layerDesc.m_PeepholeEnabled)
     {
         if (!layerDesc.m_CifgEnabled)
         {
             layer->m_PeepholeParameters.m_CellToInputWeights = std::make_unique<ScopedTensorHandle>
                     (TensorInfo({ numUnits }, DataType::Float32));
             layer->m_PeepholeParameters.m_CellToInputWeights->Allocate();
         }
         layer->m_PeepholeParameters.m_CellToForgetWeights = std::make_unique<ScopedTensorHandle>
                 (TensorInfo({ numUnits }, DataType::Float32));
         layer->m_PeepholeParameters.m_CellToOutputWeights = std::make_unique<ScopedTensorHandle>
                 (TensorInfo({ numUnits }, DataType::Float32));
         layer->m_PeepholeParameters.m_CellToForgetWeights->Allocate();
         layer->m_PeepholeParameters.m_CellToOutputWeights->Allocate();
     }

     // create input and output layers
     Layer* const input = graph.AddLayer<InputLayer>(0, "input");
     Layer* const outputStateIn = graph.AddLayer<InputLayer>(1, "outputStateIn");
     Layer* const cellStateIn = graph.AddLayer<InputLayer>(2, "cellStateIn");
     Layer* const scratchBuffer = graph.AddLayer<OutputLayer>(0, "scratchBuffer");
     Layer* const outputStateOut = graph.AddLayer<OutputLayer>(1, "outputStateOut");
     Layer* const cellStateOut = graph.AddLayer<OutputLayer>(2, "cellStateOut");
     Layer* const output = graph.AddLayer<OutputLayer>(3, "output");

     // connect up
     armnn::TensorInfo lstmTensorInfo1({ batchSize, inputSize }, DataType::Float32);
     armnn::TensorInfo lstmTensorInfo2({ batchSize, numUnits}, DataType::Float32);
     armnn::TensorInfo lstmTensorInfo3({ batchSize, outputSize }, DataType::Float32);
     armnn::TensorInfo lstmTensorInfoScratchBuff({ batchSize, numUnits * (layerDesc.m_CifgEnabled ? 3 : 4) },
                                                 DataType::Float32);

     Connect(input, layer, lstmTensorInfo1, 0, 0);
     Connect(cellStateIn, layer, lstmTensorInfo2, 0, 1);
     Connect(outputStateIn, layer, lstmTensorInfo3, 0, 2);
     Connect(layer, scratchBuffer, lstmTensorInfoScratchBuff, 0, 0);
     Connect(layer, outputStateOut, lstmTensorInfo3, 1, 0);
     Connect(layer, cellStateOut, lstmTensorInfo2, 2, 0);
     Connect(layer, output, lstmTensorInfo3, 3, 0);
 }

 }    // namespace

 BOOST_AUTO_TEST_SUITE(Optimizer)
 using namespace armnn::optimizations;

 BOOST_AUTO_TEST_CASE(LSTMValidateTensorShapesFromInputsCIFGDisabledTest)
 {
     Graph graph;

     //Helper function creates graph containing LSTM layer with required input and output layers
     CreateLSTMLayerHelper(graph, false);

     //This function used to call ValidateShapesFromInputs();
     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 BOOST_AUTO_TEST_CASE(LSTMValidateTensorShapesFromInputsCIFGEnabledTest)
 {
     Graph graph;

     //Helper function creates graph containing LSTM layer with required input and output layers
     CreateLSTMLayerHelper(graph, true);

     //This function used to call ValidateShapesFromInputs();
     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 BOOST_AUTO_TEST_CASE(InsertConvertersTest)
 {
     const armnn::TensorInfo info({ 1, 5, 2, 3 }, armnn::DataType::Float16);

     armnn::Graph graph;

     armnn::LayerBindingId inputId = 0;

     armnn::Layer* head = graph.AddLayer<armnn::OutputLayer>(0, "output");

     head = graph.InsertNewLayer<armnn::AdditionLayer>(head->GetInputSlot(0), "");
     head->GetOutputHandler().SetTensorInfo(info);

     graph.InsertNewLayer<armnn::InputLayer>(head->GetInputSlot(1), inputId++, "")
         ->GetOutputHandler().SetTensorInfo(info);

     head = graph.InsertNewLayer<armnn::FloorLayer>(head->GetInputSlot(0), "");
     head->GetOutputHandler().SetTensorInfo(info);

     head = graph.InsertNewLayer<armnn::MemCopyLayer>(head->GetInputSlot(0), "");
     head->GetOutputHandler().SetTensorInfo(info);

     graph.InsertNewLayer<armnn::InputLayer>(head->GetInputSlot(0), inputId++, "")
         ->GetOutputHandler().SetTensorInfo(info);

     // Check graph layer sequence before inserting convert layers
     BOOST_TEST(CheckSequence(graph.cbegin(),
                              graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::MemCopyLayer>,
                              &IsLayerOfType<armnn::FloorLayer>,
                              &IsLayerOfType<armnn::AdditionLayer>,
                              &IsLayerOfType<armnn::OutputLayer>));

     // Check layers have Float16 DataType
     for (auto& layer : graph)
     {
         if(layer->GetType()==LayerType::Floor || layer->GetType() == LayerType::Addition)
         {
             ARMNN_ASSERT(layer->GetOutputSlot(0).GetTensorInfo().GetDataType() == DataType::Float16);
             ARMNN_ASSERT(layer->GetDataType() == DataType::Float16);
         }
     }

     // Insert convert layers either side of unsupported layer
     for (auto& layer : graph)
     {
         if(layer->GetType()==LayerType::Floor || layer->GetType() == LayerType::Addition)
         {
             InsertConvertFp16ToFp32LayersBefore(graph, *layer);
             InsertConvertFp32ToFp16LayersAfter(graph, *layer);
         }
     }

     // Check layers have correct DataType after inserting convert layers
     for (auto& layer : graph)
     {
         if (layer->GetType()==LayerType::Floor || layer->GetType() == LayerType::Addition)
         {
             ARMNN_ASSERT(layer->GetOutputSlot(0).GetTensorInfo().GetDataType() == DataType::Float32);
             ARMNN_ASSERT(layer->GetDataType() == DataType::Float32);
         }
         else if (layer->GetType() == LayerType::ConvertFp16ToFp32)
         {
             ARMNN_ASSERT(layer->GetOutputSlot(0).GetTensorInfo().GetDataType() == DataType::Float32);
             ARMNN_ASSERT(layer->GetDataType() == DataType::Float16);
         }
         else if (layer->GetType() == LayerType::ConvertFp32ToFp16)
         {
             ARMNN_ASSERT(layer->GetOutputSlot(0).GetTensorInfo().GetDataType() == DataType::Float16);
             ARMNN_ASSERT(layer->GetDataType() == DataType::Float32);
         }
     }

     // Check sequence of layers after inserting convert layers
     BOOST_TEST(CheckSequence(graph.cbegin(),
                              graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::ConvertFp16ToFp32Layer>,
                              &IsLayerOfType<armnn::MemCopyLayer>,
                              &IsLayerOfType<armnn::ConvertFp16ToFp32Layer>,
                              &IsLayerOfType<armnn::FloorLayer>,
                              &IsLayerOfType<armnn::ConvertFp32ToFp16Layer>,
                              &IsLayerOfType<armnn::ConvertFp16ToFp32Layer>,
                              &IsLayerOfType<armnn::AdditionLayer>,
                              &IsLayerOfType<armnn::ConvertFp32ToFp16Layer>,
                              &IsLayerOfType<armnn::OutputLayer>));
 }

 void CreateConvolution2dGraph(Graph &graph, const unsigned int* inputShape,
                               const unsigned int* weightsShape, const unsigned int* outputShape,
                               DataLayout dataLayout = DataLayout::NCHW)
 {
     armnn::TensorInfo inputInfo(4, inputShape, DataType::Float32);
     armnn::TensorInfo outputInfo(4, outputShape, DataType::Float32);

     std::vector<float> weightsVector(90);
     armnn::ConstTensor weights(armnn::TensorInfo(4, weightsShape, armnn::DataType::Float32), weightsVector);

     Convolution2dDescriptor desc;
     desc.m_BiasEnabled = false;
     desc.m_StrideX     = 1;
     desc.m_StrideY     = 1;
     desc.m_DataLayout  = dataLayout;

     Layer* input = graph.AddLayer<InputLayer>(0, "input");
     input->GetOutputSlot().SetTensorInfo(inputInfo);

     Convolution2dLayer* layer = graph.AddLayer<Convolution2dLayer>(desc, "conv2d");
     layer->m_Weight           = std::make_unique<armnn::ScopedTensorHandle>(weights);
     layer->GetOutputSlot().SetTensorInfo(outputInfo);

     Layer* output = graph.AddLayer<OutputLayer>(0, "output");
     input->GetOutputSlot().Connect(layer->GetInputSlot(0));
     layer->GetOutputSlot().Connect(output->GetInputSlot(0));
 }

 BOOST_AUTO_TEST_CASE(Conv2dValidateTensorShapesFromInputs)
 {
     Graph graph;
     const unsigned int inputShape[] = { 1, 3, 8, 16 };
     const unsigned int weightsShape[] = { 2, 3, 5, 3 };
     const unsigned int outputShape[] = { 1, 2, 4, 14 };
     CreateConvolution2dGraph(graph, inputShape, weightsShape, outputShape);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 BOOST_AUTO_TEST_CASE(Conv2dValidateTensorShapesFromInputsNhwc)
 {
     Graph graph;
     const unsigned int inputShape[] = { 1, 8, 16, 3 };
     const unsigned int weightsShape[] = { 2, 5, 3, 3 };
     const unsigned int outputShape[] = { 1, 4, 14, 2 };
     CreateConvolution2dGraph(graph, inputShape, weightsShape, outputShape, DataLayout::NHWC);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 void CreateDepthwiseConvolution2dGraph(Graph &graph, const unsigned int* inputShape,
                                        const unsigned int* weightsShape, const unsigned int* outputShape,
                                        DataLayout dataLayout = DataLayout::NCHW)
 {
     armnn::TensorInfo inputInfo(4, inputShape, DataType::Float32);
     armnn::TensorInfo outputInfo(4, outputShape, DataType::Float32);

     std::vector<float> weightsVector(18);
     armnn::ConstTensor weights(armnn::TensorInfo(4, weightsShape, armnn::DataType::Float32), weightsVector);

     DepthwiseConvolution2dDescriptor desc;
     desc.m_BiasEnabled = false;
     desc.m_StrideX     = 1;
     desc.m_StrideY     = 1;
     desc.m_DataLayout  = dataLayout;

     Layer* input = graph.AddLayer<InputLayer>(0, "input");
     input->GetOutputSlot().SetTensorInfo(inputInfo);

     DepthwiseConvolution2dLayer* layer = graph.AddLayer<DepthwiseConvolution2dLayer>(desc, "depthwiseConv2d");
     layer->m_Weight                    = std::make_unique<armnn::ScopedTensorHandle>(weights);
     layer->GetOutputSlot().SetTensorInfo(outputInfo);

     Layer* output = graph.AddLayer<OutputLayer>(0, "output");
     input->GetOutputSlot().Connect(layer->GetInputSlot(0));
     layer->GetOutputSlot().Connect(output->GetInputSlot(0));
 }

 BOOST_AUTO_TEST_CASE(DepthwiseConv2dValidateTensorShapesFromInputs)
 {
     Graph graph;
     const unsigned int inputShape[] = { 1, 2, 3, 3 };
     const unsigned int weightsShape[] = { 1, 2, 3, 3 };
     const unsigned int outputShape[] = { 1, 2, 1, 1 };
     CreateDepthwiseConvolution2dGraph(graph, inputShape, weightsShape, outputShape);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 BOOST_AUTO_TEST_CASE(DepthwiseConv2dValidateTensorShapesFromInputsNhwc)
 {
     Graph graph;
     const unsigned int inputShape[] = { 1, 3, 3, 2 };
     const unsigned int weightsShape[] = { 1, 2, 3, 3 };
     const unsigned int outputShape[] = { 1, 1, 1, 2 };
     CreateDepthwiseConvolution2dGraph(graph, inputShape, weightsShape, outputShape, DataLayout::NHWC);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 void CreatePooling2dGraph(Graph& graph, const unsigned int* inputShape,  const unsigned int* outputShape,
                           DataLayout dataLayout = DataLayout::NCHW)
 {
     armnn::TensorInfo inputInfo(4, inputShape, DataType::Float32);
     armnn::TensorInfo outputInfo(4, outputShape, DataType::Float32);

     Pooling2dDescriptor desc;
     desc.m_PoolType  = armnn::PoolingAlgorithm::Average;
     desc.m_PoolWidth = desc.m_PoolHeight = 100;
     desc.m_StrideX = desc.m_StrideY = 5;
     desc.m_PadLeft                  = 50;
     desc.m_PadRight                 = 50;
     desc.m_PadTop                   = 50;
     desc.m_PadBottom                = 50;
     desc.m_PaddingMethod            = armnn::PaddingMethod::Exclude;
     desc.m_DataLayout               = dataLayout;

     Layer* input = graph.AddLayer<InputLayer>(0, "input");
     input->GetOutputSlot().SetTensorInfo(inputInfo);

     Pooling2dLayer* layer = graph.AddLayer<Pooling2dLayer>(desc, "pooling2d");
     layer->GetOutputSlot().SetTensorInfo(outputInfo);

     Layer* output = graph.AddLayer<OutputLayer>(0, "output");
     input->GetOutputSlot().Connect(layer->GetInputSlot(0));
     layer->GetOutputSlot().Connect(output->GetInputSlot(0));
 }

 BOOST_AUTO_TEST_CASE(Pooling2dValidateTensorShapesFromInputs)
 {
     Graph graph;
     const unsigned int inputShape[]  = { 5, 3, 52, 60 };
     const unsigned int outputShape[] = { 5, 3, 11, 13 };
     CreatePooling2dGraph(graph, inputShape, outputShape, DataLayout::NCHW);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 BOOST_AUTO_TEST_CASE(Pooling2dValidateTensorShapesFromInputsNhwc)
 {
     Graph graph;
     const unsigned int inputShape[]  = { 5, 52, 60, 3 };
     const unsigned int outputShape[] = { 5, 11, 13, 3 };
     CreatePooling2dGraph(graph, inputShape, outputShape, DataLayout::NHWC);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 void CreateResizeBilinearGraph(Graph& graph,
                                const unsigned int* inputShape,
                                const unsigned int* outputShape,
                                DataLayout dataLayout = DataLayout::NCHW)
 {
     TensorInfo inputInfo(4, inputShape, DataType::Float32);
     TensorInfo outputInfo(4, outputShape, DataType::Float32);

     ResizeDescriptor desc;
     desc.m_Method       = ResizeMethod::Bilinear;
     desc.m_TargetHeight = 3;
     desc.m_TargetWidth  = 4;
     desc.m_DataLayout   = dataLayout;

     Layer* input = graph.AddLayer<InputLayer>(0, "input");
     input->GetOutputSlot().SetTensorInfo(inputInfo);

     ResizeLayer* layer = graph.AddLayer<ResizeLayer>(desc, "resizeBilinear");
     layer->GetOutputSlot().SetTensorInfo(outputInfo);

     Layer* output = graph.AddLayer<OutputLayer>(0, "output");
     input->GetOutputSlot().Connect(layer->GetInputSlot(0));
     layer->GetOutputSlot().Connect(output->GetInputSlot(0));
 }

 BOOST_AUTO_TEST_CASE(ResizeBilinearValidateTensorShapesFromInputs)
 {
     Graph graph;
     const unsigned int inputShape[]  = { 1, 2, 4, 5 };
     const unsigned int outputShape[] = { 1, 2, 3, 4 };
     CreateResizeBilinearGraph(graph, inputShape, outputShape);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 BOOST_AUTO_TEST_CASE(ResizeBilinearValidateTensorShapesFromInputsNhwc)
 {
     Graph graph;
     const unsigned int inputShape[]  = { 1, 4, 5, 2 };
     const unsigned int outputShape[] = { 1, 3, 4, 2 };
     CreateResizeBilinearGraph(graph, inputShape, outputShape, DataLayout::NHWC);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 void CreateGatherGraph(Graph& graph,
                        const armnn::TensorInfo& paramsInfo,
                        const armnn::TensorInfo& indicesInfo,
                        const armnn::TensorInfo& outputInfo)
 {
     Layer* input0 = graph.AddLayer<InputLayer>(0, "params");
     input0->GetOutputSlot().SetTensorInfo(paramsInfo);

     Layer* input1 = graph.AddLayer<InputLayer>(1, "indices");
     input1->GetOutputSlot().SetTensorInfo(indicesInfo);

     GatherDescriptor descriptor;
     GatherLayer* layer = graph.AddLayer<GatherLayer>(descriptor, "gather");
     layer->GetOutputSlot().SetTensorInfo(outputInfo);

     Layer* output = graph.AddLayer<OutputLayer>(0, "output");
     input0->GetOutputSlot().Connect(layer->GetInputSlot(0));
     input1->GetOutputSlot().Connect(layer->GetInputSlot(1));
     layer->GetOutputSlot().Connect(output->GetInputSlot(0));
 }

 BOOST_AUTO_TEST_CASE(GatherValidateTensorShapesFromInputs)
 {
     Graph graph;
     armnn::TensorInfo paramsInfo({10, 5}, DataType::Float32);
     armnn::TensorInfo indicesInfo({3}, DataType::Signed32);
     armnn::TensorInfo outputInfo({3, 5}, DataType::Float32);

     CreateGatherGraph(graph, paramsInfo, indicesInfo, outputInfo);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 BOOST_AUTO_TEST_CASE(GatherValidateTensorShapesFromInputs1DParams)
 {
     Graph graph;
     armnn::TensorInfo paramsInfo({8}, DataType::Float32);
     armnn::TensorInfo indicesInfo({5}, DataType::Signed32);
     armnn::TensorInfo outputInfo( {5}, DataType::Float32);

     CreateGatherGraph(graph, paramsInfo, indicesInfo, outputInfo);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 BOOST_AUTO_TEST_CASE(GatherValidateTensorShapesFromInputsMultiDimIndices)
 {
     Graph graph;
     armnn::TensorInfo paramsInfo({3, 2, 5}, DataType::Float32);
     armnn::TensorInfo indicesInfo({2, 2}, DataType::Signed32);
     armnn::TensorInfo outputInfo({2, 2, 2, 5}, DataType::Float32);

     CreateGatherGraph(graph, paramsInfo, indicesInfo, outputInfo);

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 BOOST_AUTO_TEST_CASE(DetectionPostProcessValidateTensorShapes)
 {
     Graph graph;
     armnn::TensorInfo boxEncodingsInfo({1, 10, 4}, DataType::QAsymmU8);
     armnn::TensorInfo scoresInfo({1, 10, 4}, DataType::QAsymmU8);
     std::vector<uint8_t> anchorsVector(40);
     armnn::ConstTensor anchors(armnn::TensorInfo({10, 4}, armnn::DataType::QAsymmU8), anchorsVector);

     armnn::TensorInfo detectionBoxesInfo({1, 3, 4}, DataType::QAsymmU8);
     armnn::TensorInfo detectionScoresInfo({1, 3}, DataType::QAsymmU8);
     armnn::TensorInfo detectionClassesInfo({1, 3}, DataType::QAsymmU8);
     armnn::TensorInfo numDetectionInfo({1}, DataType::QAsymmU8);

     Layer* input0 = graph.AddLayer<InputLayer>(0, "boxEncodings");
     input0->GetOutputSlot().SetTensorInfo(boxEncodingsInfo);

     Layer* input1 = graph.AddLayer<InputLayer>(1, "score");
     input1->GetOutputSlot().SetTensorInfo(scoresInfo);

     DetectionPostProcessDescriptor descriptor;
     descriptor.m_MaxDetections = 3;

     DetectionPostProcessLayer* layer = graph.AddLayer<DetectionPostProcessLayer>(descriptor, "detectionPostProcess");
     layer->m_Anchors = std::make_unique<armnn::ScopedTensorHandle>(anchors);
     layer->GetOutputSlot(0).SetTensorInfo(detectionBoxesInfo);
     layer->GetOutputSlot(1).SetTensorInfo(detectionScoresInfo);
     layer->GetOutputSlot(2).SetTensorInfo(detectionClassesInfo);
     layer->GetOutputSlot(3).SetTensorInfo(numDetectionInfo);

     input0->GetOutputSlot().Connect(layer->GetInputSlot(0));
     input1->GetOutputSlot().Connect(layer->GetInputSlot(1));

     BOOST_CHECK_NO_THROW(graph.InferTensorInfos());
 }

 BOOST_AUTO_TEST_CASE(FoldPadLayerIntoConvolution2dLayer)
 {
     Graph graph;
     const unsigned int inputShape[]   = { 1, 2, 2, 3 };
     const unsigned int paddedShape[]  = { 1, 6, 6, 3 };
     const unsigned int weightsShape[] = { 1, 2, 3, 3 };
     const unsigned int outputShape[]  = { 1, 2, 1, 1 };

     armnn::TensorInfo inputInfo(4, inputShape, DataType::Float32);
     armnn::TensorInfo paddedInfo(4, paddedShape, DataType::Float32);
     armnn::TensorInfo outputInfo(4, outputShape, DataType::Float32);

     Layer* input = graph.AddLayer<InputLayer>(0, "input");
     input->GetOutputSlot().SetTensorInfo(inputInfo);

     PadDescriptor padDescriptor({ { 0, 0 }, { 2, 2 }, { 2, 2 }, { 0, 0 } });

     PadLayer* padLayer = graph.AddLayer<PadLayer>(padDescriptor, "pad");
     padLayer->GetOutputSlot().SetTensorInfo(paddedInfo);

     Convolution2dDescriptor convolution2dDescriptor;
     convolution2dDescriptor.m_BiasEnabled = false;
     convolution2dDescriptor.m_StrideX     = 1;
     convolution2dDescriptor.m_StrideY     = 1;
     convolution2dDescriptor.m_DataLayout  = DataLayout::NHWC;

     std::vector<float> weightsVector(18);
     armnn::ConstTensor weights(armnn::TensorInfo(4, weightsShape, armnn::DataType::Float32), weightsVector);

     Convolution2dLayer* conv2dLayer = graph.AddLayer<Convolution2dLayer>(convolution2dDescriptor, "conv2d");
     conv2dLayer->m_Weight           = std::make_unique<armnn::ScopedTensorHandle>(weights);
     conv2dLayer->GetOutputSlot().SetTensorInfo(outputInfo);

     Layer* output = graph.AddLayer<OutputLayer>(0, "output");

     // Connect up layers - input -> pad -> conv2d -> output
     input->GetOutputSlot().Connect(padLayer->GetInputSlot(0));
     padLayer->GetOutputSlot().Connect(conv2dLayer->GetInputSlot(0));
     conv2dLayer->GetOutputSlot().Connect(output->GetInputSlot(0));

     auto checkSimpleConv2d = [](const armnn::Layer* const layer) -> bool {
         const auto conv2dLayer       = static_cast<const armnn::Convolution2dLayer*>(layer);
         const auto conv2dLayerParams = conv2dLayer->GetParameters();
         return IsLayerOfType<armnn::Convolution2dLayer>(layer) && (layer->GetNameStr() == "conv2d") &&
                (conv2dLayerParams.m_PadLeft == 0) && (conv2dLayerParams.m_PadRight == 0) &&
                (conv2dLayerParams.m_PadTop == 0) && (conv2dLayerParams.m_PadBottom == 0) &&
                (conv2dLayerParams.m_BiasEnabled == false) && (conv2dLayerParams.m_StrideX == 1) &&
                (conv2dLayerParams.m_StrideY == 1) && (conv2dLayerParams.m_DataLayout == DataLayout::NHWC);
     };

     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::PadLayer>,
                              checkSimpleConv2d,
                              &IsLayerOfType<armnn::OutputLayer>));

     armnn::Optimizer::Pass(graph, armnn::MakeOptimizations(FoldPadIntoConvolution2d()));

     auto checkPadFoldedIntoConv2d = [](const armnn::Layer* const layer) -> bool {
         const auto conv2dLayer       = static_cast<const armnn::Convolution2dLayer*>(layer);
         const auto conv2dLayerParams = conv2dLayer->GetParameters();
         return IsLayerOfType<armnn::Convolution2dLayer>(layer) && (layer->GetNameStr() == "folded-pad-into-conv2d") &&
                (conv2dLayerParams.m_PadLeft == 2) && (conv2dLayerParams.m_PadRight == 2) &&
                (conv2dLayerParams.m_PadTop == 2) && (conv2dLayerParams.m_PadBottom == 2) &&
                (conv2dLayerParams.m_BiasEnabled == false) && (conv2dLayerParams.m_StrideX == 1) &&
                (conv2dLayerParams.m_StrideY == 1) && (conv2dLayerParams.m_DataLayout == DataLayout::NHWC);
     };

     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              checkPadFoldedIntoConv2d,
                              &IsLayerOfType<armnn::OutputLayer>));
 }

 BOOST_AUTO_TEST_CASE(FoldPadLayerIntoPooling2dLayer)
 {
     Graph graph;
     const unsigned int inputShape[]  = { 1, 2, 2, 3 };
     const unsigned int paddedShape[] = { 1, 4, 4, 3 };
     const unsigned int outputShape[] = { 1, 2, 2, 3 };

     armnn::TensorInfo inputInfo(4, inputShape, DataType::Float32);
     armnn::TensorInfo paddedInfo(4, paddedShape, DataType::Float32);
     armnn::TensorInfo outputInfo(4, outputShape, DataType::Float32);

     Layer* input = graph.AddLayer<InputLayer>(0, "input");
     input->GetOutputSlot().SetTensorInfo(inputInfo);

     PadDescriptor padDescriptor({ { 0, 0 }, { 1, 1 }, { 1, 1 }, { 0, 0 } });

     PadLayer* padLayer = graph.AddLayer<PadLayer>(padDescriptor, "pad");
     padLayer->GetOutputSlot().SetTensorInfo(paddedInfo);

     Pooling2dDescriptor pooling2dDescriptor;
     pooling2dDescriptor.m_PoolType   = PoolingAlgorithm::Average;
     pooling2dDescriptor.m_PoolWidth  = 3;
     pooling2dDescriptor.m_PoolHeight = 3;
     pooling2dDescriptor.m_StrideX    = 1;
     pooling2dDescriptor.m_StrideY    = 1;
     pooling2dDescriptor.m_DataLayout = DataLayout::NHWC;

     Pooling2dLayer* pool2dLayer = graph.AddLayer<Pooling2dLayer>(pooling2dDescriptor, "pool2d");
     pool2dLayer->GetOutputSlot().SetTensorInfo(outputInfo);

     Layer* output = graph.AddLayer<OutputLayer>(0, "output");

     // Connect up layers - input -> pad -> pool2d -> output
     input->GetOutputSlot().Connect(padLayer->GetInputSlot(0));
     padLayer->GetOutputSlot().Connect(pool2dLayer->GetInputSlot(0));
     pool2dLayer->GetOutputSlot().Connect(output->GetInputSlot(0));

     auto checkSimplePool2d = [&](const armnn::Layer* const layer) {
         const auto pool2dLayer = static_cast<const armnn::Pooling2dLayer*>(layer);
         return IsLayerOfType<armnn::Pooling2dLayer>(layer) && (layer->GetNameStr() == "pool2d") &&
                (pool2dLayer->GetParameters() == pooling2dDescriptor);
     };

     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::PadLayer>,
                              checkSimplePool2d,
                              &IsLayerOfType<armnn::OutputLayer>));

     armnn::Optimizer::Pass(graph, armnn::MakeOptimizations(FoldPadIntoPooling2d()));

     auto checkPadFoldedIntoPool2d = [&](const armnn::Layer* const layer) {
         if (!IsLayerOfType<armnn::Pooling2dLayer>(layer) || (layer->GetNameStr() != "folded-pad-into-pool2d"))
         {
             return false;
         }

         const auto pool2dLayer                      = static_cast<const armnn::Pooling2dLayer*>(layer);
         const Pooling2dDescriptor pool2dLayerParams = pool2dLayer->GetParameters();

         Pooling2dDescriptor pool2dLayerParamsNoPad = pool2dLayerParams;
         pool2dLayerParamsNoPad.m_PadLeft           = 0;
         pool2dLayerParamsNoPad.m_PadRight          = 0;
         pool2dLayerParamsNoPad.m_PadTop            = 0;
         pool2dLayerParamsNoPad.m_PadBottom         = 0;
         // If we fold then PaddingMethod will be set to Ignore. The original will be Exclude.
         pool2dLayerParamsNoPad.m_PaddingMethod = PaddingMethod::Exclude;

         return (pool2dLayerParamsNoPad == pooling2dDescriptor) && (pool2dLayerParams.m_PadLeft == 1) &&
                (pool2dLayerParams.m_PadRight == 1) && (pool2dLayerParams.m_PadTop == 1) &&
                (pool2dLayerParams.m_PadBottom == 1) &&
                (pool2dLayerParams.m_PaddingMethod == PaddingMethod::IgnoreValue);
     };

     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              checkPadFoldedIntoPool2d,
                              &IsLayerOfType<armnn::OutputLayer>));
 }

 BOOST_AUTO_TEST_CASE(FoldPadLayerIntoPooling2d_PadWithMultipleOutputsShouldNotBeOptimized)
 {
     // In this test case we'll setup a pad layer with two outputs. One goes to a polling layers and the other
     // goes to an output layer. FoldPadLayerIntoPooling2d should not optimize this graph as it uses the
     // OptimizeForExclusiveConnection method.
     Graph graph;
     const unsigned int inputShape[]  = { 1, 2, 2, 3 };
     const unsigned int paddedShape[] = { 1, 4, 4, 3 };
     const unsigned int outputShape[] = { 1, 2, 2, 3 };

     armnn::TensorInfo inputInfo(4, inputShape, DataType::Float32);
     armnn::TensorInfo paddedInfo(4, paddedShape, DataType::Float32);
     armnn::TensorInfo outputInfo(4, outputShape, DataType::Float32);

     Layer* input = graph.AddLayer<InputLayer>(0, "input");
     input->GetOutputSlot().SetTensorInfo(inputInfo);

     PadDescriptor padDescriptor({ { 0, 0 }, { 1, 1 }, { 1, 1 }, { 0, 0 } });

     PadLayer* padLayer = graph.AddLayer<PadLayer>(padDescriptor, "pad");
     padLayer->GetOutputSlot().SetTensorInfo(paddedInfo);

     Pooling2dDescriptor pooling2dDescriptor;
     pooling2dDescriptor.m_PoolType   = PoolingAlgorithm::Average;
     pooling2dDescriptor.m_PoolWidth  = 3;
     pooling2dDescriptor.m_PoolHeight = 3;
     pooling2dDescriptor.m_StrideX    = 1;
     pooling2dDescriptor.m_StrideY    = 1;
     pooling2dDescriptor.m_DataLayout = DataLayout::NHWC;

     Pooling2dLayer* pool2dLayer = graph.AddLayer<Pooling2dLayer>(pooling2dDescriptor, "pool2d");
     pool2dLayer->GetOutputSlot().SetTensorInfo(outputInfo);

     Layer* output = graph.AddLayer<OutputLayer>(0, "output");

     // Connect up layers - input -> pad -> pool2d -> output
     input->GetOutputSlot().Connect(padLayer->GetInputSlot(0));
     padLayer->GetOutputSlot().Connect(pool2dLayer->GetInputSlot(0));
     pool2dLayer->GetOutputSlot().Connect(output->GetInputSlot(0));

     // Add the alternative branch from the pas layer to an output layer.
     Layer* secondOutput = graph.AddLayer<OutputLayer>(1, "dummy output");
     padLayer->GetOutputSlot().Connect(secondOutput->GetInputSlot(0));

     auto checkSimplePool2d = [&](const armnn::Layer* const layer) {
         const auto pool2dLayer = static_cast<const armnn::Pooling2dLayer*>(layer);
         return IsLayerOfType<armnn::Pooling2dLayer>(layer) && (layer->GetNameStr() == "pool2d") &&
                (pool2dLayer->GetParameters() == pooling2dDescriptor);
     };

     // Initial sequence.
     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::PadLayer>,
                              checkSimplePool2d,
                              &IsLayerOfType<armnn::OutputLayer>,
                              &IsLayerOfType<armnn::OutputLayer>));

     armnn::Optimizer::Pass(graph, armnn::MakeOptimizations(FoldPadIntoPooling2d()));

     // The network should not change.
     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::PadLayer>,
                              checkSimplePool2d,
                              &IsLayerOfType<armnn::OutputLayer>,
                              &IsLayerOfType<armnn::OutputLayer>));
 }

 BOOST_AUTO_TEST_CASE(FoldPadLayerIntoPooling2dLayer_PoolingLayerWithExcludePaddingShouldNotTakeMorePadding)
 {
     // In this test setup input, Pad layer, Pooling layer that includes padding, output layer. The optimization
     // should not work as the pooling layer already includes and existing pad and specifies PaddingMethod::Exclude.
     Graph graph;
     const unsigned int inputShape[]  = { 1, 2, 2, 3 };
     const unsigned int paddedShape[] = { 1, 4, 4, 3 };
     const unsigned int outputShape[] = { 1, 2, 2, 3 };

     armnn::TensorInfo inputInfo(4, inputShape, DataType::Float32);
     armnn::TensorInfo paddedInfo(4, paddedShape, DataType::Float32);
     armnn::TensorInfo outputInfo(4, outputShape, DataType::Float32);

     Layer* input = graph.AddLayer<InputLayer>(0, "input");
     input->GetOutputSlot().SetTensorInfo(inputInfo);

     PadDescriptor padDescriptor({ { 0, 0 }, { 1, 1 }, { 1, 1 }, { 0, 0 } });

     PadLayer* padLayer = graph.AddLayer<PadLayer>(padDescriptor, "pad");
     padLayer->GetOutputSlot().SetTensorInfo(paddedInfo);

     Pooling2dDescriptor pooling2dDescriptor;
     pooling2dDescriptor.m_PoolType   = PoolingAlgorithm::Average;
     pooling2dDescriptor.m_PoolWidth  = 3;
     pooling2dDescriptor.m_PoolHeight = 3;
     pooling2dDescriptor.m_StrideX    = 1;
     pooling2dDescriptor.m_StrideY    = 1;
     pooling2dDescriptor.m_DataLayout = DataLayout::NHWC;
     // Include a pad with the pooling layer. This should prevent the optimization working.
     pooling2dDescriptor.m_PadLeft   = 1;
     pooling2dDescriptor.m_PadRight  = 1;
     pooling2dDescriptor.m_PadTop    = 1;
     pooling2dDescriptor.m_PadBottom = 1;
     pooling2dDescriptor.m_PaddingMethod = PaddingMethod::Exclude;

     Pooling2dLayer* pool2dLayer = graph.AddLayer<Pooling2dLayer>(pooling2dDescriptor, "pool2d");
     pool2dLayer->GetOutputSlot().SetTensorInfo(outputInfo);

     Layer* output = graph.AddLayer<OutputLayer>(0, "output");

     // Connect up layers - input -> pad -> pool2d -> output
     input->GetOutputSlot().Connect(padLayer->GetInputSlot(0));
     padLayer->GetOutputSlot().Connect(pool2dLayer->GetInputSlot(0));
     pool2dLayer->GetOutputSlot().Connect(output->GetInputSlot(0));

     auto checkSimplePool2d = [&](const armnn::Layer* const layer) {
         const auto pool2dLayer = static_cast<const armnn::Pooling2dLayer*>(layer);
         return IsLayerOfType<armnn::Pooling2dLayer>(layer) && (layer->GetNameStr() == "pool2d") &&
                (pool2dLayer->GetParameters() == pooling2dDescriptor);
     };

     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::PadLayer>,
                              checkSimplePool2d,
                              &IsLayerOfType<armnn::OutputLayer>));

     armnn::Optimizer::Pass(graph, armnn::MakeOptimizations(FoldPadIntoPooling2d()));

     // The optimization should not have modified the graph.
     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::PadLayer>,
                              checkSimplePool2d,
                              &IsLayerOfType<armnn::OutputLayer>));
 }

 BOOST_AUTO_TEST_CASE(FoldPadLayerIntoPooling2dLayer_MaxPoolingLayerWithLargePadValueShouldNotBeFolded)
 {
     // In this test setup input, Pad layer with a large pad value, Max Pooling layer, output layer. The optimization
     // should not work as the pad value will modify the result of the max pooling layer.
     Graph graph;
     const unsigned int inputShape[]  = { 1, 2, 2, 3 };
     const unsigned int paddedShape[] = { 1, 4, 4, 3 };
     const unsigned int outputShape[] = { 1, 2, 2, 3 };

     armnn::TensorInfo inputInfo(4, inputShape, DataType::Float32);
     armnn::TensorInfo paddedInfo(4, paddedShape, DataType::Float32);
     armnn::TensorInfo outputInfo(4, outputShape, DataType::Float32);

     Layer* input = graph.AddLayer<InputLayer>(0, "input");
     input->GetOutputSlot().SetTensorInfo(inputInfo);

     PadDescriptor padDescriptor({ { 0, 0 }, { 1, 1 }, { 1, 1 }, { 0, 0 } });
     // For Max pooling of a float a pad value of 0 is more than enough to stop the fold happening.
     // Set this to -std::numeric_limits<float>::infinity() to make the fold happen.
     padDescriptor.m_PadValue = 0;

     PadLayer* padLayer = graph.AddLayer<PadLayer>(padDescriptor, "pad");
     padLayer->GetOutputSlot().SetTensorInfo(paddedInfo);

     Pooling2dDescriptor pooling2dDescriptor;
     pooling2dDescriptor.m_PoolType   = PoolingAlgorithm::Max;
     pooling2dDescriptor.m_PoolWidth  = 3;
     pooling2dDescriptor.m_PoolHeight = 3;
     pooling2dDescriptor.m_StrideX    = 1;
     pooling2dDescriptor.m_StrideY    = 1;
     pooling2dDescriptor.m_DataLayout = DataLayout::NHWC;

     Pooling2dLayer* pool2dLayer = graph.AddLayer<Pooling2dLayer>(pooling2dDescriptor, "pool2d");
     pool2dLayer->GetOutputSlot().SetTensorInfo(outputInfo);

     Layer* output = graph.AddLayer<OutputLayer>(0, "output");

     // Connect up layers - input -> pad -> pool2d -> output
     input->GetOutputSlot().Connect(padLayer->GetInputSlot(0));
     padLayer->GetOutputSlot().Connect(pool2dLayer->GetInputSlot(0));
     pool2dLayer->GetOutputSlot().Connect(output->GetInputSlot(0));

     auto checkSimplePool2d = [&](const armnn::Layer* const layer) {
             const auto pool2dLayer = static_cast<const armnn::Pooling2dLayer*>(layer);
             return IsLayerOfType<armnn::Pooling2dLayer>(layer) && (layer->GetNameStr() == "pool2d") &&
                    (pool2dLayer->GetParameters() == pooling2dDescriptor);
         };

     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::PadLayer>,
                              checkSimplePool2d,
                              &IsLayerOfType<armnn::OutputLayer>));

     armnn::Optimizer::Pass(graph, armnn::MakeOptimizations(FoldPadIntoPooling2d()));

     // The optimization should not have modified the graph.
     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::PadLayer>,
                              checkSimplePool2d,
                              &IsLayerOfType<armnn::OutputLayer>));
 }

 #if defined(ARMNNREF_ENABLED)
 BOOST_AUTO_TEST_CASE(FoldPadLayerIntoPooling2dLayer_ExecuteInferenceWithAndWithoutOptimization)
 {
     // The idea of this test to run a simple pad+pool2d network twice. Once
     // with FoldPadLayerIntoPooling2dLayer enabled and a second time with it
     // avoided. The output tensors of each should match.
     const unsigned int inputShape[]  = { 1, 4, 4, 2 };
     const unsigned int paddedShape[] = { 1, 6, 6, 2 };
     const unsigned int outputShape[] = { 1, 4, 4, 2 };
     std::vector<float> inputData({
         2.0f,  2.0f,  6.0f,  6.0f,  4.0f,  4.0f,  8.0f,  8.0f,  10.0f, 12.0f, 14.0f, 16.0f, 10.0f, 12.0f, 16.0f, 14.0f,

         18.0f, 20.0f, 24.0f, 22.0f, 20.0f, 18.0f, 22.0f, 24.0f, 26.0f, 28.0f, 0.0f,  0.0f,  26.0f, 28.0f, 0.0f,  0.0f,
     });
     try
     {
         // Create a network of input, pad, pooling 2D, output.
         INetworkPtr network = INetwork::Create();

         IConnectableLayer* inputLayer = network->AddInputLayer(0);
         armnn::TensorInfo inputInfo(4, inputShape, DataType::Float32);
         inputLayer->GetOutputSlot(0).SetTensorInfo(inputInfo);

         PadDescriptor padDescriptor({ { 0, 0 }, { 1, 1 }, { 1, 1 }, { 0, 0 } });
         IConnectableLayer* padLayer = network->AddPadLayer(padDescriptor, "Pad");
         armnn::TensorInfo paddedInfo(4, paddedShape, DataType::Float32);
         padLayer->GetOutputSlot(0).SetTensorInfo(paddedInfo);

         Pooling2dDescriptor pooling2dDescriptor;
         pooling2dDescriptor.m_PoolType   = PoolingAlgorithm::Average;
         pooling2dDescriptor.m_PoolWidth  = 3;
         pooling2dDescriptor.m_PoolHeight = 3;
         pooling2dDescriptor.m_StrideX    = 1;
         pooling2dDescriptor.m_StrideY    = 1;
         pooling2dDescriptor.m_DataLayout = DataLayout::NHWC;
         IConnectableLayer* pool2dLayer   = network->AddPooling2dLayer(pooling2dDescriptor, "Pool2D");
         armnn::TensorInfo outputInfo(4, outputShape, DataType::Float32);
         pool2dLayer->GetOutputSlot(0).SetTensorInfo(outputInfo);

         IConnectableLayer* outputLayer = network->AddOutputLayer(0);

         // Connect layers
         inputLayer->GetOutputSlot(0).Connect(padLayer->GetInputSlot(0));
         padLayer->GetOutputSlot(0).Connect(pool2dLayer->GetInputSlot(0));
         pool2dLayer->GetOutputSlot(0).Connect(outputLayer->GetInputSlot(0));

         // Create ArmNN runtime
         IRuntimePtr run = IRuntime::Create(IRuntime::CreationOptions());    // default options
         // Optimise the network
         IOptimizedNetworkPtr optimizedNetwork = Optimize(*network, { Compute::CpuRef }, run->GetDeviceSpec());
         // Load network into runtime
         NetworkId networkIdentifier;
         BOOST_TEST(run->LoadNetwork(networkIdentifier, std::move(optimizedNetwork)) == Status::Success);

         InputTensors inputTensors{ { 0,
                                      ConstTensor(run->GetInputTensorInfo(networkIdentifier, 0), inputData.data()) } };

         // Set the initial values of the data to different values to the golden data just in case the inference fails.
         std::vector<float> optimizedData(32, -std::numeric_limits<float>::infinity());
         armnn::OutputTensors outputTensors{ { 0, armnn::Tensor(outputInfo, optimizedData.data()) } };
         // Execute network
         run->EnqueueWorkload(networkIdentifier, inputTensors, outputTensors);
         // Unload it.
         run->UnloadNetwork(networkIdentifier);

         // In this second case the pad will have two outputs, one connected to the pooling layer the second connected to
         // a second output layer. This will prevent the FoldPadLayerIntoPooling2dLayer optimization from working.
         // A previous test, FoldPadLayerIntoPooling2d_PadWithMultipleOutputsShouldNotBeOptimized, has proved that doing
         // this will avoid the optimization.
         IConnectableLayer* dummyOutputLayer = network->AddOutputLayer(1);
         padLayer->GetOutputSlot(0).Connect(dummyOutputLayer->GetInputSlot(0));

         // Optimize and load and execute it a second time.
         optimizedNetwork = Optimize(*network, { Compute::CpuRef }, run->GetDeviceSpec());
         BOOST_TEST(run->LoadNetwork(networkIdentifier, std::move(optimizedNetwork)) == Status::Success);
         std::vector<float> goldenData(32, 0.0f);
         std::vector<float> padOutputData(72, 0.0f);
         armnn::OutputTensors goldenTensors{ { 0, armnn::Tensor(outputInfo, goldenData.data()) },
                                             { 1, armnn::Tensor(paddedInfo, padOutputData.data()) } };
         run->EnqueueWorkload(networkIdentifier, inputTensors, goldenTensors);

         // Now we can compare goldenData against optimizedData. They should be the same.
         BOOST_TEST(std::equal(goldenData.begin(), goldenData.end(), optimizedData.begin()));
     }
     catch (const std::exception& e)
     {
         std::cerr << e.what() << std::endl;
         ARMNN_ASSERT_MSG(false, e.what());
     }
 }
 #endif

 class MockLayerSupport : public LayerSupportBase
 {
 public:
     bool IsInputSupported(const TensorInfo& /*input*/,
                           Optional<std::string&> /*reasonIfUnsupported = EmptyOptional()*/) const override
     {
         return true;
     }

     bool IsOutputSupported(const TensorInfo& /*input*/,
                            Optional<std::string&> /*reasonIfUnsupported = EmptyOptional()*/) const override
     {
         return true;
     }

     bool IsActivationSupported(const TensorInfo& /*input0*/,
                                const TensorInfo& /*output*/,
                                const ActivationDescriptor& /*descriptor*/,
                                Optional<std::string&> /*reasonIfUnsupported = EmptyOptional()*/) const override
     {
         return true;
     }
 };

 template <typename NamePolicy>
 class MockBackend : public IBackendInternal
 {
 public:
     MockBackend()  = default;
     ~MockBackend() = default;

     static const BackendId& GetIdStatic()
     {
         return NamePolicy::GetIdStatic();
     }
     const BackendId& GetId() const override
     {
         return GetIdStatic();
     }

     IBackendInternal::IMemoryManagerUniquePtr CreateMemoryManager() const override
     {
         return nullptr;
     };

     IBackendInternal::IWorkloadFactoryPtr
         CreateWorkloadFactory(const IBackendInternal::IMemoryManagerSharedPtr&) const override
     {
         return nullptr;
     }

     IBackendInternal::IBackendContextPtr CreateBackendContext(const IRuntime::CreationOptions&) const override
     {
         return nullptr;
     }

     IBackendInternal::Optimizations GetOptimizations() const override
     {
         return {};
     }
     IBackendInternal::ILayerSupportSharedPtr GetLayerSupport() const override
     {
         return std::make_shared<MockLayerSupport>();
     }

     OptimizationViews OptimizeSubgraphView(const SubgraphView&) const override
     {
         return {};
     };
 };

 BOOST_AUTO_TEST_CASE(BackendCapabilityTest)
 {
     BackendId backendId = "MockBackend";
     // MockBackend does not support the NonConstWeights capability
     BOOST_CHECK(!armnn::IsCapabilitySupported(backendId, armnn::BackendCapability::NonConstWeights));

     // MockBackend does not support the AsyncExecution capability
     BOOST_CHECK(!armnn::IsCapabilitySupported(backendId, armnn::BackendCapability::AsyncExecution));
 }

 BOOST_AUTO_TEST_CASE(BackendHintTest)
 {
     class TestBackendAssignment : public LayerVisitorBase<VisitorNoThrowPolicy>
     {
     public:
         void VisitInputLayer(const IConnectableLayer* layer, LayerBindingId id, const char* name = nullptr) override
         {
             IgnoreUnused(id, name);
             auto inputLayer = PolymorphicDowncast<const InputLayer*>(layer);
             BOOST_TEST((inputLayer->GetBackendId() == "MockBackend"));
         }

         void VisitOutputLayer(const IConnectableLayer* layer, LayerBindingId id, const char* name = nullptr) override
         {
             IgnoreUnused(id, name);
             auto outputLayer = PolymorphicDowncast<const OutputLayer*>(layer);
             BOOST_TEST((outputLayer->GetBackendId() == "MockBackend"));
         }

         void VisitActivationLayer(const IConnectableLayer* layer,
                                   const ActivationDescriptor& activationDescriptor,
                                   const char* name = nullptr) override
         {
             IgnoreUnused(activationDescriptor, name);
             auto activation = PolymorphicDowncast<const ActivationLayer*>(layer);
             BOOST_TEST((activation->GetBackendId() == "CustomBackend"));
         }
     };

     struct CustomPolicy
     {
         static const BackendId& GetIdStatic()
         {
             static BackendId id = "CustomBackend";
             return id;
         }
     };

     struct MockPolicy
     {
         static const BackendId& GetIdStatic()
         {
             static BackendId id = "MockBackend";
             return id;
         }
     };

     auto& backendRegistry = BackendRegistryInstance();

     backendRegistry.Register("MockBackend", []() { return std::make_unique<MockBackend<MockPolicy>>(); });

     backendRegistry.Register("CustomBackend", []() { return std::make_unique<MockBackend<CustomPolicy>>(); });

     // Define the network
     auto network = INetwork::Create();
     ActivationDescriptor desc;
     desc.m_Function = ActivationFunction::Linear;

     std::unique_ptr<Graph> graph = std::make_unique<Graph>();
     auto input                   = graph->AddLayer<InputLayer>(0, "input");
     auto act                     = graph->AddLayer<ActivationLayer>(desc, "activation");
     auto output                  = graph->AddLayer<OutputLayer>(0, "output");

     BackendId customBackendId("CustomBackend");
     act->BackendSelectionHint(customBackendId);

     input->GetOutputSlot(0).Connect(act->GetInputSlot(0));
     act->GetOutputSlot(0).Connect(output->GetInputSlot(0));

     OptimizedNetworkImpl optNet(std::move(graph));

     // Get the optimized graph
     Graph& optGraph = optNet.GetGraph();

     std::vector<BackendId> prefs{ "MockBackend", "CustomBackend" };

     BackendIdSet availableBackends = { "CustomBackend", "MockBackend" };
     DeviceSpec spec(availableBackends);

     BackendSettings backendSettings(prefs, spec);

     // Assign an available backend to each layer
     Graph::Iterator firstLayer = optGraph.begin();
     Graph::Iterator lastLayer  = optGraph.end();

     OptimizedNetworkImpl* optNetObjPtr = &optNet;
     OptimizationResult res = AssignBackends(optNetObjPtr,
                                             backendSettings,
                                             firstLayer,
                                             lastLayer,
                                             EmptyOptional());

     BOOST_TEST(res.IsOk());

     TestBackendAssignment visitor;
     for (auto it = firstLayer; it != lastLayer; ++it)
     {
         (*it)->Accept(visitor);
     }
 }

 // Tests that OptimizeForExclusiveConnections works, fusing when needed, using BatchNorm fusing as example
 BOOST_AUTO_TEST_CASE(OptimizeForExclusiveConnectionsFuseTest)
 {
     using namespace armnn;
     // Define layers information
     Convolution2dDescriptor convolution2dDescriptor;
     convolution2dDescriptor.m_BiasEnabled = false;
     convolution2dDescriptor.m_DataLayout  = DataLayout::NHWC;
     BatchNormalizationDescriptor batchNormDescriptor;
     batchNormDescriptor.m_DataLayout = DataLayout::NHWC;

     const unsigned int inputDimensionSizes[]   = { 1, 4, 4, 3 };                 // NHWCin
     const unsigned int weightsDimensionSizes[] = { 1, 2, 2, 3 };                 // CoutHWCin
     const unsigned int outputDimensionSizes[]  = { 1, 3, 3, 1 };                 // NHWCout
     const unsigned int outputChannelSize[]     = { outputDimensionSizes[3] };    // Cout

     TensorInfo inputInfo(4, inputDimensionSizes, DataType::Float32);
     TensorInfo outputInfo(4, outputDimensionSizes, DataType::Float32);

     std::vector<float> weightsVector = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 };
     ConstTensor weights(TensorInfo(4, weightsDimensionSizes, DataType::Float32), weightsVector);

     std::vector<float> betaVector     = { 0.1f };
     std::vector<float> gammaVector    = { 0.5f };
     std::vector<float> meanVector     = { 0 };
     std::vector<float> varianceVector = { 1 };
     ConstTensor beta(TensorInfo(1, outputChannelSize, DataType::Float32), betaVector);
     ConstTensor gamma(TensorInfo(1, outputChannelSize, DataType::Float32), gammaVector);
     ConstTensor mean(TensorInfo(1, outputChannelSize, DataType::Float32), meanVector);
     ConstTensor variance(TensorInfo(1, outputChannelSize, DataType::Float32), varianceVector);

     // Define the network
     Graph graph;
     auto input     = graph.AddLayer<InputLayer>(0, "input");
     auto conv      = graph.AddLayer<Convolution2dLayer>(convolution2dDescriptor, "convolution");
     auto batchNorm = graph.AddLayer<BatchNormalizationLayer>(batchNormDescriptor, "batchNorm");
     auto output    = graph.AddLayer<OutputLayer>(0, "output");

     // Set layer information
     input->GetOutputSlot().SetTensorInfo(inputInfo);
     conv->GetOutputSlot().SetTensorInfo(outputInfo);
     batchNorm->GetOutputSlot().SetTensorInfo(outputInfo);
     conv->m_Weight        = std::make_unique<ScopedTensorHandle>(weights);
     batchNorm->m_Beta     = std::make_unique<ScopedTensorHandle>(beta);
     batchNorm->m_Gamma    = std::make_unique<ScopedTensorHandle>(gamma);
     batchNorm->m_Mean     = std::make_unique<ScopedTensorHandle>(mean);
     batchNorm->m_Variance = std::make_unique<ScopedTensorHandle>(variance);
     if (convolution2dDescriptor.m_BiasEnabled)
     {
         std::vector<float> biasVector = { 11 };
         ConstTensor bias(TensorInfo(1, outputChannelSize, DataType::Float32), biasVector);
         conv->m_Bias = std::make_unique<ScopedTensorHandle>(bias);
     }

     // Connect layers
     input->GetOutputSlot(0).Connect(conv->GetInputSlot(0));
     conv->GetOutputSlot(0).Connect(batchNorm->GetInputSlot(0));
     batchNorm->GetOutputSlot(0).Connect(output->GetInputSlot(0));

     BOOST_CHECK(4 == graph.GetNumLayers());
     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<InputLayer>,
                              &IsLayerOfType<Convolution2dLayer>,
                              &IsLayerOfType<BatchNormalizationLayer>,
                              &IsLayerOfType<OutputLayer>));

     // Optimize graph
     armnn::Optimizer::Pass(graph, MakeOptimizations(FuseBatchNormIntoConvolution2DFloat32()));

     auto checkFusedConv2d = [](const armnn::Layer* const layer) -> bool {
         return IsLayerOfType<armnn::Convolution2dLayer>(layer) &&
                (layer->GetNameStr() == "fused-batchNorm-into-convolution");
     };

     BOOST_CHECK(3 == graph.GetNumLayers());
     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<InputLayer>,
                              checkFusedConv2d,
                              &IsLayerOfType<OutputLayer>));
 }

 // Tests that OptimizeForExclusiveConnections works, not fusing when not needed, using BatchNorm fusing as example
 BOOST_AUTO_TEST_CASE(OptimizeForExclusiveConnectionsWithoutFuseTest)
 {
     // Define the network
     Graph graph;
     Convolution2dDescriptor convolution2dDescriptor;
     BatchNormalizationDescriptor batchNormDescriptor;

     auto input     = graph.AddLayer<InputLayer>(0, "input");
     auto conv      = graph.AddLayer<Convolution2dLayer>(convolution2dDescriptor, "convolution");
     auto batchNorm = graph.AddLayer<BatchNormalizationLayer>(batchNormDescriptor, "batchNorm");
     auto output    = graph.AddLayer<OutputLayer>(0, "output");
     auto output2   = graph.AddLayer<OutputLayer>(1, "output2");

     // Connect layers
     input->GetOutputSlot(0).Connect(conv->GetInputSlot(0));
     conv->GetOutputSlot(0).Connect(batchNorm->GetInputSlot(0));
     batchNorm->GetOutputSlot(0).Connect(output->GetInputSlot(0));
     conv->GetOutputSlot(0).Connect(output2->GetInputSlot(0));

     BOOST_CHECK(5 == graph.GetNumLayers());
     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::Convolution2dLayer>,
                              &IsLayerOfType<armnn::BatchNormalizationLayer>,
                              &IsLayerOfType<armnn::OutputLayer>,
                              &IsLayerOfType<armnn::OutputLayer>));
     // Optimize graph
     armnn::Optimizer::Pass(graph, armnn::MakeOptimizations(FuseBatchNormIntoConvolution2DFloat32()));

     BOOST_CHECK(5 == graph.GetNumLayers());
     BOOST_TEST(CheckSequence(graph.cbegin(), graph.cend(),
                              &IsLayerOfType<armnn::InputLayer>,
                              &IsLayerOfType<armnn::Convolution2dLayer>,
                              &IsLayerOfType<armnn::BatchNormalizationLayer>,
                              &IsLayerOfType<armnn::OutputLayer>,
                              &IsLayerOfType<armnn::OutputLayer>));
 }
 BOOST_AUTO_TEST_SUITE_END()
BOOST_AUTO_TEST_SUITE
BOOST_AUTO_TEST_SUITE(TensorflowLiteParser)

armnn::LstmBasicParameters::m_ForgetGateBias
std::shared_ptr< ConstTensorHandle > m_ForgetGateBias
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmLayer.hpp:69

armnn::Graph::begin
Iterator begin()
Returns iterator pointing to the beginning of the list. Lowercase for range-based for loops...
Definition: Graph.hpp:162

armnn::LstmBasicParameters::m_OutputGateBias
std::shared_ptr< ConstTensorHandle > m_OutputGateBias
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmLayer.hpp:73

armnn::Convolution2dDescriptor::m_BiasEnabled
bool m_BiasEnabled
Enable/disable bias.
Definition: Descriptors.hpp:462

armnn::LayerSupportBase
Definition: LayerSupportBase.hpp:13

armnn::MockBackend
Definition: MockBackend.hpp:143

armnn::LstmDescriptor::m_ProjectionEnabled
bool m_ProjectionEnabled
Enable/disable the projection layer.
Definition: Descriptors.hpp:953

armnn::Convolution2dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:464

armnn::BackendCapability::AsyncExecution
Asynchronous Execution.

armnn::AssignBackends
OptimizationResult AssignBackends(OptimizedNetworkImpl *optNetObjPtr, BackendSettings &backendSettings, Graph::Iterator &firstLayer, Graph::Iterator &lastLayer, Optional< std::vector< std::string > &> errMessages)
Definition: Network.cpp:888

armnn::IRuntime::Create
static IRuntimePtr Create(const CreationOptions &options)
Definition: Runtime.cpp:37

armnn::LstmLayer::m_BasicParameters
LstmBasicParameters m_BasicParameters
Definition: LstmLayer.hpp:81

armnn::BatchNormalizationLayer
This layer represents a batch normalization operation.
Definition: BatchNormalizationLayer.hpp:15

armnn::IBackendInternal::IWorkloadFactoryPtr
std::unique_ptr< IWorkloadFactory > IWorkloadFactoryPtr
Definition: IBackendInternal.hpp:80

armnn::IConnectableLayer
Interface for a layer that is connectable to other layers via InputSlots and OutputSlots.
Definition: INetwork.hpp:62

armnn::Pooling2dDescriptor::m_PadBottom
uint32_t m_PadBottom
Padding bottom value in the height dimension.
Definition: Descriptors.hpp:371

armnn::InsertConvertFp32ToFp16LayersAfter
std::vector< ConvertFp32ToFp16Layer * > InsertConvertFp32ToFp16LayersAfter(Graph &graph, Layer &layer)
Definition: NetworkUtils.cpp:201

armnn::DepthwiseConvolution2dDescriptor::m_BiasEnabled
bool m_BiasEnabled
Enable/disable bias.
Definition: Descriptors.hpp:514

armnn::LstmOptPeepholeParameters::m_CellToForgetWeights
std::shared_ptr< ConstTensorHandle > m_CellToForgetWeights
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmLayer.hpp:49

armnn::IBackendInternal::Optimizations
std::vector< OptimizationPtr > Optimizations
Definition: IBackendInternal.hpp:86

armnn::LayerWithParameters::GetParameters
const Parameters & GetParameters() const
Definition: LayerWithParameters.hpp:18

armnn::DataLayout
DataLayout
Definition: Types.hpp:54

armnn::InsertConvertFp16ToFp32LayersBefore
std::vector< ConvertFp16ToFp32Layer * > InsertConvertFp16ToFp32LayersBefore(Graph &graph, Layer &layer, bool expectCorrectInputType)
Definition: NetworkUtils.cpp:129

armnn::Compute::CpuRef
CPU Execution: Reference C++ kernels.

armnn::Pooling2dDescriptor::m_PadLeft
uint32_t m_PadLeft
Padding left value in the width dimension.
Definition: Descriptors.hpp:365

armnn::optimizations::FoldPadIntoConvolution2d
OptimizeForExclusiveConnection< PadLayer, Convolution2dLayer, pad_fold::FoldPadIntoConvolution2dImpl > FoldPadIntoConvolution2d
Definition: FoldPadIntoLayer2d.hpp:197

armnn::MakeOptimizations
Optimizer::Optimizations MakeOptimizations(Args &&... args)
Definition: Optimizer.hpp:43

armnn::LstmDescriptor::m_ClippingThresProj
float m_ClippingThresProj
Clipping threshold value for the projection.
Definition: Descriptors.hpp:947

armnn::Optional
Definition: Optional.hpp:270

armnn::IBackendInternal
Definition: IBackendInternal.hpp:68

armnn::OutputShapeRounding::Floor

armnn::BackendIdSet
std::unordered_set< BackendId > BackendIdSet
Definition: BackendId.hpp:191

armnn::Layer::BackendSelectionHint
void BackendSelectionHint(Optional< BackendId > backend) final
Provide a hint for the optimizer as to which backend to prefer for this layer.
Definition: Layer.hpp:330

FloatingPointConverter.hpp

TensorHandle.hpp

armnn::MockLayerSupport
Definition: MockBackend.hpp:171

armnn::PadDescriptor::m_PadValue
float m_PadValue
Optional value to use for padding, defaults to 0.
Definition: Descriptors.hpp:1005

armnn::DepthwiseConvolution2dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:516

armnn::TensorInfo
Definition: Tensor.hpp:152

armnn::DeviceSpec
Definition: DeviceSpec.hpp:14

armnn::DepthwiseConvolution2dLayer
This layer represents a depthwise convolution 2d operation.
Definition: DepthwiseConvolution2dLayer.hpp:15

armnn::optimizations
Definition: AddBroadcastReshapeLayer.hpp:15

armnn::Graph::AddLayer
LayerT * AddLayer(Args &&... args)
Adds a new layer, of type LayerType, to the graph constructed with the arguments passed.
Definition: Graph.hpp:402

armnn::Pooling2dDescriptor::m_PoolWidth
uint32_t m_PoolWidth
Pooling width value.
Definition: Descriptors.hpp:373

armnn::Graph::cbegin
ConstIterator cbegin() const
Returns const iterator pointing to the beginning of the list. Lowercase for range-based for loops...
Definition: Graph.hpp:172

armnn::Convolution2dDescriptor
A Convolution2dDescriptor for the Convolution2dLayer.
Definition: Descriptors.hpp:416

armnn::DataType::Signed32

CreateResizeBilinearGraph
void CreateResizeBilinearGraph(Graph &graph, const unsigned int *inputShape, const unsigned int *outputShape, DataLayout dataLayout=DataLayout::NCHW)
Definition: OptimizerTests.cpp:407

armnn::OutputSlot::Connect
int Connect(InputSlot &destination)
Definition: Layer.cpp:83

armnn::ResizeDescriptor::m_Method
ResizeMethod m_Method
The Interpolation method to use (Bilinear, NearestNeighbor).
Definition: Descriptors.hpp:829

armnn::Optimizer::Pass
static void Pass(Graph &graph, const Optimizations &optimizations)
Definition: Optimizer.cpp:16

armnn::IRuntimePtr
std::unique_ptr< IRuntime, void(*)(IRuntime *runtime)> IRuntimePtr
Definition: IRuntime.hpp:28

armnn::PaddingMethod::Exclude
The padding fields don&#39;t count and are ignored.

armnn::Pooling2dDescriptor::m_PaddingMethod
PaddingMethod m_PaddingMethod
The padding method to be used. (Exclude, IgnoreValue).
Definition: Descriptors.hpp:383

armnn::BatchNormalizationDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:649

armnn::LayerType::ConvertFp32ToFp16

armnn::optimizations::FuseBatchNormIntoConvolution2DFloat32
OptimizeForExclusiveConnection< Convolution2dLayer, BatchNormalizationLayer, FuseBatchNorm< Convolution2dLayer, armnn::DataType::Float32 > > FuseBatchNormIntoConvolution2DFloat32
Definition: FuseBatchNorm.hpp:187

armnn::Convolution2dLayer::m_Weight
std::shared_ptr< ConstTensorHandle > m_Weight
A unique pointer to store Weight values.
Definition: Convolution2dLayer.hpp:20

armnn::ActivationLayer
This layer represents an activation operation with the specified activation function.
Definition: ActivationLayer.hpp:12

armnn::OptimizationViews
Definition: OptimizationViews.hpp:13

armnn::BackendRegistryInstance
BackendRegistry & BackendRegistryInstance()
Definition: BackendRegistry.cpp:13

armnn::Pooling2dDescriptor::m_PadTop
uint32_t m_PadTop
Padding top value in the height dimension.
Definition: Descriptors.hpp:369

armnn::InputTensors
std::vector< std::pair< LayerBindingId, class ConstTensor > > InputTensors
Definition: Tensor.hpp:340

BackendSettings.hpp

armnn::OptimizedNetworkImpl::GetGraph
Graph & GetGraph()
Definition: OptimizedNetworkImpl.hpp:21

armnn::LstmOptProjectionParameters::m_ProjectionWeights
std::shared_ptr< ConstTensorHandle > m_ProjectionWeights
A unique pointer to represent 2D weights tensor with dimensions [output_size, num_units].
Definition: LstmLayer.hpp:39

armnn::DetectionPostProcessLayer
This layer represents a detection postprocess operator.
Definition: DetectionPostProcessLayer.hpp:16

TestUtils.hpp

CreatePooling2dGraph
void CreatePooling2dGraph(Graph &graph, const unsigned int *inputShape, const unsigned int *outputShape, DataLayout dataLayout=DataLayout::NCHW)
Definition: OptimizerTests.cpp:359

BackendHelper.hpp

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_software_tools.dox:6

armnn::LstmBasicParameters::m_InputToCellWeights
std::shared_ptr< ConstTensorHandle > m_InputToCellWeights
A unique pointer to represent 2D weights tensor with dimensions [input_size, num_units].
Definition: LstmLayer.hpp:59

armnn::IBackendInternal::IMemoryManagerUniquePtr
std::unique_ptr< IMemoryManager > IMemoryManagerUniquePtr
Definition: IBackendInternal.hpp:91

armnn::PadLayer
This layer represents a pad operation.
Definition: PadLayer.hpp:14

armnn::LstmLayer
This layer represents a LSTM operation.
Definition: LstmLayer.hpp:77

armnn::IgnoreUnused
void IgnoreUnused(Ts &&...)
Definition: IgnoreUnused.hpp:14

armnn::Graph::Iterator
LayerList::const_iterator Iterator
Definition: Graph.hpp:50

BackendRegistry.hpp

armnn::Pooling2dDescriptor::m_StrideX
uint32_t m_StrideX
Stride value when proceeding through input for the width dimension.
Definition: Descriptors.hpp:377

LayerSupportBase.hpp

armnn::LayerBindingId
int LayerBindingId
Type of identifiers for bindable layers (inputs, outputs).
Definition: Types.hpp:243

armnn::IOutputSlot::SetTensorInfo
virtual void SetTensorInfo(const TensorInfo &tensorInfo)=0

Optimizer.hpp

armnn::ResizeDescriptor
A ResizeDescriptor for the ResizeLayer.
Definition: Descriptors.hpp:802

armnn::LstmOptCifgParameters::m_InputGateBias
std::shared_ptr< ConstTensorHandle > m_InputGateBias
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmLayer.hpp:33

IBackendInternal.hpp

armnn::Tensor
A tensor defined by a TensorInfo (shape and data type) and a mutable backing store.
Definition: Tensor.hpp:306

PolymorphicDowncast.hpp

armnn::IsInputSupported
bool IsInputSupported(const BackendId &backend, const TensorInfo &input, char *reasonIfUnsupported=nullptr, size_t reasonIfUnsupportedMaxLength=1024)
Deprecated in favor of IBackend and ILayerSupport interfaces.
Definition: LayerSupport.cpp:346

armnn::LstmOptPeepholeParameters::m_CellToOutputWeights
std::shared_ptr< ConstTensorHandle > m_CellToOutputWeights
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmLayer.hpp:51

armnn::SubgraphView
The SubgraphView class represents a subgraph of a Graph.
Definition: SubgraphView.hpp:23

armnn::Pooling2dDescriptor::m_PoolHeight
uint32_t m_PoolHeight
Pooling height value.
Definition: Descriptors.hpp:375

armnn::BackendCapability::NonConstWeights
Constant weights can be accessed through the descriptors, On the other hand, non-const weights can be...

armnn::DetectionPostProcessDescriptor::m_MaxDetections
uint32_t m_MaxDetections
Maximum numbers of detections.
Definition: Descriptors.hpp:551

armnn::PadDescriptor
A PadDescriptor for the PadLayer.
Definition: Descriptors.hpp:983

armnn::Layer::GetInputSlot
const InputSlot & GetInputSlot(unsigned int index) const override
Get a const input slot handle by slot index.
Definition: Layer.hpp:316

armnn::Convolution2dDescriptor::m_StrideX
uint32_t m_StrideX
Stride value when proceeding through input for the width dimension.
Definition: Descriptors.hpp:454

armnn::LayerType::ConvertFp16ToFp32

armnn::LstmBasicParameters::m_RecurrentToCellWeights
std::shared_ptr< ConstTensorHandle > m_RecurrentToCellWeights
A unique pointer to represent 2D weights tensor with dimensions [output_size, num_units].
Definition: LstmLayer.hpp:65

armnn::DepthwiseConvolution2dDescriptor::m_StrideX
uint32_t m_StrideX
Stride value when proceeding through input for the width dimension.
Definition: Descriptors.hpp:506

armnn::OutputLayer
A layer user-provided data can be bound to (e.g. inputs, outputs).
Definition: OutputLayer.hpp:13

armnn::Status::Success

armnn::LstmBasicParameters::m_CellBias
std::shared_ptr< ConstTensorHandle > m_CellBias
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmLayer.hpp:71

armnn::GatherLayer
This layer represents a Gather operator.
Definition: GatherLayer.hpp:14

armnn::LstmDescriptor
An LstmDescriptor for the LstmLayer.
Definition: Descriptors.hpp:919

armnn::Pooling2dDescriptor::m_PadRight
uint32_t m_PadRight
Padding right value in the width dimension.
Definition: Descriptors.hpp:367

armnn::Optimize
IOptimizedNetworkPtr Optimize(const INetwork &network, const std::vector< BackendId > &backendPreferences, const IDeviceSpec &deviceSpec, const OptimizerOptions &options=OptimizerOptions(), Optional< std::vector< std::string > &> messages=EmptyOptional())
Create an optimized version of the network.
Definition: Network.cpp:1568

ARMNN_ASSERT_MSG
#define ARMNN_ASSERT_MSG(COND, MSG)
Definition: Assert.hpp:15

CreateGatherGraph
void CreateGatherGraph(Graph &graph, const armnn::TensorInfo &paramsInfo, const armnn::TensorInfo &indicesInfo, const armnn::TensorInfo &outputInfo)
Definition: OptimizerTests.cpp:452

Graph.hpp

armnn::IBackendInternal::IMemoryManagerSharedPtr
std::shared_ptr< IMemoryManager > IMemoryManagerSharedPtr
Definition: IBackendInternal.hpp:92

armnn::IsOutputSupported
bool IsOutputSupported(const BackendId &backend, const TensorInfo &output, char *reasonIfUnsupported=nullptr, size_t reasonIfUnsupportedMaxLength=1024)
Deprecated in favor of IBackend and ILayerSupport interfaces.
Definition: LayerSupport.cpp:471

armnn::TensorInfo::GetDataType
DataType GetDataType() const
Definition: Tensor.hpp:194

armnn::DataType::QAsymmU8

armnn::OptimizationResult::IsOk
bool IsOk() const
Definition: Network.hpp:311

armnn::NetworkId
int NetworkId
Definition: IRuntime.hpp:22

armnn::ConstTensor
A tensor defined by a TensorInfo (shape and data type) and an immutable backing store.
Definition: Tensor.hpp:314

armnn::OutputTensors
std::vector< std::pair< LayerBindingId, class Tensor > > OutputTensors
Definition: Tensor.hpp:341

armnn::Layer::GetNameStr
const std::string & GetNameStr() const
Definition: Layer.hpp:220

armnn::Layer::GetType
LayerType GetType() const override
Returns the armnn::LayerType of this layer.
Definition: Layer.hpp:265

armnn::ResizeDescriptor::m_TargetWidth
uint32_t m_TargetWidth
Target width value.
Definition: Descriptors.hpp:824

armnn::GatherDescriptor
A GatherDescriptor for the GatherLayer.
Definition: Descriptors.hpp:750

armnn::LstmOptCifgParameters::m_RecurrentToInputWeights
std::shared_ptr< ConstTensorHandle > m_RecurrentToInputWeights
A unique pointer to represent 2D weights tensor with dimensions [input_size, num_units].
Definition: LstmLayer.hpp:31

armnn::DataType::Float16

armnn::LstmDescriptor::m_PeepholeEnabled
bool m_PeepholeEnabled
Enable/disable peephole.
Definition: Descriptors.hpp:951

armnn::IOptimizedNetworkPtr
std::unique_ptr< IOptimizedNetwork, void(*)(IOptimizedNetwork *network)> IOptimizedNetworkPtr
Definition: INetwork.hpp:174

armnn::PoolingAlgorithm::Average

armnn::MemCopyLayer
This layer represents a memory copy operation.
Definition: MemCopyLayer.hpp:13

ARMNN_ASSERT
#define ARMNN_ASSERT(COND)
Definition: Assert.hpp:14

armnn::LstmBasicParameters::m_RecurrentToOutputWeights
std::shared_ptr< ConstTensorHandle > m_RecurrentToOutputWeights
A unique pointer to represent 2D weights tensor with dimensions [output_size, num_units].
Definition: LstmLayer.hpp:67

armnn::BOOST_AUTO_TEST_CASE
BOOST_AUTO_TEST_CASE(CheckConvolution2dLayer)
Definition: ConstTensorLayerVisitor.cpp:268

armnn::LstmOptCifgParameters::m_InputToInputWeights
std::shared_ptr< ConstTensorHandle > m_InputToInputWeights
A unique pointer to represent 2D weights tensor with dimensions [input_size, num_units].
Definition: LstmLayer.hpp:29

armnn::IsActivationSupported
bool IsActivationSupported(const BackendId &backend, const TensorInfo &input, const TensorInfo &output, const ActivationDescriptor &descriptor, char *reasonIfUnsupported=nullptr, size_t reasonIfUnsupportedMaxLength=1024)
Deprecated in favor of IBackend and ILayerSupport interfaces.
Definition: LayerSupport.cpp:69

armnn::ActivationDescriptor
An ActivationDescriptor for the ActivationLayer.
Definition: Descriptors.hpp:25

armnn::OptimizationResult
Definition: Network.hpp:297

armnn::LayerType::Addition

armnn::FloorLayer
This layer represents a floor operation.
Definition: FloorLayer.hpp:13

armnn::LstmOptProjectionParameters::m_ProjectionBias
std::shared_ptr< ConstTensorHandle > m_ProjectionBias
A unique pointer to represent 1D weights tensor with dimensions [output_size].
Definition: LstmLayer.hpp:41

armnn::ResizeDescriptor::m_TargetHeight
uint32_t m_TargetHeight
Target height value.
Definition: Descriptors.hpp:826

armnn::LstmDescriptor::m_ActivationFunc
uint32_t m_ActivationFunc
The activation function to use.
Definition: Descriptors.hpp:943

armnn::LayerVisitorBase
Visitor base class with empty implementations.
Definition: LayerVisitorBase.hpp:25

armnn::Convolution2dDescriptor::m_StrideY
uint32_t m_StrideY
Stride value when proceeding through input for the height dimension.
Definition: Descriptors.hpp:456

armnn::Graph
Definition: Graph.hpp:29

armnn::OptimizedNetworkImpl
Definition: OptimizedNetworkImpl.hpp:9

armnn::Pooling2dLayer
This layer represents a pooling 2d operation.
Definition: Pooling2dLayer.hpp:13

armnn::LstmDescriptor::m_ClippingThresCell
float m_ClippingThresCell
Clipping threshold value for the cell state.
Definition: Descriptors.hpp:945

INetwork.hpp

armnn::Pooling2dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:385

armnn::AdditionLayer
This layer represents an addition operation.
Definition: AdditionLayer.hpp:13

armnn::IRuntime::CreationOptions
Definition: IRuntime.hpp:76

armnn::LstmLayer::m_PeepholeParameters
LstmOptPeepholeParameters m_PeepholeParameters
Definition: LstmLayer.hpp:84

armnn::OutputHandler::SetTensorInfo
void SetTensorInfo(const TensorInfo &tensorInfo)
Sets the TensorInfo used by this output handler.
Definition: OutputHandler.cpp:15

armnn::IBackendInternal::ILayerSupportSharedPtr
std::shared_ptr< ILayerSupport > ILayerSupportSharedPtr
Definition: IBackendInternal.hpp:87

armnn::LstmLayer::m_ProjectionParameters
LstmOptProjectionParameters m_ProjectionParameters
Definition: LstmLayer.hpp:83

BOOST_AUTO_TEST_SUITE_END
BOOST_AUTO_TEST_SUITE_END()

armnn::LstmDescriptor::m_CifgEnabled
bool m_CifgEnabled
Enable/disable cifg (coupled input & forget gate).
Definition: Descriptors.hpp:949

armnn::EmptyOptional
EmptyOptional is used to initialize the Optional class in case we want to have default value for an O...
Definition: Optional.hpp:32

armnn::LstmBasicParameters::m_InputToForgetWeights
std::shared_ptr< ConstTensorHandle > m_InputToForgetWeights
A unique pointer to represent 2D weights tensor with dimensions [input_size, num_units].
Definition: LstmLayer.hpp:57

armnn::Pooling2dDescriptor::m_PoolType
PoolingAlgorithm m_PoolType
The pooling algorithm to use (Max. Average, L2).
Definition: Descriptors.hpp:363

armnn::DepthwiseConvolution2dDescriptor::m_StrideY
uint32_t m_StrideY
Stride value when proceeding through input for the height dimension.
Definition: Descriptors.hpp:508

armnn::LstmBasicParameters::m_RecurrentToForgetWeights
std::shared_ptr< ConstTensorHandle > m_RecurrentToForgetWeights
A unique pointer to represent 2D weights tensor with dimensions [output_size, num_units].
Definition: LstmLayer.hpp:63

armnn::PaddingMethod::IgnoreValue
The padding fields count, but are ignored.

armnn::Graph::InferTensorInfos
void InferTensorInfos()
Definition: Graph.cpp:529

armnn::DepthwiseConvolution2dLayer::m_Weight
std::shared_ptr< ConstTensorHandle > m_Weight
A unique pointer to store Weight values.
Definition: DepthwiseConvolution2dLayer.hpp:19

armnn::IsCapabilitySupported
bool IsCapabilitySupported(const armnn::BackendId &backend, armnn::BackendCapability capability)
Convenience function to check a capability on a backend.
Definition: BackendHelper.cpp:30

armnn::BoostLogSeverityMapping::info

armnn::Layer::GetOutputHandler
const OutputHandler & GetOutputHandler(unsigned int i=0) const
Definition: Layer.hpp:225

armnn::ResizeMethod::Bilinear

armnn::optimizations::FoldPadIntoPooling2d
OptimizeForExclusiveConnection< PadLayer, Pooling2dLayer, pad_fold::FoldPadIntoPooling2dImpl > FoldPadIntoPooling2d
Definition: FoldPadIntoLayer2d.hpp:199

armnn::InputLayer
A layer user-provided data can be bound to (e.g. inputs, outputs).
Definition: InputLayer.hpp:13

armnn::Graph::end
Iterator end()
Returns iterator pointing to the end of the list. Lowercase for range-based for loops.
Definition: Graph.hpp:164

Network.hpp

CheckSequence
bool CheckSequence(const armnn::Graph::ConstIterator first, const armnn::Graph::ConstIterator last)
Definition: TestUtils.hpp:21

CreateConvolution2dGraph
void CreateConvolution2dGraph(Graph &graph, const unsigned int *inputShape, const unsigned int *weightsShape, const unsigned int *outputShape, DataLayout dataLayout=DataLayout::NCHW)
Definition: OptimizerTests.cpp:259

armnn::OutputSlot::SetTensorInfo
void SetTensorInfo(const TensorInfo &tensorInfo) override
Definition: Layer.cpp:58

armnn::IConnectableLayer::GetInputSlot
virtual const IInputSlot & GetInputSlot(unsigned int index) const =0
Get a const input slot handle by slot index.

scoresInfo
armnn::TensorInfo scoresInfo({ 1, 6, 3 }, armnn::DataType::Float32)

armnn::Layer::GetDataType
DataType GetDataType() const
Definition: Layer.cpp:284

armnn::Layer::GetOutputSlot
const OutputSlot & GetOutputSlot(unsigned int index=0) const override
Get the const output slot handle by slot index.
Definition: Layer.hpp:318

armnn::PoolingAlgorithm::Max

armnn::DataType::Float32

armnn::IConnectableLayer::GetOutputSlot
virtual const IOutputSlot & GetOutputSlot(unsigned int index) const =0
Get the const output slot handle by slot index.

armnn::LstmLayer::m_CifgParameters
LstmOptCifgParameters m_CifgParameters
Definition: LstmLayer.hpp:82

armnn::Graph::cend
ConstIterator cend() const
Returns const iterator pointing to the end of the list. Lowercase for range-based for loops...
Definition: Graph.hpp:174

armnn::Convolution2dLayer
This layer represents a convolution 2d operation.
Definition: Convolution2dLayer.hpp:15

Connect
void Connect(armnn::IConnectableLayer *from, armnn::IConnectableLayer *to, const armnn::TensorInfo &tensorInfo, unsigned int fromIndex, unsigned int toIndex)
Definition: TestUtils.cpp:12

LayerVisitorBase.hpp

armnn::INetworkPtr
std::unique_ptr< INetwork, void(*)(INetwork *network)> INetworkPtr
Definition: INetwork.hpp:173

armnn::IOutputSlot::Connect
virtual int Connect(IInputSlot &destination)=0

armnn::DataLayout::NCHW

armnn::Pooling2dDescriptor
A Pooling2dDescriptor for the Pooling2dLayer.
Definition: Descriptors.hpp:329

armnn::LstmOptPeepholeParameters::m_CellToInputWeights
std::shared_ptr< ConstTensorHandle > m_CellToInputWeights
A unique pointer to represent 1D weights tensor with dimensions [num_units].
Definition: LstmLayer.hpp:47

armnn::BackendSettings
Definition: BackendSettings.hpp:18

armnn::Graph::GetNumLayers
size_t GetNumLayers() const
Definition: Graph.hpp:191

armnn::ResizeDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:831

armnn::DetectionPostProcessDescriptor
Definition: Descriptors.hpp:519

armnn::DetectionPostProcessLayer::m_Anchors
std::shared_ptr< ConstTensorHandle > m_Anchors
A unique pointer to store Anchor values.
Definition: DetectionPostProcessLayer.hpp:20

CreateDepthwiseConvolution2dGraph
void CreateDepthwiseConvolution2dGraph(Graph &graph, const unsigned int *inputShape, const unsigned int *weightsShape, const unsigned int *outputShape, DataLayout dataLayout=DataLayout::NCHW)
Definition: OptimizerTests.cpp:309

armnn::ActivationFunction::Linear

armnn::OutputSlot::GetTensorInfo
const TensorInfo & GetTensorInfo() const override
Definition: Layer.cpp:63

armnn::INetwork::Create
static INetworkPtr Create(NetworkOptions networkOptions={})
Definition: Network.cpp:529

armnn::ActivationDescriptor::m_Function
ActivationFunction m_Function
The activation function to use (Sigmoid, TanH, Linear, ReLu, BoundedReLu, SoftReLu, LeakyReLu, Abs, Sqrt, Square, Elu).
Definition: Descriptors.hpp:48

armnn::Pooling2dDescriptor::m_StrideY
uint32_t m_StrideY
Stride value when proceeding through input for the height dimension.
Definition: Descriptors.hpp:379

armnn::DepthwiseConvolution2dDescriptor
A DepthwiseConvolution2dDescriptor for the DepthwiseConvolution2dLayer.
Definition: Descriptors.hpp:468

armnn::Layer
Definition: Layer.hpp:210

armnn::Optimizer
Definition: Optimizer.hpp:14

armnn::BatchNormalizationDescriptor
A BatchNormalizationDescriptor for the BatchNormalizationLayer.
Definition: Descriptors.hpp:634

armnn::DataLayout::NHWC

armnn::ResizeLayer
This layer represents a resize operation.
Definition: ResizeLayer.hpp:13

armnn::LstmBasicParameters::m_InputToOutputWeights
std::shared_ptr< ConstTensorHandle > m_InputToOutputWeights
A unique pointer to represent 2D weights tensor with dimensions [input_size, num_units].
Definition: LstmLayer.hpp:61

armnn::BackendId
Definition: BackendId.hpp:75

anchors
std::vector< float > anchors({ 0.5f, 0.5f, 1.0f, 1.0f, 0.5f, 0.5f, 1.0f, 1.0f, 0.5f, 0.5f, 1.0f, 1.0f, 0.5f, 10.5f, 1.0f, 1.0f, 0.5f, 10.5f, 1.0f, 1.0f, 0.5f, 100.5f, 1.0f, 1.0f })

armnn::IBackendInternal::IBackendContextPtr
std::unique_ptr< IBackendContext > IBackendContextPtr
Definition: IBackendInternal.hpp:81