plain/22.05/_fuse_activation_tests_8cpp_source.xhtml

 //
 // Copyright © 2020 Arm Ltd and Contributors. All rights reserved.
 // SPDX-License-Identifier: MIT
 //

 #include "LayersFwd.hpp"

 #include <Network.hpp>
 #include <ResolveType.hpp>
 #include <armnn/INetwork.hpp>
 #include <GraphUtils.hpp>
 #include <TestUtils.hpp>

 #include <doctest/doctest.h>

 #include <armnnUtils/QuantizeHelper.hpp>
 #include <string>

 using namespace armnn;

 namespace
 {

 template<typename T>
 std::vector<T> GetVector(unsigned int size, float initial, float increment)
 {
     std::vector<float> typeVector(size, initial);
     std::vector<T>     vector(size);

     if (size > 1)
     {
         for (unsigned int i = 0; i < size; ++i)
         {
             vector[i] = T(initial + (increment * static_cast<float>(i)));
         }
     }
     return vector;
 }

 template<DataType ArmnnType, typename T = ResolveType<ArmnnType>>
 struct Convolution2dTest
 {
     using LayerType = Convolution2dLayer;
     static const bool isElementWise = false;
     static const bool isConstTensorAsInputSupported = true;

     static TensorShape GetInputShape()   { return TensorShape( {1, 4, 4, 3}); }  // NHWCin
     static TensorShape GetOutputShape()  { return TensorShape( {1, 3, 3, 4}); }  // NHWCout
     static TensorShape GetWeightsShape() { return TensorShape( {4, 2, 2, 3}); }  // CoutHWCin

     constexpr static const unsigned int inputSize  = 48; // batchIn * heightIn * widthIn * channelIn
     constexpr static const unsigned int outputSize = 36; // batchOut * heightOut * widthOut * channelOut

     static IConnectableLayer* AddReceiverLayer(INetwork* network,
                                                const char* name,
                                                float scale = 1.f,
                                                int32_t offset = 0)
     {
         IgnoreUnused(scale);
         IgnoreUnused(offset);

         Convolution2dDescriptor descriptor;
         descriptor.m_DataLayout  = DataLayout::NHWC;
         descriptor.m_StrideX     = 1;
         descriptor.m_StrideY     = 1;

         return network->AddConvolution2dLayer(descriptor, name);
     }

     static std::vector<IConnectableLayer*> AddConstantLayers(INetwork* network,
                                                              float scale = 1.f,
                                                              int32_t offset = 0)
     {

         std::vector<float> weightsData   = {  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12,
                                              11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22,
                                              21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,
                                              31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 };
         std::vector<T>     weightsVector = armnnUtils::QuantizedVector<T>(weightsData, scale, offset);
         TensorInfo         weightsInfo(GetWeightsShape(), ArmnnType, scale, offset, true);
         ConstTensor        weights(weightsInfo, weightsVector);

         IConnectableLayer* weightsLayer = network->AddConstantLayer(weights, "Weights");
         weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsInfo);

         std::vector<IConnectableLayer*> layers = { weightsLayer };
         return layers;
     }
 };

 template<DataType ArmnnType, typename T = ResolveType<ArmnnType>>
 struct DWConvolution2dTest
 {
 public:
     using LayerType = DepthwiseConvolution2dLayer;
     static const bool isElementWise = false;
     static const bool isConstTensorAsInputSupported = true;

     static TensorShape GetInputShape()   { return TensorShape( {1, 4, 4, 3}); }   // [N,H,W,Cin]
     static TensorShape GetOutputShape()  { return TensorShape( {1, 3, 3, 12}); }  // [N,H,W,Cout]
     static TensorShape GetWeightsShape() { return TensorShape( {1, 2, 2, 12}); }  // [1,H,W,Cout]

     constexpr static const unsigned int inputSize  = 48; //batchIn * heightIn * widthIn * channelIn;
     constexpr static const unsigned int outputSize = 108; //batchOut * heightOut * widthOut * channelOut;

     static IConnectableLayer* AddReceiverLayer(INetwork* network,
                                                const char* name,
                                                float scale = 1.f,
                                                int32_t offset = 0)
     {
         IgnoreUnused(scale);
         IgnoreUnused(offset);

         DepthwiseConvolution2dDescriptor descriptor;
         descriptor.m_BiasEnabled = false;
         descriptor.m_DataLayout  = DataLayout::NHWC;
         descriptor.m_StrideX     = 1;
         descriptor.m_StrideY     = 1;

         return network->AddDepthwiseConvolution2dLayer(descriptor, name);
     }

     static std::vector<IConnectableLayer*> AddConstantLayers(INetwork* network,
                                                              float scale = 1.f,
                                                              int32_t offset = 0)
     {
         std::vector<float> weightsData   = { 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12,
                                              11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22,
                                              21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,
                                              31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42};
         std::vector<T>     weightsVector = armnnUtils::QuantizedVector<T>(weightsData, scale, offset);
         TensorInfo         weightsInfo(GetWeightsShape(), ArmnnType, scale, offset, true);
         ConstTensor        weights(weightsInfo, weightsVector);

         IConnectableLayer* weightsLayer = network->AddConstantLayer(weights, "Weights");
         weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsInfo);

         std::vector<IConnectableLayer*> layers = { weightsLayer };
         return layers;
     }
 };

 template<DataType ArmnnType, typename T = ResolveType<ArmnnType>>
 struct FullyConnectedTest
 {
 public:
     using LayerType = FullyConnectedLayer;
     static const bool isElementWise = false;
     static const bool isConstTensorAsInputSupported = true;

     static TensorShape GetInputShape()   { return TensorShape( {2, 5, 1, 1}); } // NCinHW
     static TensorShape GetOutputShape()  { return TensorShape( {2, 3}); }       // NCout
     static TensorShape GetWeightsShape() { return TensorShape( {5, 3}); }       // CinCout

     constexpr static const unsigned int inputSize  = 10; // batchIn * heightIn * widthIn * channelIn
     constexpr static const unsigned int outputSize = 6;  // batchOut * heightOut * widthOut * channelOut

     static IConnectableLayer* AddReceiverLayer(INetwork* network,
                                                const char* name,
                                                float scale = 1.f,
                                                int32_t offset = 0)
     {
         IgnoreUnused(scale);
         IgnoreUnused(offset);

         FullyConnectedDescriptor descriptor;
         descriptor.m_BiasEnabled = false;

         return network->AddFullyConnectedLayer(descriptor, name);
     }

     static std::vector<IConnectableLayer*> AddConstantLayers(INetwork* network,
                                                              float scale = 1.f,
                                                              int32_t offset = 0)
     {
         std::vector<float> weightsData   = { 1,  2,  3,  4,  5,
                                              6,  7,  8,  9, 10,
                                              11, 12, 13, 14, 15};
         std::vector<T>     weightsVector = armnnUtils::QuantizedVector<T>(weightsData, scale, offset);
         TensorInfo         weightsInfo(GetWeightsShape(), ArmnnType, scale, offset, true);
         ConstTensor        weights(weightsInfo, weightsVector);

         IConnectableLayer* weightsLayer = network->AddConstantLayer(weights, "Weights");
         weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsInfo);

         std::vector<IConnectableLayer*> layers = { weightsLayer };
         return layers;
     }
 };

 template<DataType ArmnnType, typename T = ResolveType<ArmnnType>>
 struct BatchNormTest
 {
 public:
     using LayerType = BatchNormalizationLayer;
     static const bool isElementWise = false;
     static const bool isConstTensorAsInputSupported = false;

     static TensorShape GetInputShape()   { return TensorShape( {1, 4, 4, 3}); }  // NHWCin
     static TensorShape GetOutputShape()  { return TensorShape( {1, 4, 4, 3}); }  // NHWCout

     constexpr static const unsigned int inputSize  = 48; // batchIn * heightIn * widthIn * channelIn
     constexpr static const unsigned int outputSize = 48; // batchOut * heightOut * widthOut * channelOut

     static IConnectableLayer* AddReceiverLayer(INetwork* network,
                                                const char* name,
                                                float scale = 1.f,
                                                int32_t offset = 0)
     {
         IgnoreUnused(scale);
         IgnoreUnused(offset);

         BatchNormalizationDescriptor descriptor;
         descriptor.m_DataLayout = DataLayout::NHWC;

         std::vector<T> betaVector     = GetVector<T>(GetOutputShape()[3], 0.0f, 0.2f);
         std::vector<T> gammaVector    = GetVector<T>(GetOutputShape()[3], 0.5f, 0.1f);
         std::vector<T> meanVector     = GetVector<T>(GetOutputShape()[3], 0.1f, 0.1f);
         std::vector<T> varianceVector = GetVector<T>(GetOutputShape()[3], 1.0f, 0.1f);

         const unsigned int outputChannelSize[] = { GetOutputShape()[3] };
         ConstTensor beta(TensorInfo(1, outputChannelSize, ArmnnType, 0.0f, 0, true), betaVector);
         ConstTensor gamma(TensorInfo(1, outputChannelSize, ArmnnType, 0.0f, 0, true), gammaVector);
         ConstTensor mean(TensorInfo(1, outputChannelSize, ArmnnType, 0.0f, 0, true), meanVector);
         ConstTensor variance(TensorInfo(1, outputChannelSize, ArmnnType, 0.0f, 0, true), varianceVector);

         return network->AddBatchNormalizationLayer(descriptor, mean, variance, beta, gamma, name);
     }

     static std::vector<IConnectableLayer*> AddConstantLayers(INetwork* network,
                                                              float scale = 1.f,
                                                              int32_t offset = 0)
     {
         IgnoreUnused(network);
         IgnoreUnused(scale);
         IgnoreUnused(offset);
         return {};
     }
 };

 template<DataType ArmnnType, typename T = ResolveType<ArmnnType>>
 struct MultiplicationTest
 {
     using LayerType = MultiplicationLayer;
     static const bool isElementWise = true;
     static const bool isConstTensorAsInputSupported = false;

     static TensorShape GetInputShape()   { return TensorShape( {1, 4, 4, 3}); }  // NHWCin
     static TensorShape GetOutputShape()  { return TensorShape( {1, 4, 4, 3}); }  // NHWCout

     constexpr static const unsigned int inputSize  = 48; // batchIn * heightIn * widthIn * channelIn
     constexpr static const unsigned int outputSize = 48; // batchOut * heightOut * widthOut * channelOut

     static IConnectableLayer* AddReceiverLayer(INetwork* network,
                                                const char* name,
                                                float scale = 1.f,
                                                int32_t offset = 0)
     {
         IgnoreUnused(scale);
         IgnoreUnused(offset);

         return network->AddMultiplicationLayer(name);
     }

     static std::vector<IConnectableLayer*> AddConstantLayers(INetwork* network,
                                                              float scale = 1.f,
                                                              int32_t offset = 0)
     {
         IgnoreUnused(network);
         IgnoreUnused(scale);
         IgnoreUnused(offset);
         return {};
     }
 };

 template<DataType ArmnnType, typename T = ResolveType<ArmnnType>>
 struct AdditionTest
 {
     using LayerType = AdditionLayer;
     static const bool isElementWise = true;
     static const bool isConstTensorAsInputSupported = false;

     static TensorShape GetInputShape()   { return TensorShape( {1, 4, 4, 3}); }  // NHWCin
     static TensorShape GetOutputShape()  { return TensorShape( {1, 4, 4, 3}); }  // NHWCout

     constexpr static const unsigned int inputSize  = 48; // batchIn * heightIn * widthIn * channelIn
     constexpr static const unsigned int outputSize = 48; // batchOut * heightOut * widthOut * channelOut

     static IConnectableLayer* AddReceiverLayer(INetwork* network,
                                                const char* name,
                                                float scale = 1.f,
                                                int32_t offset = 0)
     {
         IgnoreUnused(scale);
         IgnoreUnused(offset);

         return network->AddAdditionLayer(name);
     }

     static std::vector<IConnectableLayer*> AddConstantLayers(INetwork* network,
                                                              float scale = 1.f,
                                                              int32_t offset = 0)
     {
         IgnoreUnused(network);
         IgnoreUnused(scale);
         IgnoreUnused(offset);
         return {};
     }
 };

 template<DataType ArmnnType, typename T = ResolveType<ArmnnType>>
 struct SubtractionTest
 {
     using LayerType = SubtractionLayer;
     static const bool isElementWise = true;
     static const bool isConstTensorAsInputSupported = false;

     static TensorShape GetInputShape()   { return TensorShape( {1, 4, 4, 3}); }  // NHWCin
     static TensorShape GetOutputShape()  { return TensorShape( {1, 4, 4, 3}); }  // NHWCout

     constexpr static const unsigned int inputSize  = 48; // batchIn * heightIn * widthIn * channelIn
     constexpr static const unsigned int outputSize = 48; // batchOut * heightOut * widthOut * channelOut

     static IConnectableLayer* AddReceiverLayer(INetwork* network,
                                                const char* name,
                                                float scale = 1.f,
                                                int32_t offset = 0)
     {
         IgnoreUnused(scale);
         IgnoreUnused(offset);

         return network->AddSubtractionLayer(name);
     }

     static std::vector<IConnectableLayer*> AddConstantLayers(INetwork* network,
                                                              float scale = 1.f,
                                                              int32_t offset = 0)
     {
         IgnoreUnused(network);
         IgnoreUnused(scale);
         IgnoreUnused(offset);
         return {};
     }
 };

 template<DataType ArmnnType, typename T = ResolveType<ArmnnType>>
 struct DivisionTest
 {
     using LayerType = DivisionLayer;
     static const bool isElementWise = true;
     static const bool isConstTensorAsInputSupported = false;

     static TensorShape GetInputShape()   { return TensorShape( {1, 4, 4, 3}); }  // NHWCin
     static TensorShape GetOutputShape()  { return TensorShape( {1, 4, 4, 3}); }  // NHWCout

     constexpr static const unsigned int inputSize  = 48; // batchIn * heightIn * widthIn * channelIn
     constexpr static const unsigned int outputSize = 48; // batchOut * heightOut * widthOut * channelOut

     static IConnectableLayer* AddReceiverLayer(INetwork* network,
                                                const char* name,
                                                float scale = 1.f,
                                                int32_t offset = 0)
     {
         IgnoreUnused(scale);
         IgnoreUnused(offset);

         return network->AddDivisionLayer(name);
     }

     static std::vector<IConnectableLayer*> AddConstantLayers(INetwork* network,
                                                              float scale = 1.f,
                                                              int32_t offset = 0)
     {
         IgnoreUnused(network);
         IgnoreUnused(scale);
         IgnoreUnused(offset);
         return {};
     }
 };

 template<typename LayerTest,
          DataType ArmnnType>
 INetworkPtr CreateNetwork(ActivationDescriptor activationDescriptor, bool preventFusing,
                          float scale, int32_t offset)
 {
     // Create a network
     INetworkPtr network = INetwork::Create();

     IConnectableLayer* inputLayer = network->AddInputLayer(0);

     IConnectableLayer* receiverLayer = LayerTest::AddReceiverLayer(network.get(),
                                                                    "receiverLayer",
                                                                    scale,
                                                                    offset);

     IConnectableLayer* activationLayer = network->AddActivationLayer(activationDescriptor,
                                                                      "activation");

     IConnectableLayer* outputLayer  = network->AddOutputLayer(0);
     IConnectableLayer* output2Layer = preventFusing ? network->AddOutputLayer(1) : nullptr;

     // If ConstTensorAsInputs is supported weights and bias are stored as constant layers.
     if (LayerTest::isConstTensorAsInputSupported)
     {
         std::vector<IConnectableLayer*> constantLayers = LayerTest::AddConstantLayers(network.get(),
                                                                                       scale,
                                                                                       offset);

         // Connect constant layers to receiverLayer.
         for (unsigned int i = 0; i < constantLayers.size(); ++i)
         {
             constantLayers[i]->GetOutputSlot(0).Connect(receiverLayer->GetInputSlot(i + 1));
         }
     }

     // Define layers information
     TensorInfo inputInfo(LayerTest::GetInputShape(), ArmnnType, scale, offset);
     TensorInfo outputInfo(LayerTest::GetOutputShape(), ArmnnType, scale, offset);

     // Set layer information
     inputLayer->GetOutputSlot(0).SetTensorInfo(inputInfo);
     receiverLayer->GetOutputSlot(0).SetTensorInfo(outputInfo);
     activationLayer->GetOutputSlot(0).SetTensorInfo(outputInfo);

     // Connect layers
     inputLayer->GetOutputSlot(0).Connect(receiverLayer->GetInputSlot(0));
     receiverLayer->GetOutputSlot(0).Connect(activationLayer->GetInputSlot(0));
     activationLayer->GetOutputSlot(0).Connect(outputLayer->GetInputSlot(0));

     if (LayerTest::isElementWise)
     {
         inputLayer->GetOutputSlot(0).Connect(receiverLayer->GetInputSlot(1));
     }
     if (preventFusing)
     {
         receiverLayer->GetOutputSlot(0).Connect(output2Layer->GetInputSlot(0));
     }

     return network;
 }

 template<typename LayerTest,
          DataType ArmnnType,
          typename LayerType = typename LayerTest::LayerType,
          typename T = ResolveType<ArmnnType>>
 void FuseActivationIntoPreviousLayerTest(ActivationDescriptor activationDescriptor, float tolerance, Compute backendId,
                                          float scale = 1.f, int32_t offset=0)
 {
     // FIRST NETWORK: Fused
     // Construct ArmNN network
     INetworkPtr networkFused = CreateNetwork<LayerTest, ArmnnType>(activationDescriptor, false, scale, offset);

     // Create ArmNN runtime
     IRuntimePtr run = IRuntime::Create(IRuntime::CreationOptions()); // default options

     // Optimise ArmNN network
     IOptimizedNetworkPtr optNetFused = Optimize(*networkFused, {backendId}, run->GetDeviceSpec());

     Graph& graphFused = GetGraphForTesting(optNetFused.get());

     auto checkFusedConv2d = [](const Layer* const layer)->bool {
         return IsLayerOfType<LayerType>(layer) &&
             (layer->GetNameStr() == "fused-activation-into-receiverLayer");
     };

     // If ConstTensorAsInputs is supported, weights and bias are stored as constant layers.
     if(LayerTest::isConstTensorAsInputSupported)
     {
         CHECK(4 == graphFused.GetNumLayers());
         CHECK(CheckSequence(graphFused.cbegin(),
                             graphFused.cend(),
                             &IsLayerOfType<InputLayer>,
                             &IsLayerOfType<ConstantLayer>,
                             checkFusedConv2d,
                             &IsLayerOfType<OutputLayer>));

         // Check if new constant layer is connected to fused receiver layer.
         Layer* fusedReceiverLayer = GetFirstLayerWithName(graphFused, "fused-activation-into-receiverLayer");
         CHECK(fusedReceiverLayer);
         CHECK(fusedReceiverLayer->GetInputSlot(1).GetConnection() != nullptr);
     }
     else
     {
         CHECK(3 == graphFused.GetNumLayers());
         CHECK(CheckSequence(graphFused.cbegin(),
                             graphFused.cend(),
                             &IsLayerOfType<InputLayer>,
                             checkFusedConv2d,
                             &IsLayerOfType<OutputLayer>));
     }

     // Load network into runtime
     NetworkId networkIdentifier;
     CHECK(run->LoadNetwork(networkIdentifier, std::move(optNetFused)) == Status::Success);

     //Creates structures for inputs and outputs.
     std::vector<float> data = GetVector<float>(LayerTest::inputSize, 1.0f, 0.1f);
     std::vector<T> inputDataFused = armnnUtils::QuantizedVector<T>(data, scale, offset);
     std::vector<T> outputDataFused(LayerTest::outputSize);

     armnn::TensorInfo inputTensorInfo = run->GetInputTensorInfo(networkIdentifier, 0);
     inputTensorInfo.SetConstant(true);

     InputTensors  inputTensorsFused{
         {0, ConstTensor(inputTensorInfo, inputDataFused.data())}};
     OutputTensors outputTensorsFused{
         {0, Tensor(run->GetOutputTensorInfo(networkIdentifier, 0), outputDataFused.data())}};

     // Execute network
     CHECK(run->EnqueueWorkload(networkIdentifier, inputTensorsFused, outputTensorsFused) == Status::Success);

     // SECOND NETWORK: NotFused
     // Construct ArmNN network
     INetworkPtr networkNotFused = CreateNetwork<LayerTest, ArmnnType>(activationDescriptor, true, scale, offset);

     // Create ArmNN runtime
     IRuntimePtr runNotFused = IRuntime::Create(IRuntime::CreationOptions()); // default options

     // Optimise ArmNN network
     IOptimizedNetworkPtr optNetNotFused = Optimize(*networkNotFused, {backendId}, runNotFused->GetDeviceSpec());

     Graph& graphNotFused = GetGraphForTesting(optNetNotFused.get());

     // If ConstTensorAsInputs is supported, weights and bias are stored as constant layers.
     if(LayerTest::isConstTensorAsInputSupported)
     {
         CHECK(6 == graphNotFused.GetNumLayers());
         CHECK(CheckSequence(graphNotFused.cbegin(),
                             graphNotFused.cend(),
                             &IsLayerOfType<InputLayer>,
                             &IsLayerOfType<ConstantLayer>,
                             &IsLayerOfType<LayerType>,
                             &IsLayerOfType<ActivationLayer>,
                             &IsLayerOfType<OutputLayer>,
                             &IsLayerOfType<OutputLayer>));
     }
     else
     {
         CHECK(5 == graphNotFused.GetNumLayers());
         CHECK(CheckSequence(graphNotFused.cbegin(),
                             graphNotFused.cend(),
                             &IsLayerOfType<InputLayer>,
                             &IsLayerOfType<LayerType>,
                             &IsLayerOfType<ActivationLayer>,
                             &IsLayerOfType<OutputLayer>,
                             &IsLayerOfType<OutputLayer>));
     }

     // Load network into runtime
     NetworkId networkIdentifierNotFused;
     CHECK(runNotFused->LoadNetwork(networkIdentifierNotFused, std::move(optNetNotFused)) == Status::Success);

     //Creates structures for inputs and outputs.
     std::vector<T> inputDataNotFused = armnnUtils::QuantizedVector<T>(data, scale, offset);
     std::vector<T> outputDataNotFused(LayerTest::outputSize);
     std::vector<T> outputData2NotFused(LayerTest::outputSize);

     TensorInfo inputTensorInfoNotFused = runNotFused->GetInputTensorInfo(networkIdentifierNotFused, 0);
     inputTensorInfoNotFused.SetConstant(true);

     InputTensors  inputTensorsNotFused{
         {0, ConstTensor(inputTensorInfoNotFused, inputDataNotFused.data())}};
     OutputTensors outputTensorsNotFused{
         {0, Tensor(runNotFused->GetOutputTensorInfo(networkIdentifierNotFused, 0), outputDataNotFused.data())},
         {1, Tensor(runNotFused->GetOutputTensorInfo(networkIdentifierNotFused, 1), outputData2NotFused.data())}};

     // Execute network
     CHECK(runNotFused->EnqueueWorkload(networkIdentifierNotFused, inputTensorsNotFused, outputTensorsNotFused)
                == Status::Success);

     // Check the output of the fused-activation matches with the output of the activation in the "NotFused" network
     for (unsigned int n = 0; n < outputDataFused.size(); ++n)
     {
         auto outputNotFused = static_cast<float>(outputDataNotFused[n]);
         CHECK(static_cast<float>(outputDataFused[n]) == doctest::Approx(outputNotFused).epsilon(tolerance));
     }
 }

 template<typename LayerTest,
          DataType ArmnnType,
          typename LayerType = typename LayerTest::LayerType,
          typename T = ResolveType<ArmnnType>>
 bool FuseActivationSimpleTest(ActivationDescriptor activationDescriptor, Compute backendId,
                               float scale = 1.f, int32_t offset = 0)
 {
     bool success;
     try
     {
         // Construct ArmNN network
         INetworkPtr networkFused = CreateNetwork<LayerTest, ArmnnType>(activationDescriptor, false, scale, offset);

         // Create ArmNN runtime
         IRuntimePtr run = IRuntime::Create(IRuntime::CreationOptions()); // default options

         // Optimise ArmNN network
         IOptimizedNetworkPtr optNetFused = Optimize(*networkFused, {backendId}, run->GetDeviceSpec());

         // Load network into runtime
         NetworkId networkIdentifier;
         CHECK(run->LoadNetwork(networkIdentifier, std::move(optNetFused)) == Status::Success);

         //Creates structures for inputs and outputs.
         std::vector<float> data           = GetVector<float>(LayerTest::inputSize, 1.0f, 0.1f);
         std::vector<T>     inputDataFused = armnnUtils::QuantizedVector<T>(data, scale, offset);
         std::vector<T>     outputDataFused(LayerTest::outputSize);

         TensorInfo inputTensorInfo = run->GetInputTensorInfo(networkIdentifier, 0);
         inputTensorInfo.SetConstant(true);

         InputTensors  inputTensorsFused{
             {0, ConstTensor(inputTensorInfo, inputDataFused.data())}};
         OutputTensors outputTensorsFused{
             {0, Tensor(run->GetOutputTensorInfo(networkIdentifier, 0), outputDataFused.data())}};

         // Execute network
         run->EnqueueWorkload(networkIdentifier, inputTensorsFused, outputTensorsFused);

         success = true;
     }
     catch (const std::exception& e)
     {
         std::cerr << e.what() << std::endl;
         success = false;
     }

     return success;
 }

 }

 #if defined(ARMCOMPUTENEON_ENABLED)
 TEST_SUITE("Optimizer")
 {
 // ReLu fused into Receiver Layers Float32
 TEST_CASE("FuseReLUIntoConvFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }
 TEST_CASE("FuseReLUIntoDWConvFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<DWConvolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }
 TEST_CASE("FuseReLUIntoFullyConnectedFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<FullyConnectedTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }
 TEST_CASE("FuseReLUIntoBatchNormFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<BatchNormTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }

 // BoundedReLu fused into Receiver Layers Float32
 TEST_CASE("FuseBoundedReLUIntoConvFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoDWConvFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest < DWConvolution2dTest < DataType::Float32 > , DataType::Float32 >
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoFullyConnectedFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<FullyConnectedTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoBatchNormFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<BatchNormTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }

 // ReLU fused into Receiver Layers QAsymmU8
 TEST_CASE("FuseReLUIntoConvQAsymmU8CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }
 TEST_CASE("FuseReLUIntoDWConvQAsymmU8CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<DWConvolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }
 TEST_CASE("FuseReLUIntoFullyConnectedQAsymmU8CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }

 // BoundedReLu fused into Receiver Layers QAsymmS8
 TEST_CASE("FuseBoundedReLUIntoConvQASymmS8CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 6.0f;
     activationDescriptor.m_B = 0.0f;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::QAsymmS8>, DataType::QAsymmS8>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoDWConvQASymmS8CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 6.0f;
     activationDescriptor.m_B = 0.0f;

     FuseActivationIntoPreviousLayerTest < DWConvolution2dTest < DataType::QAsymmS8 > , DataType::QAsymmS8 >
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoFullyConnectedQASymmS8CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 6.0f;
     activationDescriptor.m_B = 0.0f;

     FuseActivationIntoPreviousLayerTest<FullyConnectedTest<DataType::QAsymmS8>, DataType::QAsymmS8>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }

 // TanH fused into Receiver Layers Float32
 TEST_CASE("FuseTanHIntoConvFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::TanH;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }

 // HardSwish fused into Receiver Layers Float32
 TEST_CASE("FuseHardSwishIntoConvFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::HardSwish;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::CpuAcc);
 }

 // Test that all receiver layers follow by all activation layers work, either fused or not fused
 TEST_CASE("LayerFollowedByActivationFloat32CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     for (int i = 0; i != 12; ++i)
     {
         activationDescriptor.m_Function = static_cast<ActivationFunction>(i);
         activationDescriptor.m_A = 1.0f;
         activationDescriptor.m_B = -1.0f;
         CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::Float32>, DataType::Float32>
             (activationDescriptor, Compute::CpuAcc)), "Convolution + Activation function " << i);
         CHECK_MESSAGE((FuseActivationSimpleTest<DWConvolution2dTest<DataType::Float32>, DataType::Float32>
             (activationDescriptor, Compute::CpuAcc)), "DepthwiseConvolution + Activation function " << i);
         CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::Float32>, DataType::Float32>
             (activationDescriptor, Compute::CpuAcc)), "FullyConnected + Activation function " << i);
         CHECK_MESSAGE((FuseActivationSimpleTest<BatchNormTest<DataType::Float32>, DataType::Float32>
             (activationDescriptor, Compute::CpuAcc)), "BatchNorm + Activation function " << i);
     }
 }
 TEST_CASE("LayerFollowedByActivationFloat16CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     for (int i = 0; i != 12; ++i)
     {
         activationDescriptor.m_Function = static_cast<ActivationFunction>(i);
         activationDescriptor.m_A = 1.0f;
         activationDescriptor.m_B = -1.0f;
         CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::Float16>, DataType::Float16>
             (activationDescriptor, Compute::CpuAcc)), "Convolution + Activation function " << i);
         CHECK_MESSAGE((FuseActivationSimpleTest<DWConvolution2dTest<DataType::Float16>, DataType::Float16>
             (activationDescriptor, Compute::CpuAcc)), "DepthwiseConvolution + Activation function " << i);
         CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::Float16>, DataType::Float16>
             (activationDescriptor, Compute::CpuAcc)), "FullyConnected + Activation function " << i);
         CHECK_MESSAGE((FuseActivationSimpleTest<BatchNormTest<DataType::Float16>, DataType::Float16>
             (activationDescriptor, Compute::CpuAcc)), "BatchNorm + Activation function " << i);
     }
 }
 TEST_CASE("LayerFollowedByActivationQAsymmU8CpuAccTest")
 {
     ActivationDescriptor activationDescriptor;

     activationDescriptor.m_Function = ActivationFunction::Sigmoid;
     CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::CpuAcc, 1.f / 256.f, 0)), "Convolution + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
     CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::CpuAcc, 1.f / 256.f, 0)), "FullyConnected + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));

     activationDescriptor.m_Function = ActivationFunction::TanH;
     CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::CpuAcc, 1.f / 128.f, 128)), "Convolution + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
     CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::CpuAcc, 1.f / 128.f, 128)), "FullyConnected + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));

     activationDescriptor.m_Function = ActivationFunction::ReLu;
     CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::CpuAcc)), "Convolution + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
     CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::CpuAcc)), "FullyConnected + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));

     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;
     CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::CpuAcc)), "Convolution + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
     CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::CpuAcc)), "FullyConnected + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));

     activationDescriptor.m_Function = ActivationFunction::HardSwish;
     CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::CpuAcc)), "Convolution + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
     CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::CpuAcc)), "FullyConnected + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
 }
 }
 #endif

 #if defined(ARMCOMPUTECL_ENABLED)
 TEST_SUITE("Optimizer")
 {
 // ReLu fused into Receiver Layers Float32
 TEST_CASE("FuseReLUIntoConvFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoDWConvFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<DWConvolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoFullyConnectedFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<FullyConnectedTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoBatchNormFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<BatchNormTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoMulFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<MultiplicationTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoAddFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<AdditionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoSubFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<SubtractionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoDivFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<DivisionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }

 // BoundedReLu fused into Receiver Layers Float32
 TEST_CASE("FuseBoundedReLUIntoConvFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoDWConvFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<DWConvolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoFullyConnectedFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<FullyConnectedTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoBatchNormFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<BatchNormTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoMulFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<MultiplicationTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoAddFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<AdditionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoSubFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<SubtractionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoDivFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;

     FuseActivationIntoPreviousLayerTest<DivisionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }

 // ReLu fused into Receiver Layers Float16
 TEST_CASE("FuseReLUIntoConvFloat16GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::Float16>, DataType::Float16>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoDWConvFloat16GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<DWConvolution2dTest<DataType::Float16>, DataType::Float16>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoFullyConnectedFloat16GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<FullyConnectedTest<DataType::Float16>, DataType::Float16>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoBatchNormFloat16GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<BatchNormTest<DataType::Float16>, DataType::Float16>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoMulFloat16GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<MultiplicationTest<DataType::Float16>, DataType::Float16>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoAddFloat16GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<AdditionTest<DataType::Float16>, DataType::Float16>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoSubFloat16GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<SubtractionTest<DataType::Float16>, DataType::Float16>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUIntoDivFloat16GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<DivisionTest<DataType::Float16>, DataType::Float16>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }

 // ReLU fused into Receiver Layers QAsymmU8
 TEST_CASE("FuseReLUQIntoConvAsymmU8GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUQIntoDWConvAsymmU8GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<DWConvolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseReLUQIntoFullyConnectedAsymmU8GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::ReLu;

     FuseActivationIntoPreviousLayerTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }

 // BoundedReLu fused into Receiver Layers QAsymmS8
 TEST_CASE("FuseBoundedReLUIntoConvQASymmS8GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 6.0f;
     activationDescriptor.m_B = 0.0f;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::QAsymmS8>, DataType::QAsymmS8>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoDWConvQASymmS8GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 6.0f;
     activationDescriptor.m_B = 0.0f;

     FuseActivationIntoPreviousLayerTest < DWConvolution2dTest < DataType::QAsymmS8 > , DataType::QAsymmS8 >
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseBoundedReLUIntoFullyConnectedQASymmS8GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 6.0f;
     activationDescriptor.m_B = 0.0f;

     FuseActivationIntoPreviousLayerTest<FullyConnectedTest<DataType::QAsymmS8>, DataType::QAsymmS8>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }

 // TanH fused into Receiver Layers Float32
 TEST_CASE("FuseTanHIntoConvFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::TanH;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseTanHIntoMulFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::TanH;

     FuseActivationIntoPreviousLayerTest<MultiplicationTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseTanHIntoAddFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::TanH;

     FuseActivationIntoPreviousLayerTest<AdditionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseTanHIntoSubFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::TanH;

     FuseActivationIntoPreviousLayerTest<SubtractionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseTanHIntoDivFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::TanH;

     FuseActivationIntoPreviousLayerTest<DivisionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }

 // HardSwish fused into Receiver Layers Float32
 TEST_CASE("FuseHardSwishIntoConvFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::HardSwish;

     FuseActivationIntoPreviousLayerTest<Convolution2dTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseHardSwishIntoMulFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::HardSwish;

     FuseActivationIntoPreviousLayerTest<MultiplicationTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseHardSwishIntoAddFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::HardSwish;

     FuseActivationIntoPreviousLayerTest<AdditionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseHardSwishIntoSubFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::HardSwish;

     FuseActivationIntoPreviousLayerTest<SubtractionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }
 TEST_CASE("FuseHardSwishIntoDivFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     activationDescriptor.m_Function = ActivationFunction::HardSwish;

     FuseActivationIntoPreviousLayerTest<DivisionTest<DataType::Float32>, DataType::Float32>
         (activationDescriptor, 0.0001f, Compute::GpuAcc);
 }

 // Test that all receiver layers follow by all activation layers work, either fused or not fused
 TEST_CASE("LayerFollowedByActivationFloat32GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     for (int i = 0; i != 12; ++i)
     {
         activationDescriptor.m_Function = static_cast<ActivationFunction>(i);
         activationDescriptor.m_A = 1.0f;
         activationDescriptor.m_B = -1.0f;
         if (activationDescriptor.m_Function != ActivationFunction::Elu)
         {
             CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::Float32>, DataType::Float32>
                 (activationDescriptor, Compute::GpuAcc)), "Convolution + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<DWConvolution2dTest<DataType::Float32>, DataType::Float32>
                 (activationDescriptor, Compute::GpuAcc)), "DepthwiseConvolution + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::Float32>, DataType::Float32>
                 (activationDescriptor, Compute::GpuAcc)), "FullyConnected + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<BatchNormTest<DataType::Float32>, DataType::Float32>
                 (activationDescriptor, Compute::GpuAcc)), "BatchNorm + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<MultiplicationTest<DataType::Float32>, DataType::Float32>
                 (activationDescriptor, Compute::GpuAcc)), "Multiplication + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<AdditionTest<DataType::Float32>, DataType::Float32>
                 (activationDescriptor, Compute::GpuAcc)), "Addition + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<SubtractionTest<DataType::Float32>, DataType::Float32>
                 (activationDescriptor, Compute::GpuAcc)), "Subtraction + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<DivisionTest<DataType::Float32>, DataType::Float32>
                 (activationDescriptor, Compute::GpuAcc)), "Division + Activation function " << i);
         }
     }
 }
 TEST_CASE("LayerFollowedByActivationFloat16GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;
     for (int i = 0; i != 12; ++i)
     {
         activationDescriptor.m_Function = static_cast<ActivationFunction>(i);
         activationDescriptor.m_A = 1.0f;
         activationDescriptor.m_B = -1.0f;
         if (activationDescriptor.m_Function != ActivationFunction::Elu)
         {
             CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::Float16>, DataType::Float16>
                 (activationDescriptor, Compute::GpuAcc)), "Convolution + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<DWConvolution2dTest<DataType::Float16>, DataType::Float16>
                 (activationDescriptor, Compute::GpuAcc)), "Depthwise + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::Float16>, DataType::Float16>
                 (activationDescriptor, Compute::GpuAcc)), "FullyConnected + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<BatchNormTest<DataType::Float16>, DataType::Float16>
                 (activationDescriptor, Compute::GpuAcc)), "BatchNorm + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<MultiplicationTest<DataType::Float16>, DataType::Float16>
                 (activationDescriptor, Compute::GpuAcc)), "Multiplication + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<AdditionTest<DataType::Float16>, DataType::Float16>
                 (activationDescriptor, Compute::GpuAcc)), "Addition + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<SubtractionTest<DataType::Float16>, DataType::Float16>
                 (activationDescriptor, Compute::GpuAcc)), "Subtraction + Activation function " << i);
             CHECK_MESSAGE((FuseActivationSimpleTest<DivisionTest<DataType::Float16>, DataType::Float16>
                 (activationDescriptor, Compute::GpuAcc)), "Division + Activation function " << i);
         }
     }
 }
 TEST_CASE("LayerFollowedByActivationQAsymmU8GpuAccTest")
 {
     ActivationDescriptor activationDescriptor;

     activationDescriptor.m_Function = ActivationFunction::Sigmoid;
     CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::GpuAcc, 1.f / 256.f, 0)), "Convolution + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
     CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::GpuAcc, 1.f / 256.f, 0)), "FullyConnected + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));

     activationDescriptor.m_Function = ActivationFunction::TanH;
     CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::GpuAcc, 1.f / 128.f, 128)), "Convolution + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
     CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::GpuAcc, 1.f / 128.f, 128)), "FullyConnected + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));

     activationDescriptor.m_Function = ActivationFunction::ReLu;
     CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::GpuAcc)), "Convolution + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
     CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::GpuAcc)), "FullyConnected + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));

     activationDescriptor.m_Function = ActivationFunction::BoundedReLu;
     activationDescriptor.m_A = 1.0f;
     activationDescriptor.m_B = -1.0f;
     CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::GpuAcc)), "Convolution + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
     CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::GpuAcc)), "FullyConnected + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));

     activationDescriptor.m_Function = ActivationFunction::HardSwish;
     CHECK_MESSAGE((FuseActivationSimpleTest<Convolution2dTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::GpuAcc)), "Convolution + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
     CHECK_MESSAGE((FuseActivationSimpleTest<FullyConnectedTest<DataType::QAsymmU8>, DataType::QAsymmU8>
         (activationDescriptor, Compute::GpuAcc)), "FullyConnected + Activation function " <<
         static_cast<int>(activationDescriptor.m_Function));
 }
 }
 #endif
armnn::TEST_SUITE
TEST_SUITE("TestConstTensorLayerVisitor")
Definition: ConstTensorLayerVisitor.cpp:110

armnn::INetwork::AddSubtractionLayer
IConnectableLayer * AddSubtractionLayer(const char *name=nullptr)
Adds a subtraction layer to the network.
Definition: Network.cpp:337

armnn::ActivationFunction::ReLu

armnn::Convolution2dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:549

armnn::IRuntime::Create
static IRuntimePtr Create(const CreationOptions &options)
Definition: Runtime.cpp:49

armnn::BatchNormalizationLayer
This layer represents a batch normalization operation.
Definition: BatchNormalizationLayer.hpp:15

armnn::IConnectableLayer
Interface for a layer that is connectable to other layers via InputSlots and OutputSlots.
Definition: INetwork.hpp:66

armnn::DepthwiseConvolution2dDescriptor::m_BiasEnabled
bool m_BiasEnabled
Enable/disable bias.
Definition: Descriptors.hpp:673

CheckSequence
bool CheckSequence(const armnn::Graph::ConstIterator first, const armnn::Graph::ConstIterator last)
Definition: TestUtils.hpp:21

GetFirstLayerWithName
armnn::Layer * GetFirstLayerWithName(armnn::Graph &graph, const std::string &name)
Definition: GraphUtils.cpp:22

armnn::INetwork::AddConstantLayer
IConnectableLayer * AddConstantLayer(const ConstTensor &input, const char *name=nullptr)
Adds a layer with no inputs and a single output, which always corresponds to the passed in constant t...
Definition: Network.cpp:292

armnn::DepthwiseConvolution2dDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:675

armnn::TensorInfo
Definition: Tensor.hpp:152

armnn::INetwork::AddDepthwiseConvolution2dLayer
IConnectableLayer * AddDepthwiseConvolution2dLayer(const DepthwiseConvolution2dDescriptor &convolution2dDescriptor, const char *name=nullptr)
Adds a 2D depthwise convolution layer to the network.
Definition: Network.cpp:118

QuantizeHelper.hpp

armnn::DepthwiseConvolution2dLayer
This layer represents a depthwise convolution 2d operation.
Definition: DepthwiseConvolution2dLayer.hpp:15

armnn::Convolution2dDescriptor
A Convolution2dDescriptor for the Convolution2dLayer.
Definition: Descriptors.hpp:499

DivisionTest
LayerTestResult< float, 4 > DivisionTest(armnn::IWorkloadFactory &workloadFactory, const armnn::IBackendInternal::IMemoryManagerSharedPtr &memoryManager, const armnn::ITensorHandleFactory &tensorHandleFactory)
Definition: DivisionTestImpl.cpp:62

armnn::IRuntimePtr
std::unique_ptr< IRuntime, void(*)(IRuntime *runtime)> IRuntimePtr
Definition: IRuntime.hpp:33

armnn::BatchNormalizationDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:808

armnn::ResolveType
typename ResolveTypeImpl< DT >::Type ResolveType
Definition: ResolveType.hpp:79

armnn::INetwork
Main network class which provides the interface for building up a neural network. ...
Definition: INetwork.hpp:249

armnn::ActivationFunction::Sigmoid

armnn::DataType::QAsymmS8

armnn::InputTensors
std::vector< std::pair< LayerBindingId, class ConstTensor > > InputTensors
Definition: Tensor.hpp:392

ResolveType.hpp

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_quick_start.dox:6

armnn::IgnoreUnused
void IgnoreUnused(Ts &&...)
Definition: IgnoreUnused.hpp:14

armnn::INetwork::AddDivisionLayer
IConnectableLayer * AddDivisionLayer(const char *name=nullptr)
Adds a division layer to the network.
Definition: Network.cpp:332

AdditionTest
LayerTestResult< float, 4 > AdditionTest(armnn::IWorkloadFactory &workloadFactory, const armnn::IBackendInternal::IMemoryManagerSharedPtr &memoryManager, const armnn::ITensorHandleFactory &tensorHandleFactory)
Definition: AdditionTestImpl.cpp:22

armnn::TensorShape
Definition: Tensor.hpp:20

armnn::InputSlot::GetConnection
const IOutputSlot * GetConnection() const override
Definition: Layer.hpp:204

armnn::INetwork::AddFullyConnectedLayer
IConnectableLayer * AddFullyConnectedLayer(const FullyConnectedDescriptor &fullyConnectedDescriptor, const char *name=nullptr)
Adds a fully connected layer to the network.
Definition: Network.cpp:166

FullyConnectedTest
LayerTestResult< T, 2 > FullyConnectedTest(armnn::IWorkloadFactory &workloadFactory, const armnn::IBackendInternal::IMemoryManagerSharedPtr &memoryManager, const armnn::ITensorHandleFactory &tensorHandleFactory, bool biasEnabled, bool constantWeights)
Definition: FullyConnectedTestImpl.cpp:97

armnn::IOutputSlot::SetTensorInfo
virtual void SetTensorInfo(const TensorInfo &tensorInfo)=0

armnn::Tensor
A tensor defined by a TensorInfo (shape and data type) and a mutable backing store.
Definition: Tensor.hpp:319

armnn::Layer::GetInputSlot
const InputSlot & GetInputSlot(unsigned int index) const override
Get a const input slot handle by slot index.
Definition: Layer.hpp:322

armnn::Convolution2dDescriptor::m_StrideX
uint32_t m_StrideX
Stride value when proceeding through input for the width dimension.
Definition: Descriptors.hpp:539

armnn::DepthwiseConvolution2dDescriptor::m_StrideX
uint32_t m_StrideX
Stride value when proceeding through input for the width dimension.
Definition: Descriptors.hpp:665

armnn::Status::Success

armnn::Compute
Compute
The Compute enum is now deprecated and it is now being replaced by BackendId.
Definition: BackendId.hpp:21

armnn::DataType
DataType
Definition: Types.hpp:48

armnn::FullyConnectedLayer
This layer represents a fully connected operation.
Definition: FullyConnectedLayer.hpp:15

armnn::Optimize
IOptimizedNetworkPtr Optimize(const INetwork &network, const std::vector< BackendId > &backendPreferences, const IDeviceSpec &deviceSpec, const OptimizerOptions &options=OptimizerOptions(), Optional< std::vector< std::string > &> messages=EmptyOptional())
Create an optimized version of the network.
Definition: Network.cpp:1847

armnn::DataType::QAsymmU8

armnn::FullyConnectedDescriptor
A FullyConnectedDescriptor for the FullyConnectedLayer.
Definition: Descriptors.hpp:468

armnn::FullyConnectedDescriptor::m_BiasEnabled
bool m_BiasEnabled
Enable/disable bias.
Definition: Descriptors.hpp:491

armnn::NetworkId
int NetworkId
Definition: IRuntime.hpp:27

armnn::ConstTensor
A tensor defined by a TensorInfo (shape and data type) and an immutable backing store.
Definition: Tensor.hpp:327

armnn::OutputTensors
std::vector< std::pair< LayerBindingId, class Tensor > > OutputTensors
Definition: Tensor.hpp:393

armnn::DataType::Float16

armnn::IOptimizedNetworkPtr
std::unique_ptr< IOptimizedNetwork, void(*)(IOptimizedNetwork *network)> IOptimizedNetworkPtr
Definition: INetwork.hpp:242

armnn::Compute::GpuAcc
GPU Execution: OpenCL: ArmCompute.

armnn::ActivationDescriptor
An ActivationDescriptor for the ActivationLayer.
Definition: Descriptors.hpp:36

armnn::ActivationFunction::BoundedReLu
min(a, max(b, input)) ReLu1 & ReLu6.

armnn::INetwork::AddBatchNormalizationLayer
IConnectableLayer * AddBatchNormalizationLayer(const BatchNormalizationDescriptor &desc, const ConstTensor &mean, const ConstTensor &variance, const ConstTensor &beta, const ConstTensor &gamma, const char *name=nullptr)
Adds a batch normalization layer to the network.
Definition: Network.cpp:247

armnn::Convolution2dDescriptor::m_StrideY
uint32_t m_StrideY
Stride value when proceeding through input for the height dimension.
Definition: Descriptors.hpp:541

armnn::Graph
Definition: Graph.hpp:30

INetwork.hpp

armnn::AdditionLayer
This layer represents an addition operation.
Definition: AdditionLayer.hpp:13

armnn::IRuntime::CreationOptions
Definition: IRuntime.hpp:77

armnn::GetGraphForTesting
Graph & GetGraphForTesting(IOptimizedNetwork *optNet)
Definition: TestUtils.cpp:49

armnn::ActivationFunction::Elu

armnn::ActivationDescriptor::m_A
float m_A
Alpha upper bound value used by the activation functions. (BoundedReLu, Linear, TanH, Elu).
Definition: Descriptors.hpp:61

armnn::INetwork::AddAdditionLayer
IConnectableLayer * AddAdditionLayer(const char *name=nullptr)
Adds an addition layer to the network.
Definition: Network.cpp:237

armnn::SubtractionLayer
This layer represents a subtraction operation.
Definition: SubtractionLayer.hpp:14

armnn::DepthwiseConvolution2dDescriptor::m_StrideY
uint32_t m_StrideY
Stride value when proceeding through input for the height dimension.
Definition: Descriptors.hpp:667

SubtractionTest
LayerTestResult< float, 4 > SubtractionTest(armnn::IWorkloadFactory &workloadFactory, const armnn::IBackendInternal::IMemoryManagerSharedPtr &memoryManager, const armnn::ITensorHandleFactory &tensorHandleFactory)
Definition: SubtractionTestImpl.cpp:107

armnn::Compute::CpuAcc
CPU Execution: NEON: ArmCompute.

Network.hpp

armnn::INetwork::AddConvolution2dLayer
IConnectableLayer * AddConvolution2dLayer(const Convolution2dDescriptor &convolution2dDescriptor, const char *name=nullptr)
Adds a 2D convolution layer to the network.
Definition: Network.cpp:85

armnn::IConnectableLayer::GetInputSlot
virtual const IInputSlot & GetInputSlot(unsigned int index) const =0
Get a const input slot handle by slot index.

armnn::TensorInfo::SetConstant
void SetConstant(const bool IsConstant=true)
Marks the data corresponding to this tensor info as constant.
Definition: Tensor.cpp:514

armnn::DivisionLayer
This layer represents a division operation.
Definition: DivisionLayer.hpp:14

armnn::DataType::Float32

armnn::IConnectableLayer::GetOutputSlot
virtual const IOutputSlot & GetOutputSlot(unsigned int index) const =0
Get the const output slot handle by slot index.

LayersFwd.hpp

armnn::Convolution2dLayer
This layer represents a convolution 2d operation.
Definition: Convolution2dLayer.hpp:15

armnn::INetwork::AddMultiplicationLayer
IConnectableLayer * AddMultiplicationLayer(const char *name=nullptr)
Adds a multiplication layer to the network.
Definition: Network.cpp:242

armnn::INetworkPtr
std::unique_ptr< INetwork, void(*)(INetwork *network)> INetworkPtr
Definition: INetwork.hpp:241

armnn::IOutputSlot::Connect
virtual int Connect(IInputSlot &destination)=0

armnn::MultiplicationLayer
This layer represents a multiplication operation.
Definition: MultiplicationLayer.hpp:14

armnn::ActivationFunction::HardSwish

armnn::INetwork::Create
static INetworkPtr Create(NetworkOptions networkOptions={})
Definition: Network.cpp:476

armnn::ActivationDescriptor::m_B
float m_B
Beta lower bound value used by the activation functions. (BoundedReLu, Linear, TanH).
Definition: Descriptors.hpp:63

MultiplicationTest
LayerTestResult< float, 4 > MultiplicationTest(armnn::IWorkloadFactory &workloadFactory, const armnn::IBackendInternal::IMemoryManagerSharedPtr &memoryManager, const armnn::ITensorHandleFactory &tensorHandleFactory)
Definition: MultiplicationTestImpl.cpp:20

armnn::ActivationDescriptor::m_Function
ActivationFunction m_Function
The activation function to use (Sigmoid, TanH, Linear, ReLu, BoundedReLu, SoftReLu, LeakyReLu, Abs, Sqrt, Square, Elu).
Definition: Descriptors.hpp:59

armnn::DepthwiseConvolution2dDescriptor
A DepthwiseConvolution2dDescriptor for the DepthwiseConvolution2dLayer.
Definition: Descriptors.hpp:624

armnn::Layer
Definition: Layer.hpp:215

armnn::BatchNormalizationDescriptor
A BatchNormalizationDescriptor for the BatchNormalizationLayer.
Definition: Descriptors.hpp:793

armnn::DataLayout::NHWC

armnn::ActivationFunction
ActivationFunction
Definition: Types.hpp:86

armnn::LayerType
LayerType
When adding a new layer, adapt also the LastLayer enum value in the enum class LayerType below...
Definition: Types.hpp:467

armnn::ActivationFunction::TanH