plain/20.05/_quantizer_visitor_8cpp_source.xhtml

 //
 // Copyright © 2017 Arm Ltd. All rights reserved.
 // SPDX-License-Identifier: MIT
 //

 #include "Network.hpp"
 #include "NetworkQuantizerUtils.hpp"
 #include "QuantizerVisitor.hpp"
 #include "StaticRangeVisitor.hpp"

 #include <armnn/utility/PolymorphicDowncast.hpp>

 namespace armnn
 {

 QuantizerVisitor::QuantizerVisitor(const RangeTracker& rangeTracker,
                                    const IQuantizationScheme* quantizationScheme,
                                    bool preserveType)
     : m_Ranges(rangeTracker)
     , m_QuantizedNetwork(INetwork::Create())
     , m_QuantizationScheme(quantizationScheme)
     , m_PreserveType(preserveType)
 {
 }

 void QuantizerVisitor::SetQuantizedInputConnections(const IConnectableLayer* srcLayer,
                                                     IConnectableLayer* quantizedLayer)
 {
     ARMNN_ASSERT(srcLayer);
     for (unsigned int i = 0; i < srcLayer->GetNumInputSlots(); i++)
     {
         const IInputSlot& srcInputSlot = srcLayer->GetInputSlot(i);
         const InputSlot* inputSlot = PolymorphicDowncast<const InputSlot*>(&srcInputSlot);
         ARMNN_ASSERT(inputSlot);
         const OutputSlot* outputSlot = inputSlot->GetConnectedOutputSlot();

         ARMNN_ASSERT(outputSlot);
         unsigned int slotIdx = outputSlot->CalculateIndexOnOwner();
         Layer& layerToFind = outputSlot->GetOwningLayer();

         auto found = m_OriginalToQuantizedGuidMap.find(layerToFind.GetGuid());
         if (found == m_OriginalToQuantizedGuidMap.end())
         {
             // Error in graph traversal order
             ARMNN_ASSERT_MSG(false, "Error in graph traversal");
             return;
         }

         // Connect the slots in the quantized model
         IConnectableLayer* prevQuantizedLayer = m_QuantizedGuidToLayerMap[found->second];
         IInputSlot& newInputSlot = quantizedLayer->GetInputSlot(i);
         IOutputSlot& newOutputSlot = prevQuantizedLayer->GetOutputSlot(slotIdx);
         newOutputSlot.Connect(newInputSlot);

         // Fetch the min/max ranges that were computed earlier
         auto range = m_Ranges.GetRange(layerToFind.GetGuid(), slotIdx);
         OffsetScalePair qParams = m_QuantizationScheme->ComputeScheme(range.first, range.second);

         // Set the quantization params
         TensorInfo info(outputSlot->GetTensorInfo());
         info.SetDataType(m_QuantizationScheme->GetDataType());
         info.SetQuantizationOffset(qParams.second);
         info.SetQuantizationScale(qParams.first);
         newOutputSlot.SetTensorInfo(info);
     }
 }

 ConstTensor QuantizerVisitor::CreateQuantizedBias(const IConnectableLayer* srcLayer,
                                                   const ConstTensor& weights,
                                                   const Optional<ConstTensor>& biases,
                                                   std::vector<int32_t>& backing)
 {
     ARMNN_ASSERT(srcLayer);
     const IInputSlot& srcInputSlot = srcLayer->GetInputSlot(0);
     auto inputSlot = PolymorphicDowncast<const InputSlot*>(&srcInputSlot);
     ARMNN_ASSERT(inputSlot);
     const OutputSlot* outputSlot = inputSlot->GetConnectedOutputSlot();

     ARMNN_ASSERT(outputSlot);
     unsigned int slotIdx = outputSlot->CalculateIndexOnOwner();
     Layer& layerToFind = outputSlot->GetOwningLayer();

     auto found = m_OriginalToQuantizedGuidMap.find(layerToFind.GetGuid());
     if (found == m_OriginalToQuantizedGuidMap.end())
     {
         // Error in graph traversal order
         ARMNN_ASSERT_MSG(false, "Error in graph traversal");
         return biases.value();
     }

     // Fetch the min/max ranges that were computed earlier
     auto range = m_Ranges.GetRange(layerToFind.GetGuid(), slotIdx);
     OffsetScalePair qParams = m_QuantizationScheme->ComputeScheme(range.first, range.second);

     // Get the quantization scale based on input and weight scale
     float scale = qParams.first * weights.GetInfo().GetQuantizationScale();

     // Set up quantized bias tensor info and allocate space
     TensorInfo qInfo(biases.value().GetInfo().GetShape(), DataType::Signed32, scale, 0);
     backing.resize(biases.value().GetInfo().GetNumElements());

     // Convert values to int32
     for (size_t i = 0; i < backing.size(); ++i)
     {
         float fp32Value = static_cast<const float*>(biases.value().GetMemoryArea())[i];
         backing[i] = boost::numeric_cast<int32_t>(fp32Value * ( 1 / scale ));
     }

     return ConstTensor(qInfo, backing);
 }

 void QuantizerVisitor::RecordLayer(const IConnectableLayer* srcLayer, IConnectableLayer* quantizedLayer)
 {
     m_OriginalToQuantizedGuidMap.insert(std::make_pair(srcLayer->GetGuid(), quantizedLayer->GetGuid()));
     m_QuantizedGuidToLayerMap.insert(std::make_pair(quantizedLayer->GetGuid(), quantizedLayer));
 }

 void QuantizerVisitor::VisitAbsLayer(const IConnectableLayer* layer, const char* name)
 {
     VisitElementwiseUnaryLayer(layer, ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);
 }

 void QuantizerVisitor::VisitActivationLayer(const IConnectableLayer* layer,
                                             const ActivationDescriptor& activationDescriptor,
                                             const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddActivationLayer(activationDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitAdditionLayer(const IConnectableLayer* layer, const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddAdditionLayer(name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitArgMinMaxLayer(const IConnectableLayer* layer,
                                            const ArgMinMaxDescriptor& argMinMaxDescriptor,
                                            const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddArgMinMaxLayer(argMinMaxDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitBatchNormalizationLayer(const IConnectableLayer* layer,
                                                     const BatchNormalizationDescriptor& desc,
                                                     const ConstTensor& mean,
                                                     const ConstTensor& variance,
                                                     const ConstTensor& beta,
                                                     const ConstTensor& gamma,
                                                     const char* name)
 {
     std::vector<uint8_t> meanBacking;
     ConstTensor qMean = CreateQuantizedConst(mean, meanBacking);

     std::vector<uint8_t> varianceBacking;
     ConstTensor qVariance = CreateQuantizedConst(variance, varianceBacking);

     std::vector<uint8_t> betaBacking;
     ConstTensor qBeta = CreateQuantizedConst(beta, betaBacking);

     std::vector<uint8_t> gammaBacking;
     ConstTensor qGamma = CreateQuantizedConst(gamma, gammaBacking);

     IConnectableLayer* newLayer = m_QuantizedNetwork->AddBatchNormalizationLayer(desc,
                                                                                  qMean,
                                                                                  qVariance,
                                                                                  qBeta,
                                                                                  qGamma,
                                                                                  name);

     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitBatchToSpaceNdLayer(const IConnectableLayer* layer,
                                                 const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,
                                                 const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddBatchToSpaceNdLayer(batchToSpaceNdDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitComparisonLayer(const IConnectableLayer* layer,
                                             const ComparisonDescriptor& comparisonDescriptor,
                                             const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddComparisonLayer(comparisonDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitConcatLayer(const IConnectableLayer* layer,
                                         const OriginsDescriptor& originsDescriptor,
                                         const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddConcatLayer(originsDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitConstantLayer(const IConnectableLayer* layer,
                                           const ConstTensor& input,
                                           const char* name)
 {
     std::vector<uint8_t> inputBacking;
     ConstTensor qInput = CreateQuantizedConst(input, inputBacking);

     IConnectableLayer* newLayer = m_QuantizedNetwork->AddConstantLayer(qInput, name);
     RecordLayer(layer, newLayer);
 }

 void QuantizerVisitor::VisitConvolution2dLayer(const IConnectableLayer* layer,
                                                const Convolution2dDescriptor& convolution2dDescriptor,
                                                const ConstTensor& weights,
                                                const Optional<ConstTensor>& biases,
                                                const char* name)
 {
     std::vector<uint8_t> weightsBacking;
     ConstTensor qWeights = CreateQuantizedConst(weights, weightsBacking);
     Optional<ConstTensor> optionalQBiases;
     std::vector<int32_t> biasesBacking;

     if (biases.has_value())
     {
         ConstTensor qBiases = CreateQuantizedBias(layer, qWeights, biases, biasesBacking);
         optionalQBiases = Optional<ConstTensor>(qBiases);
     }

     IConnectableLayer* newLayer = m_QuantizedNetwork->AddConvolution2dLayer(convolution2dDescriptor,
                                                                             qWeights,
                                                                             optionalQBiases,
                                                                             name);

     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitDepthToSpaceLayer(const IConnectableLayer* layer,
                                               const DepthToSpaceDescriptor& descriptor,
                                               const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddDepthToSpaceLayer(descriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitDepthwiseConvolution2dLayer(const IConnectableLayer* layer,
                                                         const DepthwiseConvolution2dDescriptor& desc,
                                                         const ConstTensor& weights,
                                                         const Optional<ConstTensor>& biases,
                                                         const char* name)
 {
     std::vector<uint8_t> weightsBacking;
     ConstTensor qWeights = CreateQuantizedConst(weights, weightsBacking);
     Optional<ConstTensor> optionalQBiases;
     std::vector<int32_t> biasesBacking;

     if (biases.has_value())
     {
         ConstTensor qBiases = CreateQuantizedBias(layer, qWeights, biases, biasesBacking);
         optionalQBiases = Optional<ConstTensor>(qBiases);
     }

     IConnectableLayer* newLayer = m_QuantizedNetwork->AddDepthwiseConvolution2dLayer(desc,
                                                                                      qWeights,
                                                                                      optionalQBiases,
                                                                                      name);

     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitElementwiseUnaryLayer(const IConnectableLayer* layer,
                                                   const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,
                                                   const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddElementwiseUnaryLayer(elementwiseUnaryDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitFullyConnectedLayer(const IConnectableLayer *layer,
                                                 const FullyConnectedDescriptor& desc,
                                                 const ConstTensor& weights,
                                                 const Optional<ConstTensor>& biases,
                                                 const char *name)
 {
     std::vector<uint8_t> weightsBacking;
     ConstTensor qWeights = CreateQuantizedConst(weights, weightsBacking);
     Optional<ConstTensor> optionalQBiases;
     std::vector<int32_t> biasesBacking;

     if (biases.has_value())
     {
         ConstTensor qBiases = CreateQuantizedBias(layer, qWeights, biases, biasesBacking);
         optionalQBiases = Optional<ConstTensor>(qBiases);
     }

     IConnectableLayer* newLayer = m_QuantizedNetwork->AddFullyConnectedLayer(desc,
                                                                              qWeights,
                                                                              optionalQBiases,
                                                                              name);

     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitInputLayer(const IConnectableLayer *layer, LayerBindingId id, const char *name)
 {
     const DataType dataType = layer->GetOutputSlot(0).GetTensorInfo().GetDataType();
     IConnectableLayer* inputLayer = m_QuantizedNetwork->AddInputLayer(id, name);

     if (m_PreserveType && (dataType == DataType::Float32 || dataType == DataType::Float16))
     {
         IConnectableLayer* quantizeLayer = m_QuantizedNetwork->AddQuantizeLayer();
         inputLayer->GetOutputSlot(0).Connect(quantizeLayer->GetInputSlot(0));
         inputLayer->GetOutputSlot(0).SetTensorInfo(layer->GetOutputSlot(0).GetTensorInfo());
         RecordLayer(layer, quantizeLayer);
     }
     else
     {
         RecordLayer(layer, inputLayer);
     }
 }

 void QuantizerVisitor::VisitInstanceNormalizationLayer(const IConnectableLayer* layer,
                                                        const InstanceNormalizationDescriptor& descriptor,
                                                        const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddInstanceNormalizationLayer(descriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitLogSoftmaxLayer(const IConnectableLayer* layer,
                                             const LogSoftmaxDescriptor& logSoftmaxDescriptor,
                                             const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddLogSoftmaxLayer(logSoftmaxDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitMeanLayer(const IConnectableLayer* layer,
                                       const MeanDescriptor& meanDescriptor,
                                       const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddMeanLayer(meanDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitMultiplicationLayer(const IConnectableLayer* layer,
                                                 const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddMultiplicationLayer(name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitNormalizationLayer(const armnn::IConnectableLayer* layer,
                                                const armnn::NormalizationDescriptor& normalizationDescriptor,
                                                const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddNormalizationLayer(normalizationDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitOutputLayer(const IConnectableLayer* layer, LayerBindingId id, const char* name)
 {
     const TensorInfo& info = layer->GetInputSlot(0).GetConnection()->GetTensorInfo();
     const DataType& dataType = info.GetDataType();
     IConnectableLayer* outputLayer = m_QuantizedNetwork->AddOutputLayer(id, name);

     if (m_PreserveType  && (dataType == DataType::Float32 || dataType == DataType::Float16))
     {
         IConnectableLayer* dequantizeLayer = m_QuantizedNetwork->AddDequantizeLayer();
         RecordLayer(layer, dequantizeLayer);
         SetQuantizedInputConnections(layer, dequantizeLayer);
         dequantizeLayer->GetOutputSlot(0).Connect(outputLayer->GetInputSlot(0));
         dequantizeLayer->GetOutputSlot(0).SetTensorInfo(info);
     }
     else
     {
         RecordLayer(layer, outputLayer);
         SetQuantizedInputConnections(layer, outputLayer);
     }
 }

 void QuantizerVisitor::VisitPadLayer(const IConnectableLayer* layer,
                                      const PadDescriptor& padDescriptor,
                                      const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddPadLayer(padDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitPermuteLayer(const IConnectableLayer* layer,
                                          const PermuteDescriptor& permuteDescriptor,
                                          const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddPermuteLayer(permuteDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitPooling2dLayer(const IConnectableLayer* layer,
                                            const Pooling2dDescriptor& pooling2dDescriptor,
                                            const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddPooling2dLayer(pooling2dDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitPreluLayer(const IConnectableLayer* layer,
                                        const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddPreluLayer(name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitReshapeLayer(const IConnectableLayer* layer,
                                          const ReshapeDescriptor& reshapeDescriptor,
                                          const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddReshapeLayer(reshapeDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitResizeBilinearLayer(const IConnectableLayer* layer,
                                                 const ResizeBilinearDescriptor& resizeBilinearDescriptor,
                                                 const char* name)
 {
     ResizeDescriptor resizeDescriptor;
     resizeDescriptor.m_Method       = ResizeMethod::Bilinear;
     resizeDescriptor.m_TargetWidth  = resizeBilinearDescriptor.m_TargetWidth;
     resizeDescriptor.m_TargetHeight = resizeBilinearDescriptor.m_TargetHeight;
     resizeDescriptor.m_DataLayout   = resizeBilinearDescriptor.m_DataLayout;

     VisitResizeLayer(layer, resizeDescriptor, name);
 }

 void QuantizerVisitor::VisitResizeLayer(const IConnectableLayer* layer,
                                         const ResizeDescriptor& resizeDescriptor,
                                         const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddResizeLayer(resizeDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitRsqrtLayer(const IConnectableLayer* layer, const char* name)
 {
     VisitElementwiseUnaryLayer(layer, ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);
 }

 void QuantizerVisitor::VisitSliceLayer(const IConnectableLayer* layer,
                                        const SliceDescriptor& sliceDescriptor,
                                        const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddSliceLayer(sliceDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitSoftmaxLayer(const IConnectableLayer* layer,
                                          const SoftmaxDescriptor& softmaxDescriptor,
                                          const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddSoftmaxLayer(softmaxDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitSpaceToBatchNdLayer(const IConnectableLayer* layer,
                                                 const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,
                                                 const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddSpaceToBatchNdLayer(spaceToBatchNdDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitSpaceToDepthLayer(const IConnectableLayer* layer,
                                               const SpaceToDepthDescriptor& spaceToDepthDescriptor,
                                               const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddSpaceToDepthLayer(spaceToDepthDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitSplitterLayer(const IConnectableLayer* layer,
                                           const SplitterDescriptor& splitterDescriptor,
                                           const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddSplitterLayer(splitterDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitStackLayer(const IConnectableLayer* layer,
                                        const StackDescriptor& stackDescriptor,
                                        const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddStackLayer(stackDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitStridedSliceLayer(const IConnectableLayer* layer,
                                               const StridedSliceDescriptor& stridedSliceDescriptor,
                                               const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddStridedSliceLayer(stridedSliceDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitSubtractionLayer(const IConnectableLayer* layer,
                                                 const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddSubtractionLayer(name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitTransposeConvolution2dLayer(const IConnectableLayer* layer,
                                                         const TransposeConvolution2dDescriptor& descriptor,
                                                         const ConstTensor& weights,
                                                         const Optional<ConstTensor>& biases,
                                                         const char* name)
 {
     // quantize weights
     std::vector<uint8_t> weightsBacking;
     ConstTensor qWeights = CreateQuantizedConst(weights, weightsBacking);

     // quantize biases
     std::vector<int32_t> biasesBacking;
     Optional<ConstTensor> optionalQBiases;
     if (biases.has_value())
     {
         ConstTensor qBiases = CreateQuantizedBias(layer, qWeights, biases, biasesBacking);
         optionalQBiases = Optional<ConstTensor>(qBiases);
     }

     IConnectableLayer* newLayer = m_QuantizedNetwork->AddTransposeConvolution2dLayer(descriptor,
                                                                                      qWeights,
                                                                                      optionalQBiases,
                                                                                      name);

     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 void QuantizerVisitor::VisitTransposeLayer(const IConnectableLayer* layer,
                                            const TransposeDescriptor& transposeDescriptor,
                                            const char* name)
 {
     IConnectableLayer* newLayer = m_QuantizedNetwork->AddTransposeLayer(transposeDescriptor, name);
     RecordLayer(layer, newLayer);
     SetQuantizedInputConnections(layer, newLayer);
 }

 } //namespace armnn
armnn::QuantizerVisitor::VisitInputLayer
void VisitInputLayer(const IConnectableLayer *layer, LayerBindingId id, const char *name=nullptr) override
Function that an InputLayer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:313

armnn::OffsetScalePair
std::pair< float, int > OffsetScalePair
Definition: NetworkQuantizationScheme.hpp:16

armnn::QuantizerVisitor::VisitTransposeConvolution2dLayer
void VisitTransposeConvolution2dLayer(const IConnectableLayer *layer, const TransposeConvolution2dDescriptor &descriptor, const ConstTensor &weights, const Optional< ConstTensor > &biases, const char *name=nullptr) override
Function that a 2D transpose convolution layer should call back to when its Accept(ILayerVisitor&) fu...
Definition: QuantizerVisitor.cpp:538

armnn::ViewsDescriptor
A ViewsDescriptor for the SplitterLayer.
Definition: Descriptors.hpp:198

armnn::IConnectableLayer
Interface for a layer that is connectable to other layers via InputSlots and OutputSlots.
Definition: INetwork.hpp:61

armnn::QuantizerVisitor::QuantizerVisitor
QuantizerVisitor(const RangeTracker &rangeTracker, const IQuantizationScheme *quantizationScheme, bool preserveType=false)
Definition: QuantizerVisitor.cpp:16

armnn::IConnectableLayer::GetNumInputSlots
virtual unsigned int GetNumInputSlots() const =0
Returns the number of connectable input slots.

armnn::QuantizerVisitor::VisitRsqrtLayer
void VisitRsqrtLayer(const IConnectableLayer *, const char *name=nullptr) override
Function a Reciprocal of square root layer should call back to when its Accept(ILayerVisitor&) functi...
Definition: QuantizerVisitor.cpp:462

armnn::TransposeConvolution2dDescriptor
A TransposeConvolution2dDescriptor for the TransposeConvolution2dLayer.
Definition: Descriptors.hpp:1151

armnn::Optional
Definition: Optional.hpp:270

armnn::ReshapeDescriptor
A ReshapeDescriptor for the ReshapeLayer.
Definition: Descriptors.hpp:770

armnn::QuantizerVisitor::VisitPadLayer
void VisitPadLayer(const IConnectableLayer *, const PadDescriptor &, const char *name=nullptr) override
Function a pad layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:396

armnn::TensorInfo
Definition: Tensor.hpp:53

armnn::QuantizerVisitor::VisitMultiplicationLayer
void VisitMultiplicationLayer(const IConnectableLayer *layer, const char *name=nullptr) override
Function that a multiplication layer should call back to when its Accept(ILayerVisitor&) function is ...
Definition: QuantizerVisitor.cpp:358

armnn::ComparisonDescriptor
A ComparisonDescriptor for the ComparisonLayer.
Definition: Descriptors.hpp:70

armnn::ResizeBilinearDescriptor::m_TargetWidth
uint32_t m_TargetWidth
Target width value.
Definition: Descriptors.hpp:724

armnn::QuantizerVisitor::VisitInstanceNormalizationLayer
void VisitInstanceNormalizationLayer(const IConnectableLayer *layer, const InstanceNormalizationDescriptor &instanceNormalizationDescriptor, const char *name=nullptr) override
Function that an instance normalization layer should call back to when its Accept(ILayerVisitor&) fun...
Definition: QuantizerVisitor.cpp:331

armnn::ResizeBilinearDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:728

armnn::RangeTracker
Definition: RangeTracker.hpp:17

armnn::Convolution2dDescriptor
A Convolution2dDescriptor for the Convolution2dLayer.
Definition: Descriptors.hpp:400

armnn::DataType::Signed32

armnn::OutputSlot::GetOwningLayer
Layer & GetOwningLayer() const
Definition: Layer.hpp:115

QuantizerVisitor.hpp

armnn::QuantizerVisitor::VisitReshapeLayer
void VisitReshapeLayer(const IConnectableLayer *layer, const ReshapeDescriptor &reshapeDescriptor, const char *name=nullptr) override
Function a reshape layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:431

armnn::ResizeDescriptor::m_Method
ResizeMethod m_Method
The Interpolation method to use (Bilinear, NearestNeighbor).
Definition: Descriptors.hpp:759

armnn::QuantizerVisitor::VisitAdditionLayer
void VisitAdditionLayer(const IConnectableLayer *layer, const char *name=nullptr) override
Function that an addition layer should call back to when its Accept(ILayerVisitor&) function is invok...
Definition: QuantizerVisitor.cpp:132

armnn::QuantizerVisitor::VisitLogSoftmaxLayer
void VisitLogSoftmaxLayer(const IConnectableLayer *layer, const LogSoftmaxDescriptor &logSoftmaxDescriptor, const char *name=nullptr) override
Function that a log softmax layer should call back to when its Accept(ILayerVisitor&) function is inv...
Definition: QuantizerVisitor.cpp:340

armnn::ActivationFunction::Abs

StaticRangeVisitor.hpp

armnn::INetwork
Main network class which provides the interface for building up a neural network. ...
Definition: INetwork.hpp:105

armnn::QuantizerVisitor::VisitResizeBilinearLayer
void VisitResizeBilinearLayer(const IConnectableLayer *layer, const ResizeBilinearDescriptor &resizeDesc, const char *name=nullptr) override
Function that a resize bilinear layer should call back to when its Accept(ILayerVisitor&) function is...
Definition: QuantizerVisitor.cpp:440

armnn::QuantizerVisitor::VisitStridedSliceLayer
void VisitStridedSliceLayer(const IConnectableLayer *layer, const StridedSliceDescriptor &stridedSliceDescriptor, const char *name=nullptr) override
Function a strided slice layer should call back to when its Accept(ILayerVisitor&) function is invoke...
Definition: QuantizerVisitor.cpp:521

armnn::InputSlot
Definition: Layer.hpp:41

armnn
Copyright (c) 2020 ARM Limited.
Definition: 00_introduction.dox:25

armnn::QuantizerVisitor::VisitStackLayer
void VisitStackLayer(const IConnectableLayer *layer, const StackDescriptor &stackDescriptor, const char *name=nullptr) override
Function a stack layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:512

armnn::SpaceToDepthDescriptor
A SpaceToDepthDescriptor for the SpaceToDepthLayer.
Definition: Descriptors.hpp:822

armnn::OptionalReferenceSwitch< std::is_reference< T >::value, T >::value
const T & value() const
Definition: Optional.hpp:146

armnn::IQuantizationScheme::ComputeScheme
virtual OffsetScalePair ComputeScheme(double min, double max) const =0

armnn::QuantizerVisitor::VisitBatchNormalizationLayer
void VisitBatchNormalizationLayer(const IConnectableLayer *layer, const BatchNormalizationDescriptor &desc, const ConstTensor &mean, const ConstTensor &variance, const ConstTensor &beta, const ConstTensor &gamma, const char *name=nullptr) override
Function that a batch normalization layer should call back to when its Accept(ILayerVisitor&) functio...
Definition: QuantizerVisitor.cpp:148

armnn::QuantizerVisitor::VisitSubtractionLayer
void VisitSubtractionLayer(const IConnectableLayer *layer, const char *name=nullptr) override
Function a subtraction layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:530

armnn::BatchToSpaceNdDescriptor
A BatchToSpaceNdDescriptor for the BatchToSpaceNdLayer.
Definition: Descriptors.hpp:665

armnn::LayerBindingId
int LayerBindingId
Type of identifiers for bindable layers (inputs, outputs).
Definition: Types.hpp:171

armnn::QuantizerVisitor::VisitSpaceToBatchNdLayer
void VisitSpaceToBatchNdLayer(const IConnectableLayer *layer, const SpaceToBatchNdDescriptor &spaceToBatchNdDescriptor, const char *name=nullptr) override
Function a space to batch layer should call back to when its Accept(ILayerVisitor&) function is invok...
Definition: QuantizerVisitor.cpp:485

armnn::IOutputSlot::SetTensorInfo
virtual void SetTensorInfo(const TensorInfo &tensorInfo)=0

armnn::QuantizerVisitor::VisitAbsLayer
void VisitAbsLayer(const IConnectableLayer *layer, const char *name=nullptr) override
Functions to quantize the individual layers, overridden from ILayerVisitor.
Definition: QuantizerVisitor.cpp:118

armnn::ResizeDescriptor
A ResizeDescriptor for the ResizeLayer.
Definition: Descriptors.hpp:732

armnn::RangeTracker::GetRange
MinMaxRange GetRange(LayerGuid guid, unsigned int idx) const
Retrieve the Range for a particular output slot on a particular layer.
Definition: RangeTracker.cpp:29

armnn::StackDescriptor
A StackDescriptor for the StackLayer.
Definition: Descriptors.hpp:962

PolymorphicDowncast.hpp

armnn::QuantizerVisitor::VisitDepthwiseConvolution2dLayer
void VisitDepthwiseConvolution2dLayer(const IConnectableLayer *layer, const DepthwiseConvolution2dDescriptor &desc, const ConstTensor &weights, const Optional< ConstTensor > &biases, const char *name=nullptr) override
Function that a 2D depthwise convolution layer with biases should call back to when its Accept(ILayer...
Definition: QuantizerVisitor.cpp:252

armnn::QuantizerVisitor::VisitResizeLayer
void VisitResizeLayer(const IConnectableLayer *layer, const ResizeDescriptor &resizeDescriptor, const char *name=nullptr) override
Function that a resize layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:453

armnn::PadDescriptor
A PadDescriptor for the PadLayer.
Definition: Descriptors.hpp:913

armnn::DataType
DataType
Definition: Types.hpp:32

ARMNN_ASSERT_MSG
#define ARMNN_ASSERT_MSG(COND, MSG)
Definition: Assert.hpp:15

armnn::IOutputSlot
An output connection slot for a layer.
Definition: INetwork.hpp:37

armnn::ArgMinMaxDescriptor
An ArgMinMaxDescriptor for ArgMinMaxLayer.
Definition: Descriptors.hpp:51

armnn::TensorInfo::GetQuantizationScale
float GetQuantizationScale() const
Definition: Tensor.cpp:248

armnn::TensorInfo::GetDataType
DataType GetDataType() const
Definition: Tensor.hpp:95

armnn::OriginsDescriptor
An OriginsDescriptor for the ConcatLayer.
Definition: Descriptors.hpp:155

armnn::OptionalBase::has_value
bool has_value() const noexcept
Definition: Optional.hpp:53

armnn::FullyConnectedDescriptor
A FullyConnectedDescriptor for the FullyConnectedLayer.
Definition: Descriptors.hpp:381

armnn::IConnectableLayer::GetGuid
virtual LayerGuid GetGuid() const =0
Returns the unique id of the layer.

armnn::QuantizerVisitor::VisitTransposeLayer
void VisitTransposeLayer(const IConnectableLayer *layer, const TransposeDescriptor &descriptor, const char *name=nullptr) override
Function that a transpose layer should call back to when its Accept(ILayerVisitor&) function is invok...
Definition: QuantizerVisitor.cpp:566

armnn::ConstTensor
A tensor defined by a TensorInfo (shape and data type) and an immutable backing store.
Definition: Tensor.hpp:199

armnn::QuantizerVisitor::VisitDepthToSpaceLayer
void VisitDepthToSpaceLayer(const IConnectableLayer *layer, const DepthToSpaceDescriptor &depthToSpaceDescriptor, const char *name=nullptr) override
Function a depth to space layer should call back to when its Accept(ILayerVisitor&) function is invok...
Definition: QuantizerVisitor.cpp:243

armnn::ResizeDescriptor::m_TargetWidth
uint32_t m_TargetWidth
Target width value.
Definition: Descriptors.hpp:754

armnn::DataType::Float16

armnn::QuantizerVisitor::VisitConcatLayer
void VisitConcatLayer(const IConnectableLayer *layer, const OriginsDescriptor &originsDescriptor, const char *name=nullptr) override
Function that a concat layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:197

armnn::OutputSlot
Definition: Layer.hpp:83

ARMNN_ASSERT
#define ARMNN_ASSERT(COND)
Definition: Assert.hpp:14

armnn::InputSlot::GetConnectedOutputSlot
const OutputSlot * GetConnectedOutputSlot() const
Definition: Layer.hpp:55

armnn::numeric_cast
std::enable_if_t< std::is_unsigned< Source >::value &&std::is_unsigned< Dest >::value, Dest > numeric_cast(Source source)
Definition: NumericCast.hpp:33

armnn::QuantizerVisitor::VisitConvolution2dLayer
void VisitConvolution2dLayer(const IConnectableLayer *layer, const Convolution2dDescriptor &convolution2dDescriptor, const ConstTensor &weights, const Optional< ConstTensor > &biases, const char *name=nullptr) override
Function that a 2D convolution layer should call back to when its Accept(ILayerVisitor&) function is ...
Definition: QuantizerVisitor.cpp:217

armnn::QuantizerVisitor::VisitPermuteLayer
void VisitPermuteLayer(const IConnectableLayer *layer, const PermuteDescriptor &permuteDescriptor, const char *name=nullptr) override
Function that a permute layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:405

armnn::ActivationDescriptor
An ActivationDescriptor for the ActivationLayer.
Definition: Descriptors.hpp:20

armnn::BaseTensor::GetInfo
const TensorInfo & GetInfo() const
Definition: Tensor.hpp:167

armnn::ResizeBilinearDescriptor::m_TargetHeight
uint32_t m_TargetHeight
Target height value.
Definition: Descriptors.hpp:726

armnn::ResizeDescriptor::m_TargetHeight
uint32_t m_TargetHeight
Target height value.
Definition: Descriptors.hpp:756

armnn::SliceDescriptor
A SliceDescriptor for the SliceLayer.
Definition: Descriptors.hpp:939

armnn::SpaceToBatchNdDescriptor
A SpaceToBatchNdDescriptor for the SpaceToBatchNdLayer.
Definition: Descriptors.hpp:790

armnn::QuantizerVisitor::VisitActivationLayer
void VisitActivationLayer(const IConnectableLayer *layer, const ActivationDescriptor &activationDescriptor, const char *name=nullptr) override
Function that an activation layer should call back to when its Accept(ILayerVisitor&) function is inv...
Definition: QuantizerVisitor.cpp:123

armnn::QuantizerVisitor::VisitComparisonLayer
void VisitComparisonLayer(const IConnectableLayer *layer, const ComparisonDescriptor &comparisonDescriptor, const char *name=nullptr) override
Function a Comparison layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:188

armnn::IQuantizationScheme::GetDataType
virtual DataType GetDataType() const =0

armnn::ElementwiseUnaryDescriptor
A ElementwiseUnaryDescriptor for the ElementwiseUnaryLayer.
Definition: Descriptors.hpp:90

armnn::QuantizerVisitor::VisitSoftmaxLayer
void VisitSoftmaxLayer(const IConnectableLayer *layer, const SoftmaxDescriptor &softmaxDescriptor, const char *name=nullptr) override
Function that a softmax layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:476

armnn::QuantizerVisitor::VisitMeanLayer
void VisitMeanLayer(const IConnectableLayer *layer, const MeanDescriptor &meanDescriptor, const char *name=nullptr) override
Function a Mean layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:349

armnn::BoostLogSeverityMapping::info

armnn::QuantizerVisitor::VisitArgMinMaxLayer
void VisitArgMinMaxLayer(const IConnectableLayer *layer, const ArgMinMaxDescriptor &argMinMaxDescriptor, const char *name=nullptr) override
Function that an arg min max layer should call back to when its Accept(ILayerVisitor&) function is in...
Definition: QuantizerVisitor.cpp:139

armnn::ResizeMethod::Bilinear

armnn::QuantizerVisitor::VisitElementwiseUnaryLayer
void VisitElementwiseUnaryLayer(const IConnectableLayer *layer, const ElementwiseUnaryDescriptor &elementwiseUnaryDescriptor, const char *name=nullptr) override
Function a ElementwiseUnary layer should call back to when its Accept(ILayerVisitor&) function is inv...
Definition: QuantizerVisitor.cpp:278

Network.hpp

armnn::IConnectableLayer::GetInputSlot
virtual const IInputSlot & GetInputSlot(unsigned int index) const =0
Get a const input slot handle by slot index.

armnn::MeanDescriptor
A MeanDescriptor for the MeanLayer.
Definition: Descriptors.hpp:889

armnn::IInputSlot::GetConnection
virtual const IOutputSlot * GetConnection() const =0

armnn::IQuantizationScheme
Definition: NetworkQuantizationScheme.hpp:18

armnn::TransposeDescriptor
A TransposeDescriptor for the TransposeLayer.
Definition: Descriptors.hpp:1195

armnn::StridedSliceDescriptor
A StridedSliceDescriptor for the StridedSliceLayer.
Definition: Descriptors.hpp:1014

armnn::DataType::Float32

armnn::QuantizerVisitor::VisitConstantLayer
void VisitConstantLayer(const IConnectableLayer *layer, const ConstTensor &input, const char *name=nullptr) override
Function a layer with no inputs and a single output, which always corresponds to the passed in consta...
Definition: QuantizerVisitor.cpp:206

armnn::IOutputSlot::GetTensorInfo
virtual const TensorInfo & GetTensorInfo() const =0

armnn::IConnectableLayer::GetOutputSlot
virtual const IOutputSlot & GetOutputSlot(unsigned int index) const =0
Get the const output slot handle by slot index.

armnn::IOutputSlot::Connect
virtual int Connect(IInputSlot &destination)=0

armnn::QuantizerVisitor::VisitSpaceToDepthLayer
void VisitSpaceToDepthLayer(const IConnectableLayer *layer, const SpaceToDepthDescriptor &spaceToDepthDescriptor, const char *name=nullptr) override
Function a space to depth layer should call back to when its Accept(ILayerVisitor&) function is invok...
Definition: QuantizerVisitor.cpp:494

armnn::QuantizerVisitor::VisitBatchToSpaceNdLayer
void VisitBatchToSpaceNdLayer(const IConnectableLayer *layer, const BatchToSpaceNdDescriptor &batchToSpaceNdDescriptor, const char *name=nullptr) override
Function that a batch to space ND layer should call back to when its Accept(ILayerVisitor&) function ...
Definition: QuantizerVisitor.cpp:179

armnn::Pooling2dDescriptor
A Pooling2dDescriptor for the Pooling2dLayer.
Definition: Descriptors.hpp:321

armnn::CreateQuantizedConst
ConstTensor CreateQuantizedConst(const ConstTensor &tensor, std::vector< uint8_t > &backing)
Definition: NetworkQuantizerUtils.cpp:15

armnn::UnaryOperation::Rsqrt

armnn::NormalizationDescriptor
A NormalizationDescriptor for the NormalizationLayer.
Definition: Descriptors.hpp:559

armnn::QuantizerVisitor::VisitSliceLayer
void VisitSliceLayer(const IConnectableLayer *layer, const SliceDescriptor &sliceDescriptor, const char *name=nullptr) override
Function that a slice layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:467

armnn::QuantizerVisitor::VisitOutputLayer
void VisitOutputLayer(const IConnectableLayer *layer, LayerBindingId id, const char *name=nullptr) override
Function an output layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:375

NetworkQuantizerUtils.hpp

armnn::ResizeDescriptor::m_DataLayout
DataLayout m_DataLayout
The data layout to be used (NCHW, NHWC).
Definition: Descriptors.hpp:761

armnn::InstanceNormalizationDescriptor
An InstanceNormalizationDescriptor for InstanceNormalizationLayer.
Definition: Descriptors.hpp:637

armnn::ResizeBilinearDescriptor
A ResizeBilinearDescriptor for the ResizeBilinearLayer.
Definition: Descriptors.hpp:715

armnn::OutputSlot::GetTensorInfo
const TensorInfo & GetTensorInfo() const override
Definition: Layer.cpp:63

armnn::SoftmaxDescriptor
A SoftmaxDescriptor for the SoftmaxLayer.
Definition: Descriptors.hpp:131

armnn::QuantizerVisitor::VisitPreluLayer
void VisitPreluLayer(const IConnectableLayer *layer, const char *name=nullptr) override
Function that a PReLU activation layer should call back to when its Accept(ILayerVisitor&) function i...
Definition: QuantizerVisitor.cpp:423

armnn::QuantizerVisitor::VisitNormalizationLayer
void VisitNormalizationLayer(const IConnectableLayer *layer, const NormalizationDescriptor &normalizationDescriptor, const char *name=nullptr) override
Function that a normalization layer should call back to when its Accept(ILayerVisitor&) function is i...
Definition: QuantizerVisitor.cpp:366

armnn::IInputSlot
An input connection slot for a layer.
Definition: INetwork.hpp:24

armnn::DepthwiseConvolution2dDescriptor
A DepthwiseConvolution2dDescriptor for the DepthwiseConvolution2dLayer.
Definition: Descriptors.hpp:452

armnn::Layer
Definition: Layer.hpp:209

armnn::BatchNormalizationDescriptor
A BatchNormalizationDescriptor for the BatchNormalizationLayer.
Definition: Descriptors.hpp:618

armnn::QuantizerVisitor::VisitPooling2dLayer
void VisitPooling2dLayer(const IConnectableLayer *layer, const Pooling2dDescriptor &pooling2dDescriptor, const char *name=nullptr) override
Function that a pooling layer should call back to when its Accept(ILayerVisitor&) function is invoked...
Definition: QuantizerVisitor.cpp:414

armnn::PermuteDescriptor
A PermuteDescriptor for the PermuteLayer.
Definition: Descriptors.hpp:110

armnn::QuantizerVisitor::VisitFullyConnectedLayer
void VisitFullyConnectedLayer(const IConnectableLayer *layer, const FullyConnectedDescriptor &desc, const ConstTensor &weights, const Optional< ConstTensor > &biases, const char *name=nullptr) override
Function that a fully connected layer should call back to when its Accept(ILayerVisitor&) function is...
Definition: QuantizerVisitor.cpp:287

armnn::QuantizerVisitor::VisitSplitterLayer
void VisitSplitterLayer(const IConnectableLayer *layer, const SplitterDescriptor &splitterDescriptor, const char *name=nullptr) override
Function that a splitter layer should call back to when its Accept(ILayerVisitor&) function is invoke...
Definition: QuantizerVisitor.cpp:503

armnn::Layer::GetGuid
LayerGuid GetGuid() const final
Returns the unique id of the layer.
Definition: Layer.hpp:316

armnn::OutputSlot::CalculateIndexOnOwner
unsigned int CalculateIndexOnOwner() const override
Definition: Layer.cpp:126