plain/21.02/_network_quantization_scheme_8hpp_source.xhtml

 //
 // Copyright © 2017 Arm Ltd. All rights reserved.
 // SPDX-License-Identifier: MIT
 //

 #pragma once

 #include <armnn/Types.hpp>

 #include <cmath>
 #include <algorithm>

 namespace armnn
 {

 using OffsetScalePair = std::pair<float, int>;

 struct IQuantizationScheme
 {
     virtual OffsetScalePair ComputeScheme(double min, double max) const = 0;

     virtual int NumBits() const = 0;

     virtual DataType GetDataType() const = 0;

     virtual ~IQuantizationScheme() {}
 };

 struct QAsymmU8QuantizationScheme : IQuantizationScheme
 {
     OffsetScalePair ComputeScheme(double min, double max) const override
     {
         if (min > max)
         {
             throw InvalidArgumentException("min > max will result in invalid quantization.");
         }

         double highest = (1 << NumBits()) - 1;

         min = std::min(0.0, min); // min <= 0.0
         max = std::max(0.0, max); // max >= 0.0

         // To avoid dividing by zero when quantizing a zero filled tensor
         if (min == 0.0 && max == 0.0)
         {
             max = 1.0;
         }

         // Assumes quantization range [0-highest]
         double scale = (max-min) / highest;
         double offset = -min / scale;

         // Clamp offset [0-highest]
         offset = std::max(0.0, std::min(highest, offset));

         return std::make_pair(static_cast<float>(scale), static_cast<int>(std::round(offset)));
     }

     int NumBits() const override { return 8; }

     DataType GetDataType() const override { return DataType::QAsymmU8; }
 };

 struct QAsymmS8QuantizationScheme : IQuantizationScheme
 {
     OffsetScalePair ComputeScheme(double min, double max) const override
     {
         if (min > max)
         {
             throw InvalidArgumentException("min > max will result in invalid quantization.");
         }

         double highest = (1 << NumBits()) - 1;

         min = std::min(0.0, min); // min <= 0.0
         max = std::max(0.0, max); // max >= 0.0

         // To avoid dividing by zero when quantizing a zero filled tensor
         if (min == 0.0 && max == 0.0)
         {
             max = 1.0;
         }

         // Assumes quantization range [0-255]
         double scale = (max-min) / highest ;
         double offset = - min / scale;

         //Clamp 0 to Highest
         offset = std::max(0.0, std::min(highest, offset));

         //-128 on offset to cast to signed range
         return std::make_pair(static_cast<float>(scale), static_cast<int>(std::round(offset)-128));
     }

     int NumBits() const override { return 8; }

     DataType GetDataType() const override { return DataType::QAsymmS8; }
 };

 struct QSymmS8QuantizationScheme : IQuantizationScheme
 {
     OffsetScalePair ComputeScheme(double min, double max) const override
     {
         if (min > max)
         {
             throw InvalidArgumentException("min > max will result in invalid quantization.");
         }

         // To avoid dividing by zero when quantizing a zero filled tensor
         if (min == 0.0 && max == 0.0)
         {
             max = 1.0;
         }

         double highest = (1 << (NumBits()-1)) - 1; // (numbits-1) accounts for the sign bit

         double extent = std::max(std::abs(min), std::abs(max));
         double scale = extent / highest;

         return std::make_pair(static_cast<float>(scale), 0);
     }

     int NumBits() const override { return 8; }

     DataType GetDataType() const override { return DataType::QSymmS8; }
 };

 struct QSymm16QuantizationScheme : IQuantizationScheme
 {
     OffsetScalePair ComputeScheme(double min, double max) const override
     {
         if (min > max)
         {
             throw InvalidArgumentException("min > max will result in invalid quantization.");
         }

         // To avoid dividing by zero when quantizing a zero filled tensor
         if (min == 0.0 && max == 0.0)
         {
             max = 1.0;
         }

         double highest = (1 << (NumBits()-1)) - 1; // (numbits-1) accounts for the sign bit

         double extent = std::max(std::abs(min), std::abs(max));
         double scale = extent / highest;

         return std::make_pair(static_cast<float>(scale), 0);

     }

     int NumBits() const override { return 16; }

     DataType GetDataType() const override { return DataType::QSymmS16; }
 };

 } // namespace armnn
armnn::QSymmS8QuantizationScheme::NumBits
int NumBits() const override
Definition: NetworkQuantizationScheme.hpp:123

armnn::OffsetScalePair
std::pair< float, int > OffsetScalePair
Definition: NetworkQuantizationScheme.hpp:16

armnn::QAsymmS8QuantizationScheme::GetDataType
DataType GetDataType() const override
Definition: NetworkQuantizationScheme.hpp:97

armnn::QAsymmU8QuantizationScheme::GetDataType
DataType GetDataType() const override
Definition: NetworkQuantizationScheme.hpp:61

armnn::QSymm16QuantizationScheme
Definition: NetworkQuantizationScheme.hpp:128

armnn::QSymm16QuantizationScheme::NumBits
int NumBits() const override
Definition: NetworkQuantizationScheme.hpp:152

armnn::DataType::QAsymmS8

armnn::DataType::QSymmS16

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_software_tools.dox:6

armnn::IQuantizationScheme::ComputeScheme
virtual OffsetScalePair ComputeScheme(double min, double max) const =0

armnn::QAsymmU8QuantizationScheme
Definition: NetworkQuantizationScheme.hpp:29

armnn::QSymmS8QuantizationScheme
Definition: NetworkQuantizationScheme.hpp:100

armnn::IQuantizationScheme::NumBits
virtual int NumBits() const =0

armnn::DataType
DataType
Definition: Types.hpp:32

armnn::DataType::QAsymmU8

Types.hpp

armnn::InvalidArgumentException
Definition: Exceptions.hpp:80

armnn::QSymmS8QuantizationScheme::ComputeScheme
OffsetScalePair ComputeScheme(double min, double max) const override
Definition: NetworkQuantizationScheme.hpp:102

armnn::IQuantizationScheme::GetDataType
virtual DataType GetDataType() const =0

armnn::QAsymmS8QuantizationScheme
Definition: NetworkQuantizationScheme.hpp:64

armnn::QSymm16QuantizationScheme::GetDataType
DataType GetDataType() const override
Definition: NetworkQuantizationScheme.hpp:154

armnn::IQuantizationScheme
Definition: NetworkQuantizationScheme.hpp:18

armnn::QSymmS8QuantizationScheme::GetDataType
DataType GetDataType() const override
Definition: NetworkQuantizationScheme.hpp:125

armnn::DataType::QSymmS8

armnn::QAsymmS8QuantizationScheme::ComputeScheme
OffsetScalePair ComputeScheme(double min, double max) const override
Definition: NetworkQuantizationScheme.hpp:66

armnn::QAsymmU8QuantizationScheme::ComputeScheme
OffsetScalePair ComputeScheme(double min, double max) const override
Definition: NetworkQuantizationScheme.hpp:31

armnn::IQuantizationScheme::~IQuantizationScheme
virtual ~IQuantizationScheme()
Definition: NetworkQuantizationScheme.hpp:26

armnn::QSymm16QuantizationScheme::ComputeScheme
OffsetScalePair ComputeScheme(double min, double max) const override
Definition: NetworkQuantizationScheme.hpp:130

armnn::QAsymmS8QuantizationScheme::NumBits
int NumBits() const override
Definition: NetworkQuantizationScheme.hpp:95

armnn::QAsymmU8QuantizationScheme::NumBits
int NumBits() const override
Definition: NetworkQuantizationScheme.hpp:59