IVGCVSW-4860 Add tests to verify QLstm projection

* Adds int16 output tensor to CpuRef impl to prevent overflow when accumulating output after projection. * Adds two remaining tests to verify QLstm on CpuRef. Signed-off-by: James Conroy <james.conroy@arm.com> Change-Id: I93d7c64c4a9cc1012cb2bc052d598d4279fbd372
author: James Conroy <james.conroy@arm.com> 2020-06-08 14:53:10 +0100
committer: James Conroy <james.conroy@arm.com> 2020-06-08 15:15:42 +0100
commit: b22a75e2aaec1175bbacba54e1a33a83f9749ce2 (patch)
tree: e25c0ba8652435a14825eb29a7847a421efadb84 /src/backends/reference/workloads/RefQLstmWorkload.cpp
parent: 041b3c0d416d94b1aa4efa41960808b7e5e61f25 (diff)
download: armnn-b22a75e2aaec1175bbacba54e1a33a83f9749ce2.tar.gz
1 files changed, 16 insertions, 4 deletions
diff --git a/src/backends/reference/workloads/RefQLstmWorkload.cpp b/src/backends/reference/workloads/RefQLstmWorkload.cpp
index 34d048b0cb..e11ea55add 100644
--- a/src/backends/reference/workloads/RefQLstmWorkload.cpp
+++ b/src/backends/reference/workloads/RefQLstmWorkload.cpp
@@ -146,6 +146,7 @@ void RefQLstmWorkload::Execute() const
     std::vector<int16_t> forgetGateData(stateTensorSize);
     std::vector<int16_t> outputGateData(stateTensorSize);
     std::vector<int32_t> hiddenStateData(stateTensorSize);
+    std::vector<int16_t> outputInt16Data(numBatches * outputSize);
 
     armnn::TensorInfo inputGateInfo(
             {numBatches , numUnits}, armnn::DataType::QSymmS16, m_Data.m_Parameters.m_InputIntermediateScale, 0);
@@ -159,6 +160,10 @@ void RefQLstmWorkload::Execute() const
                                       armnn::DataType::QAsymmS8,
                                       m_Data.m_Parameters.m_HiddenStateScale,
                                       m_Data.m_Parameters.m_HiddenStateZeroPoint);
+    armnn::TensorInfo outputInt16Info({numBatches , outputSize},
+                                      armnn::DataType::QSymmS16,
+                                      outputInfo.GetQuantizationScale(),
+                                      outputInfo.GetQuantizationOffset());
 
     // Decoders/Encoders for internal states
     std::unique_ptr<Decoder<float>> inputGateDecoder =
@@ -183,6 +188,12 @@ void RefQLstmWorkload::Execute() const
     std::unique_ptr<Encoder<float>> hiddenStateEncoder =
             MakeEncoder<float>(hiddenStateInfo, hiddenStateData.data());
 
+    // Int16 used to accumulate output to prevent overflowing (after Projection MatMul)
+    std::unique_ptr<Decoder<float>> outputInt16Decoder =
+            MakeDecoder<float>(outputInt16Info, outputInt16Data.data());
+    std::unique_ptr<Encoder<float>> outputInt16Encoder =
+            MakeEncoder<float>(outputInt16Info, outputInt16Data.data());
+
     // Create decoders for optional params if they are enabled
     if (!cifgEnabled)
     {
@@ -494,12 +505,13 @@ void RefQLstmWorkload::Execute() const
     {
         if (m_ProjectionBiasTensor)
         {
-            VectorBatchVectorAssign(*projectionBiasDecoder,
-                                    outputSize, numBatches, *outputEncoder);
+            VectorBatchVectorAssign(*projectionBiasDecoder, outputSize, numBatches, *outputInt16Encoder);
         }
 
-        MatrixBatchVectorMultiplyAccumulate(*projectionWeightsDecoder,
-                                            outputSize, numUnits, *hiddenStateDecoder, numBatches, *outputEncoder);
+        MatrixBatchVectorMultiplyAccumulate(*projectionWeightsDecoder, outputSize, numUnits, *hiddenStateDecoder,
+                                            numBatches, *outputInt16Encoder);
+
+        CopyVector(*outputInt16Decoder, numBatches * outputSize, *outputEncoder);
 
         if (m_Data.m_Parameters.m_ProjectionClip > 0.0)
         {
author	James Conroy <james.conroy@arm.com>	2020-06-08 14:53:10 +0100
committer	James Conroy <james.conroy@arm.com>	2020-06-08 15:15:42 +0100
commit	b22a75e2aaec1175bbacba54e1a33a83f9749ce2 (patch)
tree	e25c0ba8652435a14825eb29a7847a421efadb84 /src/backends/reference/workloads/RefQLstmWorkload.cpp
parent	041b3c0d416d94b1aa4efa41960808b7e5e61f25 (diff)
download	armnn-b22a75e2aaec1175bbacba54e1a33a83f9749ce2.tar.gz