COMPMID-632: Integrated Assembly kernel GEMM U8 for Arm Cortex-A53.

Change-Id: I053444f3cd4d0124df3a4a7aa8533b8395fb1336 Reviewed-on: https://eu-gerrit-1.euhpc.arm.com/110659 Tested-by: BSG Visual Compute Jenkins server to access repositories on http://mpd-gerrit.cambridge.arm.com <bsgcomp@arm.com> Reviewed-by: Georgios Pinitas <georgios.pinitas@arm.com> Reviewed-by: Anthony Barbier <anthony.barbier@arm.com>
author: Michalis Spyrou <michalis.spyrou@arm.com> 2017-11-24 17:06:25 +0000
committer: Anthony Barbier <anthony.barbier@arm.com> 2018-11-02 16:41:19 +0000
commit: 564ed39da0fd8a0d45d62e6f985f5bb798d8361d (patch)
tree: 2ff558b48789f39e0c8ca41cf8cbece0b58153b7 /src/runtime/NEON/functions/NEGEMMLowpAssemblyMatrixMultiplyCore.cpp
parent: c23b633fed59e7432ab82dc21c9e95acb4ab6558 (diff)
download: ComputeLibrary-564ed39da0fd8a0d45d62e6f985f5bb798d8361d.tar.gz
1 files changed, 21 insertions, 3 deletions
diff --git a/src/runtime/NEON/functions/NEGEMMLowpAssemblyMatrixMultiplyCore.cpp b/src/runtime/NEON/functions/NEGEMMLowpAssemblyMatrixMultiplyCore.cpp
index 0423777217..6e03ffa1bc 100644
--- a/src/runtime/NEON/functions/NEGEMMLowpAssemblyMatrixMultiplyCore.cpp
+++ b/src/runtime/NEON/functions/NEGEMMLowpAssemblyMatrixMultiplyCore.cpp
@@ -45,6 +45,7 @@ namespace arm_compute
 #include "arm_compute/core/NEON/kernels/assembly/kernels/a64_gemm_s16_12x8.hpp"
 #include "arm_compute/core/NEON/kernels/assembly/kernels/a64_gemm_s8_12x8.hpp"
 #include "arm_compute/core/NEON/kernels/assembly/kernels/a64_gemm_s8_4x4.hpp"
+#include "arm_compute/core/NEON/kernels/assembly/kernels/a64_gemm_u16_12x8.hpp"
 #include "arm_compute/core/NEON/kernels/assembly/kernels/a64_gemm_u8_4x4.hpp"
 } // namespace arm_compute
 
@@ -94,9 +95,26 @@ void NEGEMMLowpAssemblyMatrixMultiplyCore::configure(const ITensor *a, const ITe
 #elif defined(ARM_COMPUTE_AARCH64_V8A)
     if(ci.CPU == CPUTarget::A53)
     {
-        // Configure matrix multiply kernel
-        GemmInterleaved<gemm_s16_12x8, int8_t, int32_t> gemm(&ci, M, N, K, false, false);
-        _workspace.allocator()->init(TensorInfo(TensorShape{ (gemm.get_working_size() + workspace_alignment - 1) * NEScheduler::get().num_threads() }, 1, DataType::U8));
+        switch(a->info()->data_type())
+        {
+            case DataType::S8:
+            {
+                // Configure matrix multiply kernel
+                GemmInterleaved<gemm_s16_12x8, int8_t, int32_t> gemm(&ci, M, N, K, false, false);
+                _workspace.allocator()->init(TensorInfo(TensorShape{ (gemm.get_working_size() + workspace_alignment - 1) * NEScheduler::get().num_threads() }, 1, DataType::U8));
+            }
+            break;
+            case DataType::U8:
+            {
+                // Configure matrix multiply kernel
+                GemmInterleaved<gemm_u16_12x8, uint8_t, uint32_t> gemm(&ci, M, N, K, false, false);
+                _workspace.allocator()->init(TensorInfo(TensorShape{ (gemm.get_working_size() + workspace_alignment - 1) * NEScheduler::get().num_threads() }, 1, DataType::U8));
+            }
+            break;
+            default:
+                ARM_COMPUTE_ERROR("Datatype not supported");
+        }
+
         _memory_group.manage(&_workspace);
         // Configure matrix multiplication kernel
         auto k = arm_compute::support::cpp14::make_unique<NEGEMMLowpAArch64A53Kernel>();
author	Michalis Spyrou <michalis.spyrou@arm.com>	2017-11-24 17:06:25 +0000
committer	Anthony Barbier <anthony.barbier@arm.com>	2018-11-02 16:41:19 +0000
commit	564ed39da0fd8a0d45d62e6f985f5bb798d8361d (patch)
tree	2ff558b48789f39e0c8ca41cf8cbece0b58153b7 /src/runtime/NEON/functions/NEGEMMLowpAssemblyMatrixMultiplyCore.cpp
parent	c23b633fed59e7432ab82dc21c9e95acb4ab6558 (diff)
download	ComputeLibrary-564ed39da0fd8a0d45d62e6f985f5bb798d8361d.tar.gz