Update CPU kernels and add mixed sign GEMM support

- Add support for mixed sign quantized convolution. - Add support for mixed sign dequantized GEMM. - Add SME FP16 GEMV kernel. - Change SME vector length function to use RDSVL instead of static variable. - Add GEMM dilation support internally (not exposed yet). - Remove unused "get_default_activation_values" functions. - Add SVE fixed format interleaved BF16 DOT kernel. - Updates and optimizations to assembly kernels. Resolves COMPMID-6926 Change-Id: I227f502502611d4cc4111c89e30c53ce94079544 Signed-off-by: Michael Tyler <michael.tyler@arm.com> Reviewed-on: https://review.mlplatform.org/c/ml/ComputeLibrary/+/11570 Tested-by: Arm Jenkins <bsgcomp@arm.com> Reviewed-by: Gunes Bayir <gunes.bayir@arm.com> Comments-Addressed: Arm Jenkins <bsgcomp@arm.com> Benchmark: Arm Jenkins <bsgcomp@arm.com>
author: Michael Tyler <michael.tyler@arm.com> 2024-06-04 15:47:37 +0100
committer: Michael Tyler <michael.tyler@arm.com> 2024-06-25 09:10:13 +0000
commit: fc94f4d23abd4bc427b701f54ad85282e9ec7872 (patch)
tree: 5e2980599256e2b2f4374e5beb61596fc95c9d5a /src/core/NEON/kernels/convolution/winograd/input_transforms/arm_fp32_1x8.cpp
parent: c2237ec4094c7824f8f7e61bc89504d01c5b59ff (diff)
download: ComputeLibrary-fc94f4d23abd4bc427b701f54ad85282e9ec7872.tar.gz
1 files changed, 3 insertions, 3 deletions
diff --git a/src/core/NEON/kernels/convolution/winograd/input_transforms/arm_fp32_1x8.cpp b/src/core/NEON/kernels/convolution/winograd/input_transforms/arm_fp32_1x8.cpp
index 3e1fc491f1..890f82537c 100644
--- a/src/core/NEON/kernels/convolution/winograd/input_transforms/arm_fp32_1x8.cpp
+++ b/src/core/NEON/kernels/convolution/winograd/input_transforms/arm_fp32_1x8.cpp
@@ -31,11 +31,11 @@ namespace input_transform {
 
 void arm_fp32_1x8(
   const unsigned int n_channels,
-  const float * input_base,
+  const float *const input_base,
   size_t,  // We don't need to stride over rows
-  size_t input_col_stride,
+  const size_t input_col_stride,
   float *outptr,
-  size_t matrix_stride
+  const size_t matrix_stride
 )
 {
   constexpr int inner_tile_cols = 8;
author	Michael Tyler <michael.tyler@arm.com>	2024-06-04 15:47:37 +0100
committer	Michael Tyler <michael.tyler@arm.com>	2024-06-25 09:10:13 +0000
commit	fc94f4d23abd4bc427b701f54ad85282e9ec7872 (patch)
tree	5e2980599256e2b2f4374e5beb61596fc95c9d5a /src/core/NEON/kernels/convolution/winograd/input_transforms/arm_fp32_1x8.cpp
parent	c2237ec4094c7824f8f7e61bc89504d01c5b59ff (diff)
download	ComputeLibrary-fc94f4d23abd4bc427b701f54ad85282e9ec7872.tar.gz