Add quantized support for unary elementwise in CPU

* Add quantized unary elementwise in CPU using LUT. * Widen the input data range of the test suite. - Fix CPU exponential function overflow/underflow range. - Fix saturation issue of CL round operator. Resolves: COMPMID-5763 Signed-off-by: Viet-Hoa Do <viet-hoa.do@arm.com> Change-Id: I41445de2b4a33ec6b01e0ab701516c240c852d0b Reviewed-on: https://review.mlplatform.org/c/ml/ComputeLibrary/+/9367 Tested-by: Arm Jenkins <bsgcomp@arm.com> Reviewed-by: Jakub Sujak <jakub.sujak@arm.com> Reviewed-by: Pablo Marquez Tello <pablo.tello@arm.com> Comments-Addressed: Arm Jenkins <bsgcomp@arm.com> Benchmark: Arm Jenkins <bsgcomp@arm.com>
author: Viet-Hoa Do <viet-hoa.do@arm.com> 2023-03-15 14:05:06 +0000
committer: Viet-Hoa Do <viet-hoa.do@arm.com> 2023-03-29 14:03:30 +0000
commit: fd472f05dc73005a89a5e6275940ab5c9a609485 (patch)
tree: 4a00f42f64f4bea72c489961aaa376665d324c60 /src/core
parent: 5a7d1571a2de24eefc6f1d8d22deeef9f47521ee (diff)
download: ComputeLibrary-fd472f05dc73005a89a5e6275940ab5c9a609485.tar.gz
3 files changed, 10 insertions, 10 deletions
diff --git a/src/core/CL/cl_kernels/common/elementwise_unary.cl b/src/core/CL/cl_kernels/common/elementwise_unary.cl
index eba2dbc866..81835108a3 100644
--- a/src/core/CL/cl_kernels/common/elementwise_unary.cl
+++ b/src/core/CL/cl_kernels/common/elementwise_unary.cl
@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2018-2021 Arm Limited.
+ * Copyright (c) 2018-2021, 2023 Arm Limited.
  *
  * SPDX-License-Identifier: MIT
  *
@@ -37,13 +37,13 @@
 #define fabs_op(input) fabs(input)
 // Calculate natural_log
 #define natural_log_op(input) log(input)
-// Calculate round (Cannot use round function as it rounds halfway cases away from zero).
+// Calculate round using round to nearest even rounding mode
+#define round_op(input) rint(input)
+
 #if defined(VEC_SIZE)
 #define VEC_TYPE VEC_DATA_TYPE(DATA_TYPE, VEC_SIZE)
-#define round_op(input) CONVERT(CONVERT_SAT_ROUND(input, VEC_DATA_TYPE(int, VEC_SIZE), rte), VEC_TYPE)
 #define logical_not_op(input) CONVERT(CONVERT(!input, VEC_TYPE) & ((VEC_TYPE)0x1), VEC_TYPE)
 #else // defined(VEC_SIZE)
-#define round_op(input) CONVERT(CONVERT_SAT_ROUND(input, int, rte), DATA_TYPE)
 #define logical_not_op(input) ((!input) & 0x1)
 #endif // defined(VEC_SIZE)
 
diff --git a/src/core/NEON/NEMath.inl b/src/core/NEON/NEMath.inl
index 94bbc10ad8..8b2d1c3c37 100644
--- a/src/core/NEON/NEMath.inl
+++ b/src/core/NEON/NEMath.inl
@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2016-2022 Arm Limited.
+ * Copyright (c) 2016-2023 Arm Limited.
  *
  * SPDX-License-Identifier: MIT
  *
@@ -158,9 +158,9 @@ inline float32x4_t vexpq_f32(float32x4_t x)
     const auto neg_ln2_lo  = vreinterpretq_f32_u32(vdupq_n_u32(0xb5bfbe8e));  // -ln(2) from bits -20 to -42: -0x1.7f7d1cp-20f
 
     const auto inf       = vdupq_n_f32(std::numeric_limits<float>::infinity());
-    const auto max_input = vdupq_n_f32(88.7f);   // Approximately ln(0x1.fffffep+127)
+    const auto max_input = vdupq_n_f32(88.37f);  // Approximately ln(2^127.5)
     const auto zero      = vdupq_n_f32(0.f);
-    const auto min_input = vdupq_n_f32(-86.6f);  // Approximately ln(2^-125)
+    const auto min_input = vdupq_n_f32(-86.64f);  // Approximately ln(2^-125)
 
     // Range reduction:
     //   e^x = 2^n * e^r
diff --git a/src/core/NEON/SVEMath.inl b/src/core/NEON/SVEMath.inl
index 5f41e2138d..8973d0b273 100644
--- a/src/core/NEON/SVEMath.inl
+++ b/src/core/NEON/SVEMath.inl
@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2020-2022 Arm Limited.
+ * Copyright (c) 2020-2023 Arm Limited.
  *
  * SPDX-License-Identifier: MIT
  *
@@ -96,9 +96,9 @@ inline svfloat32_t svexp_f32_z(svbool_t pg, svfloat32_t x)
     const auto neg_ln2_lo  = svreinterpret_f32_u32(svdup_n_u32(0xb5bfbe8e));  // -ln(2) from bits -20 to -42: -0x1.7f7d1cp-20f
 
     const auto inf       = svdup_n_f32(std::numeric_limits<float>::infinity());
-    const auto max_input = svdup_n_f32(88.7f);   // Approximately ln(0x1.fffffep+127)
+    const auto max_input = svdup_n_f32(88.37f);  // Approximately ln(2^127.5)
     const auto zero      = svdup_n_f32(0.f);
-    const auto min_input = svdup_n_f32(-86.6f);  // Approximately ln(2^-125)
+    const auto min_input = svdup_n_f32(-86.64f);  // Approximately ln(2^-125)
 
     // Range reduction:
     //   e^x = 2^n * e^r
author	Viet-Hoa Do <viet-hoa.do@arm.com>	2023-03-15 14:05:06 +0000
committer	Viet-Hoa Do <viet-hoa.do@arm.com>	2023-03-29 14:03:30 +0000
commit	fd472f05dc73005a89a5e6275940ab5c9a609485 (patch)
tree	4a00f42f64f4bea72c489961aaa376665d324c60 /src/core
parent	5a7d1571a2de24eefc6f1d8d22deeef9f47521ee (diff)
download	ComputeLibrary-fd472f05dc73005a89a5e6275940ab5c9a609485.tar.gz