aarch64: add widening sme2 fp8 conversions

author Claudio Bantaloukas <claudio.bantaloukas@arm.com>

Wed, 24 Dec 2025 11:41:25 +0000 (11:41 +0000)

committer Claudio Bantaloukas <claudio.bantaloukas@arm.com>

Wed, 24 Dec 2025 11:41:25 +0000 (11:41 +0000)
author Claudio Bantaloukas <claudio.bantaloukas@arm.com>
Wed, 24 Dec 2025 11:41:25 +0000 (11:41 +0000)
committer Claudio Bantaloukas <claudio.bantaloukas@arm.com>
Wed, 24 Dec 2025 11:41:25 +0000 (11:41 +0000)
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc b/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc

index 95c5ed81d61026eb8e47ec7dad6c7c7f10b97c3b..ee392c3a745b0dbf662b552f19b15a5951b67efb 100644 (file)
--- a/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc
@@ -1020,6 +1020,8 @@ FUNCTION (svclamp, svclamp_impl,)
  FUNCTION (svcvt1, svcvt_fp8_impl, (UNSPEC_F1CVT))
  FUNCTION (svcvt2, svcvt_fp8_impl, (UNSPEC_F2CVT))
  FUNCTION (svcvtl, svcvtl_impl,)
+FUNCTION (svcvtl1, svcvt_fp8_impl, (UNSPEC_F1CVTL))
+FUNCTION (svcvtl2, svcvt_fp8_impl, (UNSPEC_F2CVTL))
  FUNCTION (svcvtlt1, svcvt_fp8_impl, (UNSPEC_F1CVTLT))
  FUNCTION (svcvtlt2, svcvt_fp8_impl, (UNSPEC_F2CVTLT))
  FUNCTION (svcvtlt, unspec_based_function, (-1, -1, UNSPEC_COND_FCVTLT))
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-sve2.def b/gcc/config/aarch64/aarch64-sve-builtins-sve2.def

index 7075e3ff12327d0cb487d0088f6ff34fd4dc48b3..c271b97de87c389d156e36fe2845c51c556b6c85 100644 (file)
--- a/gcc/config/aarch64/aarch64-sve-builtins-sve2.def
+++ b/gcc/config/aarch64/aarch64-sve-builtins-sve2.def
@@ -418,3 +418,11 @@ DEF_SVE_FUNCTION_GS_FPM (svdot_lane, ternary_mfloat8_lane_group_selection, s_flo
  DEF_SVE_FUNCTION_GS_FPM (svdot, ternary_mfloat8, h_float_mf8, none, none, set)
  DEF_SVE_FUNCTION_GS_FPM (svdot_lane, ternary_mfloat8_lane_group_selection, h_float_mf8, none, none, set)
  #undef REQUIRED_EXTENSIONS
+
+#define REQUIRED_EXTENSIONS \
+  streaming_only (AARCH64_FL_SME2 | AARCH64_FL_FP8)
+DEF_SVE_FUNCTION_GS_FPM (svcvt1, unary_convert, cvt_mf8, x2, none, set)
+DEF_SVE_FUNCTION_GS_FPM (svcvt2, unary_convert, cvt_mf8, x2, none, set)
+DEF_SVE_FUNCTION_GS_FPM (svcvtl1, unary_convert, cvt_mf8, x2, none, set)
+DEF_SVE_FUNCTION_GS_FPM (svcvtl2, unary_convert, cvt_mf8, x2, none, set)
+#undef REQUIRED_EXTENSIONS
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-sve2.h b/gcc/config/aarch64/aarch64-sve-builtins-sve2.h

index 6d7d0af26416c5ac4e343db43295ff93def8e5b5..7c1745f5c9eba90bf6ed7f729150f2ef4f7bb5c3 100644 (file)
--- a/gcc/config/aarch64/aarch64-sve-builtins-sve2.h
+++ b/gcc/config/aarch64/aarch64-sve-builtins-sve2.h
@@ -64,6 +64,8 @@ namespace aarch64_sve
      extern const function_base *const svcvt1;
      extern const function_base *const svcvt2;
      extern const function_base *const svcvtl;
+    extern const function_base *const svcvtl1;
+    extern const function_base *const svcvtl2;
      extern const function_base *const svcvtlt;
      extern const function_base *const svcvtlt1;
      extern const function_base *const svcvtlt2;
diff --git a/gcc/config/aarch64/aarch64-sve-builtins.cc b/gcc/config/aarch64/aarch64-sve-builtins.cc

index e8eeedb4d3639e03d231396fd5c2800000615d0b..03481ee4a7757dea0b147069ab7fb1a89a93f856 100644 (file)
--- a/gcc/config/aarch64/aarch64-sve-builtins.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins.cc
@@ -3207,7 +3207,8 @@ function_resolver::resolve_unary (type_class_index merge_tclass,
    /* Handle convert-like functions in which the first type suffix is
       explicit.  */
    if (type_suffix_ids[0] != NUM_TYPE_SUFFIXES)
-    return resolve_to (mode_suffix_id, type_suffix_ids[0], type);
+    return resolve_to (mode_suffix_id, type_suffix_ids[0], type,
+                      group_suffix_id);
  
    return resolve_to (mode_suffix_id, type);
  }
diff --git a/gcc/config/aarch64/aarch64-sve2.md b/gcc/config/aarch64/aarch64-sve2.md

index 9109183518291fc3aff766afca9c27f00e68f795..ab8098d33278e2bcf9b564151ffce6a24d642c1f 100644 (file)
--- a/gcc/config/aarch64/aarch64-sve2.md
+++ b/gcc/config/aarch64/aarch64-sve2.md
@@ -3591,6 +3591,16 @@
    [(set_attr "sve_type" "sve_fp_cvt")]
  )
  
+(define_insn "@aarch64_sve2_fp8_cvt_<fp8_cvt_uns_op><mode>"
+  [(set (match_operand:SVE_FULL_HFx2 0 "aligned_register_operand" "=Uw2")
+       (unspec:SVE_FULL_HFx2
+         [(match_operand:VNx16QI 1 "register_operand" "w")
+         (reg:DI FPM_REGNUM)]
+         FP8CVT_UNS))]
+  "TARGET_SSME2_FP8"
+  "<b><fp8_cvt_uns_op>\t%0, %1.b"
+)
+
  ;; -------------------------------------------------------------------------
  ;; ---- [FP<-FP] Multi-vector narrowing conversions
  ;; -------------------------------------------------------------------------
diff --git a/gcc/config/aarch64/aarch64.h b/gcc/config/aarch64/aarch64.h

index 8e1018e4014eab2a57972a45c10762ad0572220f..e3eb807fb53e7dbd21470e00a16d043937ca77eb 100644 (file)
--- a/gcc/config/aarch64/aarch64.h
+++ b/gcc/config/aarch64/aarch64.h
@@ -538,6 +538,8 @@ through +ssve-fp8dot2.  */
                 (TARGET_SVE2 && TARGET_FP8DOT2) || TARGET_STREAMING) \
                 && (AARCH64_HAVE_ISA(SSVE_FP8DOT2) || TARGET_NON_STREAMING))
  
+#define TARGET_SSME2_FP8 (TARGET_FP8 && TARGET_STREAMING_SME2)
+
  /* Standard register usage.  */
  
  /* 31 64-bit general purpose registers R0-R30:
diff --git a/gcc/config/aarch64/iterators.md b/gcc/config/aarch64/iterators.md

index c5120c37afae5b82c7e1ec2dab655d534021f5e5..026c3101e38dcd999e9922731692fef67e637e19 100644 (file)
--- a/gcc/config/aarch64/iterators.md
+++ b/gcc/config/aarch64/iterators.md
@@ -1055,8 +1055,10 @@
      UNSPEC_EORBT       ; Used in aarch64-sve2.md.
      UNSPEC_EORTB       ; Used in aarch64-sve2.md.
      UNSPEC_F1CVT       ; Used in aarch64-sve2.md.
+    UNSPEC_F1CVTL      ; Used in aarch64-sve2.md.
      UNSPEC_F1CVTLT     ; Used in aarch64-sve2.md.
      UNSPEC_F2CVT       ; Used in aarch64-sve2.md.
+    UNSPEC_F2CVTL      ; Used in aarch64-sve2.md.
      UNSPEC_F2CVTLT     ; Used in aarch64-sve2.md.
      UNSPEC_FADDP       ; Used in aarch64-sve2.md.
      UNSPEC_FCVTNB      ; Used in aarch64-sve2.md.
@@ -4044,6 +4046,8 @@
  (define_int_iterator FP8CVT_UNS
    [UNSPEC_F1CVT
     UNSPEC_F2CVT
+   UNSPEC_F1CVTL
+   UNSPEC_F2CVTL
     UNSPEC_F1CVTLT
     UNSPEC_F2CVTLT])
  
@@ -5187,6 +5191,8 @@
  (define_int_attr fp8_cvt_uns_op
    [(UNSPEC_F1CVT "f1cvt")
     (UNSPEC_F2CVT "f2cvt")
+   (UNSPEC_F1CVTL "f1cvtl")
+   (UNSPEC_F2CVTL "f2cvtl")
     (UNSPEC_F1CVTLT "f1cvtlt")
     (UNSPEC_F2CVTLT "f2cvtlt")])
  
diff --git a/gcc/testsuite/g++.target/aarch64/sme2/aarch64-sme2-acle-asm.exp b/gcc/testsuite/g++.target/aarch64/sme2/aarch64-sme2-acle-asm.exp

index 334b1108ddcd371de10b660d99d23e61cf18f23f..b182f9d4a9653ed54b37543cdd18250badebb25a 100644 (file)
--- a/gcc/testsuite/g++.target/aarch64/sme2/aarch64-sme2-acle-asm.exp
+++ b/gcc/testsuite/g++.target/aarch64/sme2/aarch64-sme2-acle-asm.exp
@@ -39,7 +39,8 @@ if { [check_effective_target_aarch64_sme2] } {
  
  # Turn off any codegen tweaks by default that may affect expected assembly.
  # Tests relying on those should turn them on explicitly.
-set sme2_flags "$sme2_flags -mtune=generic -moverride=tune=none"
+# Reduce testsuite churn when writing to fmpr
+set sme2_flags "$sme2_flags -mtune=generic -moverride=tune=none -moverride=tune=cheap_fpmr_write"
  
  global gcc_runtest_parallelize_limit_minor
  if { [info exists gcc_runtest_parallelize_limit_minor] } {
diff --git a/gcc/testsuite/gcc.target/aarch64/sme2/aarch64-sme2-acle-asm.exp b/gcc/testsuite/gcc.target/aarch64/sme2/aarch64-sme2-acle-asm.exp

index 6bd8784779c6b0bf21e4214a06428706a8594dc9..256c484bb846903a5c39b0a7bb75c2f473f95af2 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sme2/aarch64-sme2-acle-asm.exp
+++ b/gcc/testsuite/gcc.target/aarch64/sme2/aarch64-sme2-acle-asm.exp
@@ -39,7 +39,8 @@ if { [check_effective_target_aarch64_sme2] } {
  
  # Turn off any codegen tweaks by default that may affect expected assembly.
  # Tests relying on those should turn them on explicitly.
-set sme2_flags "$sme2_flags -mtune=generic -moverride=tune=none"
+# Reduce testsuite churn when writing to fmpr
+set sme2_flags "$sme2_flags -mtune=generic -moverride=tune=none -moverride=tune=cheap_fpmr_write"
  
  global gcc_runtest_parallelize_limit_minor
  if { [info exists gcc_runtest_parallelize_limit_minor] } {
diff --git a/gcc/testsuite/gcc.target/aarch64/sme2/acle-asm/cvt_mf8_x2.c b/gcc/testsuite/gcc.target/aarch64/sme2/acle-asm/cvt_mf8_x2.c

new file mode 100644 (file)

index 0000000..0fb20c8
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sme2/acle-asm/cvt_mf8_x2.c
@@ -0,0 +1,47 @@
+/* { dg-do assemble { target { aarch64_asm_fp8_ok && aarch64_asm_sme2_ok } } } */
+/* { dg-do compile { target { ! { aarch64_asm_fp8_ok && aarch64_asm_sme2_ok } } } } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sme2_acle.h"
+
+#pragma GCC target "+fp8"
+
+/*
+** cvt1_f16_mf8_x2_fpm:
+**     msr     fpmr, x0
+**     f1cvt   {z0\.h - z1\.h}, z0\.b
+**     ret
+*/
+TEST_X2_WIDE (cvt1_f16_mf8_x2_fpm, svfloat16x2_t, svmfloat8_t,
+             z0_res = svcvt1_f16_mf8_x2_fpm (z0, fpm0),
+             z0_res = svcvt1_f16_x2_fpm (z0, fpm0))
+
+/*
+** cvt1_bf16_mf8_x2_fpm:
+**     msr     fpmr, x0
+**     bf1cvt  {z0\.h - z1\.h}, z0\.b
+**     ret
+*/
+TEST_X2_WIDE (cvt1_bf16_mf8_x2_fpm, svbfloat16x2_t, svmfloat8_t,
+             z0_res = svcvt1_bf16_mf8_x2_fpm (z0, fpm0),
+             z0_res = svcvt1_bf16_x2_fpm (z0, fpm0))
+
+/*
+** cvt2_f16_mf8_x2_fpm:
+**     msr     fpmr, x0
+**     f2cvt   {z0\.h - z1\.h}, z0\.b
+**     ret
+*/
+TEST_X2_WIDE (cvt2_f16_mf8_x2_fpm, svfloat16x2_t, svmfloat8_t,
+             z0_res = svcvt2_f16_mf8_x2_fpm (z0, fpm0),
+             z0_res = svcvt2_f16_x2_fpm (z0, fpm0))
+
+/*
+** cvt2_bf16_mf8_x2_fpm:
+**     msr     fpmr, x0
+**     bf2cvt  {z0\.h - z1\.h}, z0\.b
+**     ret
+*/
+TEST_X2_WIDE (cvt2_bf16_mf8_x2_fpm, svbfloat16x2_t, svmfloat8_t,
+             z0_res = svcvt2_bf16_mf8_x2_fpm (z0, fpm0),
+             z0_res = svcvt2_bf16_x2_fpm (z0, fpm0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sme2/acle-asm/cvtl_mf8_x2.c b/gcc/testsuite/gcc.target/aarch64/sme2/acle-asm/cvtl_mf8_x2.c

new file mode 100644 (file)

index 0000000..8a8326b
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sme2/acle-asm/cvtl_mf8_x2.c
@@ -0,0 +1,47 @@
+/* { dg-do assemble { target { aarch64_asm_fp8_ok && aarch64_asm_sme2_ok } } } */
+/* { dg-do compile { target { ! { aarch64_asm_fp8_ok && aarch64_asm_sme2_ok } } } } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sme2_acle.h"
+
+#pragma GCC target "+fp8"
+
+/*
+** cvtl1_f16_mf8_x2_fpm:
+**     msr     fpmr, x0
+**     f1cvtl  {z0\.h - z1\.h}, z0\.b
+**     ret
+*/
+TEST_X2_WIDE (cvtl1_f16_mf8_x2_fpm, svfloat16x2_t, svmfloat8_t,
+             z0_res = svcvtl1_f16_mf8_x2_fpm (z0, fpm0),
+             z0_res = svcvtl1_f16_x2_fpm (z0, fpm0))
+
+/*
+** cvtl1_bf16_mf8_x2_fpm:
+**     msr     fpmr, x0
+**     bf1cvtl {z0\.h - z1\.h}, z0\.b
+**     ret
+*/
+TEST_X2_WIDE (cvtl1_bf16_mf8_x2_fpm, svbfloat16x2_t, svmfloat8_t,
+             z0_res = svcvtl1_bf16_mf8_x2_fpm (z0, fpm0),
+             z0_res = svcvtl1_bf16_x2_fpm (z0, fpm0))
+
+/*
+** cvtl2_f16_mf8_x2_fpm:
+**     msr     fpmr, x0
+**     f2cvtl  {z0\.h - z1\.h}, z0\.b
+**     ret
+*/
+TEST_X2_WIDE (cvtl2_f16_mf8_x2_fpm, svfloat16x2_t, svmfloat8_t,
+             z0_res = svcvtl2_f16_mf8_x2_fpm (z0, fpm0),
+             z0_res = svcvtl2_f16_x2_fpm (z0, fpm0))
+
+/*
+** cvtl2_bf16_mf8_x2_fpm:
+**     msr     fpmr, x0
+**     bf2cvtl {z0\.h - z1\.h}, z0\.b
+**     ret
+*/
+TEST_X2_WIDE (cvtl2_bf16_mf8_x2_fpm, svbfloat16x2_t, svmfloat8_t,
+             z0_res = svcvtl2_bf16_mf8_x2_fpm (z0, fpm0),
+             z0_res = svcvtl2_bf16_x2_fpm (z0, fpm0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/test_sve_acle.h b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/test_sve_acle.h

index 0adb39ad8b2b3bd21f732620df46052813a15d25..7c156c4cf2a73869becf630bedee9df140ca1ade 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/test_sve_acle.h
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/test_sve_acle.h
@@ -767,6 +767,7 @@
  #define TEST_X2_WIDE(NAME, TTYPE, ZTYPE, CODE1, CODE2)         \
    PROTO (NAME, void, ())                                       \
    {                                                            \
+    register fpm_t fpm0 __asm ("x0");                          \
      register ZTYPE z0 __asm ("z0");                            \
      register ZTYPE z5 __asm ("z5");                            \
      register TTYPE z6 __asm ("z6");                            \
author	Claudio Bantaloukas <claudio.bantaloukas@arm.com>
	Wed, 24 Dec 2025 11:41:25 +0000 (11:41 +0000)
committer	Claudio Bantaloukas <claudio.bantaloukas@arm.com>
	Wed, 24 Dec 2025 11:41:25 +0000 (11:41 +0000)
gcc/config/aarch64/aarch64-sve-builtins-sve2.cc		patch \| blob \| history
gcc/config/aarch64/aarch64-sve-builtins-sve2.def		patch \| blob \| history
gcc/config/aarch64/aarch64-sve-builtins-sve2.h		patch \| blob \| history
gcc/config/aarch64/aarch64-sve-builtins.cc		patch \| blob \| history
gcc/config/aarch64/aarch64-sve2.md		patch \| blob \| history
gcc/config/aarch64/aarch64.h		patch \| blob \| history
gcc/config/aarch64/iterators.md		patch \| blob \| history
gcc/testsuite/g++.target/aarch64/sme2/aarch64-sme2-acle-asm.exp		patch \| blob \| history
gcc/testsuite/gcc.target/aarch64/sme2/aarch64-sme2-acle-asm.exp		patch \| blob \| history
gcc/testsuite/gcc.target/aarch64/sme2/acle-asm/cvt_mf8_x2.c	[new file with mode: 0644]	patch \| blob
gcc/testsuite/gcc.target/aarch64/sme2/acle-asm/cvtl_mf8_x2.c	[new file with mode: 0644]	patch \| blob
gcc/testsuite/gcc.target/aarch64/sve/acle/asm/test_sve_acle.h		patch \| blob \| history