[Feature] Enable AMX FP16 on next generation CPU #456

wenhuanh · 2024-06-19T06:20:42Z

need export env DNNL_MAX_CPU_ISA=AVX512_CORE_AMX_FP16 when running

changqi1 · 2024-06-19T07:28:35Z

src/utils/matmul_helper.h

-        TimeLine t("onednn_amx_sgemm_f32bf16f32_compute");
-        TimeLine t1("onednn_amx_sgemm_f32bf16f32_compute.create_primitive");
+    template <typename Tin, typename Tweight, typename Tout>
+    void onednn_amx_sgemm_f32x16f32_compute(bool transA, int M, int N, int K, float alpha, const Tin *A, int lda,


reanme onednn_amx_gemm_compute?

changqi1 · 2024-06-19T07:29:46Z

src/utils/matmul_helper.h

-    void onednn_amx_sgemm_f32bf16f32_compute_residential(bool transA, int M, int N, int K, float alpha, const Tin *A,
-            int lda, const bfloat16_t *packedB, float beta, Tout *C, int ldc, const float *bias, const Tin *res,
+    template <typename Tin,  typename Tweight, typename Tout>
+    void onednn_amx_sgemm_f32x16f32_compute_residential(bool transA, int M, int N, int K, float alpha, const Tin *A,


reanme onednn_amx_gemm_compute_residential?

changqi1 · 2024-06-19T07:53:47Z

除了compute和compute_resident，其他的kernel也需要支持这个amx fp16的支持

wenhuanh · 2024-06-19T09:19:30Z

revised and updated.

changqi1 · 2024-06-20T05:57:35Z

@wenhuanh We will need to check ISA to select AMX_FP16 or AVX512_FP16. But currently this is OK.
And you need to give its perf improvement in GNR vs. EMR.

need export env DNNL_MAX_CPU_ISA=AVX512_CORE_AMX_FP16 when running Signed-off-by: Wenhuan Huang <wenhuan.huang@intel.com>

wenhuanh · 2024-06-24T08:48:07Z

Perf status was updated in related JIRA.

changqi1 reviewed Jun 19, 2024

View reviewed changes

wenhuanh force-pushed the feature/fp16_amx branch from ad11ced to ee2c349 Compare June 19, 2024 09:15

[Feature] Enable AMX FP16 on next generation CPU

2190d1f

need export env DNNL_MAX_CPU_ISA=AVX512_CORE_AMX_FP16 when running Signed-off-by: Wenhuan Huang <wenhuan.huang@intel.com>

wenhuanh force-pushed the feature/fp16_amx branch from ee2c349 to 2190d1f Compare June 20, 2024 09:47

changqi1 added the enhancement New feature or request label Jun 21, 2024

changqi1 approved these changes Jun 25, 2024

View reviewed changes

changqi1 merged commit 0ce383b into intel:main Jun 25, 2024
1 check passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Feature] Enable AMX FP16 on next generation CPU #456

[Feature] Enable AMX FP16 on next generation CPU #456

wenhuanh commented Jun 19, 2024

changqi1 Jun 19, 2024

changqi1 Jun 19, 2024

changqi1 commented Jun 19, 2024

wenhuanh commented Jun 19, 2024

changqi1 commented Jun 20, 2024 •

edited

Loading

wenhuanh commented Jun 24, 2024

[Feature] Enable AMX FP16 on next generation CPU #456

[Feature] Enable AMX FP16 on next generation CPU #456

Conversation

wenhuanh commented Jun 19, 2024

changqi1 Jun 19, 2024

Choose a reason for hiding this comment

changqi1 Jun 19, 2024

Choose a reason for hiding this comment

changqi1 commented Jun 19, 2024

wenhuanh commented Jun 19, 2024

changqi1 commented Jun 20, 2024 • edited Loading

wenhuanh commented Jun 24, 2024

changqi1 commented Jun 20, 2024 •

edited

Loading