ggml : fix unmerged GGML_FPxx_TO_FPxx refactoring (ggml-org#14443)

CISC · web-flow · commit a5d1fb621229 · 2025-06-29T14:38:10.000+02:00
diff --git a/ggml/src/ggml-cpu/vec.h b/ggml/src/ggml-cpu/vec.h
@@ -913,8 +913,8 @@ inline static void ggml_vec_reglu_f32 (const int n, float * y, const float * x,
 
 inline static void ggml_vec_reglu_f16 (const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {
     for (int i = 0; i < n; ++i) {
-        float v = GGML_FP16_TO_FP32(x[i]);
-        y[i] = GGML_FP32_TO_FP16((v > 0.f) ? v * GGML_FP16_TO_FP32(g[i]) : 0.f);
+        float v = GGML_CPU_FP16_TO_FP32(x[i]);
+        y[i] = GGML_CPU_FP32_TO_FP16((v > 0.f) ? v * GGML_CPU_FP16_TO_FP32(g[i]) : 0.f);
     }
 }
 
@@ -927,9 +927,9 @@ inline static void ggml_vec_geglu_f32(const int n, float * y, const float * x, c
         } else if (x[i] >= 10.0f) {
             y[i] = x[i] * g[i];
         } else {
-            ggml_fp16_t fp16 = GGML_FP32_TO_FP16(x[i]);
+            ggml_fp16_t fp16 = GGML_CPU_FP32_TO_FP16(x[i]);
             memcpy(&t, &fp16, sizeof(uint16_t));
-            y[i] = GGML_FP16_TO_FP32(ggml_table_gelu_f16[t]) * g[i];
+            y[i] = GGML_CPU_FP16_TO_FP32(ggml_table_gelu_f16[t]) * g[i];
         }
     }
 }
@@ -944,18 +944,18 @@ inline static void ggml_vec_geglu_f32(const int n, float * y, const float * x, c
 inline static void ggml_vec_geglu_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {
     const uint16_t * i16 = (const uint16_t *) x;
     for (int i = 0; i < n; ++i) {
-        float v = GGML_FP16_TO_FP32(g[i]);
-        y[i] = GGML_FP32_TO_FP16(GGML_FP16_TO_FP32(ggml_table_gelu_f16[i16[i]]) * v);
+        float v = GGML_CPU_FP16_TO_FP32(g[i]);
+        y[i] = GGML_CPU_FP32_TO_FP16(GGML_CPU_FP16_TO_FP32(ggml_table_gelu_f16[i16[i]]) * v);
     }
 }
 
 void ggml_vec_swiglu_f32(const int n, float * y, const float * x, const float * g);
 
 inline static void ggml_vec_swiglu_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {
     for (int i = 0; i < n; ++i) {
-        float v = GGML_FP16_TO_FP32(x[i]);
-        float w = GGML_FP16_TO_FP32(g[i]);
-        y[i] = GGML_FP32_TO_FP16((v/(1.0f + expf(-v))) * w);
+        float v = GGML_CPU_FP16_TO_FP32(x[i]);
+        float w = GGML_CPU_FP16_TO_FP32(g[i]);
+        y[i] = GGML_CPU_FP32_TO_FP16((v/(1.0f + expf(-v))) * w);
     }
 }
 

Original file line number	Diff line number	Diff line change
`@@ -913,8 +913,8 @@ inline static void ggml_vec_reglu_f32 (const int n, float * y, const float * x,`
`913`	`913`
`914`	`914`	`inline static void ggml_vec_reglu_f16 (const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {`
`915`	`915`	`for (int i = 0; i < n; ++i) {`
`916`		`- float v = GGML_FP16_TO_FP32(x[i]);`
`917`		`- y[i] = GGML_FP32_TO_FP16((v > 0.f) ? v * GGML_FP16_TO_FP32(g[i]) : 0.f);`
	`916`	`+ float v = GGML_CPU_FP16_TO_FP32(x[i]);`
	`917`	`+ y[i] = GGML_CPU_FP32_TO_FP16((v > 0.f) ? v * GGML_CPU_FP16_TO_FP32(g[i]) : 0.f);`
`918`	`918`	`}`
`919`	`919`	`}`
`920`	`920`
`@@ -927,9 +927,9 @@ inline static void ggml_vec_geglu_f32(const int n, float * y, const float * x, c`
`927`	`927`	`} else if (x[i] >= 10.0f) {`
`928`	`928`	`y[i] = x[i] * g[i];`
`929`	`929`	`} else {`
`930`		`- ggml_fp16_t fp16 = GGML_FP32_TO_FP16(x[i]);`
	`930`	`+ ggml_fp16_t fp16 = GGML_CPU_FP32_TO_FP16(x[i]);`
`931`	`931`	`memcpy(&t, &fp16, sizeof(uint16_t));`
`932`		`- y[i] = GGML_FP16_TO_FP32(ggml_table_gelu_f16[t]) * g[i];`
	`932`	`+ y[i] = GGML_CPU_FP16_TO_FP32(ggml_table_gelu_f16[t]) * g[i];`
`933`	`933`	`}`
`934`	`934`	`}`
`935`	`935`	`}`
`@@ -944,18 +944,18 @@ inline static void ggml_vec_geglu_f32(const int n, float * y, const float * x, c`
`944`	`944`	`inline static void ggml_vec_geglu_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {`
`945`	`945`	`const uint16_t * i16 = (const uint16_t *) x;`
`946`	`946`	`for (int i = 0; i < n; ++i) {`
`947`		`- float v = GGML_FP16_TO_FP32(g[i]);`
`948`		`- y[i] = GGML_FP32_TO_FP16(GGML_FP16_TO_FP32(ggml_table_gelu_f16[i16[i]]) * v);`
	`947`	`+ float v = GGML_CPU_FP16_TO_FP32(g[i]);`
	`948`	`+ y[i] = GGML_CPU_FP32_TO_FP16(GGML_CPU_FP16_TO_FP32(ggml_table_gelu_f16[i16[i]]) * v);`
`949`	`949`	`}`
`950`	`950`	`}`
`951`	`951`
`952`	`952`	`void ggml_vec_swiglu_f32(const int n, float * y, const float * x, const float * g);`
`953`	`953`
`954`	`954`	`inline static void ggml_vec_swiglu_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {`
`955`	`955`	`for (int i = 0; i < n; ++i) {`
`956`		`- float v = GGML_FP16_TO_FP32(x[i]);`
`957`		`- float w = GGML_FP16_TO_FP32(g[i]);`
`958`		`- y[i] = GGML_FP32_TO_FP16((v/(1.0f + expf(-v))) * w);`
	`956`	`+ float v = GGML_CPU_FP16_TO_FP32(x[i]);`
	`957`	`+ float w = GGML_CPU_FP16_TO_FP32(g[i]);`
	`958`	`+ y[i] = GGML_CPU_FP32_TO_FP16((v/(1.0f + expf(-v))) * w);`
`959`	`959`	`}`
`960`	`960`	`}`
`961`	`961`