[SYCL] refactor soft_max, add soft_max_back #16472

NeoZhangJianyu · 2025-10-08T13:33:20Z

[Issue]
Some UT cases of soft_max are fault.
The original soft_max doesn't support batch.
Not support soft_max_back.

[Solution]
Refer to #14435, refactor the soft_max, add soft_max_back.
The related UT cases are passed.

* master: (113 commits) webui: updated the chat service to only include max_tokens in the req… (ggml-org#16489) cpu : optimize the ggml NORM operation (ggml-org#15953) server : host-memory prompt caching (ggml-org#16391) No markdown in cot (ggml-org#16483) model-conversion : add support for SentenceTransformers (ggml-org#16387) ci: add ARM64 Kleidiai build and test support (ggml-org#16462) CANN: Improve ACL graph matching (ggml-org#16166) kleidiai: kernel interface refactoring (ggml-org#16460) [SYCL] refactor soft_max, add soft_max_back (ggml-org#16472) model: EmbeddingGemma Adding Support for SentenceTransformers Dense Modules (ggml-org#16367) refactor: centralize CoT parsing in backend for streaming mode (ggml-org#16394) Disable CUDA host buffers on integrated GPUs (ggml-org#16308) server : fix cancel pending task (ggml-org#16467) metal : mark FA blocks (ggml-org#16372) server : improve context checkpoint logic (ggml-org#16440) ggml webgpu: profiling, CI updates, reworking of command submission (ggml-org#16452) llama : support LiquidAI LFM2-MoE hybrid model (ggml-org#16464) server : add `/v1/health` endpoint (ggml-org#16461) webui : added download action (ggml-org#13552) (ggml-org#16282) presets : fix pooling param for embedding models (ggml-org#16455) ...

arthw added 3 commits October 7, 2025 13:07

refactor to support soft_max_ext

b0ba0ab

fix error and support soft_max_back

39760d9

rm unused functions

ef2bf6b

github-actions bot added ggml changes relating to the ggml tensor library for machine learning SYCL https://en.wikipedia.org/wiki/SYCL - GPU programming language labels Oct 8, 2025

fix format issue

e17915d

ggerganov merged commit b260213 into ggml-org:master Oct 9, 2025
67 of 68 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[SYCL] refactor soft_max, add soft_max_back #16472

[SYCL] refactor soft_max, add soft_max_back #16472

NeoZhangJianyu commented Oct 8, 2025 •

edited

Loading

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

[SYCL] refactor soft_max, add soft_max_back #16472

[SYCL] refactor soft_max, add soft_max_back #16472

Conversation

NeoZhangJianyu commented Oct 8, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

NeoZhangJianyu commented Oct 8, 2025 •

edited

Loading