GitHub · Where software is built

[Announcement] New SGLang Release Versioning Scheme
#16309 · Kangyan-Zhou opened on Jan 2, 2026
Development Roadmap (2025 Q4)
#12780 · hnyls2002 opened on Nov 6, 2025
1
[Feature] Overlap Spec Support
#11762 · hnyls2002 opened on Oct 17, 2025
16

Labels Milestones New issue

[Feature] Support Moore Threads (MUSA) GPU

#16565

· yeahdongcn opened

on Jan 6, 2026

[Bug] accuracy not tested in test_decode_attention

#16554

· polisettyvarma opened

on Jan 6, 2026

[Bug] Failed to Infer Qwen2.5-7B

#16553

· yg9538 opened

on Jan 6, 2026

Support Qwen3-Next-80B-A3B-Instruct linear attention modules (in_proj_qkvz/in_proj_ba) for LoRA

#16550

· 1277331747 opened

on Jan 6, 2026

[RFC] SGLang-Omni Design

#16546

· FrankLeeeee opened

on Jan 6, 2026

[Bug] [model-gateway] External workers fail with "Unknown parameter" in IGW mode

#16544

· zhaowenzi opened

on Jan 6, 2026

[Bug] Structured outputs not working with spec v2 PD and spec v1 crashes - DeepseekV3.1 / mimo-v2-flash

#16541

· Tiktus opened

on Jan 6, 2026

[Bug] DecodingStage VRAM usage surges dramatically

#16530

· carloszhang999 opened

on Jan 6, 2026

[Bug] on NPU,the server crashed when add --enable-piecewise-cuda-graph

#16526

· fourierr opened

on Jan 6, 2026

[Bug] glmasr: cannot import name 'GlmAsrConfig' from 'transformers'

#16518

· universorum opened

on Jan 5, 2026

[Bug] dsv3 continue_fina_message error

#16501

· whybeyoung opened

on Jan 5, 2026

[Bug] NPU Runtime Error in graph_runner.replay when batchsize changed during running benchmarking Qwen3+Eagle3

#16498

· M0reDr1nk opened

on Jan 5, 2026