就在一周前,全宇宙最火爆的推理框架 SGLang 官宣支持了 Diffusion 模型,好評如潮。團隊成員將原本在大語言模型推理中表現突出的高性能調度與內核優化,擴展到圖像與視頻擴散模型上,相較于先前的視頻和圖像生成框架,速度提升最高可達 57%:
模型支持:覆蓋主流開源視頻和圖像生成模型,包括 Wan 系列、Hunyuan、Qwen-Image、Qwen-Image-Edit、Flux 等。
性能加速:在多種工作負載上實現最高57%的推理加速。
多種接口:提供 OpenAI 兼容 API、CLI 和 Python 接口,降低使用門檻。
完整生態:與 FastVideo 團隊合作,打造從模型訓練到生產部署的端到端解決方案。