Lemonade by AMD：开源本地 LLM 服务器

2026-04-03

AMD 推出 Lemonade，一个快速、开源的本地 LLM 服务器，支持 GPU 和 NPU，可在任何 PC 上几分钟内完成部署。

核心特性

GPU 和 NPU 支持 — 充分利用 AMD 硬件加速
多模态能力 — 文本、图像生成、语音识别和合成
OpenAI API 兼容 — 与数百个应用开箱即用
轻量级后端 — 原生 C++ 后端，仅 2MB
一分钟安装 — 简单安装程序自动配置
多引擎兼容 — 支持 llama.cpp、Ryzen AI SW、FastFlowLM 等
同时运行多模型 — 可同时加载和运行多个模型
跨平台 — Windows、Linux、macOS（测试版）

使用场景

在本地运行大模型如 gpt-oss-120b 或 Qwen-Coder-Next 进行高级工具使用，无需依赖云服务。

了解更多：https://lemonade-server.ai