Lemonade by AMD:开源本地 LLM 服务器
AMD 推出 Lemonade,一个快速、开源的本地 LLM 服务器,支持 GPU 和 NPU,可在任何 PC 上几分钟内完成部署。
核心特性
- GPU 和 NPU 支持 — 充分利用 AMD 硬件加速
- 多模态能力 — 文本、图像生成、语音识别和合成
- OpenAI API 兼容 — 与数百个应用开箱即用
- 轻量级后端 — 原生 C++ 后端,仅 2MB
- 一分钟安装 — 简单安装程序自动配置
- 多引擎兼容 — 支持 llama.cpp、Ryzen AI SW、FastFlowLM 等
- 同时运行多模型 — 可同时加载和运行多个模型
- 跨平台 — Windows、Linux、macOS(测试版)
使用场景
在本地运行大模型如 gpt-oss-120b 或 Qwen-Coder-Next 进行高级工具使用,无需依赖云服务。