今日版 / 2026年6月25日星期四

limbo logolimbo

数据更新时间

6月22日 23:15

启用来源

10

抓取状态

数据库优先

开源模型Open Inference Weekly

边缘端量化方案让 70B 级模型进入工作站部署

摘要

新的推理栈将显存占用压低,并在本地检索、代码助手和离线客服场景中保持可用速度。

来源地区

United States

热度分

82

分类

开源模型

语言

en