币圈界报道:

本地化智能体新范式:Qwable融合Fable逻辑与开源潜力

在Anthropic因越狱发现被迫下架Fable 5对外籍用户访问权限之际,一个名为Qwable的新型本地模型悄然崛起。该模型由开发者Mia-AiLab基于阿里巴巴开源的Qwen3.6-27B基座,结合Fable 5的分步推理数据集完成深度微调,目标是在270亿参数规模下实现可运行于普通硬件的强推理能力。

以示例驱动训练:学习思考方式而非复制答案

Qwable采用‘基于追踪示例的指令微调’策略,通过分析Fable 5输出中体现的结构化推理模式,引导原始模型生成类似格式的回答。这并非简单模仿内容,而是系统性地内化其任务分解与解释逻辑,使其在编程辅助、技术诊断等场景中展现出更强的引导性和可读性。

GGUF格式加持:无需云端即可实现全本地运行

该模型以广泛兼容的GGUF格式发布,适配LM Studio与llama.cpp等主流本地推理框架。其Q4量化版本仅约16.5GB,且不向任何外部服务器传输用户输入,规避了原版Fable 5强制保留30天数据的隐私风险,保障了使用过程中的数据自主权。

外科手术式改造:abliteration技术移除拒绝机制

开源贡献者Huihui-ai利用‘abliteration’方法,对Qwable进行非侵入式权重调整。该技术通过对比有害与无害提示下的内部激活差异,精准定位并消除模型中用于触发拒绝响应的数学信号,使模型不再具备主动回避敏感请求的能力。

功能分化:从合规助手到研究工具的双重角色

标准版适用于需要清晰推理链的技术任务;而经abliteration处理的版本则面向安全研究、合成数据生成及模型能力评估等需绕过内容过滤的场景。尽管存在滥用风险,开发者明确声明其仅限受控环境使用,使用者须自行承担法律与伦理后果。

多版本适配:兼顾性能与易用性的部署方案

当前平台提供三个版本,推荐使用体积最小的Q4_K_M_Q8(约19GB),支持多词元预测的高阶版本亦已上线,显著提升响应效率。所有版本均无需依赖远程计算资源或复杂开发环境,可在个人电脑上即刻部署。