120 万奖金池里,有一块没人抢的肥肉:RWKV-7 × transformers 训练适配
RWKV-7 “Goose” 出来一阵子了,100% RNN、无 KV cache、constant-space、linear-time,state 比同档 Qwen3.5 小三倍多——BlinkDL 那边单卡 fp16 decode 已经跑到 13000 tok/s 的量级。问题是:vLLM / SGLang / transformers / llama.cpp 四个…
2026/7/4 3:04:56