← 返回资讯
产品发布 @vllm_project 2026-05-29

vLLM集成fastokens:开源Rust分词器兼容DeepSeek、Qwen等模型

fastokens由CrusoeAI与NVIDIA AI Dynamo联合开发,采用BPE算法,可大幅缓解长上下文推理(agentic AI、RAG、多轮对话)中CPU分词的性能瓶颈,现通过--to…

查看原文
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。