我根据官方指导文档,在dynamo+vllm+flexkv测试,遇到一个问题,https://github.com/taco-project/FlexKV/blob/main/docs/dynamo_integration/README_zh.md
我开启SSD缓存后(910GB, Qwen3-1.7B block-size=64, isl=1100, osl=1), 预估可以缓存7830个样本。
启动测试,6K个样本, 进行2遍压测, 第一遍灌入数据至SSD, 第二遍压测,结果全从SSD读取(理论命中率100%)。
NUM_WORKERS = 1 , 第二遍压测命中率符合预期(99.81%, token不足1个阶段)
NUM_WORKERS=8,启动多worker , 第二遍压测命中率差,远不足预期的99.81%,
想问下具体什么原因,我应该如何调整
dynamo脚本是采样官方配置

我根据官方指导文档,在dynamo+vllm+flexkv测试,遇到一个问题,https://github.com/taco-project/FlexKV/blob/main/docs/dynamo_integration/README_zh.md
我开启SSD缓存后(910GB, Qwen3-1.7B block-size=64, isl=1100, osl=1), 预估可以缓存7830个样本。
启动测试,6K个样本, 进行2遍压测, 第一遍灌入数据至SSD, 第二遍压测,结果全从SSD读取(理论命中率100%)。
NUM_WORKERS = 1 , 第二遍压测命中率符合预期(99.81%, token不足1个阶段)
NUM_WORKERS=8,启动多worker , 第二遍压测命中率差,远不足预期的99.81%,
想问下具体什么原因,我应该如何调整
dynamo脚本是采样官方配置