Skip to content

关于多Wroker下测试 #77

@boyanitawang

Description

@boyanitawang

我根据官方指导文档,在dynamo+vllm+flexkv测试,遇到一个问题,https://github.com/taco-project/FlexKV/blob/main/docs/dynamo_integration/README_zh.md
我开启SSD缓存后(910GB, Qwen3-1.7B block-size=64, isl=1100, osl=1), 预估可以缓存7830个样本。
启动测试,6K个样本, 进行2遍压测, 第一遍灌入数据至SSD, 第二遍压测,结果全从SSD读取(理论命中率100%)。

NUM_WORKERS = 1 , 第二遍压测命中率符合预期(99.81%, token不足1个阶段)

NUM_WORKERS=8,启动多worker , 第二遍压测命中率差,远不足预期的99.81%,
想问下具体什么原因,我应该如何调整

Image

dynamo脚本是采样官方配置

Image

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions