从零到你的第一次评测,所需的一切。
使用 Docker 的推荐路径大约需要 5 分钟:
docker compose up
最容易浪费时间的做法是:Smoke Test 用一个模型,评测用另一个。请用你真正打算评测的那个模型名。