-
Notifications
You must be signed in to change notification settings - Fork 449
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
用户调用多,出现bug,到2500后自动卡死 #2001
Comments
@qinxuye 请大神指点下 |
有没有更多日志? |
@codingl2k1 日志文件里没有其他的警告和报错 只是不断的输出上述内容 每增加10个client就增加一行 现在不清楚100的限制是在哪里添加的 如何可以修改100的限制还有2500,其实不影响使用 |
This |
|
我用的0.10.3版本,日志里也经常看到类似于WARNING Actor caller has created too many clienta (1750 >= 100), the global router may not be set的告警日志,这是因为客户端请求完成后没有释放连接资源吗 |
用户并发很低的 |
这个问题我们一直没法重现,你们 pip list 下提供下版本。以及什么模型,什么引擎提供下。 |
你好,我们这边使用的是python3.10.11版本,xinference使用的是0.10.3版本,模型使用的是Qwen1.5-32B-Chat,推理引擎使用的vllm,python依赖如下 |
same issue |
也是上面一样的日志吗? |
logs/local_1729066531438/xinference.log打印: |
System Info / 系統信息
Ubuntu20.04 CUDA12.2.0
Running Xinference with Docker? / 是否使用 Docker 运行 Xinfernece?
Version info / 版本信息
0.13.0
The command used to start Xinference / 用以启动 xinference 的命令
官方docker启动命令
Reproduction / 复现过程
log文件中的内容
-06-26 01:57:22,996 xoscar.backends.core 1 WARNING Actor caller has created too many clienta (1750 >= 100), the global router may not be set.2024-06-26 02:00:53,354 xoscar.backends.core 1 WARNING Actor caller has created too many clients (1760 >= 100), the global router may not be set.
用户调用数量多后 就会出现此问题,Clients到2500,运行模型自动注销了,且没有释放显存。
是否是docker安装无法支持多用户调用,pip安装是否有此问题
Expected behavior / 期待表现
多用户情况下,正常使用
The text was updated successfully, but these errors were encountered: