v0.9.4
1、响应消息的model和客户端model完全一致,和本身调用的模型名称不关联
2、修复ollama断开连接的问题
3、更细粒度的qpm滑动窗口实现,更加精准控制qpm,感谢 @xiaotianxt
4、支持视觉模型yi-vision和gpt-4o-mini
1、响应消息的model和客户端model完全一致,和本身调用的模型名称不关联
2、修复ollama断开连接的问题
3、更细粒度的qpm滑动窗口实现,更加精准控制qpm,感谢 @xiaotianxt
4、支持视觉模型yi-vision和gpt-4o-mini