windows 下 select.select()只能打开 500 出头个文件怎么解决?

2020-03-15 22:51:18 +08:00
 lithbitren

最近试了试一个新的框架 fastAPI,传说可做到到万级的 qps,想先在 win10 上试试,本来以未比不上 linux 应该还凑合吧,跟着教程搭起来了,啥都不说先来个 hello world 吧,跟 flask 本质上区别不大。

from fastapi import FastAPI

app = FastAPI()

@app.get("/")
def read_root():
    return "Hello World"

结果并发一打就死了,秒内并发超过 510 直接就崩了,崩的非常稳定,一超 510 必崩,一次都不含糊。

错误信息如下:

Process SpawnProcess-1: Traceback (most recent call last): File "d:\python37\lib\multiprocessing\process.py", line 297, in _bootstrap self.run() File "d:\python37\lib\multiprocessing\process.py", line 99, in run self._target(*self._args, **self._kwargs) File "d:\python37\lib\site-packages\uvicorn\subprocess.py", line 61, in subprocess_started target(sockets=sockets) File "d:\python37\lib\site-packages\uvicorn\main.py", line 382, in run loop.run_until_complete(self.serve(sockets=sockets)) File "d:\python37\lib\asyncio\base_events.py", line 566, in run_until_complete self.run_forever() File "d:\python37\lib\asyncio\base_events.py", line 534, in run_forever self._run_once() File "d:\python37\lib\asyncio\base_events.py", line 1735, in _run_once event_list = self._selector.select(timeout) File "d:\python37\lib\selectors.py", line 323, in select r, w, _ = self._select(self._readers, self._writers, [], timeout) File "d:\python37\lib\selectors.py", line 314, in _select r, w, x = select.select(r, w, w, timeout) ValueError: too many file descriptors in select()

重点就是最后一句。

# ValueError: too many file descriptors in select()错误和解决

上面说 “因为 asyncio 内部用到了 select,而 select 就是系统打开文件数是有限度的,这个其实是操作系统的限制,linux 打开文件的最大数默认是 1024,windows 默认是 509,超过了这个值,程序就开始报错, 下面的代码一次性将处理 url 的函数作为任务扔进了一个超大的 List 中,这就引起了错误。”

上面的解决方法是用 asyncio.Semaphore(500)限制协程并发数,但说的是爬虫,服务端直接这样设定是没用的,StackOverflow 大多说的也是这个。

python 异步编程之 asyncio (百万并发)

"假如你的并发达到 2000 个,程序会报错:ValueError: too many file descriptors in select()。报错的原因字面上看是 Python 调取的 select 对打开的文件有最大数量的限制,这个其实是操作系统的限制,linux 打开文件的最大数默认是 1024,windows 默认是 509,超过了这个值,程序就开始报错。这里我们有三种方法解决这个问题:

1.限制并发数量。(一次不要塞那么多任务,或者限制最大并发数量)

2.使用回调的方式。

3.修改操作系统打开文件数的最大限制,在系统里有个配置文件可以修改默认值,具体步骤不再说明了。

不修改系统默认配置的话,个人推荐限制并发数的方法,设置并发数为 500,处理速度更快。"

其中第三点说可以改配置,我搜了半天也找不到这配置在哪改,网上有几个提到改注册表的,但试过了都没用,而且应该不是一回事。

系统进程打开文件最大句柄数的限制

根据最大打开文件数,又找到了一个 c 的解决方案,于是我试着引了一个 c 扩展执行,想着就觉得没用,事实也没用。

c:

void set_max_stdio()
{
    printf("%d \n", _getmaxstdio()); // 默认输出 512
    _setmaxstdio(2048); // 如果设定值大于 2048,就会变回 512
    printf("setmaxstdio: %d \n", _getmaxstdio()); // 正常会输出 2048
}

python:

from ctypes import cdll
cdll.LoadLibrary("./setmaxstdio.so").set_max_stdio()
# 会正常打印 2048,但对并发限制没有影响

Google,GitHub 和 StackOverflow 也找不到解决方案,当然大概率是因为英语太菜,找不到关联信息,

所以问问大佬这个 select 的问题在 win10 里有没有可能解决,发出来大家讨论讨论。

7116 次点击
所在节点    Python
53 条回复
janxin
2020-03-16 20:43:02 +08:00
Windows 是事件循环实现的问题导致的,测试需要在 Linux 下进行,Mac 下的性能也不如 Linux
janxin
2020-03-16 20:46:17 +08:00
进程资源消耗比线程要重很多,所以不会是一个进程对应一个连接。

这个问题过于广,建议还是看一下比较详细的描述
http://www.kegel.com/c10k.html
v2eeeeee
2020-03-16 20:52:42 +08:00
@janxin 谢谢你!线程按说应该也是有个上限,很好奇万级 qps 的压测发起段是怎么做到的
roundgis
2020-03-17 00:30:55 +08:00
windows 有个宏叫 FD_SETSIZE cpython 设置为 512, 你可以手动改大一些,例如 16384 之类就可以支持更大的并发了

当然 windows 最好的还是用 IOCP
lithbitren
2020-03-17 01:28:24 +08:00
@roundgis FD_SETSIZE 怎么改啊,大佬明示。
ysc3839
2020-03-17 02:10:13 +08:00
@lithbitren 写在系统头文件里面的,改了要重新编译。
msg7086
2020-03-17 04:54:30 +08:00
三个系统的事件接口都不一样,Windows 下是 IOCP,Linux 下是 epoll,BSD 下是 kqueue,生产环境下肯定要看是否支持这个系统的 API。如果你的运行环境只支持 epoll,那 Windows 和 BSD 下就只能降级运行了。
loqixh
2020-03-17 11:36:07 +08:00
@wwqgtxx 汗,不好意识,我搞错了,我以为说的是 libuv 里的 uvloop 函数
roundgis
2020-03-17 14:48:04 +08:00
@lithbitren cpython 我记得没错 select module 重新编译就好了
lithbitren
2020-03-17 15:03:20 +08:00
@roundgis 我也不是想当伸手党,不过重新编译 cpython 这真不太懂,也找不到清晰的教程,select 模块我也找不到在 python 根目录的对应文件,怕乱搞搞崩了。。
lithbitren
2020-03-18 17:23:45 +08:00
确认了一下,uvicorn 在参数设置里可以把 loop 设置为 uvloop 和 iocp,不过这两个选项在 windows 里都不支持,只支持 auto 的 asyncio。
ruanimal
2020-03-20 15:04:05 +08:00
lz 探索操作系统的精神值得肯定,学习框架的效率就不行了
lithbitren
2020-03-20 17:23:04 +08:00
@ruanimal 过完了一遍才测性能的,web 框架大体都是相通的,过一遍文档了解 API 的存缺情况就差不多了,而且一般也不会拿纯 win 做生产环境,这种问题在框架里一般也很难碰上。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/653100

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX