SocketIO是一个基于websocket的封装的传输框架。在大多数对数据量要求不高的场景里,可以用于快速搭建实时数据流。SocketIO最大的优点应该是它对数据可以进行json封装,因而减去了传统socket通信中的拆包粘包的工序。
Flask-SocketIO允许在Flask的框架下直接构建SOcketIO服务,实现方式非常简单. 这里是一个基本的消息接收应答的例子
from flask import Flask, request, make_response, jsonify, session from flask_cors import CORS from flask_socketio import SocketIO '''==============================''' '''flask web server config''' '''==============================''' app = Flask(__name__, static_url_path='') app.config['SECRET_KEY'] = 'secret!' cors = CORS(app,resources={r"/*":{"origins":"*"}}) # Restful使用跨域CORS访问时通过CORS进行支持 sio = SocketIO(app) '''websocket应答消息''' @sio.on('message', namespace='/ws') def ws_message(data): ask = {'result':'OK'} sio.emit('message_back', json.dumps(ack), namespace='/ws') '''restful访问,返回json''' @app.route('/api', methods=['GET']) def api_message(): resp = make_response(jsonify({'result':'OK'}) return resp def main(): pass if __name__ == '__main__': main() sio.run(app, port=8092, host='0.0.0.0', use_reloader=False, debug=False) while True: time.sleep(10) # 防止程序退出
在简单的应用中,app和websocket可以同时共存。当服务器处于并发模式的时候,例如服务器通过多个线程向socketio emit消息的时候,如果简单采用如下的方式:
import threading thread_send_msg = threading.Thread(task_send_msg) thread_send_msg.start() def task_send_msg(): while True: time.sleep(1) msg sio.emit('message', json.dumps(msg), namespace='/ws')
你会发现,socketio的发送间隔会出现模型的延迟,而且间隔也会变得不是每秒发送一次。
那么可否采用multiprocessing?
import multiprocessing proc_send_msg = multiprocessing.Process(task_send_msg) proc_send_msg.start() def task_send_msg(): while True: time.sleep(1) msg sio.emit('message', json.dumps(msg), namespace='/ws')
测试的结果仍然会出现问题,甚至会出现flask服务完全不响应。
所以问题是什么?
查阅documentation和面向stackoverflow编程之后,发现原因在于,socketio内部采用的是协程任务调度,这样如果把emit的行为放置在线程或着进程内时,并没有解决并发emit的冲突问题。我们需要回归到coroutine的调度模式本身。在这里,采用了gevent,也可以根据自己的需求使用eventlet或者其他的模块。gevent并发模式也比较简单:
task_1(): gevent.sleep(1) print 'running task 1' task_2(): gevent.sleep(1) print 'running task 2' gevent.addall([ gevent.spawn(task_1), gevent.spawn(task_2) ])
上述的操作就是在gevent内孵化(spawn)两个协程,然后每个协程每一秒通过gevent.sleep()让出gvent供其他的协程使用。通过这个模式,我们将emit并发事件修改为这样:
socketio_msg_queue = Queue(maxsize=5000) def gtask_sockeio_emit(): while True: gevent.sleep(0.01) try: msg = socketio_msg_queue.get_nowait() except: continue print msg sio.emit(msg['on'], json.dumps(msg['data']), namespace='/ws/rt_market') gevent.addAll([ gtask_socketio_emit ])
这段代码中,我们进一步使用了一个队列将各个线程可能产生的emit事件推送到一个队列之中,然后在一个统一的协程内进行发送。
那么问题解决了么?还没有。。。
当把emit放入协程之后我们又发现,flask框架不响应了。
最大的可能就是gevent本身抢占了进程的资源,导致restful没法响应。
第一个想到的方法是把flask放入单独一个进程,例如这样:
def task_start_flask(): 'start the rest and ws server' sio.run(app, port=80, host='0.0.0.0', use_reloader=False, debug=False) proc_flask = multiprocessing.Process(target=task_start_flask) proc_flask.start()
结果两边都无法访问了。
分析之后,猜测可能是因为socketio建立需要通过web请求,因此flask在哪里启动,所有的socketio通信就会堆积在哪里,分开启动并不能解决问题。所以,第二次,我们把所有的内容都放在gevent里统一调度:
gevent.joinall([ gevent.spawn(gtask_sockeio_emit), gevent.spawn(task_start_flask), ])
至此问题解决。
后记:SocketIO从协议本身上看效率并不高,如果需要更高效率,最好还是采用原生websocket。