本文基于Thrift-0.10,使用Python实现服务器端,使用Java实现客户端,演示了Thrift RPC调用示例。Java客户端提供两个字符串参数,Python服务器端计算这两个字符串的相似度,并返回相似度结果(double类型,范围[0, 1],0表示不相似,1表示完全相同)
一,环境安装
开发环境:Windows10,PyCharm2016,Anaconda3,Python3.6
首先安装python 的thrift包:windows打开Anaconda prompt,输入:conda install -c anaconda thrift 安装thrift包。
输入:conda list 可查看系统中已经安装了哪些包,及包的版本,如下图所示:我们安装的是:thrift-0.10.0
在写代码之前,需要先定义一个 .thrift文件,然后使用Thrift Compiler生成相应的Thrift服务需要依赖的“文件”
①定义.thrift文件
namespace py similarityservice namespace java similarityservice service ChatSimilarityService{ double similarity(1:string chat1, 2:string chat2), }
namespace提供了一种组织代码的方式。其实就是,生成的文件放在:similarityservice这个文件夹下。
由于前面的Python安装的thrift-0.10,因此在官网上下载:thrift-0.10.exe,将它放在与 .thrift相同的目录下,cmd切换到该目录下,执行命令:
.\thrift-0.10.0.exe --gen py chat_similarity.thrift
生成的文件如下,将它们放在合适的python包下,即可供python 服务端程序 import 了。
二,Python服务端实现
pycharm thrift插件支持
可以去pycharm插件官网下载一个thrift插件,安装好之后,编写 .thrift 文件能够自动补全提示。
服务端的实现 主要有以下五方面:(个人理解,可能有错)
①Handler
服务端业务处理逻辑。这里就是业务代码,比如 计算两个字符串 相似度
②Processor
从Thrift框架 转移到 业务处理逻辑。因此是RPC调用,客户端要把 参数发送给服务端,而这一切由Thrift封装起来了,由Processor将收到的“数据”转交给业务逻辑去处理
③Protocol
数据的序列化与反序列化。客户端提供的是“字符串”,而数据传输是一个个的字节,因此会用到序列化与反序列化。
④Transport
传输层的数据传输。
⑤TServer
服务端的类型。服务器以何种方式来处理客户端请求,比如,一次Client请求创建一个新线程呢?还是使用线程池?……可参考:阻塞通信之Socket编程
TSimpleServer —— 单线程服务器端使用标准的阻塞式 I/O
TThreadPoolServer —— 多线程服务器端使用标准的阻塞式 I/O
TNonblockingServer —— 多线程服务器端使用非阻塞式 I/O
把上面生成的thrift文件复制到 thrift_service包下,如下图:
整个python 服务端的完整代码如下:
1 from thrift.protocol import TBinaryProtocol 2 from thrift.server import TServer 3 from thrift.transport import TSocket, TTransport 4 5 from text.thrift_service.similarityservice import ChatSimilarityService 6 7 from difflib import SequenceMatcher 8 from pypinyin import pinyin 9 import zhon 10 import pypinyin 11 from zhon.hanzi import punctuation 12 import re 13 14 __HOST = '127.0.0.1' 15 __PORT = 9090 16 17 18 def similar_num(list1, list2): 19 return len(set(list1).intersection(list2)) 20 21 22 def similar_ration(str1, str2): 23 return SequenceMatcher(lambda x: x == ' ', str1, str2).ratio() 24 25 class SimilarityHandler(ChatSimilarityService.Iface): 26 def __init__(self): 27 self.log={} 28 def ping(selfs): 29 print('ping') 30 31 def similarity(self, chat1, chat2): 32 #去掉中文字符串中的特殊标点符号 33 list1 = re.findall('[^{}]'.format(zhon.hanzi.punctuation), chat1) 34 list2 = re.findall('[^{}]'.format(zhon.hanzi.punctuation), chat2) 35 36 #将标点符号转换成拼音 37 pinyin1 = pinyin(list1, style=pypinyin.STYLE_NORMAL) 38 pinyin2 = pinyin(list2, style=pypinyin.STYLE_NORMAL) 39 40 #将所有的拼音统一保存到 单个list 中 41 pinyin_list1 = [word[0] for word in pinyin1] 42 pinyin_list2 = [word[0] for word in pinyin2] 43 44 #计算 list 中元素相同的个数 45 result1 = similar_num(pinyin_list1, pinyin_list2) 46 47 #list convert to string 48 str1_pinyin = ''.join(pinyin_list1) 49 str2_pinyin = ''.join(pinyin_list2) 50 #计算字符串的相似度 51 result2 = similar_ration(str1_pinyin, str2_pinyin) 52 53 print('ratio:{}, nums:{}'.format(result2, result1)) 54 return result2 55 56 57 if __name__ == '__main__': 58 handler = SimilarityHandler() 59 processor = ChatSimilarityService.Processor(handler) 60 transport = TSocket.TServerSocket(host=__HOST, port=__PORT) 61 tfact