利用python从中文中提取关键词

我想从一组中文字符串中取得关键词,如“出版社”,然后将“朝华出版社”赋值给publisher。但是不知道应该怎么做,已经做了如下尝试。希望能够得到解答。

python>>>import sys
>>>reload(sys)
>>>sys.setdefaultencoding('utf8')
>>>
>>>import re
>>>text = '''
出版社: 朝华出版社
出版年: 2007-12
页数: 752
定价: 49.80元
装帧: 平装
ISBN: 9787505417670
'''
>>>re.findall(r'出版社:(.*?)'.encode('utf-8'), text.encode('utf-8'))
['']
繁花不似锦
浏览 558回答 3
3回答

一只甜甜圈

print re.findall(r'出版社: ([\s\S]*?)\n', text)[0]

料青山看我应如是

可以使用json库: import json data=json.load(text) publisher=data["出版社"]
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python