我想从一组中文字符串中取得关键词,如“出版社”,然后将“朝华出版社”赋值给publisher。但是不知道应该怎么做,已经做了如下尝试。希望能够得到解答。
python
>>>import sys >>>reload(sys) >>>sys.setdefaultencoding('utf8') >>> >>>import re >>>text = ''' 出版社: 朝华出版社 出版年: 2007-12 页数: 752 定价: 49.80元 装帧: 平装 ISBN: 9787505417670 ''' >>>re.findall(r'出版社:(.*?)'.encode('utf-8'), text.encode('utf-8')) ['']
一只甜甜圈
料青山看我应如是
相关分类