输入:金额的中文大写(字符串)
输出:阿拉伯数字(float或int型)
整数部分主要是利用正则表达式进行检索,将对应项的数字与单位列表的对应项相乘并求和,小数部分也是一样的手法,但是由于可能存在只有角的情况,正则表达式不好处理,而且角、分这里涉及的情况并不多,所以我们分离处理
1. 初始化参数
def __init__(self, word):
"""
:param word: 用户传入的中文字符串
初始化参数,包括:
{
is_int :int/float 是否为纯整数
word:str 用作转换的中文金额
int_part:str 整数部分字符串
dec_part:str 小数部分字符串
int_level:list 整数部分的单位列表
trans_tab:dict 映射表
pattern:_sre.SRE_Pattern 正则表达式compile规则
}
"""
if word.endswith('圆'):
self.int_part = word
self.is_int = True
elif word.endswith('角') or word.endswith('分'):
self.int_part = word[:word.index('圆') + 1]
self.dec_part = word[word.index('圆') + 1:]
self.is_int = False
self.word = word
self.int_level = [1, 10, 100, 1000, 10000, 100000, 1000000, 10000000, 100000000, 1000000000, 10000000000,
100000000000, 1000000000000]
self.trans_tab = str.maketrans('零壹贰叁肆伍陆柒捌玖', '0123456789')
self.pattern = re.compile('(?:(.*?)兆)?(?:(.*?)千)?(?:(.*?)百)?(?:(.*?)拾)?(?:(.*?)亿)?(?:(.*?)千)?(?:(.*?)佰)'
'?(?:(.*?)拾)?(?:(.*?)万)?(?:(.*?)仟)?(?:(.*?)佰)?(?:(.*?)拾)?(.*?)圆')
2. 处理整数部分
I. 用正则表达式按照模板检索(从兆位到个位,没有对应项则为空)
II. 按照映射表执行映射后组合成数字列表
III. 将数字列表与数字单位列表的对应索引项进行相乘后求和
# 用正则表达式按照模板检索(从兆位到个位,没有对应项则为空)
word_list = re.findall(self.pattern, self.int_part)[0]
# 按照映射表执行映射后组合成数字列表
number_list = list(reversed(list(map(self.word_format, word_list))))
# 将数字列表与数字单位列表的对应索引项进行相乘后求和
print(sum(
[int(number_list[i]) * self.int_level[i] for i in range(len(number_list))]
))
3. 处理小数部分
I. 长度为4:N角N分,获取到角和分对应的数字,映射后与单位相乘求和
if len(self.dec_part) == 4:
dec_word_list = list(self.dec_part[0] + self.dec_part[2])
dec_number_list = list(map(self.word_format, dec_word_list))
dec_number = int(dec_number_list[0]) * 0.1 + int(dec_number_list[1]) * 0.01
II. 长度为3:零N分,获取到分对应的数字,执行映射后与单位相乘
elif len(self.dec_part) == 3:
dec_number = int(self.word_format(self.dec_part[:-1])) * 0.01
III. 长度为2,N角,获取到角对应的数字,执行映射后与单位相乘
else:
dec_number = int(self.word_format(self.dec_part[:-1])) * 0.1
4. 数据映射
和之前提到的映射方法一致,只是将数字与汉字对调,这里有一个对字符串的处理,如果是
零N
的形式则将字符串替换为N
,如果是空字符串,则按照零
执行映射
def word_format(self, word):
"""
:param word: 对传入的word字符串进行映射处理
:return: 根据传入字符串的长度进行处理后执行映射
"""
if len(word) > 1:
return word[-1].translate(self.trans_tab)
elif len(word) == 0:
return '零'.translate(self.trans_tab)
return word.translate(self.trans_tab)
5. 数据检查
判断数据合理性
def data_check(self):
"""
数据检查,是否符合输入要求
:return: 传入的数据不是字符串类型或者长度越界则返回False,否则返回True
"""
if not isinstance(self.word, str):
return False
if self.is_int:
if len(self.int_part) > 26:
return False
else:
return True
else:
if len(self.int_part) > 26 or len(self.dec_part) > 4:
return False
else:
return True