手记

中文大写转阿拉伯数字(金额)


输入:金额的中文大写(字符串)
输出:阿拉伯数字(float或int型)


    整数部分主要是利用正则表达式进行检索,将对应项的数字与单位列表的对应项相乘并求和,小数部分也是一样的手法,但是由于可能存在只有角的情况,正则表达式不好处理,而且角、分这里涉及的情况并不多,所以我们分离处理

1. 初始化参数

    def __init__(self, word):
        """
        :param word: 用户传入的中文字符串
        初始化参数,包括:
        {
            is_int :int/float    是否为纯整数
            word:str    用作转换的中文金额
            int_part:str    整数部分字符串
            dec_part:str    小数部分字符串
            int_level:list    整数部分的单位列表
            trans_tab:dict    映射表
            pattern:_sre.SRE_Pattern    正则表达式compile规则
        }
        """
        if word.endswith('圆'):
            self.int_part = word
            self.is_int = True
        elif word.endswith('角') or word.endswith('分'):
            self.int_part = word[:word.index('圆') + 1]
            self.dec_part = word[word.index('圆') + 1:]
            self.is_int = False
        self.word = word
        self.int_level = [1, 10, 100, 1000, 10000, 100000, 1000000, 10000000, 100000000, 1000000000, 10000000000,
                           100000000000, 1000000000000]
        self.trans_tab = str.maketrans('零壹贰叁肆伍陆柒捌玖', '0123456789')
        self.pattern = re.compile('(?:(.*?)兆)?(?:(.*?)千)?(?:(.*?)百)?(?:(.*?)拾)?(?:(.*?)亿)?(?:(.*?)千)?(?:(.*?)佰)'
                                  '?(?:(.*?)拾)?(?:(.*?)万)?(?:(.*?)仟)?(?:(.*?)佰)?(?:(.*?)拾)?(.*?)圆')

2. 处理整数部分

I. 用正则表达式按照模板检索(从兆位到个位,没有对应项则为空)
II. 按照映射表执行映射后组合成数字列表
III. 将数字列表与数字单位列表的对应索引项进行相乘后求和

# 用正则表达式按照模板检索(从兆位到个位,没有对应项则为空)
word_list = re.findall(self.pattern, self.int_part)[0]
# 按照映射表执行映射后组合成数字列表
number_list = list(reversed(list(map(self.word_format, word_list))))
# 将数字列表与数字单位列表的对应索引项进行相乘后求和
print(sum(
    [int(number_list[i]) * self.int_level[i] for i in range(len(number_list))]
))

3. 处理小数部分

I. 长度为4:N角N分,获取到角和分对应的数字,映射后与单位相乘求和

if len(self.dec_part) == 4:
    dec_word_list = list(self.dec_part[0] + self.dec_part[2])
    dec_number_list = list(map(self.word_format, dec_word_list))
    dec_number = int(dec_number_list[0]) * 0.1 + int(dec_number_list[1]) * 0.01

II. 长度为3:零N分,获取到分对应的数字,执行映射后与单位相乘

elif len(self.dec_part) == 3:
    dec_number = int(self.word_format(self.dec_part[:-1])) * 0.01

III. 长度为2,N角,获取到角对应的数字,执行映射后与单位相乘

else:
    dec_number = int(self.word_format(self.dec_part[:-1])) * 0.1

4. 数据映射

    和之前提到的映射方法一致,只是将数字与汉字对调,这里有一个对字符串的处理,如果是零N的形式则将字符串替换为N,如果是空字符串,则按照执行映射

def word_format(self, word):
        """
        
        :param word: 对传入的word字符串进行映射处理
        :return: 根据传入字符串的长度进行处理后执行映射
        """
        if len(word) > 1:
            return word[-1].translate(self.trans_tab)
        elif len(word) == 0:
            return '零'.translate(self.trans_tab)
        return word.translate(self.trans_tab)

5. 数据检查

判断数据合理性

def data_check(self):
    """
    数据检查,是否符合输入要求
    :return: 传入的数据不是字符串类型或者长度越界则返回False,否则返回True
    """
    if not isinstance(self.word, str):
        return False
    if self.is_int:
        if len(self.int_part) > 26:
            return False
        else:
            return True
    else:
        if len(self.int_part) > 26 or len(self.dec_part) > 4:
            return False
        else:
            return True

1人推荐
随时随地看视频
慕课网APP