python實現數字規整(轉中文)

1.思路根據正則匹配數字類型比如手機號、年月日等進行相對的數字規整

話不多說直接上代碼,有新的類型可以按照當前方案進行新增


import redef match_year_digit(match):m = str(match.group())relation = {'1': '一', '2': '二', '3': '三', '4': '四', '5': '五', '6': '六', '7': '七', '8': '八', '9': '九', '0': '零','年': '年'}return ''.join([relation[i] for i in m])def time_thin_filter(sequence):time_thin_reg = re.compile(r'(?P<hour_part>\d{1,2})[:|:](?P<minute_part>\d{1,2})([:|:])?(?P<second_part>(\d{1,2}))?')result = time_thin_reg.search(sequence)unit_list = ['時', '分', '']reg_list = []try:hour_part = result.group('hour_part')reg_list.append(match_common_number(hour_part))reg_list.append(unit_list[0])minute_part = result.group('minute_part')reg_list.append(match_common_number(minute_part))reg_list.append(unit_list[1])second_part = result.group('second_part')reg_list.append(match_common_number(second_part))reg_list.append(unit_list[2])except IndexError as e:print('')finally:return ''.join(reg_list)return ''def date_thin_filter(match):sequence = str(match.group())time_thin_reg = re.compile(r'(?P<year_part>[1|2]\d{3})[-|\/](?P<month_part>(1[0-2]|[1-9]))(-|\/)?(?P<day_part>(3[0-1]|2[0-9]|1[0-9]|0?[1-9]))?')result = time_thin_reg.search(sequence)unit_list = ['年', '月', '日']reg_list = []try:year_part = result.group('year_part')if re.findall('[21][0-9]{3}', year_part):year_part = re.sub(u'[21][0-9]{3}', match_year_digit, year_part)else:year_part = match_common_number(year_part)reg_list.append(year_part)reg_list.append(unit_list[0])month_part = result.group('month_part')reg_list.append(match_common_number(month_part))reg_list.append(unit_list[1])day_part = result.group('day_part')reg_list.append(match_common_number(day_part))reg_list.append(unit_list[2])except IndexError as e:print('')finally:print(sequence,''.join(reg_list))return ''.join(reg_list)def percent_than(match):m = str(match.group())percent_filter = re.compile(r'(?P<percent_part>\d[\.\d]+)(?P<percent_mark>%)')result = percent_filter.search(m)try:percent_part = result.group('percent_part')if percent_part:x = match_common_number(percent_part)s = re.sub(percent_filter, '百分之' + x, m)return sexcept Exception as e:pass
def iphone_replace(match):m = str(match.group())relation = {'1': '幺', '2': '二', '3': '三', '4': '四', '5': '五', '6': '六', '7': '七', '8': '八', '9': '九', '0': '零'}return ''.join([relation[i] for i in m])
def first_number_filter(sequence="", count=4):# 數字是“年份”的情況,返回轉化成中文的結果# (1)過濾手機號\工號(有新增版式的可以按照當前方式新增)iphone_rule=r"(?<!\d)1\d{10,15}|10086|12345|(?<!\d)0\d+"if re.findall(iphone_rule, sequence):sequence = re.sub(iphone_rule, iphone_replace, sequence, count=count)# (1)過濾年份,上個世紀的,本世紀的可以不用if re.findall('[21][0-9]{3}年', sequence):sequence = re.sub(u'[21][0-9]{3}年', match_year_digit, sequence, count=count)# (2)過濾百分比if re.findall('\d[\.\d]+%', sequence):print(re.findall('\d[\.\d]+%', sequence))sequence = re.sub(u'\d[\.\d]+%', percent_than, sequence, count=count)# (3)過濾時間# time_filter:能匹配'12:09:00~12:31:30' '12:09:00'time_filter = re.compile(r'(?P<start_time_part>\d{1,2}([:|:]\d{1,2}){1,2})(?P<time_mark>(~|-)?)(?P<end_time_part>(\d{1,2}([:|:]\d{1,2}){1,2})?)')result = time_filter.search(sequence)time_substitude_part = ''try:start_time_part = result.group('start_time_part')time_substitude_part = time_substitude_part + time_thin_filter(start_time_part)time_mark_part = result.group('time_mark')time_substitude_part += '到'end_time_part = result.group('end_time_part')time_substitude_part += time_thin_filter(end_time_part)except Exception as e:print('')if time_substitude_part:sequence = re.sub(time_filter, time_substitude_part, sequence)# (4)過濾日期if re.findall('[1|2]\d{3}[-|\/](?:1[0-2]|[1-9])[-|\/](?:3[0-1]|2[0-9]|1[0-9]|0?[1-9])', sequence):print('aaa',re.findall('[1|2]\d{3}[-|\/](?:1[0-2]|[1-9])[-|\/](?:3[0-1]|2[0-9]|1[0-9]|0?[1-9])', sequence))sequence = re.sub(u'[1|2]\d{3}[-|\/](?:1[0-2]|[1-9])[-|\/](?:3[0-1]|2[0-9]|1[0-9]|0?[1-9])', date_thin_filter, sequence, count=count)print("ssss",sequence)# (last)過濾其他數字print(sequence,"s")return re.sub(u'[\d\.]+', match_common_number, sequence)recursive_depth = 0
def match_common_number(match):global recursive_depthrelation = {'1': '一', '2': '二', '3': '三', '4': '四', '5': '五', '6': '六', '7': '七', '8': '八', '9': '九', '0': '零','年': '年'}if type(match) == type("") and "." in match:match, match1 = match.split(".")mh1 = "".join([relation[i] for i in match1])# recursive_depth = 0number = match if (type(match) is type('')) else match.group()if "." in number:number, number1 = number.split(".")mh1 = "".join([relation[i] for i in number1])# 數字非年份的情況,返回轉化成中文的結果str_number = str(number)if len(str_number) > 4:str_number = str_number[-4:]bits = "零 一 二 三 四 五 六 七 八 九".split(" ")units = " 十 百 千".split(" ")large_unit = ' 萬 億 兆'.split(" ")  # 可擴展,以萬為單位number_len = len(str_number)result = ""for i in range(number_len):result += bits[int(str_number[i])]if str_number[i] != "0":result += units[number_len - i - 1]# 去除連續的零while "零零" in result:result = result.replace("零零", "零")# 去除尾部的零if result[-1] == "零":result = result[:-1]# 調整10~20之間的數if result[:2] == "一十":result = result[1:]try:result= result + "點" + mh1except Exception as e:pass# 字符串連接上大單位result += large_unit[recursive_depth]# print(result)# 判斷是否遞歸if len(str(number)) > 4:recursive_depth += 1return first_number_filter(str(number)[:-4], recursive_depth) + resultelse:recursive_depth=0return resultif __name__ == '__main__':# print(first_number_filter("1989-12-12嘿1998-12-12"))# print(first_number_filter("1989年2024年55.5%h55.0%"))# print(first_number_filter("55.0%he2.0"))# print(first_number_filter("2024年02月01日"))# print(first_number_filter("1999-12-30he2024年02月01日,1922-12-30"))print(first_number_filter("1999-12-30,1922-12-8"))print(first_number_filter("10086和15221331963he1012"))

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/711393.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/711393.shtml
英文地址,請注明出處:http://en.pswp.cn/news/711393.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

WPF真入門教程31--WPF版房屋租售系統

1、教程回顧 到現在為止&#xff0c;“蒸”入門系列教程已完成了30刺由淺入深地講解&#xff0c;當然不可能講到了WPF的所有技能點&#xff0c;但讀者看到了wpf的內部各種功能及之間的聯系&#xff0c;在此基礎上&#xff0c;再提供一個完整有效的綜合項目&#xff0c;本項目采…

tcp的三次握手和四次揮手?

一&#xff1a;引出 客戶端與服務器之間數據的發送和返回的過程當中需要創建一個叫TCP connection的東西&#xff1b;由于TCP不存在連接的概念&#xff0c;只存在請求和響應&#xff0c;請求和響應都是數據包&#xff0c;它們之間都是經過由TCP創建的一個從客戶端發起&#xff…

身份驗證錯誤。要求的函數不受支持。遠程計算機:[IP地址]。這可能是由于CredSSP加密數據庫修正

出現“身份驗證錯誤。要求的函數不受支持。遠程計算機&#xff1a;[IP地址]。這可能是由于CredSSP加密數據庫修正”的問題&#xff0c;通常是因為Windows更新后&#xff0c;遠程桌面連接&#xff08;RDP&#xff09;的安全性增強&#xff0c;特別是與CredSSP&#xff08;Creden…

[RoarCTF 2019]Easy Calc

這題考查的是: 字符串解析特性目錄讀取文件內容讀取 字符串解析特性詳解&#xff1a;PHP字符串解析特性 &#xff08;$GET/$POST參數繞過&#xff09;&#xff08;含例題 buuctf easycalc&#xff09;_參數解析 繞過-CSDN博客 ascii碼查詢表&#xff1a;ASCII 表 | 菜鳥工具 …

AI智能雷達名片小程序平臺版源碼系統 帶完整的安裝代碼包以及安裝部署教程

在當今數字化快速發展的時代&#xff0c;人工智能&#xff08;AI&#xff09;已滲透到各個領域&#xff0c;尤其是在商務溝通領域&#xff0c;傳統的名片已經不能滿足現代商業的需求。小編給大家分享一款名為“AI智能雷達名片小程序平臺版”的源碼系統&#xff0c;該系統不僅提…

【Linux】將程序的輸出顯示到屏幕,同時寫入到log文件

1. 將程序的輸出顯示到屏幕&#xff0c;同時寫入到log文件 nohup python -u main.py 2>&1 | tee -a log.txt &nohup 放在命令的開頭&#xff0c;表示不掛起&#xff08;no hang up&#xff09;&#xff0c;也即&#xff0c;關閉終端或者退出某個賬號&#xff0c;進…

知乎引流秘籍:玩轉知乎,掘金百萬流量!

知乎&#xff0c;擁有3億注冊用戶、日新增用戶8萬的超級內容平臺&#xff0c;已然成為流量洼地。如何玩轉知乎&#xff0c;掘金百萬流量&#xff1f;這份1500字的實操指南&#xff0c;為你揭秘&#xff01; 一、知乎的優勢&#xff1a;流量大、長尾效應強 1. 流量大&#xff…

QA核心競爭力

核心競爭力的三個階段 我們知道&#xff0c;不同的工作和任務所需要的核心能力不同&#xff0c;因而核心競爭力也就不相同。QA 的入門門檻比較低&#xff0c;這也是 QA 這個群體產生恐慌和焦慮的主要原因。這個群體所涉及的技術面和技能棧非常廣&#xff0c;所以整個職業生涯的…

46-全排列(回溯算法)

題目 給定一個不含重復數字的數組 nums &#xff0c;返回其 所有可能的全排列 。你可以 按任意順序 返回答案。 示例 1&#xff1a; 輸入&#xff1a;nums [1,2,3] 輸出&#xff1a;[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[3,1,2],[3,2,1]] 示例 2&#xff1a; 輸入&#xff1a;nu…

商業銀行移動支付發展探析

一、支付交換標準的迭代      銀行卡支付交換標準基于ISO 8583-1987《產生報文的金融交易卡交換報文規范》為發展基礎&#xff0c; 經過30年的產品及應用變革&#xff0c; 支撐交換標準整體框架的數據格式日益顯現其弊端。新型與傳統業務交織&#xff0c; 衍生出多個技術標…

提升智能客服機器人的語義理解能力:理解用戶的語義和意圖

智能客服機器人的發展已經成為現代服務業的一大亮點。它們不僅能夠提供724小時不間斷的服務&#xff0c;而且能夠處理大量的用戶請求&#xff0c;大大提高了服務效率。然而&#xff0c;盡管智能客服機器人的技術已經取得了顯著的進步&#xff0c;但其語義理解能力仍有待提高。為…

List去除重復數據的五種方式

1、使用 LinkedHashSet 刪除 arraylist 中的重復數據 LinkedHashSet 是在一個 ArrayList 刪除重復數據的最佳方法。LinkedHashSet 在內部完成兩件事&#xff1a; 刪除重復數據 保持添加到其中的數據的順序 Java 示例使用 LinkedHashSet 刪除 arraylist 中的重復項。在給定的示例…

【Linux雜貨鋪】調試工具gdb的使用

目錄 &#x1f308;前言&#x1f308; &#x1f4c1;背景介紹 &#x1f4c1; 使用 list [行號] / [函數名] run/r break/b [行號] / [函數名] info break disable break enable break delete break [斷點編號] next/n step/s continue/c finish print/p [變量…

06 vim工具

目錄 概念模式基本操作配置 1. 概念 vim是一個歷史悠久的,多模式的編輯器&#xff0c;是vi的升級版。和ide不同&#xff0c;編輯器僅能編寫文本&#xff0c;不能運行代碼&#xff0c;現階段的代碼編譯的各個過程會分開按步驟執行 2. 模式 vim有很多種模式&#xff0c;想要編…

方格分割644--2017藍橋杯

1.用dfs解決&#xff0c;首先這題的方格圖形就很像一個走迷宮的類型&#xff0c;迷宮想到dfs&#xff0c;最中心點視為起點&#xff0c;起點有兩個小人在這個方格里面對稱行動&#xff0c;直到走出迷宮&#xff08;一個人走出來了另一個人就也走出來了&#xff0c;而走過的點會…

Vmware Esxi 部署Mac OS虛擬機

Vmware Esxi在創建虛擬機的時候是有Mac OS選項的&#xff0c;但是實際創建時&#xff0c;選擇ISO開機后一直反復引導&#xff0c;是有問題的&#xff0c;原因是需要先解鎖&#xff0c;需要在ESXI主機上修改配置并重啟。 首先找到管理-服務-TSM-ssh&#xff0c;點擊啟動&#x…

華納云:linux中tftp命令使用無效怎么解決

如果在Linux中使用TFTP命令時遇到問題&#xff0c;可能是由于以下幾種原因導致的&#xff0c;你可以嘗試以下方法解決&#xff1a; 檢查TFTP服務器是否正確配置&#xff1a;首先確保你正在連接的TFTP服務器已經正確配置并正在運行。你可以使用網絡工具(如ping命令)檢查與TFTP服…

★【二叉搜索樹(中序遍歷特性)】【 ★遞歸+雙指針】Leetcode 98. 驗證二叉搜索樹

★【二叉搜索樹&#xff08;中序遍歷特性&#xff09;】【 ★遞歸雙指針】Leetcode 98. 驗證二叉搜索樹 二叉搜索樹 98. 驗證二叉搜索樹解法1 笨 中序遞歸遍歷為一個數組 然后判斷數組是不是升序排列就可以★解法2 不使用數組 遞歸法 ---------------&#x1f388;&#x1f38…

【力扣】無重復字符的最長子串,滑動窗口 + 哈希集合

無重復字符的最長子串原題地址 方法一&#xff1a;滑動窗口&#xff08;雙指針&#xff09; 哈希集合 考慮找出字符串s的所有的無重復字符的子串&#xff0c;求出這些子串長度的最大值即可。 使用下標 [left,right] 來維護子串。我們只需要找到每一個 left 對應的所有 righ…

php PhpSpreadsheet 讀取日期變數字問題解決

問題描述&#xff1a; 使用PhpSpreadsheet 讀取表格數據&#xff0c;日期格式讀取后變成數字&#xff0c;如下圖&#xff1a; 解決方案&#xff1a; $cell $sheet->getCell(H . $row)->getValue(); $toTimestamp \PhpOffice\PhpSpreadsheet\Shared\Date::excelToTimes…