“記賬”很麻煩,看這場競賽中的隊伍與合合信息是如何解決問題的

在我們日常生活中或多或少都會有記賬的情況,以此來對自己的收支和消費習慣進行分析,來幫助自己減少不必要的開支,優化財務決策、合理分配資金,減少財務壓力和不必要的浪費。

但記賬這個動作本身就是一件比較麻煩的。雖然現階段有很多APP應用來幫助我們進行記賬,不再像原來一樣需要手寫記錄,但還是存在比較多的問題。比如:每記錄一筆都要手動點選分類,長期下來很浪費時間。另外,如果想自動記賬還得授權支付應用的權限接口給記賬程序,這樣會對財產造成安全隱患。

剛好,在最近的“中國大學生服務外包創新創業大賽”上就有大學生團隊針對記賬問題提供了它們的解決方案。

首先,介紹一下什么是中國大學生服務外包創新創業大賽

中國大學生服務外包創新創業大賽是在為了積極響應國家關于鼓勵服務外包產業發展、加強服務外包人才培養的相關戰略舉措與號召而衍生出的全國性競賽,該賽事自2010年創立以來,成為服務外包產業領域的國家級賽事。尤其在本屆大賽上共有803所全國院校的8006支團隊報名參賽,報名團隊數再創新高!可以說是非常有影響力的一項賽事。

本屆大賽的內容設計充分聚焦企業發展中所面臨的技術、管理等現實問題,與產業的結合度更緊密,其中智能文字識別技術是大賽重點關注的技術之一。

合合信息作為國內外智能文字識別領域領先的科技企業,基于自身在行業領域的認知,從“基于智能文字場景個人財務管理創新應用”等議題出發,向廣大學生群體發出了“產品征集令”,相關賽題吸引了全國70多所高校的近300支隊伍積極參與,也涌現出許多優秀的作品。

尤其是中南大學研發的“記賬全能王”讓我印象深刻,該應用非常有效的解決了現行業現狀記賬的痛點:

他們團隊首先對大量用戶調研,分析出綁定支付自動記賬和圖片識別記賬更受歡迎,尤其是在45-60歲的中年用戶:

也調研了市面常見的記賬類APP,指出了它們現階段存在的幾大問題,尤其是自動記賬導致隱私過度收集這一塊做了充分的說明:

它們也針對該問題,在APP中提供了通過識別賬單圖片來錄入賬單信息的方式進行記賬:

這個功能看似很簡單,實際難度是很大的!

雖然這個功能核心步驟就兩個:票據圖片識別、提取信息。

但要做好這兩步需要下很大的功夫。首先,票據種類特別多,二是票據本身保存不好的話,會有很多褶皺或者字跡不太清晰的情況,三是因拍攝環境復雜的原因會導致圖片反光、明暗不同等呈現質量差的問題。這樣就會導致在識別的時候很容易造成識別不準確或識別失敗的情況。

他們為了解決票據識別的問題,使用了合合信息提供的智能文字識別服務平臺接口來對票據進行識別及預處理,該接口支持識別的票據種類非常多、無論是發票、火車票、金融票據等都能提供精度很高的識別效果:

圖片識別出文本后,就需要對其進行預處理,這一步驟通常包括去除標點符號、數字和特殊字符,將文本轉換為小寫,以及進行分詞。他們采用了jieba這個專為中文文本設計的分詞工具庫進行分詞,然后將文本中的詞語轉換為數值向量,以便計算機能夠理解和處理,最后再對圖片中的賬單信息部分進行文本分類與信息關系抽取,抽取出具體的金額、地點、店鋪等信息,也就是命名實體識別(NER)

什么是命名實體識別(NER)呢?

是指識別文本中具有特定意義的實體,主要包括人名、地名、機構名、專有名詞等等,并把我們需要識別的詞在文本序列中標注出來。

舉個例子就很容易理解,比如現在有一段文本:

我和張三昨天去看了蜘蛛俠,感覺還不錯,下周還想去看阿凡達,你要跟我們一起嗎?

我們要在上面文本中識別出電影名稱的信息,那么我們需要識別出來內容則是:蜘蛛俠、阿凡達。

而對于上述提到的賬單識別而言,我們則需要把圖片包含的文本信息中的賬單相關部分提取出來并排除掉與其無關的信息,這就是典型的命名實體識別。

中南大學為了處理這個問題,使用了基于谷歌BERT(Bidirectional Encoder Representations from Transformers)衍生的Bert-Chinese作為預訓練模型:

?然后將各種票據類型數據輸入到模型中并進行訓練。訓練完成后再進行微調,運用到下流任務(如賬單類別判定)等任務中,最后提取出賬單信息,整個的算法步驟流程圖如下圖所示:

?他們團隊所使用的技術路線如下圖所示:

我也使用了“記賬全能王”app測試了一下,效果也是很不錯的:

?識別結果

中南大學團隊整體表現在我看來是非常亮眼的,不僅洞悉了“中老年人使用記賬本應用需要經歷繁瑣的操作”現象背后發現“圖片識別記賬方式更受歡迎”的趨勢,并針對性地進行產品優化,還靈活地將合合信息智能圖像識別模塊與小票識別的API落地到記賬場景中,再結合大模型將復雜的小票信息秒速轉換成了簡潔、高效的數據輸入,這是非常難能可貴的。

另外我還認為該類應用具有不錯的前景和商業價值,國務院印發的《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》《新一代人工智能發展規劃》等文件中也提到:人工智能在個人財務管理領域的深入應用,有利于推動個人財務管理數字化,幫助消費者以較低的成本,實現消費的合理安排、財務風險的可靠保障以及錢財的最優跨期配置。在國家大力支持的背景下,該賽道一定具有不錯的未來!


在中國信通院進行的測試中,合合信息智能文字識別產品順利通過全部7項基礎類功能指標測試以及9項增強類功能指標測試,獲得“增強級”評級,其智能文字識別產品展現出良好的性能和服務成熟度。

以具有較大難度的證件類和票據類性能測試為例,面對旋轉、陰影、反光、褶皺、形變、模糊、多語言、低像素、光照不均等復雜場景,合合信息智能文字識別產品均有較高的識別準確率,字符準確率分別為99.21%和99.59%,字段準確率分別為97.87%和98.42%。

其實,中南大學利用合合信息票據識別接口來識別票據的功能只是合合信息眾多功能中的一小部分,除此之外合合信息還有很多強大的功能和產品,特別是他們推出的掃描全能王、名片全能王等智能文字識別產品已經服務全球上百個國家和地區的上億用戶。

在去年我也使用過合合科技的PS檢測和摩爾紋去除等服務,效果都很不錯,特別是PS檢測上,這一直是很多行業迫切需要解決的難點,特別是在保險、金融、銀行等領域,如果將虛假篡改過的信息資料審核通過可能會帶來巨大的影響甚至是經濟上的損失:

今年也看到合合信息團隊對圖像篡改檢測“黑科技”持續優化升級,應用面也拓展至“截圖篡改檢測”:除了原本支持的文檔、證書、證件等自然場景圖像的識別檢測外,還支持轉賬記錄、交易記錄、聊天記錄等多種截圖的識別檢測,無論是從原圖中“摳下”關鍵要素后移動“粘貼”至另一處的“復制移動”圖片篡改手段,還是“擦除”、“重打印”等方式,圖像篡改檢測技術均可“慧眼”識假!

不難看出,合合信息的產品不僅質量高且具有十足的多樣性,能應用的領域也非常廣泛。

通過這次的大賽也可以看到,現代學生的作品不再局限于傳統互聯網思維下的應用開發,而是逐漸發展為結合人工智能、大模型進行創新、創造新時代的產品,也真正實現了“用新技術解決舊問題”。

還能夠感受到的是,現階段企業對于人才的需求人從單一性變為多樣性了,知識面單一的人才顯然已經不能滿足時代需求,因此交叉學習也越來越重要。

舉辦該大賽還有一個重要的目的是:促成校企雙方在科研項目、人才培養等方面深度合作,助推產學研用協同創新發展。因此,大賽對參賽作品的評分標準也十分“仿真”,涉及技術資源及經濟成本控制,對項目創意前景的判斷、對市場需求的分析等方面,覆蓋商業價值、社會應用價值等多方面的評估。

CharGPT以及其他生成式AI的爆火讓我們清晰的感受到未來一定是人工智能的時代,行業也會渴望每一位對專業學術領域有著深刻獨到理解,具備構建解決方案潛力的人才。

在大賽的閉幕式上,合合信息人力行政部負責人杜杰介紹了他們公司的人才培養計劃:

“企業期望與新一代青年才俊共同開拓科技新場景。在時代進步的每一個階段,我們都需要不同的新生力量來創造新的可能性。”杜杰表示,現階段,合合信息通過“星火計劃”等系列人才培育計劃和配套分享平臺,助力科技青年在實踐中強化專業能力,未來也將持續聯合高校和行業機構,共同探索產學研融合之路,讓大學生們創新的科技靈感能夠更便捷地尋找沃土里,從而“落地生花”。

相信它們的舉措以及大賽的繼續開展會持續影響更多的從業者!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/39133.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/39133.shtml
英文地址,請注明出處:http://en.pswp.cn/news/39133.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

數據結構入門 — 時間復雜度、空間復雜度

前言 數據結構_空間復雜度_時間復雜度講解_常見復雜度對比 本文介紹數據結構中的時間復雜度和空間復雜度 ***文章末尾,博主進行了概要總結,可以直接看總結部分*** 博主博客鏈接:https://blog.csdn.net/m0_74014525 點點關注,后期…

哈夫曼樹(赫夫曼樹、最優樹)詳解

目錄 哈夫曼樹(赫夫曼樹、最優樹)詳解 哈夫曼樹相關的幾個名詞 什么是哈夫曼樹 構建哈夫曼樹的過程 哈弗曼樹中結點結構 構建哈弗曼樹的算法實現 哈夫曼樹(赫夫曼樹、最優樹)詳解 哈夫曼樹相關的幾個名詞 路徑:…

2023牛客暑期多校訓練營8(A/H/I/J)

目錄 A.Alive Fossils H.Insert 1, Insert 2, Insert 3, ... I.Make It Square J.Permutation and Primes A.Alive Fossils 思路:一開始題意看半天沒看懂,后面發現只需要輸出t組輸入中,都出現過的字符串即可。 代碼: void s…

實驗三 圖像分割與描述

一、實驗目的: (1)進一步掌握圖像處理工具Matlab,熟悉基于Matlab的圖像處理函數。 (2)掌握圖像分割方法,熟悉常用圖像描述方法。 二、實驗原理 1.膚色檢測 膚色是人類皮膚重要特征之一&#xff…

7.原 型

7.1原型 【例如】 另外- this指向: 構造函數和原型對象中的this都指向實例化的對象 7.2 constructor屬性 每個原型對象里面都有個constructor屬性( constructor構造函數) 作用:該屬性指向該原型對象的構造函數 使用場景: 如果有多個對象的方法&#…

Springboot 實踐(4)swagger-ui 測試controller

前文項目操作,完成了項目的創建、數據源的配置以及數據庫DAO程序的生成與配置。此文講解利用swagger-ui界面,測試生成的數據庫DAO程序。目前,項目swagger-ui界面如下: 以”用戶管理”為例,簡單講述swagger-ui測試數據庫…

無涯教程-Perl - s函數

描述 這不是功能。這是正則表達式替換運算符。根據PATTERN中指定的正則表達式,將數據替換為REPLACE。與m //一樣,分隔符由s后的第一個字符定義。 語法 以下是此函數的簡單語法- s/PATTERN/REPLACE/返回值 如果失敗,此函數返回0,如果成功,則返回替換次數。 例 以下是顯示…

筆記:移植xenomai到nuc972

xenomai是一個實時操作系統,想要使用它,先要移植I-pipe補丁 補丁在xenomai / ipipe-arm GitLab 我的內核是4.4-248的,合并上去會有幾個小錯誤,隨便改改就好 編譯內核沒有報錯之后,接下來需要修改arch/arm/mach-nuc970/time.c 修改方法參考補丁里面其它設備的定時器驅動,就…

學習Vue:數據綁定的基本概念

在 Vue.js 中,Vue 實例是您構建應用程序的核心。它允許您將數據和界面連接起來,實現動態的數據綁定,使您的應用程序能夠根據數據的變化自動更新界面。讓我們來深入了解 Vue 實例與數據綁定的基本概念。 Vue 實例與數據綁定 什么是 Vue 實例&…

OPC【2】——Relationships

引言 Relationships由一系列Relationship構成。將Abstract Package看做是一個圖數據結構,則Relationships是圖數據中的邊集合。 Package Relationships 對于Package Relationships,其所有引用關系的source對象為Abstract Package,或者看…

【Python機器學習】實驗10 支持向量機

文章目錄 支持向量機實例1 線性可分的支持向量機1.1 數據讀取1.2 準備訓練數據1.3 實例化線性支持向量機1.4 可視化分析 實例2 核支持向量機2.1 讀取數據集2.2 定義高斯核函數2.3 創建非線性的支持向量機2.4 可視化樣本類別 實例3 如何選擇最優的C和gamma3.1 讀取數據3.2 利用數…

Open3D 最小二乘擬合平面(SVD分解法)

目錄 一、算法原理二、代碼實現三、結果展示1、點云2、擬合結果四、優秀博客本文由CSDN點云俠原創,原文鏈接。爬蟲網站自重。 一、算法原理 本文實現矩陣奇異值分解方法的最小二乘擬合平面。原理如下: 對于得到的 n n

歐拉函數(質因子分解)

思路: (1)歐拉函數:輸入n則輸出1~n中與n互質的數的個數。 (2)計算公式: (3)證明:(容斥原理)對于n個數,先分別摘除所有被pi整除的數,…

億信ABI有什么不同,來看最新DEMO演示

為了給用戶營造更好的體驗環境,提供更豐富、更完善的服務,億信華辰旗下核心產品億信ABI DEMO再次上新啦!本次億信ABI DEMO環境在原有基礎上煥新升級,帶來了全新的主視覺界面、豐富的行業應用和功能演示DEMO,我們一起來…

季度到季度的組件選擇

組件&#xff1a;<template><div class"quarter"><div class"input-wrap" id"closeId" mouseover"handler" click.stop"btn" :style"{color:colorItem}"><i class"el-icon-date"&…

【Java】BF算法(串模式匹配算法)

?? 什么是BF算法 BF算法&#xff0c;即暴力算法&#xff0c;是普通的模式匹配算法&#xff0c;BF算法的思想就是將目標串S的第一個與模式串T的第一個字符串進行匹配&#xff0c;若相等&#xff0c;則繼續比較S的第二個字符和T的第二個字符&#xff1b;若不相等&#xff0c;則…

【計算機視覺|生成對抗】用深度卷積生成對抗網絡進行無監督表示學習(DCGAN)

本系列博文為深度學習/計算機視覺論文筆記&#xff0c;轉載請注明出處 標題&#xff1a;Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks 鏈接&#xff1a;[1511.06434] Unsupervised Representation Learning with Deep Conv…

騰訊云CVM服務器競價實例是什么?和按量計費有什么區別?

騰訊云服務器CVM計費模式分為包年包月、按量計費和競價實例&#xff0c;什么是競價實例&#xff1f;競價實例和按量付費相類似&#xff0c;優勢是價格更劃算&#xff0c;缺點是云服務器實例有被自動釋放風險&#xff0c;騰訊云服務器網來詳細說下什么是競價實例&#xff1f;以及…

NLP——操作步驟講義與實踐鏈接

數據集與語料 語料是NLP的生命之源&#xff0c;所有NLP問題都是從語料中學到數據分布的規律語料的分類&#xff1a;單語料&#xff0c;平行語料&#xff0c;復雜結構 語料的例子&#xff1a;Penn Treebank, Daily Dialog, WMT-1x翻譯數據集&#xff0c;中文閑聊數據集&#xf…

大數據:Numpy基礎應用詳解

Numpy基礎應用 Numpy 是一個開源的 Python 科學計算庫&#xff0c;用于快速處理任意維度的數組。Numpy 支持常見的數組和矩陣操作&#xff0c;對于同樣的數值計算任務&#xff0c;使用 NumPy 不僅代碼要簡潔的多&#xff0c;而且 NumPy 的性能遠遠優于原生 Python&#xff0c;…