第十四屆中國大學生服務外包大賽細品,上百支隊伍與合合信息用AI共克“記賬”難題

前言

熟悉我的小伙伴應該知道我在大學時期參與了很多競賽,我向來對比賽是比較熱枕的,以我個人觀點,我認為可以通過競賽激發學習激情和檢驗自己的技能水平掌握情況,大學生很少有機會能夠了解到課堂之外市場的需求,外包服務競賽就是一個很好的機會能夠幫助大學生接觸到市場需要何種服務以及人才需求,而且大學的很多比賽都可以積累自己的操行分,拿到一個好的名次收獲頗多,可以說學業事業一箭雙雕。正好這次第十四屆中國大學生服務外包大賽圓滿落幕,在我的大學競賽生涯中曾也參見過此類比賽且獲得過金獎,正好借此次機與大家一起細品中國大學生服務外包大賽。

比賽背景

中國大學生服務外包創新創業大賽(以下簡稱“大賽”),是響應國家關于鼓勵服務外包產業發展、加強服務外包人才培養的相關戰略舉措與號召,舉辦的每年一屆的全國性競賽。服務外包是指將某些業務或工作過程外包給其他機構或公司來完成,在一定程度上降低企業的成本和提高效率。獲得服務外包的比賽獎項,可以證明獲獎者在團隊合作、項目管理、溝通協調等方面具備較強的能力和經驗,這對于未來就業和個人職業發展都是有幫助的。而且此類比賽一般來說在各大高校都是有保研加分的,自然關注的人比較多。

大賽自2010年創立以來,累計吸引了1600余所院校、50余萬名大學生參加,成為服務外包產業領域的國家級賽事。本屆大賽共有803所全國院校的8006支團隊報名參賽,報名團隊數再創新高。而且隨著技術的不斷迭代,市場需求也再不斷更迭,大賽的競賽主題也響應著時代的發展而誕生了很多貼切前沿技術主題的問題。比如就最近比較火熱的AI大模型運用,這次大賽就很好的結合了當今熱點技術話題,啟發了更多參與比賽的大學生思考。

本次競賽內容設計充分聚焦企業發展中所面臨的技術、管理等現實問題,與產業的結合度更緊密,智能文字識別技術是大賽重點關注的技術之一。智能文字識別技術融合了智能圖像處理、光學字符識別、深度學習、自然語言處理等技術,可在多語言、多版式、曲面、褶皺、背景干擾等復雜場景下進行文字信息的識別分析與理解,在生產、教育、生活等多個領域中有著廣泛的應用。

合合信息在智能文字識別領域有著十余年深耕經驗,基于自身在行業領域的認知,從“基于智能文字場景個人財務管理創新應用”等議題出發,向廣大學生群體發出了“產品征集令”,得到了積極的反饋,相關賽題吸引了包括重慶大學、北京郵電大學、哈爾濱工業大學、華東理工大學、四川大學、西北大學等全國70多所高校的近300支隊伍積極參與,也涌現出許多優秀的作品。

參賽作品評析

本次大賽中,諸多高校參賽隊伍很好地洞悉了不同用戶群體的痛點,例如從“中老年人使用記賬本應用需要經歷繁瑣的操作”現象背后發現“圖片識別記賬方式更受歡迎”的趨勢,并針對性地進行產品開發優化。

以中南大學的作品記賬全能王—基于圖像預處理和BERT模型的OCR賬單識別系統項目為例。

?項目設計方向

針對此需求,中南大學很好的理解了項目開發的疑難點。首先此類應用面對的是中老年人,那么開發左眼皮應該是適應中老年人的安卓手機APK比較合適。此外不需要設計更多繁雜的功能,只適合記賬使用,應用應該操作簡單明了,要容易快速上手,不要設計太多復雜的過程最好。傳統記賬一般都是手動輸入或者是其他應用輔助進賬,比較麻煩。而本次比賽借助合合信息智能圖像識別模塊可以快速進行小票識別,直接按照模版讀取到對應框架內容中。因此如何結合智能圖像識別模塊以及設計對應簡潔、高效的數據輸入財務管理工具是項目的主要難題。

中南大學的作品采取的是SpringCloud微服務架構,Spring Cloud可以幫助開發者實現微服務架構的快速搭建和部署,提高系統的可擴展性和彈性。對于比賽快速開發服務來說,選擇此架構沒有一點問題,而如何進行圖像識別以及識別準確率技術要求是比較大的難點。能夠支持識別外賣賬單、超市小票、手賬、證券、支付寶微信消費截圖等,且準確率較高的技術棧來說,OCR識別是一種不錯的技術,此外還應訓練出符合記賬文本對應的分類模型以及信息抽取標注模型。以上技術難點中南大學都有考慮到且做出了比較規范的處理,比如Python的jieba分詞庫以及文本轉換技術Word2Vec,信息抽取與關系抽取則是考慮到了序列標注模型(BiLSTM-CRF)。以上技術都較為成熟,使用起來不會有太大問題,適合快速開發。且作品還考慮到了企業端,另做能夠獲取消費者的消費習慣,投放廣告,提高賬單識別的技術框架,比較全面。

此外如有根據已存有歷史數據能夠自動生成歷史賬單畫像,或者是能夠結合AI大模型自動對賬號數據進行評估或許能夠完成的更加全面。盡管如此此作品完成程度已經足夠高,簡單高效最貼切競賽主題。

?開發方向

中南大學的作品代碼開發方向十分清晰。前端使用Flutter框架,Flutter采用自繪引擎,具有出色的性能和渲染效果。通過使用豐富的小部件庫,開發者可以輕松創建精美的用戶界面,并實現高度的自定義。這使得Flutter在設計感強烈的應用程序、品牌應用以及注重用戶體驗的項目中具備競爭力。開發模式采取前后端分離的模式,在這種模式下,前端和后端可以獨立開發,互不干擾,相互配合,最終組合成一個完整的應用程序,提高了開發效率,提高了系統的可維護性和可擴展性,前后端交互簡單明了,易于調試和測試。

中南大學作品記賬全能王—基于圖像預處理和BERT模型的OCR賬單識別系統不僅解決了市場上存在財務小票記賬的痛點,也靈活地將合合信息智能圖像識別模塊與小票識別的API落地財務管理場景,將復雜的小票信息秒速轉換成了簡潔、高效的數據輸入,構建了一個多場景下的財務管理工具,讓用戶在不同場景中都能輕松地進行記賬和財務管理。

可以毫不夸張地說,BERT已經對自然語言處理進行了顯著的變革。比如使用一個在大型無標號數據集上訓練的模型,在11個獨立的自然語言處理任務中取得佳績。只需稍加微調就能實現。BERT引發了許多新的自然語言處理體系結構、訓練方法以及語言模型,如Google TransformerXL、OpenAI的GPT-2、XLNeT、ERNIE2.0、RoBERTa等。自然語言處理的最大挑戰之一是缺乏訓練數據。因為自然語言處理是一個具有許多不同任務的多樣化領域,大多數任務專用的數據集只包含幾千或幾十萬個人工標記的培訓示例。因此能夠支撐起龐大的數據集是大模型結合其他領域的關鍵,運行BERT是一項GPU密集型任務,需要大量的算力資源支持。

?

談到圖像處理技術就不得不談一下OCR技術了。隨著技術的不斷發展,OCR技術在工業界中的應用也從最開始的簡單的光學字符識別拓展到涵蓋圖像預處理、文字識別、版面分析、文檔理解等多項技術的智能文檔處理領域。文檔處理與人工智能的結合,可以實現對大量文檔的自動化處理和分析,提高工作效率和準確性,降低人力成本和時間成本,對于企業的知識管理和業務分析具有重要的意義。合合信息依托自研的智能文字識別服務平臺,在解決工業界中面臨的各類問題中所做一些相關工作進展和研究成果,并探討當前工業界中面臨的一些關鍵技術難題和挑戰。相信合合信息在模式識別、深度學習、圖像處理、自然語言處理等領域的深耕厚積薄發,用技術方案惠及更多的人。

?

合合信息智能文檔處理技術采用精準的圖像裁剪、形變矯正以及去除陰影和摩爾紋等技術,利用人工智能技術對文檔圖像進行增強和清晰度提升,從而提高文檔圖像的質量和閱讀體驗。通過這種方法,可以有效提升文檔處理下游任務的質量和效率,例如識別轉換和圖像分析等。目前,該技術已經被應用于智能文字識別產品,為來自全球上百個國家和地區的數億用戶提供了服務。

?

文檔處理與人工智能的結合,可以實現對大量文檔的自動化處理和分析,提高工作效率和準確性,降低人力成本和時間成本,對于企業的知識管理和業務分析具有重要的意義。 此外,未來的圖文智能處理技術也將會更加可定制化,根據不同的行業和應用場景,為客戶提供量身定制的解決方案。這將有助于滿足客戶的不同需求,提升客戶的體驗和滿意度。

比賽發展

?

從技術創新的視角來看,參賽隊伍展現出了深刻的思考。他們將先進的大模型技術與智能文檔處理領域的實際需求相融合。通過將文本識別和文本理解技術應用于大量的消費票據,他們成功地實現了有效的分類。這項創新使得財務結算過程從過去的繁瑣手動操作變為高度自動化的流程。這一實踐充分展示了他們運用新技術來解決傳統難題的能力。

?

據大數據統計,現在有百分之七十以上的大學生畢業后所從事的職業與本科專業無關。這就表示,大學生走出大學校門時,迎接他們的可能是一個完全陌生的領域,如果不想被淘汰,就必須不斷充實提高自己的知識儲備。由此可見,建立多元化的人才培養機制非常重要。當前,科技的創新、突破與發展越來越依賴于多學科的交叉、融合,這就對復合型人才的培養提出了更高的要求。大賽對參賽作品的評分標準也十分“仿真”,涉及技術資源及經濟成本控制,對項目創意前景的判斷、對市場需求的分析等方面,覆蓋商業價值、社會應用價值等多方面的評估。

在這個人工智能時代,科技企業在應用場景中扮演著關鍵角色,并在人才培養方面發揮著重要作用。未來,各行各業都渴望擁有那些對專業學術領域有深刻理解、具備解決問題潛力的人才,特別是在不斷發展的人工智能領域。在這一背景下,大賽為學生提供了一個卓越的科技領域展示平臺。

科技企業通過參與這樣的活動,不僅能夠挖掘潛在的人才,還能夠與學術界建立更緊密的聯系,共同推動技術的發展和創新。總之,這種校企合作在人才培養和行業發展方面取得了顯著成就,為未來的科技進步奠定了堅實基礎。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/40857.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/40857.shtml
英文地址,請注明出處:http://en.pswp.cn/news/40857.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

P1123 取數游戲

取數游戲 題目描述 一個 N M N\times M NM 的由非負整數構成的數字矩陣,你需要在其中取出若干個數字,使得取出的任意兩個數字不相鄰(若一個數字在另外一個數字相鄰 8 8 8 個格子中的一個即認為這兩個數字相鄰),求…

JWT(JSON Web Token )令牌

1、介紹 jwt就是將原始的json數據格式進行了安全的封裝,這樣就可以直接基于jwt在通信雙方安全的進行信息傳輸了。 2、jwt組成 第一部分:Header(頭), 記錄令牌類型、簽名算法等。 例如:{"alg":"HS256…

EXCEL按列查找,最終返回該列所需查詢序列所對應的值,VLOOKUP函數

EXCEL按列查找,最終返回該列所需查詢序列所對應的值 示例:國標行業分類漢字,匹配id 使用VLOOKUP函數 第一參數:拿去查詢的值。 第二參數:匹配的數據。 Ps:Sheet1!$C 21 : 21: 21:E 117 ,需要…

Redis系列(三):深入解讀Redis主從同步機制

首發博客地址 https://blog.zysicyj.top/ Redis高可靠靠什么保證? 為什么要提這個呢,因為Redis主從庫目的呢其實就是為了實現高可靠。上篇文章中我們說過Redis的AOF、RDB日志其實就是為了減少數據丟失,這是高可靠的一部分。 這篇文章呢&#…

Lua 位和字節

一、位運算 從 Lua 5.3 版本開始&#xff0c;提供了針對數值類型的一組標準位運算符&#xff0c;與算數運算符不同的是&#xff0c;運算符只能用于整型數。 運算符描述&按位與|按位或&#xff5e;按位異或>>邏輯右移<<邏輯左移&#xff5e;&#xff08;一元運…

Git 如何使用TortoiseGit 操作本地倉庫

初始化倉庫 方法一: 新建一個文件夾,進入文件夾內部操作 1、右鍵--> 在這里創建Git 版本庫 注意: 不要直接在桌面上操作,否則桌面就是一個倉庫 方法二: 1、右鍵-->Git GUI here 方法三: 命令行模式 1、 git init 創建完畢倉庫,我們發現,此時我們創建的文件夾下…

leetcode做題筆記83刪除排序鏈表中的重復元素

給定一個已排序的鏈表的頭 head &#xff0c; 刪除所有重復的元素&#xff0c;使每個元素只出現一次 。返回 已排序的鏈表 。 輸入&#xff1a;head [1,1,2] 輸出&#xff1a;[1,2] 思路一&#xff1a;模擬題意 struct ListNode* deleteDuplicates(struct ListNode* head){i…

FreeRTOS qemu mps2-an385 bsp 移植制作 :系統運行篇

相關文章 FreeRTOS qemu mps2-an385 bsp 移植制作 &#xff1a;環境搭建篇 FreeRTOS qemu mps2-an385 bsp 移植制作 &#xff1a;系統啟動篇 開發環境 Win10 64位 VS Code&#xff0c;ssh 遠程連接 ubuntu VMware Workstation Pro 16 Ubuntu 20.04 FreeRTOSv202212.01&a…

React 全棧體系(二)

第二章 React面向組件編程 一、基本理解和使用 1. 使用React開發者工具調試 2. 效果 2.1 函數式組件 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>1_函數式組件</title> </head> &l…

計算機競賽 python 爬蟲與協同過濾的新聞推薦系統

1 前言 &#x1f525; 優質競賽項目系列&#xff0c;今天要分享的是 &#x1f6a9; python 爬蟲與協同過濾的新聞推薦系統 &#x1f947;學長這里給一個題目綜合評分(每項滿分5分) 難度系數&#xff1a;3分工作量&#xff1a;3分創新點&#xff1a;4分 該項目較為新穎&…

軟件壓力測試對軟件產品起到什么作用?

一、軟件壓力測試是什么? 軟件壓力測試是一種通過模擬正常使用環境中可能出現的大量用戶和大數據量的情況&#xff0c;來評估軟件系統在壓力下的穩定性和性能表現的測試方法。在軟件開發過程中&#xff0c;經常會遇到一些性能瓶頸和穩定性問題&#xff0c;而軟件壓力測試的作…

react-codemirror2 編輯器需點擊一下或者延時才顯示數據的問題

現象&#xff1a; <Codemirror/>組件的數據已經賦上值的情況下&#xff0c;初始狀態不渲染數據&#xff0c;需要點擊編輯框獲取焦點后才展示&#xff0c;或者延遲了幾秒才顯示出來。 原因&#xff1a; 指定了一些依賴的版本&#xff0c;可能不兼容了一些功能&#xff0c…

C# int ? 關鍵字使用方法

使用C#的時間也不算短。 但是今天看到了一個從來沒有見過的寫法 Int &#xff1f;這是個什么寫法&#xff0c;沒見過啊&#xff0c;百度了查一下&#xff0c;也在這里記錄一下。 1、int? 關鍵字說明 (1)、int? 表示一個int類型,且該int類型可空,如果不加?的話,那么int類…

C語言刷題指南(一)

&#x1f4d9;作者簡介&#xff1a; 清水加冰&#xff0c;目前大二在讀&#xff0c;正在學習C/C、Python、操作系統、數據庫等。 &#x1f4d8;相關專欄&#xff1a;C語言初階、C語言進階、數據結構刷題訓練營、有感興趣的可以看一看。 歡迎點贊 &#x1f44d; 收藏 ?留言 &am…

認識excel篇3之數據的有效性(數據驗證)

數據有效性不僅能夠對單元格的輸入數據進行條件限制&#xff0c;還可以在單元格中創建下拉列表菜單方便用戶選擇輸入。如果沒有做數據驗證&#xff0c;單元格內默認可以輸入任意類型的數據。數據驗證就是限制單元格輸入數據&#xff08;必須輸入符合要求的才能輸入&#xff09;…

VS2022如何查看類成員都在哪里被調用了(VS如何打開Call Hierarchy視圖)

文章目錄 打開Call Hierarchy視圖查看成員的調用 打開Call Hierarchy視圖 單擊菜單欄的“視圖” > “調用層次結構”&#xff0c;即可打卡Call Hierarchy視圖。 查看成員的調用 在代碼編輯窗口&#xff0c;右鍵單擊想要查看的類成員&#xff0c;然后選擇“查看調用層次結…

機器學習算法之-邏輯回歸(2)

為什么需要邏輯回歸 擬合效果太好 特征與標簽之間的線性關系極強的數據&#xff0c;比如金融領域中的 信用卡欺詐&#xff0c;評分卡制作&#xff0c;電商中的營銷預測等等相關的數據&#xff0c;都是邏輯回歸的強項。雖然現在有了梯度提升樹GDBT&#xff0c;比邏輯回歸效果更…

一、數學建模之線性規劃篇

1.定義 2.例題 3.使用軟件及解題 一、定義 1.線性規劃&#xff08;Linear Programming&#xff0c;簡稱LP&#xff09;是一種數學優化技術&#xff0c;線性規劃作為運籌學的一個重要分支&#xff0c;專門研究在給定一組線性約束條件下&#xff0c;如何找到一個最優的決策&…

JavaScript請求數據的4種方法總結(Ajax、fetch、jQuery、axios)

JavaScript請求數據有4種主流方式&#xff0c;分別是Ajax、fetch、jQuery和axios。 一、Ajax、fetch、jQuery和axios的詳細解釋&#xff1a; 1、 Ajax Ajax&#xff08;Asynchronous JavaScript and XML&#xff09;是一種使用JavaScript在用戶的瀏覽器上發送請求的技術&…

springboot綜合案例第三課

SpringSecurity入門 什么是SpringSecurity Spring Security 的前身是 Acegi Security &#xff0c;是 Spring 項目組中用來提供安全認證服務的框架。 (https://projects.spring.io/spring-security/) Spring Security 為基于J2EE企業應用軟件提供了全面安全服務。特別 是使…