前言
熟悉我的小伙伴應該知道我在大學時期參與了很多競賽,我向來對比賽是比較熱枕的,以我個人觀點,我認為可以通過競賽激發學習激情和檢驗自己的技能水平掌握情況,大學生很少有機會能夠了解到課堂之外市場的需求,外包服務競賽就是一個很好的機會能夠幫助大學生接觸到市場需要何種服務以及人才需求,而且大學的很多比賽都可以積累自己的操行分,拿到一個好的名次收獲頗多,可以說學業事業一箭雙雕。正好這次第十四屆中國大學生服務外包大賽圓滿落幕,在我的大學競賽生涯中曾也參見過此類比賽且獲得過金獎,正好借此次機與大家一起細品中國大學生服務外包大賽。
比賽背景
中國大學生服務外包創新創業大賽(以下簡稱“大賽”),是響應國家關于鼓勵服務外包產業發展、加強服務外包人才培養的相關戰略舉措與號召,舉辦的每年一屆的全國性競賽。服務外包是指將某些業務或工作過程外包給其他機構或公司來完成,在一定程度上降低企業的成本和提高效率。獲得服務外包的比賽獎項,可以證明獲獎者在團隊合作、項目管理、溝通協調等方面具備較強的能力和經驗,這對于未來就業和個人職業發展都是有幫助的。而且此類比賽一般來說在各大高校都是有保研加分的,自然關注的人比較多。
大賽自2010年創立以來,累計吸引了1600余所院校、50余萬名大學生參加,成為服務外包產業領域的國家級賽事。本屆大賽共有803所全國院校的8006支團隊報名參賽,報名團隊數再創新高。而且隨著技術的不斷迭代,市場需求也再不斷更迭,大賽的競賽主題也響應著時代的發展而誕生了很多貼切前沿技術主題的問題。比如就最近比較火熱的AI大模型運用,這次大賽就很好的結合了當今熱點技術話題,啟發了更多參與比賽的大學生思考。
本次競賽內容設計充分聚焦企業發展中所面臨的技術、管理等現實問題,與產業的結合度更緊密,智能文字識別技術是大賽重點關注的技術之一。智能文字識別技術融合了智能圖像處理、光學字符識別、深度學習、自然語言處理等技術,可在多語言、多版式、曲面、褶皺、背景干擾等復雜場景下進行文字信息的識別分析與理解,在生產、教育、生活等多個領域中有著廣泛的應用。
合合信息在智能文字識別領域有著十余年深耕經驗,基于自身在行業領域的認知,從“基于智能文字場景個人財務管理創新應用”等議題出發,向廣大學生群體發出了“產品征集令”,得到了積極的反饋,相關賽題吸引了包括重慶大學、北京郵電大學、哈爾濱工業大學、華東理工大學、四川大學、西北大學等全國70多所高校的近300支隊伍積極參與,也涌現出許多優秀的作品。
參賽作品評析
本次大賽中,諸多高校參賽隊伍很好地洞悉了不同用戶群體的痛點,例如從“中老年人使用記賬本應用需要經歷繁瑣的操作”現象背后發現“圖片識別記賬方式更受歡迎”的趨勢,并針對性地進行產品開發優化。
以中南大學的作品記賬全能王—基于圖像預處理和BERT模型的OCR賬單識別系統項目為例。
?項目設計方向
針對此需求,中南大學很好的理解了項目開發的疑難點。首先此類應用面對的是中老年人,那么開發左眼皮應該是適應中老年人的安卓手機APK比較合適。此外不需要設計更多繁雜的功能,只適合記賬使用,應用應該操作簡單明了,要容易快速上手,不要設計太多復雜的過程最好。傳統記賬一般都是手動輸入或者是其他應用輔助進賬,比較麻煩。而本次比賽借助合合信息智能圖像識別模塊可以快速進行小票識別,直接按照模版讀取到對應框架內容中。因此如何結合智能圖像識別模塊以及設計對應簡潔、高效的數據輸入財務管理工具是項目的主要難題。
中南大學的作品采取的是SpringCloud微服務架構,Spring Cloud可以幫助開發者實現微服務架構的快速搭建和部署,提高系統的可擴展性和彈性。對于比賽快速開發服務來說,選擇此架構沒有一點問題,而如何進行圖像識別以及識別準確率技術要求是比較大的難點。能夠支持識別外賣賬單、超市小票、手賬、證券、支付寶微信消費截圖等,且準確率較高的技術棧來說,OCR識別是一種不錯的技術,此外還應訓練出符合記賬文本對應的分類模型以及信息抽取標注模型。以上技術難點中南大學都有考慮到且做出了比較規范的處理,比如Python的jieba分詞庫以及文本轉換技術Word2Vec,信息抽取與關系抽取則是考慮到了序列標注模型(BiLSTM-CRF)。以上技術都較為成熟,使用起來不會有太大問題,適合快速開發。且作品還考慮到了企業端,另做能夠獲取消費者的消費習慣,投放廣告,提高賬單識別的技術框架,比較全面。
此外如有根據已存有歷史數據能夠自動生成歷史賬單畫像,或者是能夠結合AI大模型自動對賬號數據進行評估或許能夠完成的更加全面。盡管如此此作品完成程度已經足夠高,簡單高效最貼切競賽主題。
?開發方向
中南大學的作品代碼開發方向十分清晰。前端使用Flutter框架,Flutter采用自繪引擎,具有出色的性能和渲染效果。通過使用豐富的小部件庫,開發者可以輕松創建精美的用戶界面,并實現高度的自定義。這使得Flutter在設計感強烈的應用程序、品牌應用以及注重用戶體驗的項目中具備競爭力。開發模式采取前后端分離的模式,在這種模式下,前端和后端可以獨立開發,互不干擾,相互配合,最終組合成一個完整的應用程序,提高了開發效率,提高了系統的可維護性和可擴展性,前后端交互簡單明了,易于調試和測試。
中南大學作品記賬全能王—基于圖像預處理和BERT模型的OCR賬單識別系統不僅解決了市場上存在財務小票記賬的痛點,也靈活地將合合信息智能圖像識別模塊與小票識別的API落地財務管理場景,將復雜的小票信息秒速轉換成了簡潔、高效的數據輸入,構建了一個多場景下的財務管理工具,讓用戶在不同場景中都能輕松地進行記賬和財務管理。
可以毫不夸張地說,BERT已經對自然語言處理進行了顯著的變革。比如使用一個在大型無標號數據集上訓練的模型,在11個獨立的自然語言處理任務中取得佳績。只需稍加微調就能實現。BERT引發了許多新的自然語言處理體系結構、訓練方法以及語言模型,如Google TransformerXL、OpenAI的GPT-2、XLNeT、ERNIE2.0、RoBERTa等。自然語言處理的最大挑戰之一是缺乏訓練數據。因為自然語言處理是一個具有許多不同任務的多樣化領域,大多數任務專用的數據集只包含幾千或幾十萬個人工標記的培訓示例。因此能夠支撐起龐大的數據集是大模型結合其他領域的關鍵,運行BERT是一項GPU密集型任務,需要大量的算力資源支持。
?
談到圖像處理技術就不得不談一下OCR技術了。隨著技術的不斷發展,OCR技術在工業界中的應用也從最開始的簡單的光學字符識別拓展到涵蓋圖像預處理、文字識別、版面分析、文檔理解等多項技術的智能文檔處理領域。文檔處理與人工智能的結合,可以實現對大量文檔的自動化處理和分析,提高工作效率和準確性,降低人力成本和時間成本,對于企業的知識管理和業務分析具有重要的意義。合合信息依托自研的智能文字識別服務平臺,在解決工業界中面臨的各類問題中所做一些相關工作進展和研究成果,并探討當前工業界中面臨的一些關鍵技術難題和挑戰。相信合合信息在模式識別、深度學習、圖像處理、自然語言處理等領域的深耕厚積薄發,用技術方案惠及更多的人。
?
合合信息智能文檔處理技術采用精準的圖像裁剪、形變矯正以及去除陰影和摩爾紋等技術,利用人工智能技術對文檔圖像進行增強和清晰度提升,從而提高文檔圖像的質量和閱讀體驗。通過這種方法,可以有效提升文檔處理下游任務的質量和效率,例如識別轉換和圖像分析等。目前,該技術已經被應用于智能文字識別產品,為來自全球上百個國家和地區的數億用戶提供了服務。
?
文檔處理與人工智能的結合,可以實現對大量文檔的自動化處理和分析,提高工作效率和準確性,降低人力成本和時間成本,對于企業的知識管理和業務分析具有重要的意義。 此外,未來的圖文智能處理技術也將會更加可定制化,根據不同的行業和應用場景,為客戶提供量身定制的解決方案。這將有助于滿足客戶的不同需求,提升客戶的體驗和滿意度。
比賽發展
?
從技術創新的視角來看,參賽隊伍展現出了深刻的思考。他們將先進的大模型技術與智能文檔處理領域的實際需求相融合。通過將文本識別和文本理解技術應用于大量的消費票據,他們成功地實現了有效的分類。這項創新使得財務結算過程從過去的繁瑣手動操作變為高度自動化的流程。這一實踐充分展示了他們運用新技術來解決傳統難題的能力。
?
據大數據統計,現在有百分之七十以上的大學生畢業后所從事的職業與本科專業無關。這就表示,大學生走出大學校門時,迎接他們的可能是一個完全陌生的領域,如果不想被淘汰,就必須不斷充實提高自己的知識儲備。由此可見,建立多元化的人才培養機制非常重要。當前,科技的創新、突破與發展越來越依賴于多學科的交叉、融合,這就對復合型人才的培養提出了更高的要求。大賽對參賽作品的評分標準也十分“仿真”,涉及技術資源及經濟成本控制,對項目創意前景的判斷、對市場需求的分析等方面,覆蓋商業價值、社會應用價值等多方面的評估。
在這個人工智能時代,科技企業在應用場景中扮演著關鍵角色,并在人才培養方面發揮著重要作用。未來,各行各業都渴望擁有那些對專業學術領域有深刻理解、具備解決問題潛力的人才,特別是在不斷發展的人工智能領域。在這一背景下,大賽為學生提供了一個卓越的科技領域展示平臺。
科技企業通過參與這樣的活動,不僅能夠挖掘潛在的人才,還能夠與學術界建立更緊密的聯系,共同推動技術的發展和創新。總之,這種校企合作在人才培養和行業發展方面取得了顯著成就,為未來的科技進步奠定了堅實基礎。