?一、前言
????????? 眾所周知,隨著互聯網和人工智能的發展,我們非常多的場景需要用到智能“識別”功能,比如人臉識別、通用文字識別、表格識別、辦公文檔識別、身份證、名片、營業執照等國內外卡證文字識別等等,同時識別與理解面臨的全球性技術難題,看不清、看不準、認不全、難理解,那目前市場上有沒有一款最好的智能識別云服務端平臺產品呢?當然有,它就是 合合信息TextIn
二、合合信息TextIn簡介
1、官.網地址:https://www.textin.com/
合合信息TextIn是上海合合信息科技股份有限公司旗下智能文字識別云服務平臺,專注文字識別領域16年,對企業、開發者、個人用戶提供智能文字識別引擎、產品、云端服務。
2、 豐富的識別類型
通用文字、表格、印章等識別
???? 通過領先的深度學習技術,對各種表格,圖片,文檔、證件、面單等多種通用場景進行快速、精準的檢測和識別,支持簡體中文/繁體中文/英文/數字/西歐主流語言/東歐主流語言等共52種語言,同時支持印刷體、手寫體、傾斜、折疊、旋轉。
???? 大家可以通過這個地址來體驗:https://www.textin.com/experience/text_recognize_3d1
卡證文字識別
????? 我先用我自己的身份.證來測試(https://www.textin.com/experience/id_card),非常精致,簡直就是yyds
???? 然后我們來識別下自己的銀行卡(https://www.textin.com/experience/bank_card),非常快,非常精致。
?
企業證照識別
然后我們來識別下營業執照https://www.textin.com/experience/business_license
各種票據識別
我們點擊這個地址https://www.textin.com/experience/vat_invoice
我們只需要上傳票據圖片,然后里面的文字能非常開始識別出來,非常絲滑,非常精準、快。
各種狀態的車牌識別
我們點擊這個地址https://www.textin.com/experience/plate_number進行上傳圖片識別,精準
更多識別類型,歡迎大家到官.網體驗?https://www.textin.com/
三、多家識別產品體驗對比
?1、與某觀進行對比
??????? 進入官.網,我們點擊使用,首先提示需要登錄,而且還沒有注冊的地方,莫名其妙,體驗非常不好,而且還需要申請,我申請后,點擊在線體驗,還是提示要登錄,問題是我賬號哪里來?頁面也返回不了,直接果斷放棄了。
?2、和鵝廠識別官.網對比
????? 點擊本地文件識別,還需要登錄,體驗非常不好,還需要實名認證等等。
然后我們放進去一張本地圖片,好像很多文字識別不出來,不是那么精準,速度一般。
3、我們使用合合信息TextIn來識別
TextIn可以看出非常精準,連 “限時秒殺2“都能識別出來,速度非常快,
4、識別彎曲的書本文字來對比分析
???? 然后我們對比下鵝廠和TextIn分別識別彎曲的書本文字,圖片如下
?
我們看下鵝廠的識別效果,我們可以看到彎曲的地方,“通”字識別成了“看”,有一定的錯誤率,而且識別時間比較長。
???????
?
我們看下合合信息TextIn的效果,“通”字完美的識別出來了,基本上文字都對了,是不是非常神奇。
???????
?
合合信息TextIn為什么識別這個彎曲圖片文字這里這么精準呢?是因為使用文檔圖像質量增強:圖像矯正+去摩爾紋技術,最大極限的識別文字,簡直就是yyds.
5、我們對比識別下包含文字和英文的圖片
? 我們利用TextIn來識別下面的圖片,效果如下,時間上大約不到1秒。
利用鵝廠的來識別效果如下,但是時間畫得比較久,大概花了3秒左右,而且第一行“white白色”,之間還有空格,但是這里識別是挨在一起的,識別格式不精準。
6、結果對比
?TextIn的在識別彎曲書本文字上比鵝廠正確率高,基本上都能準確快速識別出來,鵝廠的識別正確率不是那么高,而且還非常慢,說明 TextIn在識別上更勝一籌,通過識別包含中文和英文的圖片,TextIn在識別時間上更加快速精準,而且格式不會搞錯,所以強烈推薦給大家使用。
那么TextIn還解決哪些痛點問題,是其它商品不具備的呢?
- 解決了場景及版式多樣性問題
- 解決了采集設備不確定性問題
- 解決了用戶需求多樣性問題
- 解決了文檔圖像質量退化嚴重問題
- 解決了文字檢測及版面分析困難問題
- 解決了非限定條件文字識別率低問題
- 解決了結構化智能理解能力差問題
那這些強大的功能又是基于啥技術來實現的呢?我們可以接著往下看。
四、TextIn的主要核心技術
1、圖像處理技術
- 切邊增強
?????? 切邊后圖像帶來的收益,更好的展示(美觀度),提升下游任務(OCR識別,信息抽取等)的準確率,一般用于票據識別,會議拍攝PPT。
- 彎曲矯正
???? 我們識別的時候,有些圖片會有形變類型,比如:彎曲、折疊、皺、透視、混合彎折...
我們采用彎曲矯正技術,可以更好的展示,提升下游任務(OCR識別,版面分析/還原等)的準確率,
主要用在
- 基于偏移場學習的方法
- 文檔矯正系統Pipeline
- 摩爾紋去除系統Pipeline
消除屏幕紋對畫質的干擾提高圖像、文字清晰度
?
部分技術效果如下
2、文檔理解核心技術
- 數據知識雙驅動文本圖像智能理解
??? 提出了基于數據及知識雙驅動的端到端文本圖像識別及結構化理解新方法
- 通用NLP抽取(https://www.textin.com/market/detail/contents-extract)
???? 基于自研NLP信息抽取技術,無需配置與訓練,可對單頁/多頁、任意版式文檔,智能分析與提取客戶自定義關鍵信息。推薦使用場景:各種證件、票據、非標文檔以及合同/標書/保單/網頁截圖等各類電子文檔
- TextIn Studio 訓練平臺SAAS版(https://global.textin.com/)
????? 可用于國內外卡證、票據、單據、企業內部文檔等各種固定和不固定版式文檔的結構化信息提取。基于NLP技術,依托多模態高性能預訓練模型,利用少量樣本可快速產出高可用性的信息抽取模型。
???
五、總結
??????? 合合信息TextIn(https://www.textin.com/) 主要采用了圖像處理里面的切邊增強、曲面矯正、去摩爾紋、PS檢測等技術,同時在文檔理解上,采用了版面分析與信息提取、訓練平臺TextIn Studio
等等核心技術,解決了識別場景及版式多樣性、用戶需求多樣性、采集設備不確定性、文檔圖像質量退化嚴重、文字檢測及版面分析困難、非限定條件文字識別率低、結構化智能理解能力差問題,在識別彎曲圖片文字上正確率非常高,簡直就是yyds,強烈推薦給大家使用。
?