智能識別云服務端平臺之神【合合信息TextIn】

?一、前言

????????? 眾所周知,隨著互聯網和人工智能的發展,我們非常多的場景需要用到智能“識別”功能,比如人臉識別、通用文字識別、表格識別、辦公文檔識別、身份證、名片、營業執照等國內外卡證文字識別等等,同時識別與理解面臨的全球性技術難題,看不清、看不準、認不全、難理解,那目前市場上有沒有一款最好的智能識別云服務端平臺產品呢?當然有,它就是 合合信息TextIn

二、合合信息TextIn簡介

1、官.網地址:https://www.textin.com/

合合信息TextIn是上海合合信息科技股份有限公司旗下智能文字識別云服務平臺,專注文字識別領域16年,對企業、開發者、個人用戶提供智能文字識別引擎、產品、云端服務。

2 豐富的識別類型

通用文字、表格、印章等識別

???? 通過領先的深度學習技術,對各種表格,圖片,文檔、證件、面單等多種通用場景進行快速、精準的檢測和識別,支持簡體中文/繁體中文/英文/數字/西歐主流語言/東歐主流語言等共52種語言,同時支持印刷體、手寫體、傾斜、折疊、旋轉。

???? 大家可以通過這個地址來體驗:https://www.textin.com/experience/text_recognize_3d1

卡證文字識別

????? 我先用我自己的身份.證來測試(https://www.textin.com/experience/id_card),非常精致,簡直就是yyds

???? 然后我們來識別下自己的銀行卡(https://www.textin.com/experience/bank_card),非常快,非常精致。

?

企業證照識別

然后我們來識別下營業執照https://www.textin.com/experience/business_license

各種票據識別

我們點擊這個地址https://www.textin.com/experience/vat_invoice

我們只需要上傳票據圖片,然后里面的文字能非常開始識別出來,非常絲滑,非常精準、快。

各種狀態的車牌識別

我們點擊這個地址https://www.textin.com/experience/plate_number進行上傳圖片識別,精準

更多識別類型,歡迎大家到官.網體驗?https://www.textin.com/

三、多家識別產品體驗對比

?1、與某觀進行對比

??????? 進入官.網,我們點擊使用,首先提示需要登錄,而且還沒有注冊的地方,莫名其妙,體驗非常不好,而且還需要申請,我申請后,點擊在線體驗,還是提示要登錄,問題是我賬號哪里來?頁面也返回不了,直接果斷放棄了。

?2、和鵝廠識別官.網對比

????? 點擊本地文件識別,還需要登錄,體驗非常不好,還需要實名認證等等。

然后我們放進去一張本地圖片,好像很多文字識別不出來,不是那么精準,速度一般。

3、我們使用合合信息TextIn來識別

TextIn可以看出非常精準,連 “限時秒殺2“都能識別出來,速度非常快,

4、識別彎曲的書本文字來對比分析

???? 然后我們對比下鵝廠和TextIn分別識別彎曲的書本文字,圖片如下

?

我們看下鵝廠的識別效果,我們可以看到彎曲的地方,“通”字識別成了“看”,有一定的錯誤率,而且識別時間比較長。

???????

?

我們看下合合信息TextIn的效果,“通”字完美的識別出來了,基本上文字都對了,是不是非常神奇。

???????

?

合合信息TextIn為什么識別這個彎曲圖片文字這里這么精準呢?是因為使用文檔圖像質量增強:圖像矯正+去摩爾紋技術,最大極限的識別文字,簡直就是yyds.

5、我們對比識別下包含文字和英文的圖片

? 我們利用TextIn來識別下面的圖片,效果如下,時間上大約不到1秒。

利用鵝廠的來識別效果如下,但是時間畫得比較久,大概花了3秒左右,而且第一行“white白色”,之間還有空格,但是這里識別是挨在一起的,識別格式不精準。

6、結果對比

?TextIn的在識別彎曲書本文字上比鵝廠正確率高,基本上都能準確快速識別出來,鵝廠的識別正確率不是那么高,而且還非常慢,說明 TextIn在識別上更勝一籌,通過識別包含中文和英文的圖片,TextIn在識別時間上更加快速精準,而且格式不會搞錯,所以強烈推薦給大家使用。

那么TextIn還解決哪些痛點問題,是其它商品不具備的呢?

  • 解決了場景及版式多樣性問題
  • 解決了采集設備不確定性問題
  • 解決了用戶需求多樣性問題
  • 解決了文檔圖像質量退化嚴重問題
  • 解決了文字檢測及版面分析困難問題
  • 解決了非限定條件文字識別率低問題
  • 解決了結構化智能理解能力差問題

那這些強大的功能又是基于啥技術來實現的呢?我們可以接著往下看。

四、TextIn的主要核心技術

1、圖像處理技術

  • 切邊增強

?????? 切邊后圖像帶來的收益,更好的展示(美觀度),提升下游任務(OCR識別,信息抽取等)的準確率,一般用于票據識別,會議拍攝PPT。

  • 彎曲矯正

???? 我們識別的時候,有些圖片會有形變類型,比如:彎曲、折疊、皺、透視、混合彎折...

我們采用彎曲矯正技術,可以更好的展示,提升下游任務(OCR識別,版面分析/還原等)的準確率,

主要用在

  • 基于偏移場學習的方法

  • 文檔矯正系統Pipeline

  • 摩爾紋去除系統Pipeline
    消除屏幕紋對畫質的干擾提高圖像、文字清晰度
    ?

部分技術效果如下

2、文檔理解核心技術

  • 數據知識雙驅動文本圖像智能理解

??? 提出了基于數據及知識雙驅動的端到端文本圖像識別及結構化理解新方法

  • 通用NLP抽取(https://www.textin.com/market/detail/contents-extract

???? 基于自研NLP信息抽取技術,無需配置與訓練,可對單頁/多頁、任意版式文檔,智能分析與提取客戶自定義關鍵信息。推薦使用場景:各種證件、票據、非標文檔以及合同/標書/保單/網頁截圖等各類電子文檔

  • TextIn Studio 訓練平臺SAAS版(https://global.textin.com/

????? 可用于國內外卡證、票據、單據、企業內部文檔等各種固定和不固定版式文檔的結構化信息提取。基于NLP技術,依托多模態高性能預訓練模型,利用少量樣本可快速產出高可用性的信息抽取模型。

???

五、總結

??????? 合合信息TextIn(https://www.textin.com/ 主要采用了圖像處理里面的切邊增強、曲面矯正、去摩爾紋、PS檢測等技術,同時在文檔理解上,采用了版面分析與信息提取、訓練平臺TextIn Studio
等等核心技術,解決了識別場景及版式多樣性、用戶需求多樣性、采集設備不確定性、文檔圖像質量退化嚴重、文字檢測及版面分析困難、非限定條件文字識別率低、結構化智能理解能力差問題,在識別彎曲圖片文字上正確率非常高,簡直就是yyds,強烈推薦給大家使用。

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/284883.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/284883.shtml
英文地址,請注明出處:http://en.pswp.cn/news/284883.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【ArcGIS微課1000例】0015:ArcGIS如何創建/自定義快捷鍵?

為了提高工作效率,強大的ArcGIS提供了很多快捷鍵,如訪問 ArcMap 菜單命令、窗口操縱、刷新或暫停地圖繪制、通過拖放進行移動或復制等等。本文在ArcGIS已有快捷鍵的基礎之上,為了提高工作效率,講解如何定制個性化的快捷鍵。 參考閱讀:【ArcGIS風暴】ArcGIS快捷鍵大全 文章…

Bresenham 算法

1965 年,Bresenham 為數字繪圖儀開發了一種繪制直線的算法,該算法同樣使用于光柵掃描顯示器,被稱為 Bresenham 算法。 原理 算法的目標是選擇表示直線的最佳光柵位置。Bresenhan 算法在主位移方向上每次遞增一個單位。另一個方向的增量為 0…

Python高級特性——迭代(Iteration)

Python高級特性——迭代(Iteration) 1、給定一個集合list或者tuple,可以通過for …… in ……的語法來實現循環遍歷,這個循環我們就叫做迭代 迭代list: >>> m [haha,hehe,heihei,gaga] >>> for li …

ML.NET 更新

點擊上方藍字關注我們(本文閱讀時間:5分鐘)ML.NET是一款面向.NET開發人員的開源,跨平臺機器學習框架,可以將自定義機器學習集成到.NET應用中。我們很開心地向您介紹我們在過去幾個月中所做的工作。ML.NET:https://dotnet.microsof…

Andriod之提示java.lang.SecurityException: getDataNetworkTypeForSubscriber導致程序奔潰

1、問題 修改targetSdkVersion 33 適配Android13后4G網絡環境被其它app拉起來提示這個異常 2、原因 我們定位到代碼在這行函數 telephonyManager.getNetworkType()Android11 的權限有關,由于缺少該權限導致無法訪問接口而提示安全異常 3、解決辦法 方法1:我們直接申請RE…

js-權威指南學習筆記7

第七章 數組 1、數組直接量的語法允許有可選的結尾的逗號,所以[ , , ]只有兩個元素而非三個。 2、調用構造函數Array()創建數組時,傳入一個參數時表示指定數組的長度。 3、所有的索引都是屬性名,但只有在0~2^32-2之間的…

[譯]基于GPU的體渲染高級技術之raycasting算法

[譯]基于GPU的體渲染高級技術之raycasting算法 PS:我決定翻譯一下《Advanced Illumination Techniques for GPU-Based Volume Raycasting》。像我翻譯其他資料一樣,只按我的需要和觀點來翻譯。有的部分詳細翻譯,附加注解,有的部分…

【GIS風暴】什么是地理空間智能(Geospatial AI)?

人工智能(Artificial Intelligence,AI)已經成為新技術革命下一階段的熱詞,也成為未來產業的驅動力量。使用智能算法,數據分類和智能預測、分析,AI在很多領域將有一系列的工具來幫助解決問題。 將AI用于GIS這一具體的領域的分析、方法和解決方案,就叫地理空間智能(Geos…

JavaScript 清除圖片背景顏色 使之透明

主要JS /**清除圖片背景顏色 **/ function removeImgBg(img) {//背景顏色 白色const rgba [255, 255, 255, 255];// 容差大小const tolerance 60;var imgData null;const [r0, g0, b0, a0] rgba;var r, g, b, a;const canvas document.createElement(canvas);const cont…

day01基礎部分

一、python是什么樣的語言 1、編譯型語言和解釋型語言,python是解釋型語言 1.1、編譯型語言就是把源程序代碼一次性翻譯成機器碼(計算機可識別的代碼),然后交給計算機去運行,一般需經過編譯(compile&#x…

WPF 制作 Windows 屏保

分享如何使用WPF 制作 Windows 屏保WPF 制作 Windows 屏保作者:驚鏵原文鏈接:https://github.com/yanjinhuagood/ScreenSaver框架使用.NET452;Visual Studio 2019;項目使用 MIT 開源許可協議;更多效果可以通過GitHub[1]|碼云[2]下…

Java 定時線程

功能需求:項目啟動時,后天起一個定時線程,每個小時跑一次,查出數據發郵件出來。 主要使用 public void schedule(TimerTask task, long delay)task被安排在delay(毫秒)指定的時間后執行。 public void sche…

Windows 7 下右鍵發送到菜單項沒了

為什么80%的碼農都做不了架構師?>>> 問題描述: 突然有一天,Windows 7 下右鍵發送到菜單項沒了,如圖所示: 問題原因 黑人問號臉? 轉載于:https://my.oschina.net/taadis/blog/1591398

【ArcGIS微課1000例】0016:ArcGIS書簽操作(添加書簽、管理書簽)知多少?

書簽可以將地圖數據的某一視圖狀態保存起來,以便在使用時打開書簽,直接回到這一視圖狀態。可創建多個書簽以便快速回到不同的視圖狀態,也可以對書簽進行管理。 文章目錄 1 創建書簽2 管理書簽注意:書簽只針對空間數據,在【布局視圖】中是不能創建書簽的。 1 創建書簽 可…

Android之webView打開http鏈接頁面無法加載顯示net:ERR_CLEARTEXT_NOT_PERMITTED

1、問題 適配Android13后,webView打開http鏈接提示錯誤如下 net:ERR_CLEARTEXT_NOT_PERMITTED2、原因 Android 9.0 默認使用加密連接,這意味著老舊項目在android 9.0 設備上運行,會遇到異常的情況。 3、解決辦法 android:usesCleartextTr…

分享一個WPF 實現 Windows 軟件快捷小工具

分享一個WPF 實現 Windows 軟件快捷小工具Windows 軟件快捷小工具作者:WPFDevelopersOrg原文鏈接:https://github.com/WPFDevelopersOrg/SoftwareHelper框架使用.NET40;Visual Studio 2019;項目使用 MIT 開源許可協議;項目使用 MV…

學習環境配置:Manjaro、MSYS2以及常見軟件

0.前言 在說Manjaro之前,要先說一下Linux發行版。對于各大發行版而言,內核只有版本的差異,最重要的區別就是包管理系統。常見的包管理系統包括:Pacman,Apt , Yum和Portage。在學習Linux的過程中,和大數人一…

【ArcGIS微課1000例】0017:ArcGIS測量距離和面積工具的巧妙使用

文章目錄 1 交互式測量2 測量要素ArcGIS提供了快速測量距離和面積的工具,通過測量工具可對地圖中的線和面進行測量。 工具條: 測量工具位于【工具】工具條上,如下圖所示: 測量界面: 功能按鈕簡介: 可使用此工具在地圖上繪制一條線或者一個面,然后獲取線的長度與面的面…

[轉]HTTP/3 未來可期?

2015 年 HTTP/2 標準發表后,大多數主流瀏覽器也于當年年底支持該標準。此后,憑借著多路復用、頭部壓縮、服務器推送等優勢,HTTP/2 得到了越來越多開發者的青睞,不知不覺的 HTTP 已經發展到了第三代。本文基于興趣部落接入 HTTP/3 …

只讓輸入數字、字母、中文的輸入框

1.輸入框只能輸入字母和下橫線的正則表達式 <input type"text" onkeyup"this.valuethis.value.replace(/[^_a-zA-Z]/g,)" onpaste"this.valuethis.value.replace(/[^_a-zA-Z]/g,)"> 2.只能輸入數字和英文 <input type"text" …