測試幾個 ocr 對日語的識別情況

測試幾個 ocr 對日語的識別情況

  • 1. EasyOCR
  • 2. PaddleOCR
  • 3. Deepdoc(識別pdf中圖片)
  • 4. Deepdoc(識別pdf中文字)
  • 5. Nvidia neva-22b
  • 6. Claude 3.5 sonnet 識別圖片中的文字
  • 7. Claude 3.5 sonnet 識別 pdf 中表格
  • 8. OpenAI gpt-4o 識別圖片中文字
  • 9. OpenAI gpt-4o 識別 pdf 中表格

1. EasyOCR

github: https://github.com/JaidedAI/EasyOCR

jaided: https://www.jaided.ai/easyocr/

測試圖片:

在這里插入圖片描述
識別效果:

在這里插入圖片描述
在這里插入圖片描述
結論:
效果不行

2. PaddleOCR

Github: https://github.com/PaddlePaddle/PaddleOCR

WebUI: https://aistudio.baidu.com/community/app/91660/webUI

測試圖片:

在這里插入圖片描述
識別效果:

在這里插入圖片描述

在這里插入圖片描述

結論:
效果不行

3. Deepdoc(識別pdf中圖片)

Github: https://github.com/infiniflow/ragflow/tree/main/deepdoc

測試內容:

在這里插入圖片描述
識別效果:

在這里插入圖片描述
結論:
沒識別成功

4. Deepdoc(識別pdf中文字)

Github: https://github.com/infiniflow/ragflow/tree/main/deepdoc

測試內容:

在這里插入圖片描述
識別效果:

Oのra開c発le チDaーtaムbaはse、2A3Iとaiの開提発供者開の始生を産発性表向で上きにる重こ點とをを置嬉いしてく、思OrいacまleすD。atこabのas4e年の間次、のO長ra期cサle ポDaーtaトba?seリリースの提供に向けて懸命に取り組んできました。このリリースではAIに焦點を當てており、データベースの名前をOracle Database 23cからOracle Database 23aiに変更することを決定しました。これは、このリリースの焦點と、リリースされる情勢を反映しています。、のの焦點、情勢反映。

結論:
效果不行

5. Nvidia neva-22b

neva-22b: https://build.nvidia.com/nvidia/neva-22b

在這里插入圖片描述
結論:
沒識別出來

6. Claude 3.5 sonnet 識別圖片中的文字

please identify the text in the picture, response the text only in it's original language.

在這里插入圖片描述

7. Claude 3.5 sonnet 識別 pdf 中表格

Convert the entire table to markdown format, preserving its original language. Include all content from all pages, even if information is repeated across multiple pages. Present the complete table without omitting any sections.

在這里插入圖片描述

8. OpenAI gpt-4o 識別圖片中文字

在這里插入圖片描述

9. OpenAI gpt-4o 識別 pdf 中表格

Please convert the entire table to Markdown format, preserving its original language. Include all content from all pages, even if information is repeated across multiple pages. Present the complete table without omitting any sections, and make sure to include any duplicated information exactly as it appears in the original document.

在這里插入圖片描述
問題點:
表頭被重復打印了

完結!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/40191.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/40191.shtml
英文地址,請注明出處:http://en.pswp.cn/web/40191.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

網頁計算器的實現

簡介 該項目實現了一個功能完備、交互友好的網頁計算器應用。只使用了 HTML、CSS 和 JavaScript ,用于檢驗web前端基礎水平。 開發環境:Visual Studio Code開發工具:HTML5、CSS3、JavaScript實現效果 功能設計和模塊劃分 顯示模塊&#…

Bean類的設計規范:Bean規范

Bean規范 類要求必須含有無參,公共的構造方法屬性必須私有化,然后提供公共的 set 和 get 方法

anaconda命令大全

目錄 查看所有虛擬環境查看某虛擬環境安裝的包創建虛擬環境激活創建好的虛擬環境回到之前的環境刪除創建的虛擬環境查看conda所在的位置、虛擬環境位置等信息conda修改虛擬環境所在的位置 查看所有虛擬環境 conda env list查看某虛擬環境安裝的包 激活要查看的虛擬環境之后&a…

Android 性能優化之啟動優化

文章目錄 Android 性能優化之啟動優化啟動狀態冷啟動溫啟動熱啟動 耗時檢測檢測手段TraceView使用方式缺點 Systrace環境配置使用方式TraceView和Systrace比較 AOP統計耗時環境配置使用 優化白屏優化異步加載優化環境配置使用 延遲加載優化AppStartup 源碼下載 Android 性能優化…

Reid系列論文學習——無人機場景下基于 Transformer 的輕量化行人重識別

今天介紹的一篇論文是針對無人機場景下的行人重識別,論文題目為:"無人機場景下基于 Transformer 的輕量化行人重識別"。該論文針對無人機場景下行人呈現多角度多尺度的特點、以及傳統CNN網絡在行人重識別任務中受限于感受野和下采樣導致的無法…

力扣1895.最大的幻方

力扣1895.最大的幻方 求前綴和暴力枚舉幻方邊長 求行列前綴和 class Solution {public:int largestMagicSquare(vector<vector<int>>& grid) {int n grid.size() , m grid[0].size();vector<vector<int>> rowsum(n,vector<int>(m));for…

關于汽車軟件測試的幾點想法

如果你有過汽車行業的從業經驗&#xff0c;你就應該知道&#xff0c;過去汽車行業只做測試&#xff0c;而不做開發。汽車制造商的主要任務&#xff08;從工程角度看&#xff09;是將來自數百家供應商的數千個零部件組裝在一起。考慮到現代軟件的復雜性和客戶的“挑剔”&#xf…

Rufus 制作啟動盤 | 便攜的工作空間

嘮嘮閑話 最近服務器硬盤故障多&#xff0c;在修復過程中&#xff0c;學習了一些操作&#xff0c;這里做個記錄。本期主要介紹 U盤啟動盤的制作&#xff0c;以及持久化存儲。 U 盤啟動盤 鏡像選擇 Ubuntu 的版本命名遵循 “Adjective Animal” 的模式&#xff0c;即 “形容…

【trition-server】python-backend 源碼閱讀

c++ 的stub 代碼import 了 python的類 sys 和 triton_python_backend_utils.pystub本身是一個進程,與主進程做IPC通信docker 運行一個trition-server (base) zhangbin@ubuntu-server:~$ docker run --shm-size=1g --ulimit memlock=-1 -p 8000:8000 -p 8001:8001 -p 8002:8002…

windwos環境和pyspark環境問題解決-記錄

一&#xff1a; 打不開cmd/cmd閃退問題解決 1.winR打開 regedit 2.在注冊表找到 HKEY_CURRENT_USER\Software\Microsoft\Command Processor路徑 3.在該路徑下找到AutoRun&#xff0c;將數值改為空 可能原因&#xff1a;找到AutoRun 發現值是&#xff1a; if exist & if…

新港海岸NCS8822 低功耗DP轉VGA 分辨率支持1920*1200*60HZ

NCS8822描述&#xff1a; NCS8822是一個低功耗顯示端口到vga轉換器。NCS8822集成了一個與DP1.2兼容的接收器和一個高速三通道視頻DAC。對于DP1.2輸入&#xff0c;NCS8822支持1車道/2車道&#xff0c;也支持車道交換功能。對于VGA輸出NCS8822&#xff0c;在60Hz幀率下對WUXGA&a…

C++ 棧-隊列-優先級隊列

目錄 1 棧 2 隊列 3 deque 介紹 4 優先級隊列 5 反向迭代器 棧也是我們在C語言就模擬實現過的一種數據結構&#xff0c;在C中&#xff0c;棧其實和我們前面模擬實現過的string、vector等容器有一點區別&#xff0c;站起是不是容器&#xff0c;而是一種容器適配器&#xff0c;我…

java必知必會-j2ee規范(上)

文章目錄 一、WEB三大規范二、j2ee相關接口(上)1.javax.servlet.Servlet2.javax.servlet.http.HttpServlet3.javax.servlet.ServletRequest4.javax.servlet.http.HttpServletRequest5.javax.servlet.ServletResponse6.javax.servlet.http.HttpServletResponse7. javax.servlet.…

k8s record 20240705

k8s 安全管理 request 是1g&#xff0c;你得不到要求&#xff0c;我就不創建了&#xff0c;這就是準入控制二次校驗 SA就是serviceAccount。 內部是SA和 token, 外部用戶進來就是 .kube/config文件 namespace下的是role&#xff0c;整個集群是 ClusterRole. 動作就是Binding li…

pytest-rerunfailures:優化測試穩定性的失敗重試工具

筆者在執行自動化測試用例時&#xff0c;會發現有時候用例失敗并非代碼問題&#xff0c;而是由于服務正在發版&#xff0c;導致請求失敗&#xff0c;從而降低了自動化用例的穩定性&#xff0c;最后還要花時間定位到底是自身case的原因還是業務邏輯問題&#xff0c;還是其他原因…

大數據面試題之Presto[Trino](3)

目錄 Presto如何處理數據的聚合操作&#xff1f; Presto支持哪些類型的JOIN操作&#xff1f; 如何在Presto中使用子查詢&#xff1f; 解釋Presto中的窗口函數。 Presto中的Page和Block是什么&#xff1f; 描述Presto如何處理列式存儲數據。 ORC和Parquet格式在Presto中的…

適合家居建材企業的CRM系統盤點(2024版)

當前&#xff0c;CRM市場上&#xff0c;國際巨頭的市場優勢正在逐漸減弱&#xff0c;國內CRM企業奮起追趕&#xff0c;呈現出強勁的崛起勢頭。因此&#xff0c;對于家居建材企業來講&#xff0c;在進行CRM選型時&#xff0c;如何選擇一款合適的系統是關乎企業高效發展的重要課題…

探索C嘎嘎的奇妙世界:第十九關---STL(list的模擬實現)

1. 基本框架 首先&#xff0c;我們先從節點的準備工作入手&#xff0c;請看示例&#xff1a; #pragma once #include<iostream> #include<assert.h> using namespace std; //節點 template<class T> struct ListNode {ListNode<T>* _next;Li…

矩陣鍵盤與密碼鎖

目錄 1.矩陣鍵盤介紹?編輯 2.掃描的概念 3.代碼演示&#xff08;讀取矩陣鍵盤鍵碼&#xff09; 4.矩陣鍵盤密碼鎖 1.矩陣鍵盤介紹 為了減少I/O口的占用&#xff0c;通常將按鍵排列成矩陣形式&#xff0c;采用逐行或逐列的 “掃描”&#xff0c;就可以讀出任何位置按鍵的狀態…

免殺筆記 ----> ShellCode Loader !!!

學了那么久的前置知識&#xff0c;終于到了能上線的地方了&#xff01;&#xff01;&#xff01; 不過這里還沒到免殺的部分&#xff0c;距離bypass一眾的殺毒軟件還有很長的路要走&#xff01;&#xff01; 目錄 1.ShellCode 2.ShellCode Loader的概念 3.可讀可寫可…