測試幾個 ocr 對日語的識別情況
- 1. EasyOCR
- 2. PaddleOCR
- 3. Deepdoc(識別pdf中圖片)
- 4. Deepdoc(識別pdf中文字)
- 5. Nvidia neva-22b
- 6. Claude 3.5 sonnet 識別圖片中的文字
- 7. Claude 3.5 sonnet 識別 pdf 中表格
- 8. OpenAI gpt-4o 識別圖片中文字
- 9. OpenAI gpt-4o 識別 pdf 中表格
1. EasyOCR
github: https://github.com/JaidedAI/EasyOCR
jaided: https://www.jaided.ai/easyocr/
測試圖片:
識別效果:
結論:
效果不行
2. PaddleOCR
Github: https://github.com/PaddlePaddle/PaddleOCR
WebUI: https://aistudio.baidu.com/community/app/91660/webUI
測試圖片:
識別效果:
結論:
效果不行
3. Deepdoc(識別pdf中圖片)
Github: https://github.com/infiniflow/ragflow/tree/main/deepdoc
測試內容:
識別效果:
結論:
沒識別成功
4. Deepdoc(識別pdf中文字)
Github: https://github.com/infiniflow/ragflow/tree/main/deepdoc
測試內容:
識別效果:
Oのra開c発le チDaーtaムbaはse、2A3Iとaiの開提発供者開の始生を産発性表向で上きにる重こ點とをを置嬉いしてく、思OrいacまleすD。atこabのas4e年の間次、のO長ra期cサle ポDaーtaトba?seリリースの提供に向けて懸命に取り組んできました。このリリースではAIに焦點を當てており、データベースの名前をOracle Database 23cからOracle Database 23aiに変更することを決定しました。これは、このリリースの焦點と、リリースされる情勢を反映しています。、のの焦點、情勢反映。
結論:
效果不行
5. Nvidia neva-22b
neva-22b: https://build.nvidia.com/nvidia/neva-22b
結論:
沒識別出來
6. Claude 3.5 sonnet 識別圖片中的文字
please identify the text in the picture, response the text only in it's original language.
7. Claude 3.5 sonnet 識別 pdf 中表格
Convert the entire table to markdown format, preserving its original language. Include all content from all pages, even if information is repeated across multiple pages. Present the complete table without omitting any sections.
8. OpenAI gpt-4o 識別圖片中文字
9. OpenAI gpt-4o 識別 pdf 中表格
Please convert the entire table to Markdown format, preserving its original language. Include all content from all pages, even if information is repeated across multiple pages. Present the complete table without omitting any sections, and make sure to include any duplicated information exactly as it appears in the original document.
問題點:
表頭被重復打印了
完結!