文章目錄
- 一、項目概覽
- 相關資源
- 核心特性
- 技術特點
- 二、安裝
- 三、使用說明
- 環境要求
- 四、版本更新
- 五、當前限制
一、項目概覽
MixTeX是一款創新的多模態LaTeX識別小程序,支持本地離線環境下的高效CPU推理。
無論是LaTeX公式、表格還是混合文本,MixTeX都能輕松識別,并支持中英文處理。
相關資源
- 源碼:https://github.com/RQLuo/MixTeX-Latex-OCR
- 論文:https://arxiv.org/abs/2406.17148
- Colab演示:https://colab.research.google.com/github/RQLuo/MixTeX/blob/main/MixTex_Demo.ipynb
- Hugging Face空間:https://huggingface.co/MixTex/ZhEn-Latex-OCR
- 演示視頻:https://www.youtube.com/watch?v=PqQdQ5xT-vk
- 在線演示:https://mineai.top/
- 贊賞支持:https://github.com/user-attachments/assets/9f52a771-ab84-466c-9a7e-629060e251cc
核心特性
1、LaTeX公式識別
準確識別復雜的LaTeX數學公式,確保數學表達式準確性
2、表格識別
高效處理并識別各類表格,生成對應的LaTeX表格代碼
3、混合文本識別
同時處理包含文字、公式和表格的文本,保證識別結果的完整性
4、雙語支持
支持中文和英文的高精度識別,滿足不同語言環境需求
技術特點
- 本地離線推理,無需網絡連接
- 輕量級設計,程序啟動文件僅約50MB
- 高效運行,模型加載后運行極快
- 無需GPU,僅需CPU即可運行
二、安裝
cd mixtexgui
conda create -n mixtex python=3.10.14
conda activate mixtex
pip install -r requirements.txt
pyinstaller mixtex_ui.spec
三、使用說明
1、剪貼板圖片識別:按Win+V
啟用剪貼板功能
2、截圖識別:使用Windows截圖工具或鍵盤截圖鍵
環境要求
推薦LaTeX配置:
\documentclass{ctexart}
\usepackage{amssymb}
\usepackage{amsmath}
\usepackage{stmaryrd}
\usepackage{color}
四、版本更新
v1.0.1 修復文件復制問題
v1.0.2 解決高色域顯示器兼容問題
v1.1.2 優化花括號和表格識別
v2.1.2 支持手寫文本混合公式
v2.2.3 支持黑色背景識別
v3.2.4 支持多選題OCR,優化多行公式處理
五、當前限制
- 僅支持清晰印刷體中英文混合公式
- 僅支持相對簡單表格識別
- 未來計劃支持手寫識別和多語言
伊織 xAI 2025-05-04(日)