LLM面試題六

NLP方向CRF算法面試題

  1. 什么是CRF?CRF的主要思想是什么?

????設X與Y是隨機變量,P(Y | X)是給定條件X的條件下Y的條件概率分布,若隨機變量Y構成一個由無向圖G=(V,E)表示的馬爾科夫隨機場。則稱條件概率分布P(X | Y)為條件隨機場。CRF的主要思想統計全局概率,在做歸一化時,考慮了數據在全局的分布。

在這里插入圖片描述

  1. CRF的三個基本問題是什么?
  • 概率計算問題定義:給定觀測序列x和狀態序列y,計算概率P(y | x)
  • 解決方法:前向計算、后向計算
  • 學習計算問題定義:給定訓練數據集估計條件隨機場模型參數的問題,即條件隨機場的學習問題。
  • 公式定義:利用極大似然的方法來定義目標函數
  • 解決方法:隨機梯度法、牛頓法、擬牛頓法、迭代尺度法這些優化方法來求解得到參數。
  • 目標:解耦模型定義,目標函數,優化方法
  • 預測問題定義:給定條件隨機場P(Y | X)和輸入序列(觀測序列)x,求條件概率最大的輸出序列(標記序列)y*,即對觀測序列進行標注。
  • 方法:維特比算法
  1. 線性鏈條件隨機場的參數化形式?

????在隨機變量X取值為X的條件下,隨機變量Y取值為y的條件概率如下:P(ulx)=Z(aexp王紅-,0+于4利)其中,Z)=∑xp∑s(-1,x司+∑4s,劉

  • Z(x):是規范化因子,求和是在所有可能得輸出序列上進行的。
  • t_k:是定義在邊上的特征函數,稱為轉移特征,依賴于當前和前一個位置
  • s_l:是定義在結點上的特征函數,稱為狀態特征,依賴于當前位置;
  1. CRF的優缺點是什么?
  • 優點:為每個位置進行標注過程中可利用豐富的內部及上下文特征信息
  • CRF模型在結合多種特征方面的存在優勢
  • 避免了標記偏置問題
  • CRF的性能更好,對特征的融合能力更強
  • 缺點:訓練模型的時間比ME更長,且獲得的模型非常大。在一般的PC機上可能無法執行
  • 特征的選擇和優化是影響結果的關鍵因素。特征選擇問題的好與壞,直接決定了系統性能的高低
  1. HMM與CRF的區別?
  • 共性:都常用來做序列標注的建模,像詞性標注。HMM是有向圖,CRF是無向圖.
  • HMM只使用了局部特征(齊次馬爾科夫假設和觀測獨立性假設),只能找到局部最優解;CRF使用了全局特征(在所有特征進行全局歸一化),可以得到全局的最優值。
  • 隱馬爾可夫模型(HMM)是描述兩個序列聯合分布P(I,O)的概率模型;條件隨機場模型(CRF)是給定觀測狀態O的條件下預測狀態序列I的P(I/O)的條件概率模型。
  • HMM是生成模型,CRF是判別模型。CRF包含HMM,或者說HMM是CRF的一種特殊情況。
  1. 生成模型與判別模型的區別?
  • 生成模型:學習得到聯合概率分布P(x, y),即特征X,共同出現的概率
  • 常見的生成模型:樸素貝葉斯模型,混合高斯模型,HMM模型。
  • 判別模型:學習得到條件概率分布P(y | x),即在特征x出現的情況下標記y出現的概率。
  • 常見的判別模型:感知機,決策樹,邏輯回歸,SVM,CRF等。
  • 判別式模型:要確定一個羊是山羊還是綿羊,用判別式模型的方法是從歷史數據中學習到模型,然后通過提取這只羊的特征來預測出這只羊是山羊的概率,是綿羊的概率。
  • 生成式模型:是根據山羊的特征首先學習出一個山羊的模型,然后根據綿羊的特征學習出一個綿羊的模型,然后從這只羊中提取特征,放到山羊模型中看概率是多少,再放到綿羊模型中看概率是多少,哪個大就是哪個。

NLP方向文本分類常見面試題

  1. 文本分類任務有哪些應用場景?

????文本分類時機器學習匯總常見的監督學習任務質疑,常見的應用場景如情感分類、新聞分類、主題分類、問答匹配、意圖識別、推斷等等。分類任務根據具體的數據集的標簽情況,還可以分為二分類、多分類、多標簽分類等。

  1. 文本分類的具體流程?

????文本分類的流程一般包括文本預處理、特征提取、文本表示、最后分類輸出。文本處理通常需要做分詞及去除停用詞等操作,常會使用一些分詞工具,如hanlp、jieba、哈工大LTP、北大pkuseg等。

在這里插入圖片描述

  1. fastText的分類過程?fastText的優點?

????fastText首先把輸入轉化為詞向量,取平均,再經過線性分類器得到類別。輸入的詞向量可以是預先訓練好的,也可以隨機初始化,跟著分類狂務一起訓練fastText是一個快速文本分類算法,與基于神經網絡的分類算法相比有兩大優點:

  • fastText在保持高精度的情況下加快了訓練速度和測試速度
  • fastText不需要預訓練好的詞向量,fastText會自己訓練詞向量
  • fastText兩個重要的優化:使用層級Softmax提升效率、采用了char-level的n-gram作為附加特征。
  1. TextCNN進行文本分類的過程?

????卷積神經網絡的核心思想是捕捉局部特征,對于文本來說,局部特征就是由若干單詞組成的滑動窗口,類似于N-gram。卷積神經網絡的優勢在于能夠自動地對N-gram特征進行組合和篩選,獲得不同抽象層次的語義信息。因此文本分類任務中可以利用CNN來提取句子中類似n-gram的關鍵信息。

在這里插入圖片描述

  • 第一層為輸入層。將最左邊的7乘5的句子矩陣,每行是詞向量,維度=5,這個可以類比為圖像中的原始像素點了。圖中的輸入層實際采用了雙通道的形式,即有兩個n×k的輸入矩陣,其中一個用預訓練好的詞嵌入表達,并且在訓練過程中不再發生變化;另外一個也由同樣的方式初始化,但是會作為參數,隨著網絡的訓練過程發生改變。
  • 第二層為卷積層。然后經過有filter_size=(2,3,4)的一維卷積層,每個filter_size有兩個輸出channel。第三層是一個1-max_pooling層,這樣不同長度句子經過pooling層之后都能變成定長的表示了。
  • 最后接一層全連接的softmax層,輸出每個類別的概率。每個詞向量可以是預先在其他語料庫中訓練好的,也可以作為未知的參數由網絡訓練得到。
  1. TextCNN可以調整哪些參數?
  • 輸入詞向量表征:詞向量表征的選取(如選word2vec還是GloVe)
  • 卷積核大小:一個合理的值范圍在1~10。若語料中的句子較長,可以考慮使用更大的卷積核。另外,可以在尋找到了最佳的單個filter的大小后,嘗試在該filter的尺寸值附近尋找其他合適值來進行組合。實踐證明這樣的組合效果往往比單個最佳filter表現更出色
  • feature map特征圖個數:主要考慮的是當增加特征圖個數時,訓練時間也會加長,因此需要權衡好。這個參數會影響最終特征的維度,維度太大的話訓練速度就會變慢。這里在100-600之間調參即可。當特征圖數量增加到將性能降低時,可以加強正則化效果,如將dropout率提高過0.5
  • 激活函數:ReLU和tanh
  • 池化策略:1-max pooling表現最佳,復雜任務選擇k-max
  • 正則化項(dropout/機2):指對CNN參數的正則化,可以使用dropout或L2,但能起的作用很小,可以試下小的dropout率(<0.5),L2限制大一點
  1. 文本分類任務使用的評估指標有哪些?

????準確率、召回率、ROC,AUC,F1、混淆矩陣

在這里插入圖片描述

NLP方向文本摘要常見面試題

  1. 抽取式摘要和生成式摘要存在哪些問題?
  • 抽取式摘要在語法、句法上有一定的保證,但是也面臨了一定的問題,例如:內容選擇錯誤、連貫性差、靈活性差等問題。
  • 生成式摘要優點是相比于抽取式而言用詞更加靈活,因為所產生的詞可能從未在原文中出現過。但存在以下問題:
  • OOV問題。源文檔語料中的詞的數量級通常會很大,但是經常使用的詞數量則相對比較固定。因此通常會根據詞的頻率過濾掉一些詞做成詞表。這樣的做法會導致生成摘要時會遇到UNK的詞。
  • 摘要的可讀性。通常使用貪心算法或者beam search方法來做decoding。這些方法生成的句子有時候會存在不通順的問題。
  • 摘要的重復性。這個問題出現的頻次很高。與2的原因類似,由于一些decoding的方法的自身缺陷,導致模型會在某一段連續timesteps生成重復的詞。
  • 長文本摘要生成難度大。對于機器翻譯來說,NLG的輸入和輸出的語素長度大致都在一個量級上,因此NLG在其之上的效果較好。但是對摘要來說,源文本的長度與目標文本的長度通常相差很大,此時就需要encoder很好的將文檔的信息總結歸納并傳遞給decoder,decoder需要完全理解并生成句子。
  1. Pointer-generator network解決了什么問題?
  • 指針生成網絡從兩方面針對seq-to-seq模型在生成式文本摘要中的應用做了改進。
  • 第一,使用指針生成器網絡可以通過指向從源文本中復制單詞(解決OOV的問題),這有助于準確復制信息,同時保留generater的生成能力。PGN可以看作是抽取式和生成式摘要之間的平衡。通過一個門來選擇產生的單詞是來自于詞匯表,還是來自輸入序列復制。
  • 第二,使用coverage跟蹤摘要的內容,不斷更新注意力,從而阻止文本不斷重復(解決重復性問題)。利用注意力分布區追蹤目前應該被覆蓋的單詞,當網絡再次注意同一部分的時候予以懲罰。
  1. 文本摘要有哪些應用場景?

????文本摘要技術有許多應用場景。例如,在新聞報道領域,可以使用文本摘要技術快速生成新聞摘要,使讀者可以快速了解新聞內容:在市場調查領域,可以使用文本摘要技術對大量用戶反饋進行快速分析,提取出關鍵信息,從而更好地了解市場需求;在醫學領域,可以使用文本摘要技術從海量醫學文獻中快速找到相關研究成果,以幫助醫生更好地做出診療決策。

  1. 幾種ROUGE指標之間的區別是什么?
  • ROUGE是將待審摘要和參考摘要的元組共現統計量作為評價依據。
  • ROUGE-N=每個n-gram在參考摘要和系統摘要中同現的最大次數之和/參考摘要中每個n-gram出現的次數之和
  • ROUGE-L計算最長公共子序列的匹配率,L是LCS(longest common subsequence)的首字母。如果兩個句子包含的最長公共子序列越長,說明兩個句子越相似。
  • Rouge-W是Rouge-L的改進版,使用了加權最長公共子序列(Weighted LongestCommon Subsequence),連續最長公共子序列會擁有更大的權重。

在這里插入圖片描述

  1. BLEU和ROUGE有什么不同?
  • BLEU是2002年提出的,而ROUGE是2003年提出的。
  • BLEU的計算主要基于精確率,ROUGE的計算主要基于召回率。
  • ROUGE用作機器翻譯評價指標的初衷是這樣的;在SMT(統計機器翻譯)時代,機器翻譯效果稀爛,需要同時評價翻譯的準確度和流暢度;等到MT(神經網絡機器翻譯)出來以后,神經網絡腦補能力極強,翻譯出的結果都是通順的,但是有時候容易瞎翻譯。
  • ROUGE的出現很大程度上是為了解決NMT的漏翻問題(低召回率)。所以ROUGE只適合評價NMT,而不適用于SMT,因為它不管候選譯文流不流暢。
  • BLEU需要計算譯文1-gram,2-gram,.,N-gram的精確率,一般N設置為4即可,公式中的Pn指n-gram的精確率。Wn指n-gram的權重,一般設為均勻權重,即對于任意n都有Wn=1/N。BP是懲罰因子,如果譯文的長度小于最短的參考譯文,則BP小于1。BLEU的1-gram精確率表示譯文忠于原文的程度,而其他n-gram表示翻譯的流暢程度。

在這里插入圖片描述

海康-CV算法工程師實習面試題

  1. YOLO的正負樣本是什么?

????在YOLO算法中,目標物體被定義為一組邊界框,也稱為錨框(anchor box)。每個錨框都由其中心點坐標、寬度和高度來定義。對于每個錨框,計算它與所有目標物體的loU(交并比)值。如果U大于某個閾值(如0.5),則將該錨框標記為正樣本,否則將其標記為負樣本。

  1. 模型壓縮和加速的方法有哪些?
  • 參數剪枝(Parameter Pruning):別除模型中冗余的參數,減少模型的大小。通常情況下,只有很少一部分參數對模型的性能貢獻較大,其余參數對性能的貢獻較小或沒有貢獻,因此可以刪除這些冗余參數。
  • 量化(Quantization):將浮點型參數轉換為更小的整數或定點數,從而減小模型大小和內存占用,提高計算效率。
  • 知識蒸餾(Knowledge Distillation):利用一個較大、較準確的模型的預測結果來指導一個較小、較簡單的模型學習。這種方法可以減小模型的復雜度,提高模型的泛化能力和推理速度。
  • 網絡剪枝(Network Pruning):刪除模型中冗余的神經元,從而減小模型的大小。與參數剪枝不同,網絡剪枝可以刪除神經元而不會刪除對應的參數。
  • 蒸餾對抗網絡(Distil訓ation Adversarial Networks):在知識蒸餾的基礎上,通過對抗訓練來提高模型的魯棒性和抗干擾能力。
  • 模型量化(Model Quantization):將模型的權重和激活函數的精度從32位浮點數減少到更小的位數,從而減小模型的大小和計算開銷。
  • 層次化剪枝(Layer–wise Pruning):對模型的不同層進行不同程度的剪枝,以實現更高效的模型壓縮和加速。
  • 低秩分解(Low-Rank Decomposition):通過將一個較大的權重矩陣分解為幾個較小的權重矩陣,從而減少計算開銷。
  • 卷積分解(Convolution Decomposition):將卷積層分解成幾個更小的卷積層或全連接層,以減小計算開銷。
  • 網絡剪裁(Network Trimming):通過對模型中一些不重要的連接進行剪裁,從而減小計算開銷。
  1. 半精度是什么?

????半精度是指使用16位二進制浮點數(half-precision floating point.)來表示數字的數據類型,可以加速計算和減小內存占用。

  1. 半精度的理論原理是什么?

????半精度使用16位二進制浮點數來表示數字,其中1位表示符號位,5位表示指數,10位表示尾數。相比于單精度(32位)和雙精度(64位)的浮點數,半精度的表示范圍和精度更小,但可以通過降低內存占用和加速計算來實現高效的運算。

  1. 你了解的知識蒸餾模型有哪些?
  • FitNets:使用一個大型模型作為教師模型來指導一個小型模型的訓練。
  • Hinton蒸餾:使用一個大型模型的輸出作為標簽來指導一個小型模型的訓練。
  • Borm-Again Network(BAN):使用一個已經訓練好的模型來初始化一個新模型,然后使用少量的數據重新訓練模型。
  • TinyBERT:使用一個大型BERT模型作為教師模型來指導一個小型BERT模型的訓練。
  1. 自監督、半監督、無監督的區別?
  • 自監督學習:使用輸入數據的某些屬性(例如,數據本身的結構或某些隱含信息)來作為監督信號,從而避免了手動標注的成本。例如,圖像數據可以通過旋轉、剪切等方式進行擴增,并使用數據自身的變換作為監督信號來訓練模型。
  • 半監督學習:是指使用有標注和無標注的數據來訓練模型。通常情況下,有標注的數據只是無標注數據的一個子集。通過同時使用有標注和無標注數據進行訓練,可以提高模型的性能和泛化能力。
  • 無監督學習:是指在沒有標注數據的情況下,通過分析數據本身的結構、模式和相關性來學習模型。無監督學習的目標是從數據中發現一些有用的結構,例如聚類、降維、密度估計等。常見的無監督學習方法包括自編碼器、生成對抗網絡、變分自編碼器等。與監督和半監督學習不同,無監督學習不需要手動標注數據,因此可以處理大量未標注的數據,從而提高數據利用率和模型性能。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/76646.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/76646.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/76646.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

每日一題(小白)ASCLL娛樂篇5

本題我們使用ASCLL值的方法解決&#xff0c;也可以打表去判斷。加深對ASCLL表的認識&#xff01; 圖源ASCII 表 | 菜鳥教程&#xff0c;有需要的小伙伴可以在菜鳥詳細了解。 由題知要識別三種類型的字符&#xff0c;使用三個變量存儲最終值輸出即可。根據ASCLL表可知數字、大寫…

ffmpeg中格式轉換需要注意點總結

某些封裝格式(例如MP4/FLV/MKV等)的H.264碼流的SPS和PPS信息存儲在AVCodeccontext結構體的extradata中。分離某些封裝格式(例如MP4/FLV/MKV等)中的H.264的時候&#xff0c;需要首先寫入SPS和PPS&#xff0c;否則會導致分離出來的數據沒有SPS、PPS而無法播。需要使用ffmpeg中名稱…

小型語言模型與檢索增強生成系統的融合:機遇與挑戰

小型語言模型(SLMs)是大型語言模型(LLMs)的緊湊版本。其參數量通常比大型模型少得多&#xff1a;約30億或更少。這使得它們具有相對輕量級的特點&#xff0c;推理速度更快。 當前研究的一個有趣方向是將SLMs整合到檢索增強生成(RAG)系統中以提升性能。本文探討這一最新趨勢&…

使用 .NET 9 和 Azure 構建云原生應用程序:有什么新功能?

隨著 .NET 9 推出一系列以云為中心的增強功能&#xff0c;開發人員擁有比以往更多的工具來在 Azure 上創建可擴展、高性能的云原生應用程序。讓我們深入了解 .NET 9 中的一些出色功能&#xff0c;這些功能使構建、部署和優化云應用程序變得更加容易&#xff0c;并附有示例以幫助…

PostgreSQL:表分區與繼承

&#x1f9d1; 博主簡介&#xff1a;CSDN博客專家&#xff0c;歷代文學網&#xff08;PC端可以訪問&#xff1a;https://literature.sinhy.com/#/?__c1000&#xff0c;移動端可微信小程序搜索“歷代文學”&#xff09;總架構師&#xff0c;15年工作經驗&#xff0c;精通Java編…

Linux / Windows 下 Mamba / Vim / Vmamba 安裝教程及安裝包索引

目錄 背景0. 前期環境查詢/需求分析1. Linux 平臺1.1 Mamba1.2 Vim1.3 Vmamba 2. Windows 平臺2.1 Mamba2.1.1 Mamba 12.1.2 Mamba 2- 治標不治本- 終極版- 高算力版 2.2 Vim- 治標不治本- 終極版- 高算力版 2.3 Vmamba- 治標不治本- 終極版- 高算力版 3. Linux / Windows 雙平…

開源項目更新到個人倉庫二次開發并保持同步

當你克隆了一個開源項目并將其推送到自己的倉庫后&#xff0c;定期更新該開源項目并與你的本地修改同步是一個常見的需求。為了高效地管理這一過程&#xff0c;你可以使用 Git 的 upstream 遠程倉庫和 rebase 技術來保持代碼的整潔和線性歷史。 1. 設置上游遠程倉庫 首先&…

多輸入多輸出 | Matlab實現BO-GRU貝葉斯優化門控循環單元多輸入多輸出預測

多輸入多輸出 | Matlab實現BO-GRU貝葉斯優化門控循環單元多輸入多輸出預測 目錄 多輸入多輸出 | Matlab實現BO-GRU貝葉斯優化門控循環單元多輸入多輸出預測預測效果基本介紹程序設計參考資料 預測效果 基本介紹 Matlab實現BO-GRU貝葉斯優化門控循環單元多輸入多輸出預測&#…

MCP(模型上下文協議)入門指南:用Web開發的視角理解下一代AI引擎

引言&#xff1a;當Java Web遇到長期記憶 想象你正在開發一個在線法律咨詢平臺。用戶上傳一份300頁的合同后&#xff0c;連續提出了10個問題&#xff1a; 第3頁的違約條款具體內容是什么&#xff1f;請對比第15頁和第120頁的支付條件整份合同中最高的賠償金額是多少&#xff…

簡易Minecraft python

廢話多說 以下是一個基于Python和ModernGL的簡化版3D沙盒游戲框架。由于代碼長度限制&#xff0c;這里提供一個核心實現&#xff08;約500行&#xff09;&#xff0c;您可以通過添加更多功能和內容來擴展它&#xff1a; python import pygame import moderngl import numpy a…

element-ui自制樹形穿梭框

1、需求 由于業務特殊需求&#xff0c;想要element穿梭框功能&#xff0c;數據是二級樹形結構&#xff0c;選中左邊數據穿梭到右邊后&#xff0c;左邊數據不變。多次選中左邊相同數據進行穿梭操作&#xff0c;右邊數據會多次增加相同的數據。右邊數據穿梭回左邊時&#xff0c;…

WPS宏開發手冊——Excel實戰

目錄 系列文章5、Excel實戰使用for循環給10*10的表格填充行列之和使用for循環將10*10表格中的偶數值提取到另一個sheet頁使用for循環給寫一個99乘法表按市場成員名稱分類&#xff08;即市場成員A、B、C...&#xff09;&#xff0c;統計月內不同時間段表1和表2的乘積之和&#x…

計算機網絡-TCP的流量控制

內容來源&#xff1a;小林coding 本文是對小林coding的TPC流量控制的精簡總結 什么是流量控制 發送方不能無腦的發數據給接收方&#xff0c;要考慮接收方處理能力 如果一直無腦的發數據給對方&#xff0c;但對方處理不過來&#xff0c;那么就會導致觸發重發機制 從而導致網…

Spring Boot 七種事務傳播行為只有 REQUIRES_NEW 和 NESTED 支持部分回滾的分析

Spring Boot 七種事務傳播行為支持部分回滾的分析 支持部分回滾的傳播行為 REQUIRES_NEW&#xff1a;始終開啟新事務&#xff0c;獨立于外部事務&#xff0c;失敗時僅自身回滾。NESTED&#xff1a;在當前事務中創建保存點&#xff08;Savepoint&#xff09;&#xff0c;可局部…

突破反爬困境:SDK開發,瀏覽器模塊(七)

聲明 本文所討論的內容及技術均純屬學術交流與技術研究目的&#xff0c;旨在探討和總結互聯網數據流動、前后端技術架構及安全防御中的技術演進。文中提及的各類技術手段和策略均僅供技術人員在合法與合規的前提下進行研究、學習與防御測試之用。 作者不支持亦不鼓勵任何未經授…

C++數據排序( 附源碼 )

一.冒泡排序 原理:自左向右依次遍歷,若相鄰兩數順序錯誤,則交換兩數. 這樣,每一輪結束后,最大/最小的數就會到最后. Code: #include <iostream> #include <cstdio> using namespace std; const int N1e51; int n,a[N],in; void PrintArray(int a[],int n){for…

I2C 讀寫 AT24C02

根據AT24C02的 Datasheet 可知AT24C02有2K bit&#xff0c;即256B&#xff0c;分為32頁,每頁8個字節&#xff0c;結合數據手冊和原理圖可以得知&#xff0c;板載AT24C02的讀地址為0xA2&#xff0c;寫地址為0xA3&#xff1a; #define AT24C02_ADDR_WRITE 0xA2 #define AT24C02_…

K8S學習之基礎七十四:部署在線書店bookinfo

部署在線書店bookinfo 在線書店-bookinfo 該應用由四個單獨的微服務構成&#xff0c;這個應用模仿在線書店的一個分類&#xff0c;顯示一本書的信息&#xff0c;頁面上會顯示一本書的描述&#xff0c;書籍的細節&#xff08;ISBN、頁數等&#xff09;&#xff0c;以及關于這本…

Linux 查找文本中控制字符所在的行

參考資料 ASCIIコード表 目錄 一. 業務背景二. 遇到的問題三. 分析3.1 url編碼的前置知識3.2 出現控制字符的transactionid分析3.3 16進制分析 四. 從文本中查找控制字符所在的行五. 控制字符一覽 一. 業務背景 ?在項目中&#xff0c;業務請求對應著下URL http://www.test.…

python將pdf文件轉為圖片,如果pdf文件包含多頁,將轉化的多個圖片通過垂直或者水平合并成一張圖片

要將PDF文件轉換為圖片&#xff0c;并將多頁PDF垂直合并成一張圖片&#xff0c;可以使用PyMuPDF&#xff08;也稱為fitz&#xff09;庫來讀取PDF文件&#xff0c;并使用Pillow庫來處理和合并圖片。以下是一個示例代碼&#xff0c;展示了如何實現這個功能&#xff1a; 首先&…