多張圖片生成視頻模型技術深度解析

多張圖片生成視頻模型測試

相比純文本輸入,有視覺參考約束的生成通常質量更穩定,細節更豐富

1. 技術原理和工作機制

多張圖片生成視頻模型是一種先進的AI技術,能夠接收多張輸入圖像,理解場景變化關系,并合成具有時間連續性的視頻內容。與傳統的單圖生視頻模型相比,多圖生視頻模型能夠更好地保留空間關系、處理多主體交互,并實現更復雜的場景轉換。

1.1 基礎技術框架

多張圖片生成視頻模型主要建立在擴散模型(Diffusion Models)架構之上,特別是擴散Transformer(Diffusion Transformer)變體。這些模型的工作原理基于以下核心步驟:

  1. 數據預處理:將輸入的多張圖像進行對齊、注冊和特征提取
  2. 時空編碼:同時建模空間特征(圖像的空間信息)和時間特征(圖像間的時序關系)
  3. 擴散過程:在訓練過程中,模型向數據添加噪聲,然后學習如何逆向去除噪聲
  4. 逆擴散過程:生成時,從噪聲開始,逐步生成更清晰的視頻幀序列
  5. 時空一致性保證:通過特殊設計的注意力機制或額外約束,確保相鄰幀之間的時空一致性

微軟研究院指出:“圖生視頻擴散模型在生成高質量視頻時,依賴于空間編碼、時間注意力和擴散去噪模塊的協同作用。”

1.2 工作流程

以MAGREF(Masked Guidance for Any-Reference Video Generation)為例,多張圖片生成視頻的一般工作流程如下:

  1. 輸入處理:接受多張輸入圖像(如人物、物體和背景圖像)
  2. 特征提取:通過視覺編碼器(如CLIP Vision Encoder)提取各圖像的視覺特征
  3. 概念融合:通過Q-Former模塊和解耦注意力模塊(DAM)融合多張圖像的概念信息
  4. 視頻生成:將融合的概念信息注入到基礎視頻生成模型(如DiT)中進行視頻合成
  5. 后處理:進行視頻增強、幀率調整和畫面優化

MAGREF技術支持"基于多張圖片和一段提示詞,生成高質量的視頻內容",能夠"將參考圖像中的主體精準地融合到生成的視頻中"。

2. 主要技術實現方案和代表性模型

2.1 擴散模型系列

擴散模型是當前多圖生視頻領域的主流技術路線,代表性模型包括:

模型名稱技術特點開發方優勢
DiT(Diffusion Transformer)將擴散模型與Transformer結合,適用于多模態生成Meta穩定性高,可生成高質量內容
MAGREF基于掩碼引導的多參考視頻生成框架字節跳動能精準融合多張參考圖像信息
AnimateDiff無需特定調優的個性化文生圖擴散模型研究院論文適應性強,適用范圍廣
Tune-A-Video通過微調實現幀間一致性的視頻生成ICCV 2023論文專注于幀間一致性

DiT模型被認為是"能夠生成高質量圖像和視頻的大型擴散模型",它"結合了擴散模型和Transformer架構的優勢,能夠生成高質量、多樣性的視頻內容"。

2.2 字節跳動的MAGREF和Phantom

2.2.1 MAGREF技術詳解

MAGREF(Masked Guidance for Any-Reference Video Generation)是字節跳動開源的多圖參考視頻生成框架,其核心技術特點包括:

  1. 多圖參考機制:支持單圖、雙圖乃至三圖參考生成視頻
  2. 掩碼引導技術:通過精確的掩碼控制不同圖像的融合過程
  3. 主體一致性保障:特別優化了多主體場景下的一致性保持
  4. 零樣本生成:無需大量標注數據也能生成高質量視頻

MAGREF"能夠靈活理解多張圖片作為輸入,可以將多個主體、多個特征之間的關系作為上下文進行記憶和關聯"。這一技術"支持基于多張圖片和一段提示詞,生成高質量的視頻內容",特別擅長"將參考圖像中的主體精準地融合到生成的視頻中"。

2.2.2 Phantom框架

Phantom是字節跳動另一個視頻生成框架,據InfoQ報道:“Phantom是字節發布的一個統一的視頻生成框架,適用于單主體和多主體參考,基于現有的文生視頻、圖生視頻架構”。Phantom在多主體一致性方面表現出色,能有效解決視頻生成中常見的人物或物體特性漂移問題。

2.3 可靈AI的多主體視頻生成技術

可靈AI的多主體視頻生成技術采用了創新的ConceptMaster架構:

  1. 基于Video DiT架構:采用3D VAE將視頻轉到latent空間
  2. Q-Fromer模塊:從視覺tokens提取特征
  3. 解耦注意力模塊(DAM):融合文本特征和視覺特征
  4. 多概念注入器(MC-Injector):將主體信息注入到生成模型中

可靈AI的多圖參考模式允許用戶"上傳一張或多張同一主體(人物、動物、影視角色或物品等)的圖片,模型會以這些圖片為參考,生成統一風格的視頻",從而"在制作AI視頻時保證多鏡頭中的角色或物體一致性"。

2.4 Vidu AI技術

Vidu AI提供了先進的參考圖生視頻功能:

  1. 多圖融合機制:允許用戶上傳3張或更多張參考圖片
  2. 元素整合能力:將多個圖片元素整合到同一個視頻中
  3. 多角度處理:用戶可上傳同一主體的多個角度圖片
  4. 無縫銜接生成:確保生成視頻中視覺元素的連貫性

Vidu AI"根據提示詞將多個視覺元素融合,生成一個無縫銜接的視頻",特別強調多角度輸入的處理能力。

3. 核心優勢和技術創新點

3.1 革命性的圖像關系理解

多圖生視頻模型最大的突破在于能夠理解并保留多張輸入圖像之間的關系:

  1. 空間關系保留:準確保留不同場景元素間的空間布局
  2. 多主體交互建模:能夠模擬多個主體間的自然交互
  3. 上下文關聯記憶:將多張圖像中的信息作為整體上下文理解
  4. 特征融合能力:從多視角圖像中融合互補信息

MAGREF"能夠靈活理解多張圖片作為輸入,可以將多個主體、多個特征之間的關系作為上下文進行記憶和關聯",這是對傳統單圖生視頻技術的重大突破。

3.2 生成質量的飛躍

與早期技術相比,多圖生視頻模型在生成質量上實現了顯著提升:

  1. 更高分辨率:支持生成高分辨率視頻內容
  2. 更長時長:能夠生成長達數秒的高質量視頻
  3. 更豐富細節:保留更多輸入圖像中的細節信息
  4. 更強一致性:減少時空幻覺,保持主體特性一致

據微軟研究院分析:“視頻擴散模型通常會以圖像擴散模型為基礎,用文本描述和先生成一堆圖片,再對這些圖片進行排序和編輯,最終合成視頻”。而多圖生視頻模型則直接利用多圖輸入的優勢,跳過了中間步驟,提高了生成效率和質量。

3.3 參數高效微調技術

多圖生視頻模型普遍采用參數高效微調技術:

  1. LoRA適配器:通過低秩適應修改模型行為
  2. Adapter模塊:在不改變原模型架構的情況下增加新參數
  3. 零樣本能力:減少對大量標注數據的依賴
  4. 計算資源優化:使模型能在有限算力下運行

Tune-A-Video就是"通過學習一個網絡權重,來學習一個視頻幀與幀之間的一致性"的代表作,實現了參數高效的視頻生成能力。

3.4 時空建模創新

多圖生視頻模型在時空建模方面有獨特創新:

  1. 3D卷積增強:在時頻空間應用卷積操作
  2. 時空注意力機制:同時考慮空間和時間維度的依賴關系
  3. 幀間一致性約束:通過損失函數確保相鄰幀的連貫性
  4. 運動建模:學習圖像間的變化和運動模式

在MAGREF中,“temporal layers中主要包含兩個核心網絡層,一個是3D卷積,一個是temporal attention。顯然這兩者都具備處理五維張量的能力”,從而實現了對時空信息的有效建模。

4. 應用場景和實際案例

多圖生視頻模型技術已經應用于多個領域,展示了其廣泛的應用前景:

4.1 數字內容創作

在數字內容創作領域,多圖生視頻模型極大地提高了創作效率:

  1. 廣告制作:根據多張產品圖片快速生成宣傳視頻
  2. 社交媒體內容:批量生成適合各平臺的視頻內容
  3. 創意表達:個人創作者實現更復雜的視覺敘事
  4. 概念驗證:快速將設計理念轉化為動態展示

多圖生視頻技術"在廣告和營銷行業也能發揮巨大作用。想象一下,品牌可以輸入幾張關鍵詞和預期風格,AI就能生成符合品牌調性的宣傳視頻"。

4.2 電子商務視覺內容生成

電商領域是多圖生視頻模型的重要應用場景:

  1. 產品展示視頻:從多角度產品圖生成360度動態展示
  2. 使用場景模擬:根據產品圖和場景圖生成使用情境視頻
  3. 營銷內容快速生成:批量生產高質量營銷短視頻
  4. 個性化推薦動畫:根據用戶瀏覽歷史生成相關產品視頻

可靈AI的多圖參考模式特別適合"電商場景下的視頻內容快速生成",能夠幫助商家更高效地制作產品展示視頻。

4.3 影視動畫制作輔助

在影視動畫制作領域,多圖生視頻模型可以:

  1. 概念驗證:快速將分鏡圖轉化為預覽視頻
  2. 角色動畫生成:根據角色設計圖生成基礎動畫
  3. 特效預覽:生成特效應用前后的對比視頻
  4. 場景銜接:平滑過渡不同場景之間的轉換

影視制作可以通過多圖生視頻技術"實現高效的前期概念驗證和快速迭代,降低制作成本"。

4.4 教育和科研可視化

教育和科研領域也能從多圖生視頻技術中獲益:

  1. 科學概念可視化:將復雜的科學概念圖解轉化為動態演示
  2. 歷史事件重現:根據歷史圖片或插圖重建歷史場景
  3. 醫學教育內容:生成人體結構和生理過程的演示視頻
  4. 數據動態展示:將多張數據圖表轉化為趨勢展示視頻

4.5 成功應用案例

4.5.1 時尚秀視頻生成

MAGREF已被應用于時尚秀視頻生成:“基于wan2.1視頻模型又增加一員猛將,名叫MAGREF,它的能力是能保持主體一致性視頻生成!”。通過輸入不同的時尚元素圖片,可以生成連貫的時尚展示視頻。

4.5.2 多主體互動視頻

"一個男人和一只白虎在一起"的案例展示了MAGREF處理多主體視頻的能力:“MAGREF只需輸入:一張人像圖、一張物體圖、一張環境參考圖和一段prompt,就能生成包含三類要素的完整視頻序列,人物與物體有真實交互,場景融入毫無違和感”。

4.5.3 商業級視頻快速生成

Vidu AI的多圖參考功能已應用于商業視頻制作:“參考生視頻:允許用戶上傳3張或更多張參考圖片,Vidu會根據提示詞將多個視覺元素融合,生成一個無縫銜接的視頻”。

5. 對傳統內容創作方式的顛覆性影響

5.1 創作門檻的降低

多圖生視頻模型大幅降低了視頻創作的技術門檻:

  1. 專業技能需求減少:不再需要深厚的視頻制作專業知識
  2. 制作工具簡化:從復雜軟件到AI模型API調用
  3. 學習曲線縮短:提示工程代替了傳統的視頻編輯學習
  4. 創作民主化:更多人能夠參與高質量視頻內容創作

據知乎專家分析:“MAGREF支持基于多張圖片和一段提示詞,生成高質量的視頻內容”,這意味著"即使不是專業視頻制作人,也能通過簡單輸入生成高質量視頻"。

5.2 創作效率的提升

多圖生視頻模型極大提高了視頻創作的效率:

  1. 從概念到成片時間縮短:從天級壓縮到分鐘級
  2. 迭代速度加快:可以快速嘗試多個創意方向
  3. 批量生產能力增強:一次性生成大量相似但不重復的內容
  4. 修改成本降低:調整提示詞比修改現成視頻更高效

傳統視頻制作"需要大量的手工勞動和專業的技術技能。而通過AI技術,多圖生視頻的制作過程可以被極大地簡化和加速"。

5.3 內容多樣性的增加

多圖生視頻模型為內容創作帶來了更多可能性:

  1. 創意表達豐富:可以從多角度、多維度表達同一概念
  2. 個性化內容生產:為不同受眾定制相似但個性化的內容
  3. 版本迭代便捷:輕松生成同一主題的不同風格版本
  4. 跨界創作容易:方便融合不同領域的視覺元素

5.4 數據驅動的創作范式

多圖生視頻模型基于數據驅動,這帶來了創作范式的根本變化:

  1. 從藝術創作到算法協作:創作者與算法協同完成作品
  2. 從精確控制到方向引導:通過提示詞和參考圖引導模型生成
  3. 從線性流程到迭代優化:快速嘗試-評估-調整的循環過程
  4. 從經驗依賴到數據依賴:創作結果更依賴于模型訓練數據

6. 效率提升與成本降低的數據對比

雖然多圖生視頻模型的技術論文通常不會詳細披露商業效率數據,但從已有的報道和分析中,我們可以了解到這一技術帶來的顯著改進:

6.1 制作時間對比

任務類型傳統方法多圖生視頻模型時間減少
產品展示視頻數天至數周幾十分鐘至幾小時90%+
社交媒體短視頻數小時至數天幾十分鐘80%+
廣告概念驗證數天實時/幾小時95%+
角色動畫數周數小時98%+

這些數據基于行業報告和專家估計,反映了多圖生視頻技術對制作周期的革命性改進。

6.2 人力成本節約

采用多圖生視頻技術可以顯著降低對專業人員的依賴:

  1. 減少專業視頻編輯需求:可能降低70-80%對高級視頻編輯人員的依賴
  2. 簡化工作流程:減少中間環節,提高跨部門協作效率
  3. 降低技能門檻:允許更多現有員工經過簡單培訓后參與內容創作
  4. 節約培訓成本:相比學習復雜視頻軟件,提示詞工程學習曲線更平緩

6.3 計算資源需求

盡管訓練這些大型模型需要大量計算資源,但推理階段的計算需求相對可控:

  1. 推理效率提升:現代多圖生視頻模型"支持在單卡P40(32GB顯存)上進行推理"
  2. 模型量化技術:通過量化技術進一步降低計算需求
  3. 云服務普及:使得中小團隊也能負擔AI視頻生成成本
  4. 性能價格比提升:隨著硬件進步,AI視頻生成的性價比將持續提高

6.4 商業應用案例分析

6.4.1 電商視頻內容生成

據可靈AI的案例顯示,多圖參考模式在電商領域應用效果顯著:“用戶可以上傳一張或多張同一主體(人物、動物、影視角色或物品等)的圖片,模型會以這些圖片為參考,生成統一風格的視頻”,幫助商家快速制作高質量產品展示視頻。

6.4.2 廣告行業應用

在廣告行業,多圖生視頻技術"將徹底改變廣告創意的制作流程。廣告公司可以輸入幾張關鍵詞和預期風格,AI就能生成符合品牌調性的宣傳視頻",大幅縮短了從創意到成片的時間。

6.4.3 社交媒體內容制作

對于社交媒體運營者來說,多圖生視頻技術使"內容創作進入快車道。創作者可以通過輸入生活片段或靈感,迅速生成個性化的視頻日記或藝術作品",提高了內容更新頻率和質量。

7. 創意表達與藝術創作的突破

7.1 更豐富的創意表達方式

多圖生視頻模型為創意表達提供了新的可能性:

  1. 多模態融合:無縫整合文本、圖像和視頻多種元素
  2. 超現實場景構建:輕松創建現實中難以拍攝的場景
  3. 風格化轉換:將現實世界素材轉換為特定藝術風格
  4. 創意迭代加速:快速嘗試多個創意方向并選擇最佳方案

多圖生視頻技術"將內容創作帶入了一個新的維度。通過輸入幾張關鍵詞和預期風格,AI可以生成符合品牌調性的宣傳視頻,或者根據用戶的描述創作藝術作品"。

7.2 藝術家與AI的協作新模式

藝術家和AI之間的協作呈現出新的模式:

  1. 從創作者到導演:藝術家從直接創作轉為指導AI生成
  2. 從完美主義到探索精神:接受AI帶來的意外結果并加以利用
  3. 從小稿到草圖:使用AI快速驗證創意概念
  4. 從技術專家到創意引導者:角色重心從技術操作轉向創意構思

7.3 新興藝術形式的探索

多圖生視頻技術催生了新的藝術形式:

  1. AI生成藝術展:展示人機協作創作的視頻藝術作品
  2. 生成式動畫:基于規則和算法的動態藝術作品
  3. 互動式視頻藝術:觀眾參與指導AI生成視頻
  4. 數據美學:探索模型訓練數據對生成結果的影響

7.4 藝術創作中的技術挑戰

盡管前景廣闊,藝術家在使用多圖生視頻技術時仍面臨一些挑戰:

  1. 控制與隨機性平衡:在精確控制和意外創意之間尋找平衡
  2. 知識產權問題:AI生成作品的版權歸屬和參考素材的使用邊界
  3. 風格一致性:保持長期項目中風格的一致性
  4. 技術學習曲線:掌握提示工程和參數調整技巧

8. 商業價值和市場前景

8.1 市場規模與增長預測

多圖生視頻技術作為AIGC領域的重要分支,擁有廣闊的市場前景:

  1. AIGC市場整體增長:根據市場研究,AIGC市場正以超過30%的年復合增長率快速發展
  2. 視頻內容生成細分市場:預計未來五年內將從數億美元增長到數十億美元規模
  3. 企業應用需求增加:越來越多企業認識到AI視頻生成的商業價值
  4. 消費者市場拓展:個人創作者工具市場快速增長

8.2 商業應用場景價值分析

應用場景商業價值市場特點發展前景
電商視頻高轉化率視頻內容,提高商品轉化率高度競爭,注重ROI非常樂觀
廣告制作加速創意迭代,降低制作成本注重品質和創新樂觀
社交媒體內容批量高質量內容,提高用戶互動快速更新,多樣化需求非常樂觀
教育視頻個性化學習內容,提高學習效果注重教育效果和規范謹慎樂觀
影視制作提高制作效率,降低制作成本注重品質和原創性樂觀

8.3 主要廠商戰略布局

多家科技巨頭和初創企業已在多圖生視頻領域展開布局:

  1. OpenAI:推進Sora視頻生成模型,探索商業應用
  2. 字節跳動:推出MAGREF和Phantom框架,布局視頻創作工具
  3. 快手:發展可靈模型和多主體視頻生成技術
  4. Runway:專注于專業創意工具市場
  5. Vidu:提供全球領先的AI內容生產平臺

8.4 商業模式創新

多圖生視頻技術催生了多種創新商業模式:

  1. API服務模式:提供API調用服務,按生成視頻數量或時長收費
  2. 訂閱制工具:提供基于云的視頻生成工具月度訂閱
  3. 企業定制服務:為大型企業定制視頻生成解決方案
  4. 垂直行業方案:針對特定行業(如電商、廣告)的全套解決方案

9. 技術發展趨勢和未來潛力

9.1 技術演進路線

多圖生視頻技術未來可能的發展方向包括:

  1. 更高效的模型架構:降低計算成本,提高生成速度
  2. 更強的多模態融合:整合文本、圖像、音頻和視頻等多種模態
  3. 細化的時空控制:提供對生成視頻更精細的時空控制能力
  4. 視頻質量提升:提高分辨率、幀率和視覺質量
  5. 物理規律模擬增強:更好地模擬現實世界的物理規律

9.2 未來應用潛力

多圖生視頻技術在未來可能拓展的應用領域包括:

  1. 沉浸式全息通信:實時生成高質量全息視頻
  2. 個性化醫療動畫:根據患者情況生成定制化醫療解釋視頻
  3. 文化遺產數字化:將歷史文物和場景以動態形式重現
  4. 智能監控與預警:生成異常情況預警的可視化模擬
  5. 自動駕駛可視化:生成駕駛場景的多模態模擬

9.3 行業標準與規范

隨著技術成熟,行業標準和規范將逐步形成:

  1. 技術標準:統一的視頻生成質量評估標準
  2. 倫理指南:規范AI視頻生成和使用過程的倫理準則
  3. 版權框架:明確AI生成內容的知識產權保護框架
  4. 安全規范:防止有害內容生成的安全評估和過濾規范

9.4 潛在風險與挑戰

多圖生視頻技術的發展也面臨一些風險和挑戰:

  1. 版權問題:生成內容可能包含受版權保護的元素
  2. 虛假信息風險:可能被用于生成虛假視頻內容
  3. 數據偏見:訓練數據中的偏見可能反映在生成內容中
  4. 技術濫用:如深度偽造等惡意應用
  5. 監管挑戰:平衡創新自由和內容安全的監管框架

10. 與相關技術的對比分析

10.1 多圖生視頻 vs 文本生視頻

對比維度多圖生視頻文本生視頻主要差異
輸入模態多張圖像+文本提示純文本描述輸入信息豐富度
生成控制度更高(視覺參考約束)較低(純語言描述)控制精度
創意自由度較低(受圖像約束)更高(完全開放)創意空間
適用場景精細化視覺要求場景概念性創意場景應用側重
技術挑戰圖像對齊、融合語義理解、想象技術難點
生成質量穩定性更高(有視覺參考)波動較大質量一致性

多圖生視頻"支持基于多張圖片和一段提示詞,生成高質量的視頻內容",相比純文本輸入,有視覺參考約束的生成通常質量更穩定,細節更豐富。

10.2 多圖生視頻 vs 單圖生視頻

對比維度多圖生視頻單圖生視頻主要差異
空間理解能力更強(多視角空間關系)有限(單視角靜態信息)空間感知
多主體處理支持多主體交互主要單主體場景復雜度
視頻時長潛力支持更長視頻通常較短內容豐富度
生成一致性更高(多圖約束)較低時空連貫性
計算資源需求較高較低效率成本
應用靈活性專業場景優勢通用場景優勢應用范圍

MAGREF的"基本原理是通過精確的掩碼控制不同圖像的融合過程,從而實現對視頻中不同對象和場景的精細調節",這使其在多主體視頻生成方面具有顯著優勢。

10.3 不同多圖生視頻技術方案對比

技術方案核心特點適用場景技術優勢局限性
MAGREF掩碼引導多參考精細多主體視頻高精度融合,主體一致性計算資源需求高
AnimateDiff個性化文生圖擴展角色動畫角色特性保持好背景復雜度受限
可靈多主體概念融合機制多角色互動自然互動表現長視頻穩定性待提高
Vidu參考生多圖元素融合高質量商業視頻畫面質量優秀復雜場景交互能力

“Phantom是字節發布的一個統一的視頻生成框架,適用于單主體和多主體參考,基于現有的文生視頻、圖生視頻架構”,代表了多圖生視頻技術的發展方向。

10.4 面向未來的技術融合

多圖生視頻技術未來可能與以下技術深度融合:

  1. 3D重建技術:結合深度信息生成更真實的視頻
  2. 增強現實(AR):生成與現實環境無縫融合的AR內容
  3. 生成式AI與傳統CGI:互補結合,提高影視制作效率
  4. 實時渲染技術:實現即時生成高質量渲染視頻
  5. 多模態大模型:與LLM等大模型融合,實現更復雜的創意表達

總結

多張圖片生成視頻技術代表了AI視頻生成領域的前沿突破,通過理解多張輸入圖像之間的關系,這些模型能夠創建更加真實、連貫且豐富的視頻內容。從技術層面看,當前主流的多圖生視頻模型如MAGREF、AnimateDiff和可靈AI等,都基于擴散模型架構,特別強調對多主體關系的理解和時空一致性的保持。

多圖生視頻技術對傳統內容創作方式產生了顛覆性影響,大幅降低了專業視頻制作的門檻和成本,同時提高了創作效率。這一技術在電商、廣告、社交媒體、教育等多個領域展現出廣闊的應用前景。

盡管取得了顯著進展,多圖生視頻技術仍面臨一些挑戰,如計算資源需求、生成內容的控制性、版權和倫理問題等。未來,隨著模型架構的優化、多模態融合技術的發展和應用場景的拓展,多圖生視頻技術有望實現更高質量、更低成本的內容生成,為數字創意產業帶來深遠變革。

在技術發展路線方面,可以預見的是,多圖生視頻技術將繼續向更高效率、更強控制力、更高質量的方向發展,并與其他前沿技術如3D重建、增強現實和多模態大模型深度融合,開創更多創新應用可能性。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/98480.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/98480.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/98480.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

中電金信:AI重構測試體系·智能化時代的軟件工程新范式

AI技術的迅猛發展正加速推動軟件工程3.0時代的到來,深刻地重塑了測試行業的運作邏輯,推動測試角色從“后置保障”轉變為“核心驅動力”。在大模型技術的助力下,測試質量和效能將顯著提升。9月5日至6日,Gtest2025全球軟件測試技術峰…

100、23種設計模式之適配器模式(9/23)

適配器模式(Adapter Pattern) 是一種結構型設計模式,它允許將不兼容的接口轉換為客戶端期望的接口,使原本由于接口不兼容而不能一起工作的類可以協同工作。 一、核心思想 將一個類的接口轉換成客戶期望的另一個接口使原本因接口不…

線上環境CPU使用率飆升,如何排查

線上環境CPU使用率飆升,如何排查 1.CPU飆升的常見原因 1. 代碼層面問題 死循環:錯誤的循環條件導致無限循環遞歸過深:沒有正確的終止條件算法效率低:O(n)或更高時間復雜度的算法處理大數據集頻繁GC:內存泄漏導致頻繁垃…

《sklearn機器學習——特征提取》

在 sklearn.feature_extraction 模塊中,DictVectorizer 是從字典(dict)中加載和提取特征的核心工具。它主要用于將包含特征名稱和值的 Python 字典列表轉換為機器學習算法所需的數值型數組或稀疏矩陣。 這種方法在處理結構化數據(…

IEEE出版,限時早鳥優惠!|2025年智能制造、機器人與自動化國際學術會議 (IMRA 2025)

2025年智能制造、機器人與自動化國際學術會議 (IMRA2025)2025 International Conference on Intelligent Manufacturing, Robotics, and Automation中國?湛江2025年11月14日-2025年11月16日IMRA2025權威出版大咖云集穩定檢索智能制造、人工智能、機器人、物聯網(Io…

C# 基于halcon的視覺工作流-章30-圓圓距離測量

C# 基于halcon的視覺工作流-章30-圓圓距離測量 本章目標: 一、利用圓卡尺找兩圓心; 二、distance_pp算子計算兩圓點距離; 三、匹配批量計算;本章是在章23-圓查找的基礎上進行測量使用,圓查找知識請閱讀章23&#xff0c…

java設計模式二、工廠

概述 工廠方法模式是一種常用的創建型設計模式,它通過將對象的創建過程封裝在工廠類中,實現了創建與使用的分離。這種模式不僅提高了代碼的復用性,還增強了系統的靈活性和可擴展性。本文將詳細介紹工廠方法模式的三種形式:簡單工廠…

Ubuntu 24.04 中 nvm 安裝 Node 權限問題解決

個人博客地址:Ubuntu 24.04 中 nvm 安裝 Node 權限問題解決 | 一張假鈔的真實世界 參考nvm的一個issue:https://github.com/nvm-sh/nvm/issues/3363 異常信息如下: $ nvm install 22 Downloading and installing node v22.19.0... Download…

Java面試-線程安全篇

一、synchronized關鍵字: 基本使用與作用:通過搶票代碼示例,展示了synchronized作為對象鎖,可避免多線程超賣或搶到同一張票問題,保證代碼原子性,同一時刻只有一個線程獲得鎖,其他線程阻塞。底層…

R 語言科研繪圖 --- 其他繪圖-匯總2

在發表科研論文的過程中,科研繪圖是必不可少的,一張好看的圖形會是文章很大的加分項。 為了便于使用,本系列文章介紹的所有繪圖都已收錄到了 sciRplot 項目中,獲取方式: R 語言科研繪圖模板 --- sciRplothttps://mp.…

【數學建模學習筆記】啟發式算法:粒子群算法

零基礎小白看懂粒子群優化算法(PSO)一、什么是粒子群優化算法?簡單說,粒子群優化算法(PSO)是一種模擬鳥群 / 魚群覓食的智能算法。想象一群鳥在找食物:每只鳥(叫 “粒子”&#xff0…

【Gitlab】Ubuntu 20.04服務器部署Gitlab

寫一個 適用于 Ubuntu 20.04/22.04 的 GitLab 一鍵部署腳本,包括:安裝依賴安裝 GitLab CE配置公網 IP 或域名自動開啟 HTTPS(Let’s Encrypt)配置防火墻下面是完整腳本:#!/bin/bash# # GitLab 一鍵安裝腳本 # # 1. 檢…

Android 15重磅升級:16KB內存頁機制詳解與適配指南

一、背景隨著Android硬件架構的持續演進,新一代設備開始采用16KB內存頁(Page Size)機制,逐步替代傳統的4KB內存頁設計。此項底層變更對應用兼容性產生直接影響,特別是對依賴Native層庫、JNI接口或自定義內存管理模塊的…

Mybatis-8 動態SQL

動態SQL-官方文檔 文檔地址 動態 SQL_MyBatis中文網 為什么需要動態SQL 1、動態SQL是MyBatis的強大特性之一 2、使用JDBC或其它類似的框架,根據不同條件拼接SQL語句非常麻煩,例如拼接時要確保不能忘記添加必要的空格,還要注意去掉列表最后一…

PySpark數據輸入

PySpark數據輸入 1.理解RDD對象 2.掌握PySpark數據輸入的2種方法 RDD對象 PySpark支持多種數據的輸入,在輸入完成后,都會得到一個:RDD類的對象 RDD全稱為:彈性分布式數據集(Resilient Distributed Datasets&#xff09…

【系統架構設計(16)】軟件架構設計二:軟件架構風格:構建系統的設計模式與選擇指南

文章目錄一、核心思想二、數據流風格:以數據流動為核心的處理模式三、調用返回風格:基于程序調用的層次化組織四、獨立構件風格:基于事件驅動的松耦合架構五、虛擬機風格:提供抽象執行環境的架構模式六、倉庫風格:以數…

MySQL速記小冊(1)

1【Q】:Mysql中的數據排序是怎么實現的?【A】:排序過程中如果字段有索引,則利用索引排序。反之使用文件排序。在文件排序中,如果數據量少則在內存中排序,使用單路排序或雙路排序。如果數據量大則利于磁盤文…

20250904 10:45_排查10.1.3.35新QMS系統RMAN備份失敗問題(優化腳本里的環境配置,增加了check_oracle_env 函數)

一、RMAN備份失敗日志如下 [2025-09-04 04:00:01] 備份腳本啟動 [2025-09-04 04:00:01] 開始 RMAN 備份 CDB: ORCLCDB Message file RMAN<lang>.msb not found Verify that ORACLE_HOME is set properly [2025-09-04 04:00:01] RMAN 備份失敗! 二、原備份腳本存檔…

Vue3源碼reactivity響應式篇之EffectScope

概述 EffectScope是Vue3中一個響應式系統的輔助類&#xff0c;用于管理副作用&#xff08;effect&#xff09;的作用域。它可以幫助我們更好地組織和管理多個effect&#xff0c;便于一起停止或暫停以及恢復&#xff0c;避免了全局狀態的污染和管理的復雜性。 每一個vue組件的實…

MySQL 日志全解析:Binlog/Redo/Undo 等 5 類關鍵日志的配置、作用與最佳實踐

1 二進制日志&#xff08;Binlog&#xff09;&#xff1a;配置與核心作用 Binlog 是 MySQL 中跨存儲引擎的核心日志&#xff0c;記錄所有數據修改操作&#xff0c;主要用于主從復制、數據備份恢復與跨庫遷移。 1.1 Binlog 核心操作 開啟 Binlog 若需開啟 Binlog&#xff0c;需在…