推薦幾個免費提取音視頻文案的工具(SRT格式、通義千問、飛書妙記、VideoCaptioner、AsrTools)

文章目錄

  • 1. 前言
  • 2. SRT格式
    • 2.1 SRT 格式的特點
    • 2.2 SRT 文件的組成
    • 2.3 SRT 文件示例
  • 3. 通義千問
    • 3.1 官網
    • 3.2 上傳音視頻文件
    • 3.3 導出文案
  • 4. 飛書妙記
    • 4.1 官網
    • 4.2 上傳音視頻文件
    • 4.3 導出文案
    • 4.4 缺點
  • 5. VideoCaptioner
    • 5.1 GitHub地址
    • 5.2 下載
      • 5.2.1 通過GitHub下載
      • 5.2.2 通過作者提供的地址下載
    • 5.3 安裝
    • 5.4 上傳音視頻文件
    • 5.5 導出文案
    • 5.6 可能遇到的問題
      • 5.6.1 問題呈現
      • 5.6.2 問題產生的原因
      • 5.6.3 解決方法
    • 5.7 進階使用教程
  • 6. AsrTools
    • 6.1 GitHub地址
    • 6.2 下載
    • 6.3 安裝
    • 6.4 上傳音視頻文件
    • 6.5 導出文案

1. 前言

網上有一些大聰明提供了奇奇怪怪的提取音視頻文案的方法,例如打開輸入法的語音輸入后,播放音視頻,就可以自動將音視頻轉換成文字了,乍一看方法沒什么問題,但如果音視頻的非常長,使用這種方法分分鐘崩潰

其實很多剪輯軟件都有自動生成字幕的功能,例如剪映就有這個功能,生成字幕后還可以將字幕導出為SRT格式的文件。當然,這么好用的功能大概率都是需要付費的︿( ̄︶ ̄)︿

下面為大家介紹幾個免費提取音視頻文案的工具,這些工具大部分都是需要上傳視頻文件的,如果平臺沒有開放視頻的下載權限,可以參考我的另一篇博文:推薦幾個可以免費下載視頻的軟件(Neat Download Manager、蝸牛下載助手、bilidown)

2. SRT格式

SRT:SubRip Text,字幕文件

SRT 格式是一種簡單的字幕文件格式,用于存儲視頻的字幕信息

2.1 SRT 格式的特點

  • 簡單易懂: SRT 文件是純文本文件,結構清晰,易于閱讀和編輯
  • 廣泛支持: 大多數視頻播放器和字幕編輯軟件都支持 SRT 格式
  • 跨平臺: SRT 文件可以在不同的操作系統和設備上使用

2.2 SRT 文件的組成

SRT 文件由多個字幕塊組成,每個字幕塊包含以下信息:

  1. 序號: 字幕塊的序號,從 1 開始遞增
  2. 時間碼: 字幕的出現和消失時間,格式為 小時:分鐘:秒,毫秒 --> 小時:分鐘:秒,毫秒
  3. 字幕文本: 字幕的文本內容,可以包含多行
  4. 空行: 用于分隔不同的字幕塊

2.3 SRT 文件示例

通俗地說,SRT文件的作用就是告訴視頻剪輯軟件哪句字幕該在哪個時間段出現在視頻上

1
00:00:20,000 --> 00:00:24,400
Hello, welcome to this video.2
00:00:25,000 --> 00:00:28,000
This is an example of SRT subtitles.3
00:00:29,000 --> 00:00:32,000
They are widely used and supported.

將SRT文件導入剪映等剪輯軟件中,為視頻添加字幕的工作可以在幾秒內完成

3. 通義千問

3.1 官網

官網地址:https://www.tongyi.com/discover

https://www.tongyi.com/discover

點擊發現

在這里插入圖片描述

接著點擊音視頻速讀

在這里插入圖片描述

3.2 上傳音視頻文件

根據需求選擇音視頻語言、是否翻譯、是否區分發言人等選項

在這里插入圖片描述

上傳完音視頻文件之后點擊確認

在這里插入圖片描述

點擊右上角的任務列表圖標或下方的查看全部可以查看處理進度

在這里插入圖片描述

3.3 導出文案

任務完成之后,點擊右上角的導出按鈕,可以選擇導出的文檔格式,也可以選擇是否包含發言人和時間戳信息

最后點擊導出按鈕,就可以得到完整的文案了

在這里插入圖片描述

通義千問還提供了腦圖功能和筆記功能,感興趣的同學可以摸索一下

4. 飛書妙記

4.1 官網

官網地址:https://www.feishu.cn/product/minutes

https://www.feishu.cn/product/minutes

進入到飛書妙記的官網后,點擊登錄按鈕

在這里插入圖片描述

登錄成功后點擊開啟妙記按鈕

在這里插入圖片描述

4.2 上傳音視頻文件

在這里插入圖片描述

選擇語言后點擊提交按鈕

在這里插入圖片描述

在這里插入圖片描述

4.3 導出文案

處理完成后點擊任務,在新的標簽頁打開

在這里插入圖片描述

點擊文字記錄,接著點擊右上角的三個點,最后導出文字記錄

在這里插入圖片描述

有三個可選項:

  • 導出的文件格式(有飛書文檔、TXT、SRT三種格式)
  • 是否包含說話人
  • 是否包含時間戳

選擇完成后點擊導出按鈕,就可以得到包含文案的文件了

在這里插入圖片描述

4.4 缺點

每個月只有300分鐘的免費時長

在這里插入圖片描述

5. VideoCaptioner

5.1 GitHub地址

GitHub地址:https://github.com/WEIFENG2333/VideoCaptioner

https://github.com/WEIFENG2333/VideoCaptioner

在這里插入圖片描述

項目是用Python編寫的,感興趣的同學可以把源碼下載到本地,在自己的機器上跑一下


值得一提的是,項目的開發者是一個大學生

在這里插入圖片描述

5.2 下載

作者貼心地為Windows用戶準備了安裝包

5.2.1 通過GitHub下載

下載地址:https://github.com/WEIFENG2333/VideoCaptioner/releases/tag/v1.3.3

https://github.com/WEIFENG2333/VideoCaptioner/releases/tag/v1.3.3

在這里插入圖片描述

5.2.2 通過作者提供的地址下載

下載地址:https://wwwm.lanzoue.com/ii14G2pdsbej

在這里插入圖片描述

5.3 安裝

雙擊VideoCaptioner-Setup-win64-v1.3.3.exe安裝包,一路點擊下一步就可以了(記得更改軟件的安裝目錄)

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述

5.4 上傳音視頻文件

可以點擊選擇文件按鈕上傳,也可以直接拖動文件到窗口

在這里插入圖片描述

5.5 導出文案

上傳音視頻文件后點擊開始處理按鈕

在這里插入圖片描述

轉錄后的字幕文件默認存放在工作目錄下,點擊打開文件夾可以定位到字幕文件的所在位置。如果不想要SRT文件,只想要純文字,可以使用本文介紹的AsrTools工具

在這里插入圖片描述

語音轉錄后默認會合成視頻與字幕,如果不需要該功能,可以在設置中關閉

合成后的視頻默認存放在原視頻所在的目錄下

在這里插入圖片描述

在這里插入圖片描述

5.6 可能遇到的問題

5.6.1 問題呈現

在使用VideoCaptioner提取音視頻的文案時,可能會遇到以下錯誤


轉錄失敗 [WinError 3] 系統找不到指定的路徑。:'F:VideoCaptionerlVideoCaptioner\lwork-di\檀東東_【進階教
程】一套連招,徹底釋放A!的寫作能力 #AI助手 #豆包,AI #豆包電腦版 #AI文本創作\subtitle

在這里插入圖片描述

5.6.2 問題產生的原因

一般產生這個問題是因為視頻文件的命名中含有某些特殊字符,導致軟件在創建目錄時遇到了問題

5.6.3 解決方法

有兩個解決方法:

  • 第一個方法是重命名視頻文件,確保視頻文件的命名沒有特殊字母
  • 第二個方法時點擊轉錄失敗按鈕,軟件會重新轉錄一次。點擊轉錄失敗按鈕重新轉錄,導出的文案默認存放在視頻文件所在的目錄下

在這里插入圖片描述

點擊打開文件夾也能查看字幕文件的所在位置

在這里插入圖片描述

5.7 進階使用教程

本文只演示了VideoCaptioner的基礎用法,除了提取音視頻的文案之外,VideoCaptioner還可以直接給視頻添加字幕,無需借助剪輯軟件


VideoCaptioner的更多進階用法可以觀看以下視頻:

  • 第52集 | 免費無廣!VideoCaptioner,一鍵視頻字幕翻譯 #ai #人工智能 #AI工具 #AI在抖音 #字幕
  • 第159集 | 基于LLM的智能字幕助手,完全免費,開蓋即用! 最近在github上非常非常火爆的項目——卡卡字幕助手 | VideoCaptioner
  • 開源免費!一鍵生成字幕并翻譯,中日英多語言支持!- 字幕生成、斷句、優化、翻譯全流程處理#ai #字幕 #軟件#教程

6. AsrTools

AsrTools和VideoCaptioner由同一個作者開發,AsrTools可以看做是VideoCaptioner的前身

6.1 GitHub地址

GitHub地址:https://github.com/WEIFENG2333/AsrTools

在這里插入圖片描述

項目是用Python編寫的,感興趣的同學可以把源碼下載到本地,在自己的機器上跑一下

6.2 下載

下載地址:https://github.com/WEIFENG2333/AsrTools/releases/tag/v1.1.0

https://github.com/WEIFENG2333/AsrTools/releases/tag/v1.1.0

在這里插入圖片描述

6.3 安裝

無需安裝,雙擊AsrTools.exe文件就可以直接運行軟件了

在這里插入圖片描述

6.4 上傳音視頻文件

可以點擊選擇文件按鈕上傳,也可以直接拖動文件到窗口

在這里插入圖片描述

6.5 導出文案

上傳音視頻文件后點擊開始處理,有SRT、TXT、ASS三種導出格式

在這里插入圖片描述

運行過程中會出現一個黑窗,不要手動關閉黑窗,處理結束后會黑窗會自動關閉

在這里插入圖片描述

導出的文案默認存放在視頻文件所在的目錄下,而且目錄中會出現一個與視頻文件同名的MP3文件,因為提取文案只需要音頻,軟件對視頻的音頻做了分離

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/77293.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/77293.shtml
英文地址,請注明出處:http://en.pswp.cn/web/77293.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Linux深度探索:進程管理與系統架構

1.馮諾依曼體系結構 我們常見的計算機,如筆記本。我們不常見的計算機,如服務器,大部分都遵守馮諾依曼體系。 截至目前,我們所認識的計算機,都是由?個個的硬件組件組成。 輸入設備:鍵盤,鼠標…

觀察者模式 (Observer Pattern)

觀察者模式(Observer Pattern)是一種行為型設計模式。它定義了一種一對多的依賴關系,讓多個觀察者對象同時監聽某一個主題對象。當主題對象的狀態發生變化時,會自動通知所有觀察者對象,使它們能夠自動更新自己的狀態。 一、基礎 1. 意圖 核心目的:定義對象間的一種一對…

Network.framework 的引入,不是為了取代 URLSession

Network.framework 的引入,不是為了取代 URLSession 如果你感覺 Network.framework 的引入, 可能是為了取代 URLSession, 那你就大錯特錯了!這里需要非常準確地區分一下: 🔵 Network.framework 不是為了取代 URLSession。 &…

Redis 數據分片三大方案深度解析與 Java 實戰

Redis 數據分片是將數據分散存儲在多個 Redis 實例上的技術,以解決單個 Redis 實例在存儲容量、性能和可用性上的限制。常見的 Redis 數據分片方案包括客戶端分片、代理分片和Redis Cluster(集群分片),以下為你詳細介紹&#xff1…

FreeBSD可以不經過windows服務器訪問windows機器上的共享文件嗎?

答案是:當然可以! 使用sharity-light 軟件 可以使用sharity-light 軟件,直接不用安裝samba等軟件,直接訪問windows機器上的共享文件。 但是可惜的是,sharity-light在FreeBSD的ports里棄用了。看來是從FreeBSD 8 就開…

主流 LLM 部署框架

主流 LLM 部署框架 框架主要特點適用場景vLLM- 超快推理(高吞吐) - 動態批處理 - 支持 HuggingFace Transformer - 支持 PagedAttention高并發、低延遲在線推理TGI (Text Generation Inference)- Huggingface官方出品 - 多模型管理 - 支持動態量化 - 支持…

在 Vue 3 setup() 函數中使用 TypeScript 處理 null 和 undefined 的最佳實踐

在 Vue 3 中使用 setup() 函數和 TypeScript 時,null 和 undefined 是兩個需要特別關注的類型。雖然它們看起來都表示“沒有值”,但它們在 JavaScript 和 TypeScript 中有著不同的含義和使用場景。如果不小心處理它們,可能會導致潛在的 bug 或…

在 UniApp 中獲取當前頁面地址

在 UniApp 中獲取當前頁面地址,可以通過以下步驟實現: 方法說明: 獲取當前頁面實例:使用 getCurrentPages() 獲取頁面棧數組,最后一個元素即為當前頁面實例。 提取頁面路徑和參數:從頁面實例的 route 屬性…

【華為】防火墻雙擊熱備-之-主備模式-單外網線路-分享

FW1和FW2的業務接口都工作在三層,上行連接二層交換機。上行交換機連接運營商的接入點,運營商為企業分配的IP地址為100.100.100.2。現在希望FW1和FW2以主備備份方式工作。正常情況下,流量通過FW1轉發;當FW1出現故障時,流…

crossOriginLoading使用說明

1. 說明 此配置用于控制 Webpack 動態加載的代碼塊&#xff08;chunk&#xff09;&#xff08;例如代碼分割或懶加載的模塊&#xff09;在跨域&#xff08;不同域名&#xff09;加載時的行為。它通過為動態生成的 <script>標簽添加 crossorigin 屬性&#xff0c;確保符合…

windows中安裝VMware Workstation Pro虛擬機和ubuntu

目錄 一、安裝 VMware Workstation Pro 虛擬機 1、官網下載VMware Workstation Pro 1.1 選中 "VMware Workstation Pro for PC" 的 "DOWNLOAD NOW" 1.2 跳轉到broadcom登錄頁面 1.3 注冊賬號 1.4 輸入給郵箱收到的驗證碼信息&#xff0c;然后點擊”Verify…

如何快速輕松地恢復未保存的 Word 文檔:簡短指南

文字處理器已經存在了幾十年&#xff0c;其中許多已經變得非常擅長防止問題。丟失未保存的數據是一個常見問題&#xff0c;因此辦公軟件通常帶有恢復文件的方法。在本文中&#xff0c;我們將介紹如何恢復 Word 文檔&#xff0c;即使您尚未保存它。 確保數據安全的最佳方法是保…

JavaScript原生實現簡單虛擬列表(列表不定高)

本文首發在我的個人博客上&#xff1a;JavaScript原生實現簡單虛擬列表(列表不定高)https://www.brandhuang.com/article/1745637125513 前言 之前實現了一個定高版本的虛擬列表&#xff0c;今天在定高版本的基礎上稍作調整&#xff0c;來實現不定高版本&#xff0c;之前的版本…

redis數據類型-位域bitfield

redis數據類型-位域bitfield 文檔 redis單機安裝redis常用的五種數據類型redis數據類型-位圖bitmapredis數據類型-基數統計HyperLogLogredis數據類型-地理空間GEOredis數據類型-流Stream 官方文檔 官網操作命令指南頁面&#xff1a;https://redis.io/docs/latest/commands/…

pandas讀取MySQL中的數據

使用pandas讀取MySQL中的數據 1、導入庫 pip install pandas pip install sqlalchemy2、示例代碼 # -*- coding: utf-8 -*-import pandas as pd import re from sqlalchemy import create_engine# 清洗文本 def clean_text(text):text

MyBatis緩存配置的完整示例,包含一級緩存、二級緩存、自定義緩存策略等核心場景,并附詳細注釋和總結表格

以下是MyBatis緩存配置的完整示例&#xff0c;包含一級緩存、二級緩存、自定義緩存策略等核心場景&#xff0c;并附詳細注釋和總結表格&#xff1a; 1. 一級緩存&#xff08;默認開啟&#xff09; // 使用同一SqlSession執行兩次查詢&#xff0c;自動命中一級緩存 try (SqlSe…

深入解析 C++17 中的std::variant與std::visit:從原理到實踐

引言 什么是std::variant 在 C17 之前&#xff0c;如果你想在一個變量中存儲多種可能的類型&#xff0c;通常會使用 union 或 void* 指針。然而&#xff0c;這些方法都有明顯的缺點。 使用 union 時&#xff0c;類型信息會丟失&#xff0c;使得代碼容易出錯。 void* 指針則需…

Dijkstra算法對比圖神經網絡(GNN)

什么是AI模型? AI模型(人工智能模型)是一類模仿人類智能行為的數學模型或算法。它們通過從大量數據中學習,識別模式、做出預測或決策。常見的AI模型包括機器學習模型(如決策樹、神經網絡、支持向量機)和深度學習模型(如卷積神經網絡CNN、循環神經網絡RNN)。簡單來說,…

Yarn 安裝與使用教程

Yarn 安裝與使用教程 Yarn 是一個由 Facebook 開發的 JavaScript 包管理工具&#xff0c;它比傳統的 npm 更加高效、可靠&#xff0c;并且在性能上有所提升。Yarn 主要解決了 npm 安裝速度慢、并發性差、緩存機制不完善等問題&#xff0c;它提供了更快的安裝速度、更穩定的依賴…

Spring Boot 的配置加載順序

Spring Boot 的配置加載順序是“后來居上”——優先級高的配置源會覆蓋優先級低的配置源中的同名配置 覆蓋規則如下&#xff1a; 后加載的配置具有更高的優先級&#xff0c;會覆蓋先加載的配置。如果多個配置源中存在同名配置項&#xff0c;最終生效的是具有最高優先級的那個…