AI編程：使用Trae1小時做成的音視頻工具，提取音頻并識別文本

AI編程：使用Trae1小時做成的音視頻工具，提取音頻并識別文本

diannao/2025/9/18 2:34:35/文章來源:https://blog.csdn.net/weixin_44978801/article/details/147857784

背景

在上個月，有網頁咨詢我怎么才能獲取視頻中的音頻并識別成文本，我當時給他的回答是去問一下AI，讓AI來給你答案。

他覺得我在敷衍他，大罵了我一頓，大家覺得我的回答對嗎？

小編心里委屈，我覺得現在這個時代，什么問題都可以先咨詢AI，實在沒思路了再咨詢專業的人。

歷程

作為一個在軟件開發行業摸爬滾打多年的老碼農，這種工具肯定還是能手到擒來的。

說實話，之前沒想過這個問題，因為從來沒做過音視頻相關的項目，對這方面的知識了解不多。只知道直播行業對這方面的知識要求比較高。

遇事不決，先問AI。

由于之前了解過ffmpeg用這個工具獲取過視頻的時長，對此這個工具有基本的認知。

這里我們打開熱門的AI IDE Trae，直接用Builder模式問一下一般處理音視頻用技術方案，并讓他寫出Markdown文檔。

Trae AI IDE
按照我的要求，給出了獨立的md文檔。

md技術需求文檔

大體的瀏覽了一下，文檔給出的還是不錯的。

能給出具體的技術方案，并給出開發框架的選擇。可以說文檔的質量還是不錯的。修改一下不滿足的地方，可以作為實現的技術文檔。

技術方案最終用的Electron來實現，這是比較熱門的桌面端開發框架。
VSCode、Cherry Studio。

接下來就是讓AI自己按照文檔的要求實現了，實現的第一版，AI用簡單的樣式實現了。

第一版相對來說頁面看起來不美觀，又讓ai用UI組件Element-Plus來實現。

最后的版本是這樣的布局。

音頻提取
相對來說還是比較簡約的，畢竟功能簡單。沒有太多的實現。如果要添加功能可以在左側增加一個側邊欄。

對于我來說夠用了。
在這里插入圖片描述
這里設置密鑰，使用了硅基流動的FunAudioLLM/SenseVoiceSmall模型進行的獲取，目前這個模型還是免費的，質量不錯。

最后

看來我沒有騙那個網友，用AI確實能解決他的問題。

技術棧

Electron
Element-Plus
NodeJs
ffmpeg

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/82472.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/82472.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/82472.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

AI日報 · 2025年5月10日｜OpenAI“Stargate”超級數據中心項目掀起美國各州爭奪戰

AI日報 · 2025年5月10日｜OpenAI“Stargate”超級數據中心項目掀起美國各州爭奪戰

1、OpenAI“Stargate”超級數據中心項目掀起美國各州爭奪戰《華盛頓郵報》披露，OpenAI 與 Oracle、SoftBank 合作推進的“Stargate”項目（首期投資 1000?億美元，四年內總投資 5000?億美元）已收到超過 250 份選址提案&#xff…

閱讀更多...

Windows系統Jenkins企業級實戰

Windows系統Jenkins企業級實戰

目標在Windows操作系統上使用Jenkins完成代碼的自動拉取、編譯、打包、發布工作。實施 1.安裝Java開發工具包（JDK） Jenkins是基于Java的應用程序，因此需要先安裝JDK。可以從Oracle官網或OpenJDK下載適合的JDK版本。推薦java17版本&#x…

閱讀更多...

MySQL 索引和事務

MySQL 索引和事務

目錄一、MySQL 索引介紹 1、索引概述 2、索引作用 3、索引的分類 （1）普通索引 （2）唯一索引 （3）主鍵索引 （4）組合索引（最左前綴） （5&…

閱讀更多...

Block Styler——字符串控件

Block Styler——字符串控件

字符串控件的應用參考官方幫助案例：（這個方式感覺更好，第二種方式也可以）E:\NX1980\UGOPEN\SampleNXOpenApplications\C\BlockStyler\ColoredBlock 普通格式： 讀取： //方法一 string0->GetProperti…

閱讀更多...

P2572 [SCOI2010] 序列操作 Solution

P2572 [SCOI2010] 序列操作 Solution

Description 給定 01 01 01 序列 a ( a 1 , a 2 , ? , a n ) a(a_1,a_2,\cdots,a_n) a(a1?,a2?,?,an?)，并定義 f ( l , r ) [ ( ∑ i l r a i ) r ? l 1 ] f(l,r)[(\sum\limits_{il}^r a_i)r-l1] f(l,r)[(il∑r?ai?)r?l1]. 執行 m m m 個操作&am…

閱讀更多...

RAG 2.0 深入解讀

RAG 2.0 深入解讀

作者：阿里云開發者原文：https://zhuanlan.zhihu.com/p/1903437079603545114? 一、Introduction 過去一年可謂是RAG元年，檢索增強生成技術迅速發展與深刻變革，其創新與應用已深刻重塑了大模型落地的技術范式。站在2025年&#x…

閱讀更多...

代碼隨想錄第41天：圖論2（島嶼系列）

代碼隨想錄第41天：圖論2（島嶼系列）

一、島嶼數量（Kamacoder 99） 深度優先搜索： # 定義四個方向：右、下、左、上，用于 DFS 中四向遍歷 direction [[0, 1], [1, 0], [0, -1], [-1, 0]]def dfs(grid, visited, x, y):"""對一塊陸地進行深度…

閱讀更多...

基于CNN的貓狗圖像分類系統

基于CNN的貓狗圖像分類系統

一、系統概述本系統是基于PyTorch框架構建的智能圖像分類系統，專門針對CIFAR-10數據集中的貓（類別3）和狗（類別5）進行分類任務。系統采用卷積神經網絡（CNN）作為核心算法，結合圖形用…

閱讀更多...

linux搭建hadoop學習

linux搭建hadoop學習

linux搭建hadoop學習下載安裝包: 海外資源可能需要翻墻或者找國內資源 cd /opt wget https://dlcdn.apache.org/hadoop/common/hadoop-2.10.2/hadoop-2.10.2.tar.gz tar -zxvf hadoop-2.10.2.tar.gz mv hadoop-2.10.2 hadoop配置環境變量 # 在/etc/profile文件中添加下面內…

閱讀更多...

Kubernetes生產實戰(十六)：集群安全加固全攻略

Kubernetes生產實戰(十六)：集群安全加固全攻略

Kubernetes集群安全加固全攻略：生產環境必備的12個關鍵策略在容器化時代，Kubernetes已成為企業應用部署的核心基礎設施。但根據CNCF 2023年云原生安全報告顯示，75%的安全事件源于K8s配置錯誤。本文將基于生產環境實踐，系統講解集…

閱讀更多...

類加載機制詳解：雙親委派模型與打破它的方式

類加載機制詳解：雙親委派模型與打破它的方式

在復雜的 Java 系統中，類加載是最基礎卻常被忽略的一環。理解 JVM 的類加載機制，特別是雙親委派模型（Parent Delegation Model），是我們深入掌握熱部署、插件機制、ClassLoader 隔離、ClassNotFound 錯誤等問題的關鍵。…

閱讀更多...

Android SDK 開發中的 AAR 與 JAR 區別詳解

Android SDK 開發中的 AAR 與 JAR 區別詳解

在 Android SDK 開發中，構建項目時我們常常會看到生成兩個不同的文件：一個是 build/outputs/aar/*.aar，另一個是 build/intermediates/aar_main_jar/debug/syncDebugLibJars/classes.jar。很多初學者會疑惑：它們之間有什么區別&am…

閱讀更多...

服務器配置錯誤導致SSL/TLS出現安全漏洞，如何進行排查？

服務器配置錯誤導致SSL/TLS出現安全漏洞，如何進行排查？

SSL/TLS 安全漏洞排查與修復指南一、常見配置錯誤類型? 弱加密算法與密鑰問題? 使用弱密碼套件（如DES、RC4）或密鑰長度不足（如RSA密鑰長度<2048位），導致加密強度不足。密鑰管理不當（如私鑰未加密存…

閱讀更多...

Day20打卡-奇異值SVD分解

Day20打卡-奇異值SVD分解

今天學習非特征篩選的方法： 知識點回顧： 線性代數概念回顧（可不掌握）奇異值推導（可不掌握）奇異值的應用特征降維：對高維數據減小計算量、可視化數據重構：比如重構信號、重構圖像&am…

閱讀更多...

temu采購自養號全流程解析：從賬號搭建到安全下單的技術閉環

temu采購自養號全流程解析：從賬號搭建到安全下單的技術閉環

temu 自養號采購下單技術是一個精細的過程，需要從多個方面進行考慮和操作，其核心在于通過技術手段模擬真實用戶行為，構建獨立、安全的賬號環境以確保賬號的安全性、真實性和采購下單的成功率。以下是對該技術的詳細解析 1. 賬號準備手機號…

閱讀更多...

相機Camera日志分析之八：高通Camx HAL架構opencamera三級日志詳解及關鍵字

相機Camera日志分析之八：高通Camx HAL架構opencamera三級日志詳解及關鍵字

【關注我，后續持續新增專題博文，謝謝！！！】上一篇我們講了：相機Camera日志分析之七：高通Camx HAL架構opencamera二級日志詳解及關鍵字這一篇我們開始講：相機Camera日志分析之八：高通Camx HAL架構opencamera三級日志詳解及關鍵字目錄【關注我，后續持續…

閱讀更多...

自定義類型-結構體（二）

自定義類型-結構體（二）

結構體內存對齊偏移量指的是結構體中某個成員相對于結構體起始地址的字節距離第一個成員的起始位置為0，一個字節表示一個單位這里的數字表示的是該成員地址與結構體首地址之間的值對齊規則 1.結構體第一個成員的第一個字節的偏移量為0 2.其余成員變量要…

閱讀更多...

【免費工具】圖吧工具箱2025.02正式版

【免費工具】圖吧工具箱2025.02正式版

DIY愛好者的必備工具軟件截圖： —————【下載地址】——————— 【本章單下載】：https://drive.uc.cn/s/f08aad37ddb14 【百款黑科技】：https://ucnygalh6wle.feishu.cn/wiki/HPQywvPc7iLZu1k0ODFcWMt2n0d?fromfrom_copylink …

閱讀更多...

DAX 權威指南1：DAX計算、表函數與計算上下文

DAX 權威指南1：DAX計算、表函數與計算上下文

參考《DAX 權威指南第二版》文章目錄二、DAX簡介2.1 理解 DAX 計算2.2 計算列和度量值2.3 變量2.3.1 VAR簡介2.3.2 VAR的特性 2.4 DAX 錯誤處理2.4.1 DAX 錯誤類型2.4.1.1 轉換錯誤2.4.1.2 算術運算錯誤2.4.1.3 空值或缺失值 2.4.2 使用IFERROR函數攔截錯誤2.4.2.1 安全地進…

閱讀更多...

【Linux系統】從零開始構建簡易 Shell：從輸入處理到命令執行的深度剖析

【Linux系統】從零開始構建簡易 Shell：從輸入處理到命令執行的深度剖析

文章目錄前言一、打印命令行提示符代碼功能概述二、讀取鍵盤輸入的指令2.1 為什么不繼續使用scanf()而換成了fgets()？2.2 調試輸出的意義2.3 為什么需要去掉換行符？ 三、指令切割補充知識： strtok 的函數原型四、普通命令的執行代碼功能概…

閱讀更多...

最新文章