AI編程: 使用Trae1小時做成的音視頻工具,提取音頻并識別文本

背景

在上個月,有網頁咨詢我怎么才能獲取視頻中的音頻并識別成文本,我當時給他的回答是去問一下AI,讓AI來給你答案。

他覺得我在敷衍他,大罵了我一頓,大家覺得我的回答對嗎?

小編心里委屈,我覺得現在這個時代,什么問題都可以先咨詢AI,實在沒思路了再咨詢專業的人。

歷程

作為一個在軟件開發行業摸爬滾打多年的老碼農,這種工具肯定還是能手到擒來的。

說實話,之前沒想過這個問題,因為從來沒做過音視頻相關的項目,對這方面的知識了解不多。只知道直播行業對這方面的知識要求比較高。

遇事不決,先問AI。

由于之前了解過ffmpeg用這個工具獲取過視頻的時長,對此這個工具有基本的認知。

這里我們打開熱門的AI IDE Trae,直接用Builder模式問一下一般處理音視頻用技術方案,并讓他寫出Markdown文檔。

Trae AI IDE
按照我的要求,給出了獨立的md文檔。

md技術需求文檔

大體的瀏覽了一下,文檔給出的還是不錯的。

能給出具體的技術方案,并給出開發框架的選擇。可以說文檔的質量還是不錯的。修改一下不滿足的地方,可以作為實現的技術文檔。

技術方案最終用的Electron來實現,這是比較熱門的桌面端開發框架。
VSCode、Cherry Studio。

接下來就是讓AI自己按照文檔的要求實現了,實現的第一版,AI用簡單的樣式實現了。

第一版相對來說頁面看起來不美觀,又讓ai用UI組件Element-Plus來實現。

最后的版本是這樣的布局。

音頻提取
相對來說還是比較簡約的,畢竟功能簡單。沒有太多的實現。如果要添加功能可以在左側增加一個側邊欄。

對于我來說夠用了。
在這里插入圖片描述
這里設置密鑰,使用了硅基流動的FunAudioLLM/SenseVoiceSmall模型進行的獲取,目前這個模型還是免費的,質量不錯。

最后

看來我沒有騙那個網友,用AI確實能解決他的問題。

技術棧

  • Electron
  • Element-Plus
  • NodeJs
  • ffmpeg

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/82472.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/82472.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/82472.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AI日報 · 2025年5月10日|OpenAI“Stargate”超級數據中心項目掀起美國各州爭奪戰

1、OpenAI“Stargate”超級數據中心項目掀起美國各州爭奪戰 《華盛頓郵報》披露,OpenAI 與 Oracle、SoftBank 合作推進的“Stargate”項目(首期投資 1000?億美元,四年內總投資 5000?億美元)已收到超過 250 份選址提案&#xff…

Windows系統Jenkins企業級實戰

目標 在Windows操作系統上使用Jenkins完成代碼的自動拉取、編譯、打包、發布工作。 實施 1.安裝Java開發工具包(JDK) Jenkins是基于Java的應用程序,因此需要先安裝JDK。可以從Oracle官網或OpenJDK下載適合的JDK版本。推薦java17版本&#x…

MySQL 索引和事務

目錄 一、MySQL 索引介紹 1、索引概述 2、索引作用 3、索引的分類 (1)普通索引 (2)唯一索引 (3)主鍵索引 (4)組合索引(最左前綴) (5&…

Block Styler——字符串控件

字符串控件的應用 參考官方幫助案例:(這個方式感覺更好,第二種方式也可以)E:\NX1980\UGOPEN\SampleNXOpenApplications\C\BlockStyler\ColoredBlock 普通格式: 讀取: //方法一 string0->GetProperti…

P2572 [SCOI2010] 序列操作 Solution

Description 給定 01 01 01 序列 a ( a 1 , a 2 , ? , a n ) a(a_1,a_2,\cdots,a_n) a(a1?,a2?,?,an?),并定義 f ( l , r ) [ ( ∑ i l r a i ) r ? l 1 ] f(l,r)[(\sum\limits_{il}^r a_i)r-l1] f(l,r)[(il∑r?ai?)r?l1]. 執行 m m m 個操作&am…

RAG 2.0 深入解讀

作者:阿里云開發者 原文:https://zhuanlan.zhihu.com/p/1903437079603545114? 一、Introduction 過去一年可謂是RAG元年,檢索增強生成技術迅速發展與深刻變革,其創新與應用已深刻重塑了大模型落地的技術范式。站在2025年&#x…

代碼隨想錄第41天:圖論2(島嶼系列)

一、島嶼數量(Kamacoder 99) 深度優先搜索: # 定義四個方向:右、下、左、上,用于 DFS 中四向遍歷 direction [[0, 1], [1, 0], [0, -1], [-1, 0]]def dfs(grid, visited, x, y):"""對一塊陸地進行深度…

基于CNN的貓狗圖像分類系統

一、系統概述 本系統是基于PyTorch框架構建的智能圖像分類系統,專門針對CIFAR-10數據集中的貓(類別3)和狗(類別5)進行分類任務。系統采用卷積神經網絡(CNN)作為核心算法,結合圖形用…

linux搭建hadoop學習

linux搭建hadoop學習 下載安裝包: 海外資源可能需要翻墻或者找國內資源 cd /opt wget https://dlcdn.apache.org/hadoop/common/hadoop-2.10.2/hadoop-2.10.2.tar.gz tar -zxvf hadoop-2.10.2.tar.gz mv hadoop-2.10.2 hadoop配置環境變量 # 在/etc/profile文件中添加下面內…

Kubernetes生產實戰(十六):集群安全加固全攻略

Kubernetes集群安全加固全攻略:生產環境必備的12個關鍵策略 在容器化時代,Kubernetes已成為企業應用部署的核心基礎設施。但根據CNCF 2023年云原生安全報告顯示,75%的安全事件源于K8s配置錯誤。本文將基于生產環境實踐,系統講解集…

類加載機制詳解:雙親委派模型與打破它的方式

在復雜的 Java 系統中,類加載是最基礎卻常被忽略的一環。理解 JVM 的類加載機制,特別是 雙親委派模型(Parent Delegation Model),是我們深入掌握熱部署、插件機制、ClassLoader 隔離、ClassNotFound 錯誤等問題的關鍵。…

Android SDK 開發中的 AAR 與 JAR 區別詳解

在 Android SDK 開發中,構建項目時我們常常會看到生成兩個不同的文件:一個是 build/outputs/aar/*.aar,另一個是 build/intermediates/aar_main_jar/debug/syncDebugLibJars/classes.jar。很多初學者會疑惑:它們之間有什么區別&am…

服務器配置錯誤導致SSL/TLS出現安全漏洞,如何進行排查?

SSL/TLS 安全漏洞排查與修復指南 一、常見配置錯誤類型? 弱加密算法與密鑰問題? 使用弱密碼套件&#xff08;如DES、RC4&#xff09;或密鑰長度不足&#xff08;如RSA密鑰長度<2048位&#xff09;&#xff0c;導致加密強度不足。 密鑰管理不當&#xff08;如私鑰未加密存…

Day20打卡-奇異值SVD分解

今天學習非特征篩選的方法&#xff1a; 知識點回顧&#xff1a; 線性代數概念回顧&#xff08;可不掌握&#xff09;奇異值推導&#xff08;可不掌握&#xff09;奇異值的應用 特征降維&#xff1a;對高維數據減小計算量、可視化數據重構&#xff1a;比如重構信號、重構圖像&am…

temu采購自養號全流程解析:從賬號搭建到安全下單的技術閉環

temu 自養號采購下單技術是一個精細的過程&#xff0c;需要從多個方面進行考慮和操作&#xff0c;其核心在于通過技術手段模擬真實用戶行為&#xff0c;構建獨立、安全的賬號環境以確保賬號的安全性、真實性和采購下單的成功率。以下是對該技術的詳細解析 1. 賬號準備 手機號…

相機Camera日志分析之八:高通Camx HAL架構opencamera三級日志詳解及關鍵字

【關注我,后續持續新增專題博文,謝謝!!!】 上一篇我們講了:相機Camera日志分析之七:高通Camx HAL架構opencamera二級日志詳解及關鍵字 這一篇我們開始講: 相機Camera日志分析之八:高通Camx HAL架構opencamera三級日志詳解及關鍵字 目錄 【關注我,后續持續…

自定義類型-結構體(二)

結構體內存對齊 偏移量 指的是結構體中某個成員相對于結構體起始地址的字節距離 第一個成員的起始位置為0&#xff0c;一個字節表示一個單位 這里的數字表示的是該成員地址與結構體首地址之間的值 對齊規則 1.結構體第一個成員的第一個字節的偏移量為0 2.其余成員變量要…

【免費工具】圖吧工具箱2025.02正式版

DIY愛好者的必備工具 軟件截圖&#xff1a; —————【下 載 地 址】——————— 【本章單下載】&#xff1a;https://drive.uc.cn/s/f08aad37ddb14 【百款黑科技】&#xff1a;https://ucnygalh6wle.feishu.cn/wiki/HPQywvPc7iLZu1k0ODFcWMt2n0d?fromfrom_copylink …

DAX 權威指南1:DAX計算、表函數與計算上下文

參考《DAX 權威指南 第二版》 文章目錄 二、DAX簡介2.1 理解 DAX 計算2.2 計算列和度量值2.3 變量2.3.1 VAR簡介2.3.2 VAR的特性 2.4 DAX 錯誤處理2.4.1 DAX 錯誤類型2.4.1.1 轉換錯誤2.4.1.2 算術運算錯誤2.4.1.3 空值或 缺失值 2.4.2 使用IFERROR函數攔截錯誤2.4.2.1 安全地進…

【Linux系統】從零開始構建簡易 Shell:從輸入處理到命令執行的深度剖析

文章目錄 前言一、打印命令行提示符代碼功能概述 二、讀取鍵盤輸入的指令2.1 為什么不繼續使用scanf()而換成了fgets()&#xff1f;2.2 調試輸出的意義2.3 為什么需要去掉換行符&#xff1f; 三、指令切割補充知識&#xff1a; strtok 的函數原型 四、普通命令的執行代碼功能概…