騰訊云錄音文件快速識別實戰教程

文章目錄

  • 前言
  • 接口簡介
  • 前置條件
  • 實戰
    • 添加 Maven 依賴
    • 核心代碼示例
  • 參數說明
  • 個人簡介

前言

  • 本文介紹如何基于騰訊云語音識別 快速識別接口,實現通過 HTTPS POST 方式上傳音頻并快速識別同步返回識別結果的實戰流程。

接口簡介

  • 騰訊云語音識別 快速識別接口 支持上傳音頻文件并同步返回識別結果,適合以下場景:
- 視頻字幕自動生成
- 呼叫中心/質檢實時轉寫
- 會議記錄轉寫

前置條件

  • 開通騰訊云語音識別服務。
  • 在 API 密鑰管理 新建密鑰,獲取:
    • AppID
    • SecretID
    • SecretKey

實戰

添加 Maven 依賴

  • 在項目 pom.xml 中引入騰訊云語音識別 SDK:
<dependency><groupId>com.tencentcloudapi</groupId><artifactId>tencentcloud-speech-sdk-java</artifactId><version>1.0.52</version>
</dependency>

核心代碼示例

@Component
@Slf4j
public class FlashRecognizerService {private static final String SECRET_KEY = "你的SecretKey";private static final String SECRET_ID = "你的SecretId";private static final String APP_ID = "你的AppId";private final Credential credential = Credential.builder().secretId(SECRET_ID).secretKey(SECRET_KEY).build();public String recognizer(File file) {log.info("開始解析音頻文件:{}", file);FlashRecognizer recognizer = SpeechClient.newFlashRecognizer(APP_ID, credential);byte[] data = ByteUtils.inputStream2ByteArray(file);// 初始化識別請求FlashRecognitionRequest recognitionRequest = FlashRecognitionRequest.initialize();recognitionRequest.setEngineType("16k_zh"); // 中文普通話recognitionRequest.setFirstChannelOnly(1);  // 僅識別第一聲道recognitionRequest.setVoiceFormat(getFileExtension(file));recognitionRequest.setSpeakerDiarization(0); // 不做說話人分離recognitionRequest.setFilterDirty(0); // 不過濾臟詞recognitionRequest.setFilterModal(0); // 不過濾語氣詞recognitionRequest.setFilterPunc(0);  // 保留標點recognitionRequest.setConvertNumMode(1); // 開啟數字轉換recognitionRequest.setWordInfo(1); // 返回詞級信息// 同步識別FlashRecognitionResponse response = recognizer.recognize(recognitionRequest, data);log.info("音頻文件解析完成:{} {}", file, JSONObject.toJSONString(response));return response.getFlashResult().get(0).getText();}/*** 獲取文件擴展名*/public static String getFileExtension(File file) {String name = file.getName();int lastIndex = name.lastIndexOf(".");if (lastIndex == -1 || lastIndex == name.length() - 1) {return "";}return name.substring(lastIndex + 1);}
}

參數說明

參數說明默認值
EngineType引擎類型(如 16k_zh 中文普通話)
FirstChannelOnly是否僅識別第一個聲道(1 是,0 否)1
VoiceFormat音頻格式,如 mp3、wav、m4a
SpeakerDiarization是否進行說話人分離(0 否,1 是)0
FilterDirty過濾臟詞(0 不過濾,1 過濾)0
FilterModal過濾語氣詞(0 不過濾,1 過濾)0
FilterPunc過濾標點(0 不過濾,1 過濾)0
ConvertNumMode數字轉換(0 關閉,1 開啟)1
WordInfo是否返回詞級信息(0 否,1 是)1

個人簡介

👋 你好,我是 Lorin 洛林,一位 Java 后端技術開發者!座右銘:Technology has the power to make the world a better place.

🚀 我對技術的熱情是我不斷學習和分享的動力。我的博客是一個關于Java生態系統、后端開發和最新技術趨勢的地方。

🧠 作為一個 Java 后端技術愛好者,我不僅熱衷于探索語言的新特性和技術的深度,還熱衷于分享我的見解和最佳實踐。我相信知識的分享和社區合作可以幫助我們共同成長。

💡 在我的博客上,你將找到關于Java核心概念、JVM 底層技術、常用框架如Spring和Mybatis 、MySQL等數據庫管理、RabbitMQ、Rocketmq等消息中間件、性能優化等內容的深入文章。我也將分享一些編程技巧和解決問題的方法,以幫助你更好地掌握Java編程。

🌐 我鼓勵互動和建立社區,因此請留下你的問題、建議或主題請求,讓我知道你感興趣的內容。此外,我將分享最新的互聯網和技術資訊,以確保你與技術世界的最新發展保持聯系。我期待與你一起在技術之路上前進,一起探討技術世界的無限可能性。

📖 保持關注我的博客,讓我們共同追求技術卓越。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/913857.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/913857.shtml
英文地址,請注明出處:http://en.pswp.cn/news/913857.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

.NET Framework 安裝失敗及異常情況 常用處理方法

在使用.NET Framework 的過程中&#xff0c;安裝失敗或出現異常是比較常見的問題。這些問題可能由系統環境、文件損壞、權限不足等多種原因引起。以下是一些常見的安裝失敗及異常情況&#xff0c;以及對應的處理方法&#xff1a; 首先&#xff0c;下載.net framework 3.5文件。…

?AI賦能的自動駕駛革命:從安全架構到世界模型的系統性突破

?在計算機視覺與機器人技術的交匯處&#xff0c;自動駕駛正經歷著從模塊化設計向端到端AI系統的范式轉移。NVIDIA作為這場變革的核心推動者&#xff0c;其DRIVE平臺展現出的技術整合深度令人驚嘆——從芯片級的能效優化到城市級數字孿生仿真&#xff0c;構建起覆蓋"AI訓練…

ACL協議:核心概念與配置要點解析

ACL協議 在H3C網絡設備&#xff08;交換機、路由器、防火墻等&#xff09;中&#xff0c;ACL&#xff08;Access Control List&#xff0c;訪問控制列表&#xff09; 是一個核心的流量過濾和控制機制。核心目的&#xff1a; 流量過濾&#xff1a;控制哪些流量可以通過接口&…

文件追加模式:編寫一個程序,向一個已存在的文件末尾追加內容。

知識點文件打開模式"r"&#xff1a;只讀&#xff1b;文件須存在。"w"&#xff1a;寫入&#xff1b;清空或新建。"a"&#xff1a;追加&#xff1b;文件末尾寫入。"a"&#xff1a;讀/寫追加。追加&#xff08;Append&#xff09;機制&qu…

OneCode框架事件基礎模型架構深度剖析與代碼實現

一、整體架構概覽 作為OneCode框架的事件核心模塊&#xff0c;構建了一套跨瀏覽器、多終端兼容的事件驅動架構。該架構采用分層設計思想&#xff0c;從底層事件捕獲到高層事件模擬&#xff0c;形成了完整的事件生命周期管理體系。整體架構可分為五個核心層次&#xff1a;事件捕…

Spring for Apache Pulsar->Reactive Support->Message Production

好消息&#xff1a;Spring for Apache Pulsar這兩天剛剛升到2.0.0版本1. ReactivePulsarTemplate在Pulsar生產者端&#xff0c;Spring Boot自動配置提供了一個ReactivePulsarTemplate用于發布記錄。該模板實現了一個名為ReactivePulse Operations的接口&#xff0c;并提供了通過…

AtCoder Beginner Contest 413

比賽鏈接如下&#xff1a;Denso Create Programming Contest 2025&#xff08;AtCoder Beginner Contest 413&#xff09; - AtCoder A - Content Too Large Problem Statement Takahashi has N items and one bag. The size of the i-th (1≤i≤N) item is Ai?, and the si…

Java學習---JVM(1)

JVM&#xff0c;即Java虛擬機&#xff0c;其是Java程序的運行環境&#xff0c;是Java技術的核心組成部分&#xff0c;本次就JVM的自動內存管理詳細展開&#xff1a;JVM的內存區域分為2大類&#xff0c;即線程私有的和線程共享的&#xff0c;前者分為3大塊&#xff0c;虛擬機棧、…

Qt去噪面板搭建

建立單選互斥性面板用于選擇噪聲屬性// 創建去噪面板 QWidget* noisePanel new QWidget(); QVBoxLayout* mainLayout new QVBoxLayout(noisePanel); mainLayout->setContentsMargins(10, 10, 10, 10); mainLayout->setSpacing(15);// 去噪方法選擇組QGroupBox* methodG…

無需公網IP的文件交互:FileCodeBox容器化部署技術解析

文章目錄 前言1.Docker部署2.簡單使用演示3. 安裝cpolar內網穿透4. 配置公網地址5. 配置固定公網地址 前言 在數字化辦公需求日益增長的今天&#xff0c;文件傳輸已成為職場協作的高頻剛需。傳統共享方式卻飽受詬病&#xff1a;"需要安裝哪些臃腫客戶端&#xff1f;免費版…

1. http 有哪些版本,你是用的哪個版本,怎么查看

http 有哪些版本&#xff0c;你是用的哪個版本&#xff0c;怎么查看 總結&#xff1a;http 版本有 0.9/1.0/1.1/2.0/3.0&#xff0c;我們常用的是 1.1 和 2.0&#xff0c;使用 window.chrome.loadTimes() 獲取 http 版本。 常見的 HTTP 版本 HTTP/0.9&#xff1a;最初的版本&am…

C# IIncrementalGenerator干點啥

生成器項目 得基于.Net Stander 2.0 重要&#xff1a;<IsRoslynComponent>true</IsRoslynComponent>、<IncludeBuildOutput>false</IncludeBuildOutput>、 <PackageReference Include"Microsoft.CodeAnalysis" Version"4.14.0&q…

在徐州網絡中服務器租用與托管的優勢

一、高性價比&#xff1a;徐州萬恒提供多種配置的服務器供租用&#xff0c;滿足不同企業和個人的業務需求&#xff0c;無論是初創企業追求低成本高效能&#xff0c;還是對性能有嚴苛要求的大型項目&#xff0c;都能找到合適的服務器型號&#xff0c;以極具競爭力的價格獲取強大…

學習軟件測試的第十四天(移動端)

一.常用的abd命令有哪些1.什么是 ADB&#xff1f;通俗解釋&#xff1a; ADB 就像一個橋梁&#xff0c;讓電腦能控制連接的手機&#xff0c;比如安裝APP、抓日志、重啟設備等。專業術語總結&#xff1a; ADB&#xff08;Android Debug Bridge&#xff09;是 Android SDK 提供的命…

04-ES6

let和const命令ES6中新增了let命令&#xff0c;用來聲明變量&#xff0c;用法類似與varlet和var的不同&#xff1a;1、不存在變量提升 console.log(a); //Cannot access a before initializationlet a 100;2、同一個作用域不能重復定義同一個名稱var c 20;let c 30;c…

基于GeographicLib實現測站地平坐標系(東北天)轉地心固定坐標系XYZ

一、概述主要內容&#xff1a;本文基于GeographicLib開源庫&#xff0c;實現了一個地理空間坐標轉換功能&#xff0c;主要用于根據觀測站的位置和目標的相對方位信息&#xff0c;計算目標在地球坐標系中的絕對位置。輸入&#xff1a;觀測站的經緯度坐標(緯度、經度、海拔高度)和…

若依框架去掉Redis

這篇文章全是按照我的實戰操作來的&#xff0c;本文一是記錄一下這個過程&#xff0c;二是幫助更多的人少走彎路。 接下來我們看實戰&#xff1a;第一步毋庸置疑&#xff0c;就是找到配置文件application.yml里面大redis配置部分&#xff0c;直接注釋掉 注意這里的data:這是否注…

【會員專享數據】2013-2024年我國省市縣三級逐日SO?數值數據(Shp/Excel格式)

之前我們分享過2013-2024年全國范圍逐日SO?柵格數據&#xff08;可查看之前的文章獲悉詳情&#xff09;!該數據來源于韋晶博士、李占清教授團隊發布在國家青藏高原科學數據中心網站上的中國高分辨率高質量近地表空氣污染物數據集。很多小伙伴拿到數據后反饋柵格數據不太方便使…

TCP SYN、UDP、ICMP之DOS攻擊

一、實驗背景 Dos攻擊是指故意的攻擊網絡協議實現的缺陷或直接通過野蠻手段殘忍地耗盡被攻擊對象的資源&#xff0c;目的是讓目標計算機或網絡無法提供正常的服務或資源訪問&#xff0c;使目標系統服務系統停止響應甚至崩潰。 二、實驗設備 1.一臺靶機Windows主機 2.增加一個網…

Ntfs!LfsUpdateLfcbFromRestart函數分析之根據Ntfs!_LFS_RESTART_AREA初始化Ntfs!_LFCB

第一部分&#xff1a;LfsUpdateLfcbFromRestart( ThisLfcb,FileSize,DiskRestartArea,FirstRestar1: kd> p Ntfs!LfsRestartLogFile0x317: f71fc8dd e820e5ffff call Ntfs!LfsUpdateLfcbFromRestart (f71fae02) 1: kd> t Ntfs!LfsUpdateLfcbFromRestart: f71fae0…