微軟語音使用小計

簡介

使用微軟語音可以實現語音轉文字和文字轉語音。測試了下,使用還是挺方便的。

使用微軟語音有兩種方式。一種是使用命令行的形式,另一種是調用SDK的方式。

適合使用語音 CLI 的情況:

  • 想在極少設置且無需編寫代碼的情況下試驗語音服務功能。
  • 對使用語音服務的生產應用程序的要求相對簡單。

適合使用語音 SDK 的情況:

  • 需要在特定語言或平臺(如 C#、Python 或 C++)中集成語音服務功能。
  • 你有可能需要高級服務請求的復雜需求。
  • 你要開發自定義行為,包括響應流。

語音CLI

語音 CLI 是一種命令行工具,用于在不編寫任何代碼的情況下使用語音服務。 語音 CLI 需要的設置很少。

核心功能

????????語音識別:將音頻文件中的或直接將麥克風語音轉換為文本,或轉錄錄制的對話。

????????語音合成:將文本文件中輸入的文本或直接來自于命令行的輸入文本轉換為語音。 使用語音合成標記語言 (SSML) 配置自定義語音輸出特征。

????????語音翻譯:將源語言的音頻翻譯為目標語言的文本或音頻。

????????在 Azure 計算資源上運行:使用 spx webjob 發送語音 CLI 命令以在 Azure 遠程計算資源上運行。

使用說明
下載安裝

第一步下載安裝:?Microsoft Visual C++ Redistributable for Visual Studio 2019

第二步下載安裝:?.NET 6

第三步下載安裝語音插件:

命令行安裝

dotnet tool install --global Microsoft.CognitiveServices.Speech.CLI

命令行更新

dotnet tool update --global Microsoft.CognitiveServices.Speech.CLI

配置賬戶

假定你已經申請了賬戶,如果沒有可以到Microsoft Azure 門戶 | Microsoft Azure注冊試用賬戶

//這里使用cmd控制臺配置賬戶到當前路徑

spx config @key --set SPEECH-KEY
spx config @region --set SPEECH-REGION

//查看配置信息

spx config @key
spx config @region

//刪除配置信息

spx config @key --clear
spx config @region --clear

使用

//查看幫助

spx

//查看指定主題的幫助信息

spx help find --topics "examples"

語音轉文本

//識別麥克風輸入的音頻,運行該命令后,SPX 開始在當前活動的輸入設備上偵聽音頻。 當你選擇 Enter 時,SPX 將停止偵聽。 然后,語音音頻將被識別并轉換為控制臺輸出中的文本

spx recognize --microphone

//將指定音頻文件轉為文本輸出

spx recognize --file /path/to/file.wav

文本轉語音

//以下命令會將文本作為輸入,然后將合成的語音輸出到當前活動的輸出設備(例如計算機揚聲器)

spx synthesize --text "Testing synthesis using the Speech CLI" --speakers

//你還可將合成的輸出保存到文件中。 在此示例中,我們可以在運行命令的目錄中創建一個名為 my-sample 的文件

spx synthesize --text "Enjoy using the Speech CLI." --audio output my-sample.wav

//獲取語音列表

spx synthesize --voices

//使用指定語音輸出

spx synthesize --text "Bienvenue chez moi." --voice fr-FR-AlainNeural --speakers

語音到文本的轉換

//借助語音 CLI,你還可以執行語音到文本的轉換。 運行以下命令,可從默認的麥克風捕獲音頻,并以文本形式輸出轉換。 記住,你需要通過?translate?命令提供?source?和?target?語言

spx translate --microphone --source en-US --target ru-RU

將語音翻譯成多種語言時,請用分號 (;)分隔語言代碼

spx translate --microphone --source en-US --target 'ru-RU;fr-FR;es-ES'

如果要保存轉換的輸出,請使用?--output?標志。 在本例中,還可以從文件中進行讀取

spx translate --file /some/file/path/input.wav --source en-US --target ru-RU --output file /some/file/path/russian_translation.txt

官方說明文檔:如何基于文本合成語音 - 語音服務 - Azure AI services | Microsoft Learn

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/14726.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/14726.shtml
英文地址,請注明出處:http://en.pswp.cn/web/14726.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

最簡單的方式解決android studio 模擬器無法聯網的問題

最簡單的方式解決android studio 模擬器無法聯網的問題 看了網上很多解決android studio內置模擬器無法聯網的問題,基本上都是在模擬器手機上配置dns,個人試了多種辦法也連不上網,現在給出一種,僅需要在命令行操作的解決安卓模擬…

輕松拿捏C語言——二分查找

🥰歡迎關注 輕松拿捏C語言系列,來和 小哇 一起進步!? 🌈感謝大家的閱讀、點贊、收藏和關注💕 目錄🎉 一、介紹🌈 二、步驟🌙 三、代碼?? 一、介紹 二分查找是一種在有序數組中…

【Linux-驅動開發】

Linux-驅動開發 ■ Linux-應用程序對驅動程序的調用流程■ Linux-file_operations 結構體■ Linux-驅動模塊的加載和卸載■ 1. 驅動編譯進 Linux 內核中■ 2. 驅動編譯成模塊(Linux 下模塊擴展名為.ko) ■ Linux-■ Linux-■ Linux-設備號■ Linux-設備號-分配■ 靜態分配設備號…

React Native 之 主題偏好(十一)

如果你的 React Native 版本較新,它提供一個主題API useColorScheme,你可以直接使用它。如果不是,需安裝額外的庫,如react-native-appearance。 下面是一個使用 react-native-appearance(或 useColorScheme&#xff0…

家電維修上門維修小程序怎么搭建制作?

?在家庭生活中,家電的維修問題一直是人們關注的焦點。隨著微信小程序的普及,家電維修服務行業也迎來了線上轉型的機遇。一款便捷、高效的家電維修上門維修小程序,不僅能為維修服務商帶來新的客戶,也能為用戶帶來更便捷的服務體驗…

[Algorithm][動態規劃][路徑問題][下降路徑最小和][最小路徑和][地下城游戲]詳細講解

目錄 1.下降路徑最小和1.題目鏈接2.算法原理詳解3.代碼實現 2.最小路徑和1.題目鏈接2.算法原理詳解3.代碼實現 3.地下城游戲1.題目鏈接2.算法原理詳解3.代碼實現 1.下降路徑最小和 1.題目鏈接 下降路徑最小和 2.算法原理詳解 思路: 確定狀態表示 -> dp[i][j]的…

用WPS將多張圖片生成一個pdf文檔,注意參數設置

目錄 1 新建一個docx格式的文檔 2 向文檔中插入圖片 3 設置頁邊距 4 設置圖片大小 5 導出為pdf格式 需要把十幾張圖片合并為一個pdf文件,本以為很簡單,迅速從網上找到兩個號稱免費的在線工具,結果浪費了好幾分鐘時間,發現需要…

面試-軟件工程與設計模式相關,Spring簡介

面試-軟件工程與設計模式相關,Spring簡介 1.編程思想1.1 面向過程編程1.2 面向對象編程1.2.1 面向對象編程三大特征 1.3 面向切面編程1.3.1 原理1.3.2 大白話?1.3.3 名詞解釋1.3.4 實現 2. 耦合與內聚2.1 耦合性2.2 內聚性 3. 設計模式3.1 設計模型七大原…

【Nodejs-多進程之Cluster】

cluster 模塊是 Node.js 提供的一個用于多進程的模塊,它可以輕松地創建一組共享同一個服務器端口的子進程(worker進程)。通過使用 cluster 模塊,可以充分利用多核系統,提高應用程序的性能和可靠性。 基本原理 cluste…

#php把pdf文件轉成圖片#

本地環境 系統:win11 64位 環境:phpStudy PHP版本:8.0.2 礦建:laravel 配置擴展 一、安裝imageMagick 下載地址:https://imagemagick.org/script/download.php 安裝版本:ImageMagick-最新版本-Q16-HDRI-x64…

Docker: exec命令淺析

簡介 Docker exec命令是Docker提供的一個強大工具,用于在正在運行的容器中執行命令。在此將介紹Docker exec命令的用法和示例,幫助大家更好地理解和使用這個命令。 Docker是一種流行的容器化平臺,允許用戶在容器中運行應用程序。有時候&#…

React開發環境配置詳細講解-04

React環境 前端隨著規范化,可以說規范和環境插件配置滿天飛,筆者最早接觸的是jquery,那個開發非常簡單,只要引入jquery就可以了,當時還寫了一套UI框架,至今在做小型項目中還在使用,show一張效果…

一款顏值頗高的虛擬列表!差點就被埋沒了,終于還是被我挖出來了

大家好,我是曉衡! 今天,推薦一款頗有顏值的虛擬列表組件,不然真的被埋沒就可惜了! 我們先來看下效果: 感覺怎么樣?還不錯吧! 為什么說這個資源差點被埋沒呢?因為個朋友找…

用數據,簡單點!奇點云2024 StartDT Day數智科技大會,直播見

在充滿挑戰的2024,企業如何以最小化的資源投入和試錯成本,挖掘新的增長機會,實現確定性發展? “簡單點”是當前商業環境的應對策略,也是奇點云2024 StartDT Day的核心理念。 5月28日,由奇點云主辦的2024 S…

Linux —— 信號量

Linux —— 信號量 什么是信號量P操作(Wait操作)V操作(Signal操作)信號量的類型 一些接口POSIX 信號量接口:其他相關命令: 基于循環隊列的生產者和消費者模型同步關系 多生產多消費 我們今天接著來學習信號…

【譯】組復制和 Percona XtraDB 集群: 常見操作概述

原文地址:Group Replication and Percona XtraDB Cluster: Overview of Common Operations 在這篇博文中,我將概述使用 MySQL Group Replication 8.0.19(又稱 GR)和 Percona XtraDB Cluster 8 (PXC)(基于 Galera&…

Jetbrains插件AI Assistant,終于用上了

ai assistant激活成功后,如圖 ai assistant獲取:https://web.52shizhan.cn/activity/ai-assistant 主要功能如下

Spring Boot 配置使用 PEM 格式SSL/TLS證書和私鑰

傳統的為 Spring Boot 配置SSL/TLS證書一般都會把證書打包成 JKS(Java KeyStore) 或 PKCS12 (Public Key Cryptographic Standards) 格式,然后為Spring Boot 增加以下類似配置: # The format used for the keystore. It could be set to JKS in case it…

SpringBoot(六)之內嵌容器

SpringBoot(六)之內嵌容器 文章目錄 SpringBoot(六)之內嵌容器內嵌容器的特點如何替換默認容器1.pom形式2.主動配置 如何通過配置切換serlvet容器 Spring Boot 提供了一種便捷的方式來創建獨立運行的 Spring 應用程序,…