昇思25天學習打卡營第14天|munger85

基于MindNLP+MusicGen生成自己的個性化音樂

這個所謂的個性化的音樂就是指你輸入一段文字它會根據這個文字輸出一段音樂這個音樂是貼近于那段文字的所以叫做文生成音樂，如果網絡正常的話就可以直接從下載這個模型。
在這里插入圖片描述那么音樂生成的有兩種方式呢有兩種方式，其中貪心。新的方式呢就沒有采樣那么方式那樣子生成的音樂那么有創造力因為采樣的話可能是隨機采樣的，那樣子生成的音樂那么有創造力，因為采樣的話可能是隨機采樣的。 greddy的方式就會選一個最大的所以就會是很穩定的在這里插入圖片描述下面代碼就是直接使用隨機的我理解是一個隨機的造型然后生成一個隨機的音樂因為我們沒有輸入文字然后生成一個按照我文字要求的音樂。音頻輸出是格式是: a Torch tensor of shape (batch_size, num_channels, sequence_length)。
所以0，0就是第一個音頻，的第一個通道，單聲道在這里插入圖片描述
可以直接試聽下，只要設置samplerate聲音作為數字信號是有信號頻率的所以，所以如果信號頻率采樣頻率越高，就這個聲音非常清楚。為了使人能夠聽到一個聲音，所以它的采樣頻率一般都是要高于40千赫茲。在這里插入圖片描述這段音頻的長度就是說他有多少秒鐘就是看它有多少秒鐘，就是看你在生成的時候這個模型，這個模型的幀率用256去除。這個參數就是在畫畫的時候也會用到它代表的是你的文本和要生成的東西的相關度，如果你生成的東西越相關，那么這個數字越高。在這里插入圖片描述通過這樣的描述我們就可以把輸入的文字進行一些，我們就可以把輸入的文字進行一些預處理。處理好這個文字之后丟到這個是音樂的生成模型里面就會幫我們生成，丟到這個是音樂的生成模型里面，就會幫我們生成相應的音樂。在這里插入圖片描述之后都是一些比較生成音樂，看哪一些是比較滿意的，你就可以保留下來，然后把它存成音樂文件。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/46295.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/46295.shtml
英文地址，請注明出處：http://en.pswp.cn/web/46295.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！