基于MindNLP+MusicGen生成自己的個性化音樂
這個所謂的個性化的音樂就是指你輸入一段文字它會根據這個文字輸出一段音樂這個音樂是貼近于那段文字的所以叫做文生成音樂, 如果網絡正常的話就可以直接從下載這個模型。
那么音樂生成的有兩種方式呢有兩種方式,其中貪心。新的方式呢就沒有采樣那么方式那樣子生成的音樂那么有創造力因為采樣的話可能是隨機采樣的,那樣子生成的音樂那么有創造力,因為采樣的話可能是隨機采樣的。 greddy的方式就會選一個最大的所以就會是很穩定的
下面代碼就是直接使用隨機的我理解是一個隨機的造型然后生成一個隨機的音樂因為我們沒有輸入文字然后生成一個按照我文字要求的 音樂。
音頻輸出是格式是: a Torch tensor of shape (batch_size, num_channels, sequence_length)。
所以0,0就是第一個音頻,的第一個通道,單聲道
可以直接試聽下,只要設置samplerate聲音作為數字信號是有信號頻率的所以,所以如果信號頻率采樣頻率越高,就這個聲音非常清楚。為了使人能夠聽到一個聲音,所以它的采樣頻率一般都是要高于40千赫茲。
這段音頻的長度就是說他有多少秒鐘就是看它有多少秒鐘,就是看你在生成的時候這個模型,這個模型的幀率用256去除。
這個參數就是在畫畫的時候也會用到它代表的是你的文本和要生成的東西的相關度,如果你生成的東西越相關,那么這個數字越高。
通過這樣的描述我們就可以把輸入的文字進行一些,我們就可以把輸入的文字進行一些預處理。處理好這個文字之后丟到這個是音樂的生成模型里面就會幫我們生成,丟到這個是音樂的生成模型里面,就會幫我們生成相應的音樂。
之后都是一些比較生成音樂,看哪一些是比較滿意的,你就可以保留下來,然后把它存成音樂文件。