OpenBayes 一周速覽|1分鐘生成完整音樂,DiffRhythm人聲伴奏一鍵搞定; Stable Virtual Camera重塑3D視頻創作

公共資源速遞

5 個數據集:

*?302 例罕見病病例數據集

* DRfold2 RNA 結構測試數據集

* NaturalReasoning 自然推理數據集

*?VenusMutHub 蛋白質突變小樣本數據集

* Bird Vs Drone 鳥類與無人機圖像分類數據集

2 個模型:

* Qwen2.5-0mni

*?Llama-4-Scout-17B-16E-Instruct

4 個教程:

* CSM 雙人對話語音生成 Demo

* 一鍵部署 Qwen2.5-VL-32B-lnstruct

* Stable Virtual Camera 圖像秒變 3D 視頻

* 諦韻 DiffRhythm:1 分鐘即可生成完整音樂 Demo

訪問官網立即使用:openbayes.com

公共數據集

1.?302 例罕見病病例數據集

該數據集包含 302 種罕見病,這些罕見病是從 Orphanet 數據庫中 33 種類型的 7k+ 種罕見病中選出的,Orphanet 數據庫是歐盟委員會共同資助的綜合罕見病數據庫。

* 直接使用:

https://go.openbayes.com/JreTB

2.?DRfold2 RNA 結構測試數據集

該數據集是為了客觀評估研究中 DRfold2 的性能而構建的獨立測試數據集。其中包含 28 種 RNA 結構,它們的序列長度均小于 400 nts,并來源于以下 3 個類別:最新的 RNA-Puzzles 目標序列、CASP15 競賽中的 RNA 目標序列、截至 2024 年 8 月 1 日,Protein Data Bank (PDB) 數據庫中最新發布的 RNA 結構。

* 直接使用:

https://go.openbayes.com/pN0Oi

3. NaturalReasoning 自然推理數據集

該數據集包含 280 萬個挑戰性問題,這些問題覆蓋了多個領域,如 STEM 領域(例如物理、計算機科學)、經濟學、社會科學等。該數據集旨在通過利用預訓練語料庫和大型語言模型 (LLMs) 來生成多樣化且具有挑戰性的推理問題及其參考答案,而無需額外的人工標注。

* 直接使用:

https://go.openbayes.com/KAQyB

圖片

數據集構建示意圖

4.?VenusMutHub 蛋白質突變小樣本數據集

VenusMutHub 是首個針對真實應用場景蛋白質突變小樣本數據集,含 905 個真實應用場景的小樣本實驗突變數據,覆蓋 527 種蛋白質(其中 98% 的蛋白的突變數量在 5-200 個之間),涵蓋了穩定性、活性、結合親和力與選擇性等多種功能測量數據。所有數據均采用直接生化測量,而非替代性熒光讀數,確保了評估的準確性。

* 直接使用:

https://go.openbayes.com/Y4B73

5.?Bird Vs Drone 鳥類與無人機圖像分類數據集

數據集包含來自 Pexel 網站的多種圖像集合,代表運動中的鳥類和無人機。這些圖像是從視頻幀中捕獲的,經過分割、增強和預處理以模擬不同的環境條件,從而增強模型的訓練過程。

* 直接使用:

https://go.openbayes.com/2tCNM

公共模型

1.?Qwen2.5-0mni

* 發布機構:阿里巴巴通義千問團隊

Qwen2.5-Omni 是阿里巴巴通義千問團隊發布的最新端到端多模態旗艦模型,專為全面的多模式感知設計,無縫處理包括文本、圖像、音頻和視頻在內的各種輸入,同時支持流式的文本生成和自然語音合成輸出。

* 直接使用:

https://go.openbayes.com/EIpHB

圖片

模型應用

2.?Llama-4-Scout-17B-16E-Instruct

* 發布機構:Meta

Llama-4-Scout-17B-16E-Instruct 是由 Meta 于 2025 年 4 月開發的一款混合專家 (MoE) 語言模型,屬于 Llama 4 系列模型的一部分,支持文本和多模態體驗。該模型利用專家的混合架構,在文本和圖像理解方面提供行業領先的性能。

* 直接使用:

https://go.openbayes.com/EsnVz

公共教程

1.?CSM 雙人對話語音生成 Demo

CSM (Conversational Speech Model) 旨在通過自然、連貫的語音生成技術提升語音助手的情感交互能力。該模型基于多模態學習框架,結合文本和語音數據,采用端到端的 Transformer 架構直接生成自然且富有情感的語音,可根據文本和音頻輸入生成 RVQ 音頻代碼。

該教程使用 CSM-1B 模型即可實現兩人對話生成,算力資源采用 RTX 4090。

*?在線運行:

https://go.openbayes.com/zrpWM

圖片

模型界面示例

2.?一鍵部署 Qwen2.5-VL-32B-lnstruct

Qwen2.5-VL-32B-Instruct 是阿里巴巴通義千問團隊于 2025 年 3 月 24 日開源的多模態大模型,基于 Apache 2.0 協議發布。該模型在 Qwen2.5-VL 系列的基礎上,通過強化學習技術優化,以 32B 參數規模實現了多模態能力的突破。

進入官網克隆并啟動容器,打開 API 地址即可體驗模型。

*?在線運行:

https://go.openbayes.com/bOYvX

圖片

模型示例

3. Stable Virtual Camera 圖像秒變 3D 視頻

Stable Virtual Camera 能夠根據任意數量的輸入視圖和目標相機,生成場景的新視圖。其設計克服了現有方法在生成大視角變化或時間上平滑樣本方面的局限性,同時無需依賴特定的任務配置。該模型的一個顯著特點是無需額外的 3D 表示學習,即可保持高一致性的樣本生成,從而簡化了實際應用中的視角合成流程。

相關代碼已配置完成,克隆容器進入 API 地址即可生成 3D 視頻。

*?在線運行:

https://go.openbayes.com/qBENf

圖片

模型示例

4.?諦韻 DiffRhythm:1 分鐘即可生成完整音樂 Demo

DiffRhythm 是首個能夠創作完整歌曲的基于擴散的歌曲生成模型。它能夠在短時間內生成長達 4 分 45 秒的完整歌曲,包含人聲和伴奏。

只需為模型提供歌詞和風格提示,DiffRhythm 就能自動生成與歌詞匹配的旋律和伴奏,還支持多語言輸入。

*?在線運行:

https://go.openbayes.com/uK2X2

圖片

模型工作流程

?


以上就是小貝上周在 OpenBayes 的全部更新內容啦~

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/901304.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/901304.shtml
英文地址,請注明出處:http://en.pswp.cn/news/901304.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

PostgreSQL 實例運行狀態全面檢查

PostgreSQL 實例運行狀態全面檢查 PostgreSQL 實例的健康檢查是數據庫運維的核心工作,以下是系統化的狀態檢查方法和關鍵指標解讀。 一 基礎健康檢查 1.1 實例可用性檢查 # 快速連接測試 pg_isready -h localhost -p 5432 -U postgres -d postgres# 返回狀態說明…

利用 Python 進行股票數據可視化分析

在金融市場中,股票數據的可視化分析對于投資者和分析師來說至關重要。通過可視化,我們可以更直觀地觀察股票價格的走勢、交易量的變化以及不同股票之間的相關性等。 Python 作為一種功能強大的編程語言,擁有豐富的數據處理和可視化庫&#xf…

時序約束高級進階使用詳解二:Set_Min_Delay

目錄 一、前言 二、設計示例 2.1 示例代碼 2.2 時序約束 三、Set_min_delay 3.1 start points 3.1.1 對象有效性 3.1.2 邊沿有效性 3.1.3 start point非有效起點 3.2 Through points 3.2.1 約束對象為Cells 3.2.2 約束對象為Cell pin/Net 3.3 to points 3.4 rise…

2025-4-12-C++ 學習 XOR 三元組 異或 急轉彎問題

C的學習必須更加精進一些,對于好多的函數和庫的了解必須深入一些。 文章目錄 3513. 不同 XOR 三元組的數目 I題解代碼 3514. 不同 XOR 三元組的數目 II題解代碼 晚上,10點半,參加了LC的競賽,ok了一道,哈哈~ ??第二道…

圖像形態學操作對比(Opencv)

形態學基于圖像的形狀進行操作,用于處理二值化圖像,主要包括腐蝕和膨脹兩種基本操作。這些操作通常用于去除噪聲、分隔或連接相鄰的元素以及尋找圖像中顯著的最大點和最小點。 1. 形態學操作 import cv2 import numpy as np import matplotlib.pyplot …

sql 向Java的映射

優化建議,可以在SQL中控制它的類型 在 MyBatis 中,如果返回值類型設置為 java.util.Map,默認情況下可以返回 多行多列的數據

excel中的VBA指令示例(一)

示例注釋: Sub 宏1() sub是宏開頭,宏1是宏的名稱,自定義,在按鈕中可指定用某個宏 后面是注釋 Sheets("裝配材料").Select ‘選擇表 裝配材料 Ce…

【Linux C】簡單bash設計

主要功能 循環提示用戶輸入命令(minibash$)。創建子進程(fork())執行命令(execlp)。父進程等待子進程結束(waitpid)。關鍵問題 參數處理缺失:scanf("%s", buf)…

【vue】基礎

一、vi-if 1.1基本使用 必須綁定大盒子包住的代碼,使用id或者class都可以進行綁定 new Vue({ el:"#id" el:".class" }) 1.2v-if和v-show的區別 v-show會渲染,但是不顯示,v-if不渲染不顯示 1.3vue實例的作用范圍 必須包…

【數據結構_5】鏈表(模擬實現以及leetcode上鏈表相關的題目)

書接上文,繼續編寫鏈表的功能 4.鏈表的中間插入 在鏈表中,本身是沒有下標這樣的概念的,不像順序表,順序表根據下標訪問元素,O(1)復雜度。鏈表需要遍歷之后找到正確的位置才能進行插入,為O(N&a…

C語言的發展史

一、起源 C語言的起源可以追溯到20世紀60年代末期。其前身是BCPL(Basic Combined Programming Language)語言,由劍橋大學的Martin Richards于1967年在CPL語言的基礎上簡化而來。1970年,美國貝爾實驗室的Ken Thompson以BCPL語言為…

深入解析棧式虛擬機與反向波蘭表示法

1.1 什么是虛擬機? 虛擬機(Virtual Machine, VM)是一種軟件實現的計算機系統,提供與物理計算機相類似的環境,但在軟件層面運行。虛擬機的存在簡化了跨平臺兼容性、資源管理以及安全隔離等問題。 1.2 棧式虛擬機的架構…

ubuntu 系統安裝Mysql

安裝 mysql sudo apt update sudo apt install mysql-server 啟動服務 sudo systemctl start mysql 設置為開機自啟 sudo systemctl enable mysql 查看服務狀態 (看到類似“active (running)”的狀態信息代表成功) sudo systemctl status mysql …

《前端面試題之 CSS篇(第一集)》

目錄 1、CSS的盒模型2、CSS選擇器及其優先級3、隱藏元素的方法有那些4、px、em、rem的區別及使用場景5、重排、重繪有什么區別6、水平垂直居中的實現7、CSS中可繼承與不可繼承屬性有哪些8、Sass、Less 是什么?為什么要使用他們?9、CSS預處理器/后處理器是…

HTTP:四.HTTP連接

HTTP(Hypertext Transfer Protocol)是一種用于傳輸超文本數據的應用層協議。它是互聯網上最常用的協議,用于在客戶端和服務器之間傳輸數據。HTTP協議通常用于從Web服務器傳輸網頁和文件到客戶端瀏覽器,并支持其他用途,如傳輸API數據和傳輸文件。 HTTP連接是指客戶端向服務…

opencv 識別運動物體

import cv2 import numpy as npcap cv2.VideoCapture(video.mp4) try:import cv2backSub cv2.createBackgroundSubtractorMOG2() except AttributeError:backSub cv2.bgsegm.createBackgroundSubtractorMOG()#形態學kernel kernel cv2.getStructuringElement(cv2.MORPH_REC…

要查看 ??指定 Pod 的資源限制(CPU/內存)

要查看 指定 Pod 的資源限制&#xff08;CPU/內存&#xff09;&#xff0c;可以通過以下 kubectl 命令實現&#xff1a; 1. 快速查看某個 Pod 的資源限制 kubectl get pod <pod-name> -o jsonpath{.spec.containers[*].resources} | jq輸出示例&#xff1a; {"lim…

信息安全管理與評估廣東省2023省賽正式賽題

任務1&#xff1a;網絡平臺搭建(60分) 題號 網絡需求 1 根據網絡拓撲圖所示&#xff0c;按照IP地址參數表&#xff0c;對DCFW的名稱、各接口IP地址進行配置。&#xff08;10分&#xff09; 2 根據網絡拓撲圖所示&#xff0c;按照IP地址參數表&#xff0c;對DCRS的名稱進…

IBM Rational Software Architect安裝感受及使用初體驗

1 安裝感受 最近準備用UML 2.0繪制模型圖。在讀UML創始人之一Grady Booch寫的書《Object-Oriented Analysis and Design with Applications》&#xff08;第3版&#xff09;1時&#xff0c;發現書中用的UML工具之一為IBM Rational Software Architect&#xff08;RSA&#xff…

接聽電話,手機靠近耳朵后拿開,掛斷電話,設備自動鎖屏

目錄 一、問題分析/需求分析 二、解決方案 一、問題分析/需求分析 先說一下大致流程: 首先是打電話過程會啟動PROXIMITY(接近光傳感器)用于監聽手機是否到耳邊,當手機到耳邊時進行滅屏處理,滅屏過程中會調用到鎖屏,所以最終會導致鎖屏 詳細流程分析: 首先根據日志看…