OpenBayes 一周速覽｜TripoSR 開源：1 秒即 2D 變 3D、經典 GTZAN 音樂數據集上線

公共資源速遞

This Weekly Snapshots ！
5 個數據集：

FER2013 面部表情識別數據集

GTZAN 音樂流派分類數據集

MVTec-AD 工業異常檢測數據集

UCAS-AOD 遙感目標檢測數據集

Oxford 102 Flowers 花卉圖片數據集

3 個教程：

Latte 全球首個開源文生視頻 DiT

在線運行 TripoSR 模型 Demo

深度學習入門教程：語音識別數字 0-9

訪問官網立即使用：http://openbayes.com

公共數據集

1. FER2013 面部表情識別數據集

該數據集包含大約 30,000 張不同表情的面部 RGB 圖像，圖像的尺寸均為 48×48 像素，主要標注了 7 種類型的表情：0 = 憤怒，1 = 厭惡，2 = 恐懼，3 = 快樂，4 = 悲傷，5 = 驚奇，6 = 中立。

直接使用：

https://go.openbayes.com/DPK80

2. GTZAN 音樂流派分類數據集

GTZAN 數據集包含了 10 個不同類型的音樂樣本，每個類型包含 100 個樣本。這個數據集最初由 Marsyas 音樂信息檢索工具包創建，并被廣泛用于評估音樂分類算法的性能。

直接使用：

https://go.openbayes.com/La1f2

3. MVTec-AD 工業異常檢測數據集

MVTec-AD 是用于對異常檢測方法進行基準測試的數據集，重點是工業檢測。它包含 15 個不同的對象和紋理類別的超過 5,000 個高分辨率圖像。

直接使用：

https://go.openbayes.com/sopj8

4. UCAS-AOD 遙感目標檢測數據集

UCAS-AOD 是一個遙感影像數據集，包含汽車、飛機以及背景負樣本。

直接使用：

https://go.openbayes.com/7zPYQ

5.Oxford 102 Flowers 花卉圖片數據集

該數據集包含 102 個花的類別，每個類包含 40 到 258 個圖像，主要用于圖像分類。

直接使用：

https://go.openbayes.com/3PSqZ

公共教程

1. Latte 全球首個開源文生視頻 DiT

Latte 是 2023 年 11 月開源的一種用于視頻生成的創新模型，Latte 作為全世界首個開源文生視頻 DiT，已經取得了很有前景的結果。該教程為 Latte 項目的效果實現 Demo。

在線運行：

https://go.openbayes.com/Mkm0f

2.??在線運行 TripoSR 模型 Demo

TripoSR 由 Stability AI 和 Tripo AI 合作開發，可在 1 秒鐘內根據單張圖像生成高質量的 3D 模型，并且對算力的需求很低，因此普通用戶也可以輕松在本地設備上使用它。該教程已經搭建好了環境，方便大家運行體驗。

在線運行：

https://go.openbayes.com/AOPcQ

3. 深度學習入門教程：語音識別數字 0-9

該教程是使用深度學習把語音文件轉譯為文本數據，檢測數字 0-9 的語音，例如把英語「eight」的發音轉譯為文本「eight」。

在線運行：

https://go.openbayes.com/dBWzn

小貝還建立了「Stable Diffusion 教程交流群」，歡迎小伙伴們入群探討各類技術問題、分享應用效果~掃描下方二維碼添加小貝總微信（微信號：OpenBayes001），備注「SD 教程交流」，即可加入群聊。

以上就是小貝上周在 OpenBayes 的全部更新內容啦~

創作者激勵計劃第二期活動已開始招募，最高可得 300 元現金獎勵，歡迎掃碼報名↓

此外，OpenBayes 平臺還提供超過 500 個精選公共數據集、模型、教程等優質資源，并已經整合到「公共資源」模塊中。OpenBayes 平臺支持一鍵 Input，開箱即用！

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/17197.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/17197.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/17197.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！