公共資源速遞
This Weekly Snapshots !
5 個數據集:
FER2013 面部表情識別數據集
GTZAN 音樂流派分類數據集
MVTec-AD 工業異常檢測數據集
UCAS-AOD 遙感目標檢測數據集
Oxford 102 Flowers 花卉圖片數據集
3 個教程:
Latte 全球首個開源文生視頻 DiT
在線運行 TripoSR 模型 Demo
深度學習入門教程:語音識別數字 0-9
訪問官網立即使用:http://openbayes.com
公共數據集
1. FER2013 面部表情識別數據集
該數據集包含大約 30,000 張不同表情的面部 RGB 圖像,圖像的尺寸均為 48×48 像素,主要標注了 7 種類型的表情:0 = 憤怒,1 = 厭惡,2 = 恐懼,3 = 快樂,4 = 悲傷,5 = 驚奇,6 = 中立。
直接使用:
https://go.openbayes.com/DPK80
2. GTZAN 音樂流派分類數據集
GTZAN 數據集包含了 10 個不同類型的音樂樣本,每個類型包含 100 個樣本。這個數據集最初由 Marsyas 音樂信息檢索工具包創建,并被廣泛用于評估音樂分類算法的性能。
直接使用:
https://go.openbayes.com/La1f2
3. MVTec-AD 工業異常檢測數據集
MVTec-AD 是用于對異常檢測方法進行基準測試的數據集,重點是工業檢測。它包含 15 個不同的對象和紋理類別的超過 5,000 個高分辨率圖像。
直接使用:
https://go.openbayes.com/sopj8
4. UCAS-AOD 遙感目標檢測數據集
UCAS-AOD 是一個遙感影像數據集,包含汽車、飛機以及背景負樣本。
直接使用:
https://go.openbayes.com/7zPYQ
5.Oxford 102 Flowers 花卉圖片數據集
該數據集包含 102 個花的類別,每個類包含 40 到 258 個圖像,主要用于圖像分類。
直接使用:
https://go.openbayes.com/3PSqZ
公共教程
1. Latte 全球首個開源文生視頻 DiT
Latte 是 2023 年 11 月開源的一種用于視頻生成的創新模型,Latte 作為全世界首個開源文生視頻 DiT,已經取得了很有前景的結果。該教程為 Latte 項目的效果實現 Demo。
在線運行:
https://go.openbayes.com/Mkm0f
2.??在線運行 TripoSR 模型 Demo
TripoSR 由 Stability AI 和 Tripo AI 合作開發,可在 1 秒鐘內根據單張圖像生成高質量的 3D 模型,并且對算力的需求很低,因此普通用戶也可以輕松在本地設備上使用它。該教程已經搭建好了環境,方便大家運行體驗。
在線運行:
https://go.openbayes.com/AOPcQ
3. 深度學習入門教程:語音識別數字 0-9
該教程是使用深度學習把語音文件轉譯為文本數據,檢測數字 0-9 的語音,例如把英語「eight」的發音轉譯為文本「eight」。
在線運行:
https://go.openbayes.com/dBWzn
小貝還建立了「Stable Diffusion 教程交流群」,歡迎小伙伴們入群探討各類技術問題、分享應用效果~掃描下方二維碼添加小貝總微信(微信號:OpenBayes001),備注「SD 教程交流」,即可加入群聊。
以上就是小貝上周在 OpenBayes 的全部更新內容啦~
創作者激勵計劃第二期活動已開始招募,最高可得 300 元現金獎勵,歡迎掃碼報名↓
此外,OpenBayes 平臺還提供超過 500 個精選公共數據集、模型、教程等優質資源,并已經整合到「公共資源」模塊中。OpenBayes 平臺支持一鍵 Input,開箱即用!