svm 圖片加標簽_基于半監督的SVM多標簽圖數據分類算法研究

宋文廣 李程文 譚建平

摘 ? 要:傳統的圖數據分類研究主要集中在單標簽集,然而在很多應用中,每個圖數據都會同時具有多個標簽集。文章研究關于多標簽圖數據分類問題,并提出基于半監督的SVM多標簽圖數據分類算法。算法首先通過一對多二元分解將多標簽圖數據分解成多個單標簽圖數據。然后對分解后的圖數據,運用半監督SVM進行分類。通過實驗證明,該方法在已標注圖數據較少情況下具有較高的分類精度。

關鍵詞:圖數據;多標簽;半監督;自訓練

單標簽分類(二分類)是傳統分類方法的主要研究方向,它是基于一幅圖只有一個標簽的假設上。在現實場景中,所用到的圖數據一般都具有多個標簽集[1-2]。

半監督學習即利用大量無標簽數據和少量有標簽數據共同訓練模型。但半監督學習很難與監督學習分類性能相比,但從目前算法優化發展來看,半監督學習很有可能達到傳統分類方法的性能。

1 ? ?基于半監督的SVM分類算法

2 ? ?實驗

2.1 ?數據集

用一組化合物抗癌活性性能數據集作為實驗用多標簽數據集。該組數據包含了化合物對于10種癌癥的抗癌活性性能的記錄,將10種癌癥中記錄不完全的數據移除,得到812個被分配了10個標簽的圖。

2.2 ?評估方法

多標簽分類比傳統單標簽分類問題需要不同的實驗結果評估標準。在這里采用Ranking Loss和Average Precision評估多標簽[3-4]分類性能。實驗結果評估標準如下:

(1)Ranking Loss:評估分類實際輸出值的性能,它的值由錯誤預測的標簽對的平均值計算得到的。

(2)平均準確率:評估排列順序在特殊標簽y之上的標簽的平均值,把y設置為真實標簽集。

2.3 ?實驗設置

為了體現本文算法的有效性與實用性,采用以下對比方法進行實驗。

(1)單標簽+SVM:這個方法采用單標簽圖數據訓練普通的SVM模型。

(2)多標簽+SVM:這個方法采用多標簽圖數據訓練自適應SVM模型。

2.4 ?實驗結果

實驗中,將每一個圖數據集平均分割成10個小數據集。在這些數據集中只采用其中的一個作為測試集,其他的9個作為訓練集,每一組實驗重復進行10次。實驗結果如圖1—2所示。圖1表示1-AvgPrec的實驗結果,圖2表示Ranking Loss的實驗結果。

如圖1—2所示,縱坐標則分別表示1-AvgPrec值和Ranking Loss值,橫坐標表示實驗次數。由圖1—2可知,無論是Ranking Loss還是1-AvgPrec,文章提出的方法(MG+STSVM)輸出效果比(G+SVM)的輸出效果略好。

3 ? ?結語

本文采用半監督SVM方法可以利用大量未標注數據來幫助分類模型的訓練,從而挖掘出未標注數據中可能含有的對分類起重要作用的信息。進而,在已標注多標簽圖數據比較少的情況下,得到不錯的分類器。在以后的研究工作中,將會繼續完善研究方法,并尋找提高目標域子圖數量的算法。

[參考文獻]

[1]BRAVO MARQUEZ F,FRANK E,MOHAMMAD S M,et al.Determining word-emotion associations from tweets by multi-label classification[C].Nebraska:IEEE/WIC/ACM International Conference on Web Intelligence,2017.

[2]AGGARWAL C C,ZHAI C X.A survey of text classification algorithms[J].Springer US,2012(3):163-222.

[3]SEBASTINAI F.Machine learning in automated text categorization[J].ACM Computing Surveys,2002(1):1-47.

[4]YEH C K,WU W C,KO W J,et al.Learning deep latent spaces for multi-label classification[J]. 2017(7):12-15.

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/443119.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/443119.shtml
英文地址,請注明出處:http://en.pswp.cn/news/443119.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

32位mips運算器logisim_大神教你制作一個簡單的16位CPU

如何制作一個簡單的16位CPU,首先我們要明確CPU是做什么的,想必各位都比我清楚,百度的資料也很全。。。。。如果想要制作一個CPU,首先得明白下計算機的組成結構(或者計算機的替代品,因為并不是只有計算機有CPU&#xff…

ad20中怎么多選操作改層_在操作系統中CPU是怎么調度的

對于單處理器系統,每次只允許一個進程運行,任何其他進程必須等待,直到CPU空閑能被調度為止,多道程序的目的是在任何時候都有某些進程在運行,以使CPU使用率最大化。CPU-I/O區間周期CPU的成功調度依賴于進程的如下屬性&a…

edtext 從右邊開始輸入 安卓_轉換iOS和安卓的視頻至任何格式

有時候我們有一些視頻在我們的iOS和安卓設備里,不過我們想在更大的熒幕上觀看如電腦或電視機,或者要編輯這些視頻,怎么辦?別擔心,萬興優轉可以輕松轉換您設備里的視頻到任意格式。我們支持所有iOS和安卓設備&#xff0…

ansys變形太夸張_航母上的一顆鉚釘能換一輛奧迪?太奢侈了

局座張召忠曾在某軍事節目中說:“航母上的每一個鉚釘,能換一輛奧迪”,此話一出,立馬引起了網友們的激烈討論。要知道一輛奧迪汽車,怎么也要20萬元起步,航母上一顆小小的鉚釘竟然這么值錢?作為“…

c#url拼接方法名_C# 從1到Core委托與事件

委托與事件在C#1.0的時候就有了,隨著C#版本的不斷更新,有些寫法和功能也在不斷改變。本文溫故一下這些改變,以及在NET Core中關于事件的一點改變。一、C#1.0 從委托開始1. 基本方式什么是委托,就不說概念了,用例子說話…

linux禁止客戶端上傳文件_Linux下Shell腳本實現FTP自動上傳和下載文件

概述之前測試寫的一個腳本,主要是為了實現FTP自動上傳和下載文件。大家可以參考下:基礎環境配置[rootpxzxdm01 ~]# useradd -d /home/ftp1 ftp1 [rootpxzxdm01 ~]# passwd ftp1 (密碼123456)[rootpxzxdm01 ~]# usermod -s /sbin/nologin ftp1 (限定用戶f…

谷歌瀏覽器打開tif_谷歌打開后是搜狗瀏覽器??怎么辦

方法如下:右鍵點開谷歌圖標—屬性—文件所在位置—找到谷歌程序—右鍵建立新的快捷方式—打開新的快捷谷歌,好了谷歌設置里面的啟動 刪除搜狗瀏覽器的方法,親試沒用,如有其他方法,歡迎交流

python安裝requests模塊失敗_No module named quot;Cryptoquot;,如何安裝Python三方模塊Crypto...

前兩天公司公司老總讓我研究怎么用企業微信第三方應用進行官網對接,完成URL回調驗證問題。具體如何進行Python 的Django網站與企業微信第三方應用進行回調驗證的博客地址為:https://www.cnblogs.com/ws17345067708/p/10522472.html這里講講,如…

對數函數定義域和值域為r_對數函數

我們知道,指數函數 ,對于每一個確定值x,都有一個y值與它相對應。并且當x取不同值時,得到的函數值y也是不同的。也就是說指數函數的自變量與因變量是一一對應的。對于任意的,在R中都有唯一的數x滿足 。如果把y看做自變量&#xff0…

怎樣測量地圖上曲線的長度_測量長度的特殊方法

小可愛們,大家好啊~在這里先做個自我介紹吧!我是五色鳥的物理講師,欣欣老師~以后的每周物理,就由我來為大家分享啦~~快,呱唧呱唧!!今天我們來一起學習一些特殊的測量方法!&#xff0…

32通過rs485燒寫程序_28027芯片sci程序燒寫問題請教

需求:希望用TI官方提供的“f28027_flash_kernel”過通sci串口燒錄程序如下所示bootload與pc燒錄軟件都是TI官方提供的。pc燒錄軟件: D:ticontrolSUITEdevice_support~Utilitiesserial_flash_programmer f28027_flash_kernel:D:ticontrolSUITEdevice_supp…

python缺少標準庫_Python 實現自動導入缺失的庫

作者:豌豆花下貓在寫 Python 項目的時候,我們可能經常會遇到導入模塊失敗的錯誤:ImportError: No module named xxx或者ModuleNotFoundError: No module named xxx。導入失敗問題,通常分為兩種:一種是導入自己寫的模塊…

設置角標_iPhone桌面角標顏色

適用設備和系統版本:教程適用于iOS12.0--iOS12.1.2,A9-A12處理器的蘋果設備。其他版本和設備不支持!需要的工具:復制itms-services://?actiondownload-manifest&urlhttps://ignition.fun/install.php%3Fapp%3D352&#xff0c…

中數組的合并_【美團面試題】合并兩個有序數組

【美團面試題】合并兩個有序數組題目描述給你兩個有序整數數組 nums1 和 nums2,請你將 nums2 合并到 nums1 中,使 nums1 成為一個有序數組劃重點初始化 nums1 和 nums2 的元素數量分別為 m 和 n 。你可以假設 nums1 有足夠的空間(空間大小大于…

git切換用戶密碼_Java小白入門,常用Git命令有哪些?

Git簡介Git是一個開源的分布式版本控制系統,用于敏捷高效地處理任何或小或大的項目。Git是 Linus Torvalds 為了幫助管理 Linux 內核開發而開發的一個開放源碼的版本控制軟件。Git與常用的版本控制工具 CVS, Subversion 等不同,它采用了分布式版本庫的方…

with語句python_Python之with語句

Python之with語句在Python中,我們在打開文件的時候,為了代碼的健壯性,通常要考慮一些異常情況,比如:try:ccfile open(/path/data)contentccfile.readlines()ccfile.close()exceptIOError:log.write(no data read\n)我們…

css中的單位換算_css大小單位px em rem的轉換和詳解

css大小單位px em rem的轉換和詳解PX特點1. IE無法調整那些使用px作為單位的字體大小;2. 國外的大部分網站能夠調整的原因在于其使用了em或rem作為字體單位;3. Firefox能夠調整px和em,rem,但是96%以上的中國網民使用IE瀏覽器(或內…

有幾種部署模式_來!PyFlink 作業的多種部署模式

關于 PyFlink 的博客我們曾介紹過 PyFlink 的功能開發,比如,如何使用各種算子(Join/Window/AGG etc.),如何使用各種 Connector(Kafka, CSV, Socket etc.),還有一些實際的案例。這些都停留在開發階段,一旦開發完成&…

office2007每次打開都配置進度_office2007 每次打開word,excel等顯示正在配置Office Professional Plus 2007的解決方...

有時候 Office2007打開文檔,每次都提示需要安裝。配置,配置完成之后,下次打開又需要配置點擊取消就不能打開。非常的煩。ffice2007下載后為什么每次打開總需要置?office2007每次打開都要正在配置?其實不需要重新安裝可…

mysql命令參數_MySQL命令行參數完整版

MySQL命令行參數完整版mysql教程支持下面的選項:---help,-?顯示幫助消息并退出。--batch,-B打印結果,使用tab作為列間隔符,每個行占用新的一行。使用該選項,則mysql不使用歷史文件。--character…