?文章鏈接:https://mp.weixin.qq.com/s/danmd9lSQpmck4tVsM37bQ
今天分享一篇將圖神經網絡應用于文本分類的創新模型——TextSSL。在傳統的文檔理解中,模型往往難以同時捕捉文本的局部句法細節和全局語義關聯。針對這一挑戰,TextSSL提出了一種基于動態稀疏圖結構學習的新范式,通過構建句內句法子圖和句間語義關聯,使模型能夠像人類一樣"精讀"文檔——既關注詞語間的局部搭配,又理解跨句子的長程依賴關系。
Text GNN文章:?突破傳統!圖神經網絡Text GCN如何實現文本分類新高度?
Text Level GNN文章:【重磅開源】TextGNN的“終結者”來了!單卡輕松訓練億級文本,推理無需全語料!
TextING文本分類:突破傳統!TextING:用圖神經網絡為每篇文本「量身定制」關系圖譜
接下來,我將深入對這篇論文展開全面解讀。和以往一樣,我會嚴格依照論文的結構框架,從研究背景、核心論點、實驗設計到最終結論,逐一對文章的各個關鍵部分進行細致剖析 ,力求為大家呈現這篇時間序列預測論文的全貌,挖掘其中的研究價值與創新點。
🌟 公眾號回復以下【】內編號獲取專屬資源: 【000】:💻 ChatGPT接入公眾號代碼。 【333】:📊 AI時序算法論文集&數據集。 【666】:📝 算法面試常考手撕代碼。 【777】:🌐 AI開源項目合集[CV/NLP/LLMs]。 【888】:📲 添加小編微信,加入AI算法學習交流群。 📋 本公眾號已接入AI對話機器人,直接提問即可收到回復。 🎁 期待你在這里找到技術成長與緣分的交匯點!💫 |
1. Abstract
近年來,圖神經網絡(GNNs)被廣泛應用于文檔分類任務。然而,現有方法大多基于靜態的詞共現圖且缺乏句子層級信息,這帶來了三大挑戰:(1)詞匯歧義性,(2)詞匯同義性,以及(3)動態上下文依賴性。為解決這些挑戰,本文提出了一種新穎的基于GNN的稀疏結構學習模型,用于歸納式文檔分類。具體而言,首先通過句子級詞共現圖的不相交并集生成文檔級圖。該模型通過一組可訓練的邊連接不同句子間的離散詞匯,并采用結構學習機制稀疏地篩選具有動態上下文依賴關系的邊。具有稀疏結構的圖能夠通過GNN聯合挖掘文檔中的局部和全局上下文信息。在歸納學習階段,優化后的文檔圖被送入通用讀出函數,以端到端的方式完成圖層級分類和優化。在多個真實數據集上的實驗表明,所提出模型性能優于當前最先進方法,并驗證了為每個文檔學習稀疏結構的必要性。
2. Introduction
文檔分類作為自然語言處理(NLP)領域最基礎的任務之一,旨在通過算法自動將輸入文檔劃分到一個或多個類別中。該任務的核心在于提取能夠表征文檔的特征。傳統方法采用人工設計的特征(如詞袋模型、詞頻-逆文檔頻率)。隨著深度學習技術的發展,Word2Vec(Mikolov et al. 2013)等相關工作開始利用上下文信息學習詞表征。考慮到詞匯在序列中的順序,許多模型采用基于序列的模型,包括循環神經網絡(RNN)(Mikolov et al. 2010; Tai, Socher, and Manning 2015; Liu, Qiu, and Huang 2016)和卷積神經網絡(CNN)(Kim 2014;
文章鏈接:https://mp.weixin.qq.com/s/danmd9lSQpmck4tVsM37bQ