論文鏈接:Neutral bots probe political bias on social media | EndNote Click
????????試圖遏制濫用行為和錯誤信息的社交媒體平臺被指責存在政治偏見。我們部署中立的社交機器人,它們開始關注 Twitter 上的不同新聞源,并跟蹤它們以探究平臺機制與用戶交互中出現的明顯偏見。我們在新聞推送中沒有發現強有力或一致的政治偏見證據。盡管如此,美國 Twitter 用戶所接觸到的新聞和信息在很大程度上取決于他們早期關系的政治傾向。保守派賬戶的互動偏右,而自由派賬戶則接觸溫和的內容,將他們的經驗轉向政治中間派。黨派賬戶,尤其是保守賬戶,往往會獲得更多關注者并關注更多自動化賬戶。保守賬戶還發現自己處于更密集的社區中,并且接觸到更多低可信度的內容。
背景
????????與傳統媒體相比,在線社交媒體可以比以往更便宜、更快捷的方式連接更多的人。由于很大一部分人經常使用社交媒體來生成內容、消費信息以及與他人互動1,在線平臺也在塑造用戶的規范和行為。
????????實驗表明,簡單地改變社交提要上出現的消息就可以影響用戶的在線表達和現實世界行為2,3,并且社交媒體用戶對早期社會影響很敏感4,5。
研究點引入:兩級分化,用戶傾向于同質話題;推薦算法傾向于推薦虛假信息,不利于檢測
????????與此同時,社交媒體上的討論往往圍繞選舉 6-8、疫苗接種 9 和氣候變化 10 等關鍵但有爭議的話題。兩極分化往往伴隨著觀點不一致的用戶被隔離到所謂的回聲室11-16,即與意識形態激進化和錯誤信息傳播相關的同質在線社區。對抗這種不良現象需要深入了解其根本原因機制。
????????一方面,網絡脆弱性與人類的幾種社會認知偏見有關,包括選擇與信念一致的信息以及在社會關系中尋求同質性的傾向。
????????另一方面,網絡平臺有自己的算法偏差。例如,排名算法偏向流行且引人入勝的內容,這可能會造成惡性循環,放大噪音而不是質量。接觸參與度指標也可能會增加受到錯誤信息影響的可能性。舉個更極端的例子,最近的研究和媒體報道表明,無論起點如何,YouTube 推薦系統都可能會導致視頻出現更多錯誤信息或極端觀點。
????????除了個人用戶的社會認知偏見和技術平臺的算法偏見之外,我們對社交媒體介導的集體互動如何影響我們通過在線信息生態系統獲得的世界觀的理解非常有限。主要障礙是系統的復雜性——用戶不僅通過許多隱藏機制與大量其他人交換大量信息,而且這些交互可以被合法的影響者以及不真實的敵對者公開或秘密地操縱,他們有動機影響觀點或激進行為32。有證據表明,社交機器人和網絡噴子等惡意實體已經被用來傳播錯誤信息并影響對關鍵問題的公眾輿論33-37。
目標是揭示人們在新聞和信息中接觸到的偏見
????????在這項研究中,我們的目標是揭示人們在新聞和信息中接觸到的偏見。社交媒體生態系統。我們特別有興趣澄清社交媒體互動在極化過程和回聲室形成過程中的作用。因此,我們關注 Twitter 上的美國政治話語,因為該平臺在美國政治中發揮著重要作用,并且存在強烈的兩極分化和回音室現象。 Twitter 形成了一個有向社交網絡,其中從朋友節點到關注者節點的邊表示該朋友發布的內容出現在關注者的新聞提要上。
????????我們的目標是研究生態系統偏見,其中包括潛在的平臺偏見以及與社交網絡(有機或非有機)用戶互動的凈效應,這些效應由平臺機制介導并受其政策監管。雖然我們只嘗試在提要管理的狹隘情況下將平臺效應與自然發生的偏差分開,但我們的調查針對的是平臺用戶所經歷的整體偏差。這需要排除個人用戶的偏見,這是使用傳統觀察方法時的一個挑戰——不可能將生態系統影響與可能影響被跟蹤人類賬戶行為的混雜因素分開,例如年齡、性別、種族、意識形態和社會經濟的。
完全由算法控制的社交媒體帳戶(稱為社交機器人)
????????因此,我們轉向一種方法,通過利用模仿人類用戶但完全由算法控制的社交媒體帳戶(稱為社交機器人)來消除控制此類混雜因素的需要。在這里,我們部署具有中立(無偏見)和隨機行為的社交機器人作為探測社交媒體中曝光偏差的工具。我們將我們的機器人稱為“漂流者”,以將它們的中立行為與 Twitter上其他類型的良性和惡意社交機器人區分開來。所有漂流者都有相同的行為模型,唯一的區別是最初的朋友不同。
??????? 在我們的實驗中,在代表單個自變量(治療)的初始行動之后,每個漂流者都被釋放到野外。可以肯定的是,雖然所有的漂流者都有相同的行為,但是他們的行為是不同的,取決于他們的初始條件。我們預計,最初關注自由主義賬戶的漂泊者將更有可能接觸自由主義內容,分享其中一些內容,被自由主義賬戶關注,等等。但這些行為是由平臺機制和社會互動驅動的,而不是由自變量中的政治偏見驅動的:行為模型無法區分自由派、保守派或任何類型的內容。因此,漂流者的行為是我們實驗測量的因變量(結果)的一部分。
研究問題
????????這種方法使我們能夠檢查源自 Twitter 系統設計和算法以及漂流者和其他帳戶之間有機和無機社交互動的綜合偏差。我們的研究問題是:(i)社交媒體平臺上的早期行為對不真實賬戶、政治回聲室和錯誤信息的影響和曝光有何影響?
????????(ii) 這種差異是否可以歸因于平臺新聞源中的政治偏見?為了回答這些問題,我們初始化了來自不同政治領域新聞來源的漂移者。
????????五個月后,我們檢查了漂流者消費和生成的內容,并分析了(i)他們的朋友和追隨者的特征,包括通過共享鏈接和主題標簽推斷出他們的自由保守派政治立場;
???????? (ii) 通過機器學習方法測量的自動化活動;
???????? (iii) 接觸來自新聞和事實核查組織確定的低可信度來源的信息。
??????? 我們發現最初朋友的政治立場對受歡迎程度、社交網絡結構、接觸機器人和低可信度來源以及每個漂泊者的行為所體現的政治立場有重大影響。然而,我們沒有發現任何證據表明這些結果可以歸因于平臺偏見。我們對 Twitter 信息生態系統政治趨勢的研究提供的見解可以幫助公眾辯論社交媒體平臺如何影響人們對政治信息的接觸。
結果
????????我們實驗中的所有漂流者都遵循相同的行為模型,其設計是中立的,不一定是現實的。每個漂流者在隨機時間被激活以執行操作。操作類型,例如推文、點贊和回復是根據以下條件隨機選擇的:預定義的概率。對于每個操作,模型指定如何選擇隨機目標,例如要轉發的推文或要取消關注的好友。動作之間的時間間隔是從廣泛的分布中得出的,以產生逼真的突發行為。
漂流機器人的實施
????????詳細信息請參見“方法”。我們開發了 15 個漂流機器人,將它們分為五組,并使用相同的初始朋友初始化同一組中的每個漂流機器人。每個 Twitter 帳戶都使用與美國政治光譜的左派、中左派、中間派、中右派或右派一致的流行新聞來源作為第一個朋友(詳細信息請參閱“方法”)。我們用他們最初朋友的政治立場來稱呼漂流者。例如,使用中左來源初始化的機器人被稱為“C.左”漂流者。
????????從2019年7月10日部署到2019年12月1日停用,我們每天監控漂流者的行為并收集數據。具體來說,我們測量了:(1)每個漂流者的追隨者數量,以比較他們獲得影響力的能力; (2) 每個漂流者的回波室暴露情況; (3) 漂流者的朋友和追隨者可能進行的自動化活動; (4)漂流者接觸到的低可信度信息比例; (5) 對漂流者及其朋友生成的內容進行政治調整,以探究政治偏見。
????????影響力。追隨者的數量可以用作影響力的粗略指標。為了衡量政治聯盟如何影響影響力動態,圖 1 繪制了不同群體中漂流者隨時間變化的平均追隨者數量。
?(圖1追隨者的增長。X 軸顯示的是2019年實驗的持續時間,而 x 軸顯示的是不同流浪者群體的平均追隨者數量。有色置信區間表示 ± 1標準誤差。源數據以源數據文件的形式提供。自然通訊 |? https://doi.org/10.1038/s41467-021-25738-6articlenature 通訊 | (2021)12:5580 |? https://doi.org/10.1038/s41467-021-25738-6 |? www.nature.com/naturecommunications3)
????????為了比較不同組的增長率,我們考慮了對每個漂流者的追隨者計數的連續觀察,并將它們在每個組中匯總(n = 387 為左,373 為 C. 左,389 為中,387 為 C. 右,386 為右)。 測試中出現了兩種趨勢(本次分析和以下分析中的所有測試都是雙面的)。
????????首先,與大多數黨派來源作為初始朋友的漂流者往往比中間漂流者吸引更多的追隨者(左派與中派的d.f.=774,t=5.13,p<0.001,右派d.f.=773,t=8.00,p<0.001)與中心)。其次,初始來源右傾的漂流者獲得追隨者的比例明顯高于初始來源左傾的漂流者(d.f=771,t=3.84,右翼與左翼的 p< 0.001)。
????????漂流者之間影響力的差異不僅受到政治結盟的影響,還受到他們最初朋友的其他特征的影響。為了理清這些因素,我們測量了漂泊者追隨者的數量與他們最初朋友的兩個特征之間的相關性:他們的整體影響力和他們在其他政治聯盟賬戶中的受歡迎程度。雖然漂流者的影響力不受最初朋友的整體影響力的影響,但它與他們在政治上一致的賬戶中的受歡迎程度呈正相關(見補充說明)。這與具有共同黨派傾向的用戶更有可能形成社會關系的證據一致42,正如我們接下來探討的那樣。
????????回聲室。
????????我們將回聲室定義為密集且高度聚集的社交媒體社區,可以放大同質內容的曝光度。為了研究漂流者機器人是否發現自己處于這樣的回聲室中,讓我們考慮每個漂流者的自我網絡,即由漂流者及其朋友和追隨者組成的網絡。我們可以使用自我網絡的密度和傳遞性作為回聲室存在的代理。密度是網絡中連接的節點對的分數。傳遞性衡量節點中實際存在的可能三角形的比例。高傳遞性意味著朋友和關注者也可能互相關注。詳細內容請參見“方法”。
????????圖2a、b顯示了漂流者自我網絡的平均密度和傳遞性(詳見“方法”)。由于這兩個度量在自我網絡中是相關的,圖 2c 還繪制了通過打亂的隨機網絡重新調整的傳遞性(參見“方法”)。
?(圖2 漂流器周圍的回波室結構。不同群體漂泊者自我網絡的a密度、b及物性及標準化及物性。誤差條表示標準誤差(每組 n=3 名漂流者)。d 五個組中漂流者的自我網絡。節點代表帳戶,邊代表朋友/關注者關系。節點大小和顏色分別表示共享鏈接的程度(鄰居數量)和政治傾向。由于不共享政治內容,黑色節點缺少對齊分數。源數據作為源數據文件提供。 3 漂流者的朋友和追隨者的機器人分數分布。機器人分數是 0 到 1 之間的數字,分數越高表示可能是自動化的。對于每個組,我們考慮該組中漂流者的朋友和追隨者的聯合。條形表示平均值。對于朋友,n=282(左)、261(左)、206(中)、323(右)和 414(右)。對于追隨者,n=172(左)、118(左)、65(中)、205(右)和 299(右)。源數據作為源數據文件提供。 https://doi.org/10.1038/s41467-021-25738-64自然通訊| (2021) 12:5580 | https://doi.org/10.1038/s41467-021-25738-6 | www.nature.com/naturecommunications)
????????右漂者的自我網絡比中漂者的自我網絡更密集(d.f.=4,t=?8.28,p=0.001),而中漂者和左漂者之間的密度差異并不顯著(d.f.=4,t=?2.68,p =0.055)。右帳戶網絡也比中心網絡具有更高的傳遞性(d.f.=4,t=?9.31,p<0.001);左帳戶網絡也具有更高的傳遞性(d.f.=4,t=?3.53,p=0.024)。即使考慮到密度差異 (d.f.=4,t=?8.96,p< 0.001),右翼賬戶也比中間派賬戶更加聚集,而左翼賬戶與中間賬戶的差異并不顯著 (d.f.=4,t=?2.73,p =0.053)。此外,右漂移器的回聲室比左漂移器更強(對于密度,d.f.=4,t=?3.84,p=0.019;對于傳遞性,d.f.=4,t=?3.02,p=0.039)。然而,左、右之間歸一化及物性的差異并不顯著(d.f.=4,t=?0.60,p=0.579),這表明右側較高的聚集性是由社會聯系的密度來解釋的。
????????自動化活動。
????????被稱為社交機器人的自動化賬戶積極參與有關最近美國選舉的在線討論33,43,44。因此,漂流者預計會遇到機器人帳戶。我們使用 Botometer 服務45,46 收集漂流者的朋友和關注者的機器人分數。我們在圖 3 中報告了漂流者的朋友和追隨者的機器人分數分布。毫不奇怪,跨政治領域的漂流者更有可能在他們的追隨者中擁有機器人,而不是在他們的朋友中。關注朋友揭示了社交媒體用戶更嚴重的潛在脆弱性。我們發現,黨派漂流者關注的賬戶比中間派漂流者關注的賬戶更像機器人(d.f.=618,t=?6.14,p<0.001(右翼 vs. 中間)和 d.f.=486,t=?3.67,p<0.001(左翼 vs. 中間)中心)。比較黨派和溫和派,右翼漂流者所遵循的賬戶比C.右翼漂流者更像機器人(d.f.=735,t=?3.01,p=0.003),而自由派的差異較小(d.f.=541,t=? 2.56,p=0.011(左與 C. 左)。在黨派中,右翼分子關注的賬戶比左翼賬戶更像機器人(d.f.=694,t=?2.33,p=0.020)。