網絡爬蟲安全:90后小伙,用軟件非法搬運他人原創視頻被判刑

目錄

違法視頻搬運軟件是網絡爬蟲

如何發現偷盜視頻的爬蟲?

攔截違法網絡爬蟲


央視《今日說法》欄目近日報道了一名程序員開發非法視頻搬運軟件獲利超700多萬,最終獲刑的案例。

國內某知名短視頻平臺報警稱,有人在網絡上售賣一款視頻搬運軟件,使用軟件的人可以繞過平臺的審核機制,一鍵“搬運”竊取他人作品非法轉載投稿。警方調查發現,在這背后是一條違法犯罪的產業鏈條,犯罪團伙的上游開發制作非法軟件,通過更改短視頻平臺的代碼,逃避平臺監管。

圖片

犯罪嫌疑人 90 后程序員周某交代,這款軟件主要用于非法搬運視頻,支持視頻鏡像,去水印,草稿替換,攝像頭替換等功能,修改后的視頻支持在快手、抖音、嗶哩嗶哩、小紅書、西瓜視頻等主流視頻平臺一鍵發布,從而協助他人實現賬號“快速漲粉”目的。從 2022 年 5 月到20 23 年 3 月份,周某累計獲利 700 多萬元。目前周某已被判有期徒刑 3 年、緩刑 5 年;而負責軟件銷售的從犯陳某被判有期徒刑 3 年、緩刑 3 年 2 個月。

圖片


違法視頻搬運軟件是網絡爬蟲

該案件中,非法下載視頻內容的軟件是網絡爬蟲。網絡爬蟲,又被稱為網頁蜘蛛,網絡機器人,是按照一定的規則,自動地抓取網絡信息和數據的程序或者腳本。

圖片

圖片

2022年11月,頂象防御云業務安全情報披露,某社交媒體平臺遭遇持續性的網絡爬蟲盜取。大量用戶信息和原創內容被網絡爬蟲盜取,被黑灰產轉售給競爭對手或直接用于惡意營銷。

數據顯示,2023年全球數據盜取量將達到1900億條,其中超過80%的數據來自網絡爬蟲。網絡爬蟲通常會通過編程的方式自動訪問網站,獲取用戶信息或數據。這類行為不僅侵犯了用戶的隱私,也給企業造成了巨大的經濟損失。

圖片


如何發現偷盜視頻的爬蟲?

現在的網絡爬蟲程序具有隨機 IP 地址、匿名代理、身份修改、模仿人類操作行為等特征,非常難檢測和阻止,需要在多個維度進行識別與分析。

圖片

一是訪問目標。惡意的網絡爬蟲的目的是獲取網站、App的核心信息,比如用戶數據、商品價格、評論內容等,因此它們通常只會訪問包含這些信息的頁面,而忽略其他無關的頁面。

二是訪問行為。網絡爬蟲是由程序自動執行的,按照預設的流程和規則進行訪問,因此它們的行為具有明顯的規律性、節奏性和一致性,與正常用戶的隨機性、靈活性和多樣性有很大差異。

三是訪問設備。惡意的網絡爬蟲的目標是在最短時間內抓取最多信息,因此它們會使用同一設備進行大量的訪問操作,包括瀏覽、查詢、下載等,這會導致該設備的訪問頻率、時長、深度等指標異常。

四是訪問IP地址。惡意的網絡爬蟲為了避免被網站識別和封禁,會采用各種手段變換IP地址,比如使用云服務、路由器、代理服務器等。這會導致該IP地址的來源地域、運營商、網絡類型等信息不一致,或者與正常用戶的分布有明顯偏差。

五是訪問時間段。惡意的網絡爬蟲為了減少被發現的風險,通常會選擇在網站流量較低、監控較弱的時間段進行批量爬取,比如深夜、凌晨等。這會導致該時間段內的訪問量、帶寬占用等指標異常。

六是大數據建模挖掘。通過對網站正常用戶和網絡爬蟲的訪問數據進行收集、處理、挖掘和建模,可以構建出專屬于網站自身的爬蟲識別模型,從而提高識別準確率和效率。

圖片


攔截違法網絡爬蟲

網絡爬蟲的攻擊手段也日益智能化和復雜化,僅僅依靠限制訪問頻率或者前端頁面加密已經難以有效防御,需要提升人機識別技術,增加異常行為的識別和攔截能力,以限制網絡爬蟲的訪問,提高惡意盜取的攻擊成本。頂象為企業提供了全流程的立體防控方案,能夠有效防范網絡爬蟲的惡意盜取行為。

頂象無感驗證基于AIGC技術,能夠防止AI的暴力破解、自動化攻擊和釣魚攻擊等威脅,有效防止未經授權的訪問、攔截網絡爬蟲盜取。它集成了13種驗證方式和多種防控策略,支持安全用戶無感通過,實時對抗處置能力也縮減至60s內,進一步提高了數字登錄服務體驗的便捷性和效率。

頂象設備指紋通過將多端設備信息的內部打通,對每個設備生成統一且唯一設備指紋。基于設備、環境、行為的多維度識別策略模型,識別出虛擬機、代理服務器、模擬器等被惡意操控等風險設備,分析設備是否存在多賬號登錄、是否頻繁更換IP地址、頻是否繁更換設備屬性等出現異常或不符合用戶習慣的行為,快速識別訪問頁面爬蟲是否來自惡意設備。

頂象Dinsight實時風控引擎幫助企業進行風險評估、反欺詐分析和實時監控,提高風控的效率和準確性。Dinsigh的日常風控策略的平均處理速度在100毫秒以內,支持多方數據的配置化接入與沉淀,能夠基于成熟指標、策略、模型的經驗儲備,以及深度學習技術,實現風控自我性能監控與自迭代的機制。

與Dinsight搭配的Xintell智能模型平臺,能夠對已知風險進行安全策略自動優化,基于風控日志和數據挖掘潛在風險,一鍵配置不同場景支持風控策略。其基于關聯網絡和深度學習技術,將復雜的數據處理、挖掘、機器學習過程標準化,提供從數據處理、特征衍生、模型構建到最終模型上線的一站式建模服務。從而有效挖掘潛在惡意爬取威脅,進一步提升對惡意盜取行為的識別度和對惡意網絡爬蟲的攔截效果。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/13137.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/13137.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/13137.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

劉邦的創業團隊是沛縣人,朱元璋的則是鳳陽;要創業,一個縣人才就夠了

當人們回顧劉邦和朱元璋的創業經歷時,總是會感慨他們起于微末,都創下了偌大王朝,成就無上榮譽。 尤其是我們查閱史書時,發現這二人的崛起班底都是各自的家鄉人,例如劉邦的班底就是沛縣人,朱元璋的班底是鳳…

大模型技術介紹和實現流程以及向量庫的介紹

多模態大模型:(Multimodal Models)指能夠處理和生成多種類型數據(如文本、圖像、音頻等)的機器學習模型。該模型整合了來自不同模態的數據,從而提高了任務執行的準確性和廣度。 一、多模態大模型 任務步驟…

分布式搜索-elaticsearch基礎 概念

什么是elaticsearch: 倒排索引:就是將要查詢的內容分成一個個詞條,在將詞條文檔id存入,詞條是唯一的。 文檔詞條總結: mysql和Elasticsearch概念對比: 架構: 基本概念總結:

Linux上執行內存中的腳本和程序

在Linux中可以不需要有腳本或者二進制程序的文件在文件系統上實際存在,只需要有對應的數據在內存中,就有辦法執行這些腳本和程序。 原理其實很簡單,Linux里有辦法把某塊內存映射成文件描述符,對于每一個文件描述符,Lin…

一線互聯網大數據面試題核心知識庫(100萬字)

本面試寶典涵蓋大數據面試高頻的所有技術棧,包括Liunx&Shell基礎,Hadoop,Zookpeer,Flume,Kafka,Hive,Datax,Maxwell,DolphinScheduler,Spark Core&SQ…

光伏行業該如何起步?

隨著全球對可再生能源的需求日益增長,光伏行業作為其中的佼佼者,正迎來前所未有的發展機遇。然而,對于新進入者或希望在這一領域有所建樹的企業來說,如何起步并穩健發展是一個值得深思的問題。以下是一些關于光伏行業起步的建議。…

MySQL-事務篇

文章目錄 何為事務?什么是事務的ACID特性?并發事務帶來了哪些問題?不可重復讀和幻讀有什么區別?并發事務的控制方式有哪些?SQL標準定義了哪些事務隔離級別?MYSQL的隔離級別是基于鎖實現的嗎? 何…

微服務- protobuf 安裝

這里寫自定義目錄標題 1:下載鏈接2 :下載對應的包3:解壓到目錄4:設置環境變量5: 查看版本 1:下載鏈接 https://github.com/protocolbuffers/protobuf/releases 2 :下載對應的包 3:解壓到目錄 4&…

從RTTR談Reflection機制

雖然C11引入了RTTI、Metaprogramming 等技術,但C在Reflection編程方面依舊功能有限。在社區上,RTTR則提供了一套C編寫的反射庫,補充了C在Reflection方面的缺陷。 零、環境 操作系統Windows 11Visual StudioVisual Studio Community 2022 CMa…

git 命令 - rebase

簡介 git rebase 是一個用于重新應用一系列提交到另一個基礎的 Git 命令。 它可以用來整合來自不同分支的更改,同時保持項目歷史的整潔。 操作流程 開始變基: 要開始一個變基操作,你需要指定一個基礎分支。通常,這個基礎分支是…

2024.05.14 Diffusion 代碼學習筆記

配環境 我個人用的是Geowizard的環境:https://github.com/fuxiao0719/GeoWizard。 出于方便考慮,用的pytorch官方的docker容器,因此python版本(3.10)和原作者(3.9)不同,其余都是一…

一文說通用戶故事點數是什么?

一文說通用戶故事點數是什么? 第26期:一文說通用戶故事點數是什么? 用戶故事點數是一種采用相對估算法進行估算的一種工具,一般采用斐波那契數列表征用戶故事里說的大小,采用0 1 2 3 5 8 13這樣的一些數字來表征用戶…

【漏洞復現】Secnet-智能路由系統 actpt_5g.data信息泄露

0x01 產品簡介 Secnet安網智能AC管理系統是廣州安網通信技術有限公司(簡稱“安網通信”)的無線AP管理系統 0x02 漏洞描述 Secnet智能路由系統 acipt 5g.data 接口存在信息泄露漏洞,未經身份驗證的遠程攻擊者可以利用此漏洞獲取系統賬戶名密碼等重要憑據&#xff…

全流程TOUGH系列軟件實踐技術應用

TOUGH系列軟件是由美國勞倫斯伯克利實驗室開發的,旨在解決非飽和帶中地下水、熱運移的通用模擬軟件。和傳統地下水模擬軟件Feflow和Modflow不同,TOUGH系列軟件采用模塊化設計和有限積分差網格剖分方法,通過配合不同狀態方程(EOS模…

永磁同步電機的脈振高頻注入無速度傳感器simulink仿真模型

整理了永磁同步電機的脈振高頻注入無速度傳感器simulink仿真模型,該模型高頻注入仿真pmsm,無感控制,解決0速轉矩輸出問題,插入式永磁同步電機,凸極,高頻注入。MATLAB/simulink仿真,適合研究學習…

騰訊開源混元DiT文生圖模型,消費級單卡可推理

節前,我們組織了一場算法崗技術&面試討論會,邀請了一些互聯網大廠朋友、今年參加社招和校招面試的同學。 針對大模型技術趨勢、大模型落地項目經驗分享、新手如何入門算法崗、該如何準備面試攻略、面試常考點等熱門話題進行了深入的討論。 總結鏈接…

第七十八章 IIS 技術說明

文章目錄 第七十八章 IIS 技術說明IIS 應用程序池和Web Gardens應用程序池Web Gardens 應用程序池、Web花園和CSP 第七十八章 IIS 技術說明 對于那些有興趣使用 IIS 的人,此頁面介紹了應用程序池、網絡花園和位數。 IIS 應用程序池和Web Gardens 應用程序池 應用…

【AI+漫畫】程序員小李解決疑難雜癥BUG的日常

周末花了點時間制作的AI漫畫。 感慨一句,程序人生, 相伴隨行。 原文鏈接:【AI漫畫】程序員小李解決疑難雜癥BUG的日常

一物一碼數字化營銷進軍調味品行業,五豐黎紅“星廚俱樂部”火啦!

近日,由五豐黎紅聯合納寶科技精心打造的小程序“星廚俱樂部”火啦!一經上線就吸引了大量用戶注冊和參與,可以說取得了非常成功的市場反饋,那究竟是一個什么樣的小程序,竟然有這么大的吸引力呢? 介紹小程序之…

武漢星起航:中國賣家借力亞馬遜跨境電商平臺,拓展全球銷售市場

隨著互聯網技術的飛速發展,跨境電商已成為連接全球消費者與賣家的重要橋梁。作為全球領先的跨境電商平臺,亞馬遜憑借其強大的品牌影響力、豐富的商品資源和高效的物流體系,為全球消費者提供了一個便捷、安全的購物環境。在這個平臺上&#xf…