我在全球最大的同性社交平臺那點事

本文作者:夏之冰雪,i春秋簽約作家

《我在百度網盤上看到上萬條車主個人信息,企業、政府高官信息、各種數據庫和無窮無盡的盜版》,一時間,這篇文章就火了,火爆程度另百度猝不及防。

其實呢,這事真不能全怪百度,畢竟用戶分享出去了。之所以引起這么大轟動,主要是因為用戶的文件本身,什么數據都有,導致這次危害或者說恐慌,進行了放大。

每一次危機過去之后————
普通人,只會對其津津樂道;
有能力的人,會思考如何避免再次發生;
而開拓者,則會洞察整個形勢。
  1. 百度網盤泄露事件留給了我們什么

百度事件發生,得到消息的人會趕緊確認自己的隱私文件是否被分享,然后盡快取消分享保證安全。一周過后,風波也就散了,基本就沒有什么話題或者新聞了。

這里我拋出一系列問題:

  1. 除了百度網盤,還有沒有其它類似的問題?

  2. 遭受泄露的用戶群體,有哪些通性?

  3. 從事技術行業的人,更具備敏感意識么?他們是否更大程度避免發生這類問題?

本篇文章不會給出答案,因為這是開放性問題,沒有絕對的答案。上面這幾個問題,目的是為了讓大家帶著思考去看下文,之后,你可能會對百度事件,有一個更全面的認識。

  1. 從最大的同性社交平臺獲取數據

好了,言歸正傳,回到題目。題目不是噱頭,毋庸置疑github是全球最大的同性社交平臺,這篇文章,我會通過github向大家展示一種攻擊思路,以及我的一個成果:

我有幾千個github賬號和密碼(確實沒有上萬,不吹牛逼,該多少就多少)。

幾千個賬號,說多不多,說少不少,所運用到的技術原理————基于爬蟲的數據攻擊,這方面的研究(不知道算不算學術)差不多有一年多了,我會把可公開的內容展示給大家,研究的結果還不是很成熟,歡迎大家在下面回帖討論,很樂意與大家交流。

在github平臺,用戶需要輸入賬號和密碼登陸,而賬號可以輸入郵箱也可以輸入github的用戶名。

clipboard.png

github用戶名就是所謂的git賬號,這個是對外公開的,查看個人主頁,或者查看代碼時候,都會在比較明顯的地方顯示用戶名,通過用戶名可以直接登錄github。比如這個哥們,他叫Sushil Thasale,而他的github賬號是sushil-thasale。

圖片描述

賬號很容易得到,那么密碼怎么才能知道呢?直接上圖!

  1. 這是某個用戶的密碼:
    圖片描述

這是這個用戶的登陸后的頁面:

clipboard.png

  1. 這個用戶名字是四位,很好的賬號——jv98,他的密碼很復雜:

clipboard.png

這是登陸后的個人主頁:

clipboard.png

  1. 其實我們還能知道用戶的郵箱,這個用戶的郵箱是Oliver.andersson.te14c @ gmail.com,如此復雜,他的密碼卻很簡單:

clipboard.png

個人賬戶設置頁面,我可以悄悄地加一個郵箱進行監控:

clipboard.png

  1. 再給一個2013年就注冊的賬號和密碼:

clipboard.png

登陸后的個人主頁:

clipboard.png

好了,不曬圖了,這種賬號確實有幾千個,而且有好多都是github的重度用戶。

細心的讀者應該已經發現,我是怎么找到他們的密碼的了。所有密碼截圖,都是來自他們自己上傳到github項目的代碼里,所有截圖都是代碼截圖。我利用了github的搜索技術,搜索到一堆想要的賬號和密碼,然后進行登錄嘗試,登陸成功的我就記下來。

那么,怎么搜索才能找到呢?

  1. 充分利用開源項目,開源項目有固定的存儲密碼的位置,比如php語言的wordpress,密碼存放位置在根目錄下的wp-config.php文件中,代碼內容define(‘DB_PASSWORD’, ‘password’)。

  2. 開源項目有很多,就拿php語言來說,就有wordpress、joomla、phpcms、discuz等。

  3. 利用搜索技術,比如同時搜索多個關鍵詞define,DB_PASSWORD,篩選語言為php,基本就能列出所有wordpress的密碼了。

  4. 善于利用搜索技術,對于密碼為空的要過濾掉,對于密碼為####、*這種的也要過濾掉。

以上操作,千萬不要手工,開頭我都說了————基于爬蟲的數據攻擊,所以我們要寫爬蟲,自動爬取github數據,然后通過正則匹配篩選掉不想要的數據。

這里的核心就是爬蟲,以及過濾。過濾技術用得越好,數據越有價值,爆破的時間成本越低!

除了過濾掉常見的password、####、、空密碼等,還有一個細節一定要注意:

clipboard.png

沒錯,github密碼有要求的,所以我們可以寫個正則,只保留符合 github 密碼要求的,這樣我就拿到了一堆價值數據。

然后再用python寫個程序,模擬登陸github就可以了。

最后再展示一個github項目比較多的賬號:

clipboard.png

clipboard.png

為了避免引起額外信息泄露,暫時無法提供更多深入的數據和完整的爬蟲框架腳本。

坐擁這些賬號,目前我能想到的賺錢方法就是,收費幫別人的項目點贊。
  1. 網絡安全從業者與爬蟲技術

爬蟲技術本身,并不能實施黑客攻擊,也不能直接與安全連在一起。

但是縱觀很多安全方面的東西,卻又都離不開爬蟲技術:

  1. 百度網盤數據泄露,爬蟲惹的禍。

  2. 某企業存在通過id泄露數據,我們可以編寫爬蟲批量掃描id獲取數據。

  3. 某網站權限配置不當,導致在特定情況訪問登陸后的頁面,這時候也可能需要寫爬蟲。

  4. wvs等安全工具,嚴重依賴爬蟲,通過爬蟲爬取網站組織架構。

  5. 探探app,兩年前我就玩過,含有大量美女,我的第一反應不是感不感興趣,而是悄悄地寫了個爬蟲,獲取了大量圖片,而且我還發現他們防色情做的不嚴謹。(開個玩笑)

寫到這里,大家應該明白了,為什么我強調爬蟲的重要性了。

另外,爬蟲可以使很多事情變得有趣,只要肯琢磨,腦洞足夠開,我們完全可以實施很多攻擊。

從過來人角度說一下,自己的成長蠻有意思的,從爬蟲起家學技術,中途又在公司從事過接近一年的數據挖掘,這兩個技術的結合,給我的學習和研究,帶來了很多興趣。

當你具備爬蟲和數據分析時,你真的可以去改變一些事情。

  1. 烏云密布的爬蟲

百度網盤這件事,是我不想看到的,這類安全問題的一個共同特點:

  1. 用戶自身確實存在問題。

  2. 從嚴格意義上講,這個不是漏洞。

  3. 企業在修復時,處于下風,甚至無能為力、無法修復。

就拿github這個例子來說,除非我把github幾千個賬號發出來,github把每個人賬號都凍結。

我只是嘗試了一些開源項目,還有很多項目我沒有實施爬蟲攻擊,比如facebook的redmine項目等,很有可能這些項目代碼里,也有密碼泄露。

真的沒辦法根治!未來,我擔心會有越來越多的安全問題,屬于沒有辦法根治的,卻存在極大安全隱患的。就好比,我生大病了,我卻不知道怎么治,你說問題嚴重么?

只說結論:

腳本執行了一個下午,我便擁有了幾百個阿里云服務,其中不乏性能很高的服務,不乏百萬數據級別的redis服務,也不乏企業服務。這些服務里面的數據,我不知道有多少價值,泄露會引起多少恐慌,因為我一條都沒看過。

這是提交給阿里云之后,阿里云的修復建議(很早之前的短信了):

clipboard.png

我的同事、朋友們之中,都有收到阿里云的這條短信。嗯,沒錯,因為漏洞本身源自用戶自己的數據泄露,只能通過短信提醒用戶。

是不是和百度網盤泄露,有相似之處?

就寫到這里吧。。。

安全漸遠漸行,卻總有一些無能為力的事情發生,絲絲的痛

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/455443.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/455443.shtml
英文地址,請注明出處:http://en.pswp.cn/news/455443.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

H.264的CAVLC(編碼.解碼)過程詳解

看264也看到CAVLC來了,把這方面的資料貼在這里: 編碼過程: 假設有一個4*4數據塊 (變化,量化后就送入熵編碼){ 0 , 3 , -1 , 0, 0, -1 , 1, 0, 1 , 0 , 0 , 0, 0 , 0 , 0 , 0 } 數據重排列&a…

python進程通信方式有幾種_python全棧開發基礎【第二十一篇】互斥鎖以及進程之間的三種通信方式(IPC)以及生產者個消費者模型...

一、互斥鎖進程之間數據隔離,但是共享一套文件系統,因而可以通過文件來實現進程直接的通信,但問題是必須自己加鎖處理。注意:加鎖的目的是為了保證多個進程修改同一塊數據時,同一時間只能有一個修改,即串行…

Python實現修改圖片尺寸

起步 很多小伙伴從網上找的圖片可能圖片尺寸與自己的需求不符合 今天小編就教大家使用python寫一個簡單腳本程序實現修改圖片的尺寸 環境準備 首先我們需要python環境,它的安裝可以參考:python安裝以及版本檢測 其次我們還需要安裝一個python圖形化的庫PIL PIL的安裝,這里…

數據集

https://zhuanlan.zhihu.com/p/25138563轉載于:https://www.cnblogs.com/zhangbojiangfeng/p/7039725.html

常見的攻擊手段及其防御方式

本文簡單介紹幾種常見的攻擊手段及其防御方式 XSS(跨站腳本攻擊)CSRF(跨站請求偽造)SQL注入DDOSXSS 概念 全稱是跨站腳本攻擊(Cross Site Scripting),指攻擊者在網頁中嵌入惡意腳本程序。案列 比如說我寫了一個博客網站…

使用ffmpeg進行h.264編碼

m_fmt->video_codec CODEC_ID_H264; /* 添加視頻流 */ m_video_st av_new_stream(m_oc, 0); if (!m_video_st) { return 0; } m_videocavcodec_alloc_context(); m_videoc m_video_st->codec; /* 視頻相關參數 */ m_videoc->codec_id m_fmt->video_codec; m_…

關于java的關鍵字 transient

我們都知道一個對象只要實現了Serilizable接口,這個對象就可以被序列化,Java的這種序列化模式為開發者提供了很多便利,我們可以不必關系具體序列化的過程,只要這個類實現了Serilizable接口,這個的所有屬性和方法都會自…

python中文件變化監控-watchdog

起步 在python中文件監控主要有兩個庫,一個是pyinotify,一個是watchdog。pyinotify依賴于Linux平臺的inotify,后者則對不同平臺的的事件都進行了封裝。因為我主要用于Windows平臺,所以下面著重介紹watchdog(推薦大家閱…

python決策樹分類鳶尾花_基于決策樹—鳶尾花分類

決策樹算法廣泛應用于:語音識別、醫療診斷、客戶關系管理、模式識別、專家系統等,在實際工作中,必須根據數據類型的特點及數據集的大小,選擇合適的算法。本文選擇經典案例——《鳶尾花分類》一、決策樹定義決策樹算法是一種基于實…

希捷宣布出貨雙碟裝1TB硬盤 單碟500GB上市

希捷今天宣布,單碟容量高達500GB的Barracuda 7200.12 1TB硬盤已經出貨。 現有的1TB硬盤產品一般都是三碟裝(此前也有四碟裝),包括希捷自家的ST31000340AS,但希捷一進率先將其升級為雙碟裝,存儲密度也達到了329Gb每平方英寸。這樣一…

P1334 瑞瑞的木板

題目描述 瑞瑞想要親自修復在他的一個小牧場周圍的圍欄。他測量柵欄并發現他需要N(1≤N≤20,000)根木板,每根的長度為整數Li(1≤Li≤50,000)。于是,他神奇地買了一根足夠長的木板,長度為所需的N…

FFMpeg的output_example.c例子分析

該例子講了如何輸出一個libavformat庫所支持格式的媒體文件。 (1)av_register_all(),初始化libavcodec庫,并注冊所有的編解碼器和格式。 (2)guess_format(),根據文件名來獲取輸出文件格式&#…

大量數據+同步+多線程_Vulkan 多線程渲染

1. Overview of Vulkan1.1 計算機圖形軟件圖形軟件有兩個大類:專用軟件包(special-purpose packages)和通用編程軟件包(general programming packages)。專用軟件包通常提供一種UI設計語言,讓用戶直接生成想…

飛康任命Gartner前分析師擔任亞洲區市場總監

在虛擬化、數據保護和數據遷移領域具備15年創新經驗的美國飛康軟件公司(FalconStor Software, Inc.,NASDAQ:FALC)近日宣布任命張瑾(Jimmie Chang)先生擔任該公司亞洲區市場部門負責人。 飛康公司近日面向全…

12_登陸案例

13131轉載于:https://www.cnblogs.com/ZHONGZHENHUA/p/7044846.html

如何基于FFMPEG和SDL寫一個少于1000行代碼的視頻播放器

http://blog.csdn.net/eplaylity/archive/2008/12/05/3454431.aspx http://www.cnblogs.com/konyel/tag/SDLGuide%E4%B8%AD%E6%96%87%E8%AF%91%E7%89%88/ ffmpeg文檔http://blog.sina.com.cn/s/blog_46dc65a90100a91b.html http://dranger.com/ffmpeg/ffmpeg.html VLC核心功能部…

Flask 概述

什么是Web Framework? Web Application Framework(Web應用程序框架)或簡單的Web Framework(Web框架)表示一個庫和模塊的集合,使Web應用程序開發人員能夠編寫應用程序,而不必擔心協議&#xff0…

(五)Maven中的聚合和繼承

一、為什么要聚合? 定義:我們在開發過程中,創建了2個以上的模塊,每個模塊都是一個獨立的maven project,在開始的時候我們可以獨立的編譯和測試運行每個模塊,但是隨著項目的不斷變大和復雜化,我們…

python堆棧反向輸出列表_python - IPython:將Python腳本的輸出重定向到文件(如bash) - 堆棧內存溢出...

IPython有自己的上下文管理器來捕獲stdout / err ,但它沒有重定向到文件,它重定向到一個對象:from IPython.utils import iowith io.capture_output() as captured:%run my_script.pyprint captured.stdout # prints stdout from your script…

關于datagrid

基本在公司使用的datagrid不需要自己寫前臺代碼,只需要自己給grid明確id,url以及列屬性即可。 后臺需要返回一個數據類型:{recordsFiltered2, data[], drawnull, recordsTotal2},通常返回這個數據類型的話,只需要調用d…