AI正在迅速改變世界,對于程序員來說,這絕對是一個千載難逢的轉型機會。機器學習是計算機科學的一個子領域,在人工智能領域,機器學習逐漸發展成模式識別和計算科學理論的研究。從2016年起,機器學習到達了不合理的火熱巔峰。但是,有效的機器學習是困難的,因為機器學習本身就是一個交叉學科,沒有科學的方法及一定的積累很難入門。
開頭先奉上云棲社區翻譯小組的年中總結!
請收下這份關于人工智能的根目錄——博客整理系列(一)
關于數據科學的那些事——博客整理系列(二)
機器學習必備手冊——博客整理系列(三)
擴展眼界的都在這——博客整理系列(四)
深度學習必備手冊(上)——博客整理系列(五)
深度學習必備手冊(下)——博客整理系列(六)
一.機器學習篇:
1.?機器學習算法選用指南
摘要:本文對機器學習的一些基本概念給出了簡要的介紹,并對不同任務中使用不同類型的機器學習算法給出一點建議。
2. 支持向量機分類實戰
摘要:對于機器學習者來說,SVM是非常重要的監督式學習模型之一,本文通過幾個小例子,通俗的介紹了SVM的基本思想和關鍵信息,值得嘗試。(文中源碼)
3. 秒懂!看機器學習如何凈化處理文本
摘要:通過本教程,你可以學到如何開發簡單的文本凈化工具,如何使用NLTK庫中更復雜的方法,以及在使用現代文字表示方法時如何處理文本。
4. Raúl Garreta大神教你5步搭建機器學習文本分類器:MonkeyLearn
摘要:Raúl Garreta,《Learning scikit-learn: Machine Learning in Python》一書作者,手把手教你5步搭建機器學習文本分類器:1.定義類別樹;2.數據收集;3.數據標記;4.訓練分類器;5.測試&提升分類器。
5. 機器學習時代的到來,企業該如何駕馭
摘要:隨著機器學習受到的關注和應用越來越多,作為一個想成為機器學習的公司,該如何做呢?本文從不同的方面詳細介紹了一個機器學習公司應當做哪些準備。
6. 機器學習初學者必須知道的十大算法
摘要:還在為不知道學什么算法入門機器學習感到頭疼?本文作者通過自身的學習向初學者介紹十大機器學習(ML)算法,并附有數字和實例以便于理解。
7. 機器學習小白如何成長為業內專家?
摘要:作者用了十八個月的時間從一個機器學習小白成長為業內專家,總結了一套屬于自己的機器學習入門方法。
8. 7步掌握Python機器學習
摘要:如今,網絡上的Python機器學習資源紛繁復雜,使得剛入門的小白們眼花繚亂。究竟從哪里開始?如何進行?讀完這篇文章,相信你就會有自己的答案。
9. 機器學習必知的15大框架
摘要:不管你是一個研究人員,還是開發者,亦或是管理者,想要使用機器學習,需要使用正確的工具來實現。本文介紹了當前最流行15個機器學習框架。
10. 機器學習案例 — 聞聲識鳥
摘要:TensorFlow是一個開源的機器學習庫—對任何人都是開放的。公司、非營利性組織、研究人員和開發人員已經在一些領域使用了TensorFlow。
11. 機器學習基礎:分類vs回歸
摘要:在機器學習中我們也許會對分類和回歸兩個算法有所混淆或者困惑,看完本文相信會有所收獲。
12. 業內最流行機器學習在線課程匯總
摘要:機器學習界最流行的在線課程,技術進階必備!
13. 2017年十大最受歡迎機器學習Python庫
摘要:Python已經成為機器學習時代的最受歡迎的語言,業內大牛正在使用什么Python庫呢?今天我們就來盤點一下2017年十大最受歡迎的機器學習Python庫。
14.探秘機器是如何“長大成人”(含視頻)
摘要:機器是如何“長大成人”的呢?讓我們一起來探索……
15. 為什么機器學習難于應用
摘要:本文主要講述了如何管理機器學習應用方面的棘手問題。
16. Web開發工程師轉型機器學習的實戰經驗
摘要:歷經兩個月對深度學習和計算機視覺領域進行探索,獲得一些經驗與總結。
17. 機器學習2017年重大進展匯總
摘要:2017年注定是機器學習快速發展的一年,特別是機器學習商業化的成功是的更多的人積極的投入到機器學習的學習當中。機器學習一定會成為未來的技術,讓我們看看這項未來的技術現在發展到何種程度。
18. 機器學習必知的八大神經網絡架構
摘要:機器學習八大神經網絡架構的分類和歷史發展。
19. 2017年機器學習開源項目TOP30
摘要:本文比較了2017年發布的8800多個開源的機器學習項目,通過考量受歡迎程度、參與度和新近度來等指標來評估這些參選項目,并選出前30名。
20. 機器學習與Docker容器
摘要:機器學習和Docker容器是如何相互配合出色完成任務的?我們將使用Tenserflow和Kontena來詳細闡述。
21. 機器學習新手必學十大算法指南
摘要:本文為機器學習新手介紹了十種必備算法:線性回歸、邏輯回歸、線性判別分析、分類和回歸樹、樸素貝葉斯、K-近鄰算法、學習向量量化、支持向量機、Bagging和隨機森林、Boosting和AdaBoost。
22. 機器學習?人工智能?傻傻分不清楚?
摘要:機器學習就是人工智能?別在這樣認為了,太傻了!看完本文,搞清楚它們之間的關系吧。
23. 數據科學、機器學習和AI的區別
摘要:本文詳細講解了數據科學、機器學習和AI的相同點與區別,并用實例進行說明。
24. 從超級瑪麗說起,談談如何為機器賦予好奇心
摘要:如何讓機器付有好奇心?加州大學伯克利分校研究團隊給出了答案。
25. 盤點·GitHub最著名的20個Python機器學習項目
摘要:開源是技術創新和快速發展的核心。這篇文章向你展示Python機器學習開源項目以及在分析過程中發現的非常有趣的見解和趨勢。
26. 脈沖神經網絡——下一代機器學習?
摘要:脈沖神經網絡是什么?本位對脈沖神經網絡做了簡要敘述。
27. 遷移學習——機器學習的下一個前沿陣地
摘要:深度學習作為機器學習的重要領域,在過去的幾年時間里面發揮了巨大的作用。但是隨著機器學習在不同領域的深入應用,遷移學習正在成為不可忽視的力量。
28. 從頭了解Gradient Boosting算法
摘要:Gradient Boosting算法是機器學習中較為重要的算法,通過本文你能有清晰地了解和掌握
29. 遷移學習簡述
摘要:什么是遷移學習,遷移學習的例子有哪些,在預測建模中如何使用遷移學習?本文將帶你一步步深入探討。
學習完機器學習,為什么不順帶了解一下AI,看看機器學習到底在創造一個什么樣的“怪獸”!
二.人工智能擴展篇:
1. 是什么讓 AI 時代真正到來
摘要:AI 已經在眾多領域帶來了革新,取代了眾多人類的工作,改變未來學生必須具備的技能——這都是怎么發生的?
2. 不知道這些AI知識,可能你就out了!
摘要:為什么人工智能,機器學習突然之間成了熱門話題,變成IT領域,甚至其他領域的人們都在討論的熱點?也許文章的作者會給你一點這方面的思考。
3. 從神經科學到計算機視覺:人類與計算機視覺五十年回顧
摘要:本文簡單的介紹了神經網絡近50年的發展歷程,從1968年的Hubel和Wiesel開展的貓實驗,一直到李飛飛教授等人的成果。從本質上講解了人工神經網絡的原理及學習過程,對于想了解神經網絡起源及發展歷程的讀者而言,是一篇較為合適的文章。
4. “突發性死亡”的終結者
摘要:醫療AI歷史性的一刻,讓科技真正的轉化為延續人類生命的方法。作者通過對斯坦福大學醫院數據的匯總,開發了一套深度學習系統,并生成一篇論文。該論文在2017年IEEE生物信息學和生物醫學國際會議上獲得最佳學習論文獎。
5. 2018年AI面臨的五大難題
摘要:本文作者介紹了2018年擺在人工智能面前的五大難題:理解人類語言,機器人附能,防黑客,玩游戲,辨別是非。如何解決這些問題,讓AI繼續造福人類社會將成為所有AI從業者的首要任務。
6. 總結2017年AI之十大“敗筆”
摘要:AI并非全能選手,匯總2017年AI出的糗事。
7. 2017 AI醫學領域的年終總結:進展、問題與趨勢
摘要:本文總結了2017年醫學人工智能領域的相關發展,并對自己2016年預測的結果與2017年的實際情況相比對,說明了醫學人工智能領域的發展趨勢。
8. 2017年,那些讓人難以忘記的AI成果
摘要:盤點2017年AI領域最具影響力的成就,發布2017 AI成就榜:發現八行星太陽系、擊敗圍棋高手、擊敗德州撲克高手、自學寫代碼。
9. 煮酒論AI,看看大牛怎么說
摘要:回望2017,AI取得了突飛猛進的發展,預見2018,AI將何去何從,聽大牛煮酒論AI。
10. 時代聚焦AI安全——可解釋性
摘要:隨著人工智能的發展,越來越多的人開始關注人工智能的安全問題。今年的NIPS多集中人工智能安全上,作者列舉了在會議上出現的解決人工智能安全問題的比較不錯的論文。
11. 面向開發者的2018年AI趨勢分析
摘要:本文從開發者的角度分析2018年AI的趨勢:拿來即用的AI領域、算法與技術。例如GANs、ONNX、Zoo、AutoML、語音識別、時間序列分析、NLP、高智能機器人等。
12. 人工智能最受歡迎的10大TED演講
摘要:本文匯總了人工智能最受歡迎的10大TED演講,讓你全面了解人工智能和機器學習。
13. 五類受自然啟發的AI算法
摘要:本文主要講解了受自然啟發的五類AI算法以及各自的實際用例:神經網絡、遺傳算法、群集集體智慧、強化學習、人體免疫。
14. 人工智能并非是“神”
摘要:人工智能將要毀滅人類?人工智能讓更多的人失去工作?是不是媒體過于夸大了人工智能的能力?人工智障還是人工智能?今天我們就來看看人工智能到底有什么樣的缺點!
15. WIRED網站給出的一份人工智能完全指南
摘要:本文是WIRED博客網站給出的一份人工智能完全智能,首先回顧人工智能發展歷程,并著重介紹了幾個大的科技里程碑;之后對人工智能的未來進行了簡單的預測,并簡單介紹了人工智能的相關知識。
16. 人工智能系統安全性分析
摘要:人工智能研究人員輕易地欺騙了一個圖像識別系統,使得香蕉被錯誤地識別為烤面包機。這引發了一系列安全性的擔憂,如何確保人工智能系統的安全呢?
17. 流行AI框架和庫的優缺點比較
摘要:不知道自己應該選用那個AI框架和庫?看看本文就行了,本文為AI開發的工程師們梳理了現在最流行的框架,并簡單的分析了它們的優缺點。
18. Keras締造者:Fran?ois Chollet專訪
摘要:Fran?ois Chollet作為人工智能時代的先行者,為無數的開發者提供了開源深度學習框架Keras。時代需要這樣的巨人,這樣開發者才能站在巨人的肩膀上走的更遠。文中可以下載他的新書《deep-learning-with-python》!
19. 深度學習與人工智能革命:part I
摘要:人工智能始于思想實驗,深入了解AI和深度學習的歷史,并了解它們為什么現在取得快速的發展。
20. 深度學習與人工智能革命:part II
摘要:本文是該系列內容的第2部分內容,主要介紹人工智能、機器學習和深度學習三者的差別,著重介紹機器學習中的有監督學習和無監督學習。
21. 深度學習與人工智能革命:part III
摘要:本文是該系列內容的第3部分內容,主要介紹人工神經網絡、深度學習的基本原理,著重介紹深度學習中數據庫的選擇需要考慮的問題。
22. 深度學習與人工智能革命:part IV
摘要:本文是該系列內容的第4部分內容,主要討論深度學習為何使用MongoDB數據庫,并提供相關使用實例。
23. 不容錯過的2017數據科學15大熱門GitHub項目
摘要:本文作者通過回顧2017年的數據科學發展路徑,為數據科學愛好者匯總了2017年數據科學15大熱門GitHub項目。
24. 2017年深度學習框架之爭——看誰主沉浮?
摘要:本文總結并分析了2017年的相關深度學習框架之間的競爭,包含一些主流的框架比如TensorFlow、PyTorch等,以及一些相關的應用程序接口,比如Keras等,最后展望了下后續的發展。
25. 2017年十大最佳數據可視化項目
摘要:本文是作者在2017年總結自己最喜歡的十個數據可視化項目,涵蓋范圍廣,項目生動、有趣且有深度。讀者們可以選擇自己感興趣的項目動手體驗一下吧。
26. 2017數據科學與機器學習行業現狀調查 Python是最受歡迎的語言
摘要:最近,Kaggle這一互聯網上最著名的數據科學競賽平臺首次進行了機器學習與數據科學現狀調查。在超過 16000 名從業者的答卷中,我們可以一窺目前該行業的發展趨勢。
27.AlphaGo Zero:從頭開始學習
摘要:AlphaGo zero這幾天在人工智能領域掀起了不小的風浪,AlphaGo zero到底是否能夠達到我們所說的通用人工智能的標準呢?
28. 福利|熱門技術看什么?這份書單告訴你!(內含PDF鏈接)
摘要:這是一份關于數據科學、商業分析、大數據、機器學習、算法、數據科學工具和相關程序語言的福利書單。又騙你買書?不,我們還有電子書!心動不如行動,趕快進來看看吧!
三.求職技巧篇:
1. 數據科學求職過程中總結的四點經驗
摘要:本文是作者在求職數據科學崗位過程中總結出的四點經驗:注重實踐積累經驗、多方出擊充分準備、面對現實確定目標、認清自己明智抉擇。相信對于找工作的相關讀者有所幫助。
2. 每個數據科學家都應該學習4個必備技能
摘要:作為一個數據科學家你必須要掌握的四個必備技能,值得每個想要成為數據科學家和已經成為數據科學家的人去學習。
3. 考察數據科學家支持向量機(SVM)知識的25道題,快來測測吧
摘要:本套自測題專為SVM及其應用而設計,目前超過550人注冊了這個測試,最終得滿分的人卻很少,[doge],一起來看看你的SVM知識能得多少分吧,順便還能查漏補缺哦。
4. 三步走——帶你打造一份完美的數據科學家簡歷|(附件有PPT福利)
摘要:本文介紹了關于寫數據科學家簡歷的一些技巧,主要包含三個部分,分別為簡歷前的材料準備,寫簡歷時應注意的地方以及對整個簡歷的整理。不管你是不是數據科學領域的工作者,本文對于即將求職或找實習的同學而言是一份不可多得的簡歷寫法指南。
5. 數據科學家需要掌握的10項統計技術,快來測一測吧
摘要:本文給出了數據科學應用中的十項統計學習知識點,相信會對數據科學家有一定的幫助。
6. 開啟數據科學職業生涯的8個基本技巧
摘要:本文為數據科學家開創數據科學事業鋪平了道路。只要按照這八個小貼士來做,你就能讓自己的職業生涯有一個良好的開端。
7. 數據科學家實操之路
摘要:Kaggle最近進行了一項旨在評估數據科學和機器學習當前發展狀況的調查。 他們收到了將近17000份答卷,并利用這些答卷做出了大量的分析。
8. 數據分析師不是數據科學家
摘要:作者認為數據分析師是指能夠使用Excel和SQL等工具分析數據,生成報告、圖表和建議,但卻提供不出代碼的人員。作者這篇文章不是抨擊分析師的,而是為了解決多數人對于數據分析與數據科學之間的誤解。