《跟李沐學 AI》AlexNet論文逐段精讀學習心得 | PyTorch 深度學習實戰

前一篇文章,使用 AlexNet 實現圖片分類 | PyTorch 深度學習實戰

本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started

本篇文章內容來自于學習 9年后重讀深度學習奠基作之一:AlexNet【下】【論文精讀】】的心得。

《跟李沐學 AI》AlexNet論文逐段精讀學習心得

  • ImageNet Classification with Deep Convolutional Neural Networks
  • 視頻學習感悟
  • 視頻學習知識經驗

ImageNet Classification with Deep Convolutional Neural Networks

https://proceedings.neurips.cc/paper_files/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf

在這里插入圖片描述

關于 AlexNet 工作原理的博客: https://readmedium.com/alexnet-explained-a-step-by-step-guide-93870b45126b

視頻學習感悟

  • 沒有必要學習前人的太多東西,因為很多東西是錯誤的,學習它們反而限制了自己的思路1
  • 工程能力很強才能驗證自己的猜想,驗證自己的猜想才能創新;光有猜想而沒有能力驗證等于空談
  • 只要你的東西足夠新,即使有很多說法是錯誤的,別人也會相信,關鍵是能 work,方法就是好過現在的,至于為什么可以慢慢等待時間,這個和牛頓萊布尼茨使用微積分,而微積分的嚴謹要一百多年后由柯西補充是一樣的
  • 不要害怕學術工作,學術工作需要你:學習數學2,掌握編程,并且要勤奮。

視頻學習知識經驗

  • 經過了 2012 ~ 2021 年的探索,人們最終發現,主要的貢獻在于大規模的數據集和算力本身,一些技巧證明不是大模型可訓練的關鍵因素。
  • 正則化手段去處理過擬合,不是最關鍵的,最關鍵的是網絡的架構設計,網絡的架構好,就會讓模型更容易訓練
  • 首先要說自己實現了什么東西,比如在哪些地方超過了其它的模型和方法。然后,再說自己是怎么做的。
  • 論文前面的內容要高屋建瓴,細節放在第 3、4 章去寫。
  • 論文的核心觀點是:用 CNN 來做圖像分類,然后經驗是如何將 CNN 做的特別大。
    • 使用多 GPU,論文仲使用的顯卡是 GTX 580 3GB, 兩張。所以,該顯卡在當時也不是很先進,而且要將模型切開,放在兩張卡,所以,該論文的研發還是工作量很大 3
    • 使用一些技術來降低過擬合
    • 結果好只是一些方面,一些工程上的勞動也可能做出好結果,但是這意味著沒有算法上的創新,學術主要看算法的創新
    • 使用 RGB 做成向量,進入模型,被稱為 RAW 模式 4 。還有一種模式,是把圖片提取特征,常見算法是 SIFT。一些研究方向,https://github.com/christiansafka/img2vec, https://scikit-image.org/docs/stable/auto_examples/features_detection/plot_sift.html
  • 這個項目 Alex 對比了 ILSVRC-2010 和 ILSVRC-2012 兩個數據集的成績。
  • 論文中,重點強調了使用 ReLU 作為激活函數,Hinton 在一次訪談中 5 ,坦陳挑選到 ReLU 花了十年的時間
  • 論文中的參考文章并不多,這個文章的寫作團隊很牛,作為一個創新的團隊,沒有必要研究前人的很多東西,因為前人的很多東西也是錯誤的,研究了很多以后自己反而被限制,那么靈感來源于哪里?靈感來源于對周圍世界的觀察和一些更為成熟的行業,比如人工智能領域內的很多發明來自于更成熟的通信行業6

  1. 自然界的寶庫和秘密,就在我們眼前,需要我們多問問題。用好奇心探索,就像達芬奇,并沒有學習他所在時代的前人精華太多,主要靠自學,從觀察身邊的事物開始。https://www.bilibili.com/video/BV1iG411K7ma/ ??

  2. 主要是微積分、概率論、線性代數。 ??

  3. 實現一篇高質量的論文,還是需要通過工程手段驗證猜想,無論結果是證實還是證偽,都是有價值的,關鍵是猜想本身是一個好的猜想,有新意。首先是好的猜想,然后工程能力是必不可少的。如果有很好的猜想,卻無法證實或證偽,這個就是玄學,玄學不是科學。 ??

  4. 不做任何特征提取,直接將原始的圖片、文本作為訓練模型的輸入,被稱為 End to end 訓練。 ??

  5. Hinton 回顧與 Ilya 的初次見面和合作,https://www.bilibili.com/video/BV1xM4m1k7ZJ ??

  6. 很多論文發布,只是作為一些經典論文的陪襯,因為它們的作者是通過一些經典論文,并研究其中的不足之處,然后發布的。真正的有價值的論文其實不多,這些論文的靈感是來自于作者的好奇心或者從別的行業汲取的寶貴經驗。 ??

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/71490.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/71490.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/71490.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

微軟Win11新動態:官方“換機助手”曝光,PC數據遷移或迎全新體驗

目錄 微軟入局數據遷移領域,第三方工具或面臨挑戰 無縫遷移體驗:近距離傳輸與OTP驗證 模擬圖僅為概念設計,最終功能或存變數 發布時間未定,Insider用戶或率先體驗 總結 微軟在近期發布了Windows 11 Insider Beta頻道的最新版本Build 22635.4945。盡管此次更新并未引入重…

Could not initialize class io.netty.util.internal.Platfor...

異常信息: Exception in thread "main" java.lang.NoClassDefFoundError: Could not initialize class io.netty.util.internal.PlatformDependent0 Caused by: java.lang.ExceptionInInitializerError: Exception java.lang.reflect.InaccessibleObjec…

java練習(34)

ps:題目來自力扣 尋找兩個正序數組的中位數 給定兩個大小分別為 m 和 n 的正序(從小到大)數組 nums1 和 nums2。請你找出并返回這兩個正序數組的 中位數 。 算法的時間復雜度應該為 O(log (mn)) 。 class Solution {public double findMedianSortedA…

用Java創建一個驗證碼的工具類

在Java中創建一個驗證碼工具類,可以通過以下代碼實現。該工具類支持生成包含字母和數字的隨機驗證碼圖片,并添加干擾線和噪點以提高安全性。以下是詳細實現: 完整代碼實現 import javax.imageio.ImageIO; import java.awt.*; import java.aw…

提升信息檢索準確性和效率的搜索技巧

一、基礎技巧 精準關鍵詞 避免長句子,提取核心關鍵詞(如用“光合作用 步驟”代替“請告訴我光合作用的具體過程”)。 同義詞替換:嘗試不同表達(如“AI 發展史” vs “人工智能 歷史”)。 排除干擾詞 使用…

設計模式 之 工廠模式(簡單工廠模式、工廠方法模式、抽象工廠模式)(C++)

文章目錄 C 工廠模式引言一、簡單工廠模式概念實現步驟示例代碼優缺點 二、工廠方法模式概念實現步驟示例代碼優缺點 三、抽象工廠模式概念實現步驟示例代碼優缺點 C 工廠模式 引言 在 C 編程中,對象的創建是一個常見且基礎的操作。然而,當項目規模逐漸…

DAY12 Tensorflow 六步法搭建神經網絡

六步法: 一.import 導入各種庫,比如: import tensorflow as tf from tensorflow.keras.layers import Dense, Flatten from tensorflow.keras import Model import numpy as np import pandas as pd # 可能還會根據需求導入其他庫&…

Zookeeper分布式鎖實現

zookeeper最初設計的初衷就是為了保證分布式系統的一致性。本文將講解如何利用zookeeper的臨時順序結點,實現分布式鎖。 目錄 1. 理論分析 1.1 結點類型 1.2 監聽器 1.3 實現原理 2. 手寫實現簡易zookeeper分布式鎖 1.1 依賴 1.2 常量定義 1.3 實現zookeeper分布式…

Git是什么

簡單介紹: Git是一個分布式版本控制系統,用于跟蹤文件的更改,特別是在多人協作開發的環境中。 Key: 分布式 版本控制 系統 最常用于軟件開發,但也可以用于管理任何類型的文件和文件夾。 Git幫助團隊跟蹤和管理文件的歷史版本&a…

Pycharm 2024在解釋器提供的python控制臺中運行py文件

2024版的界面發生了變化, run with python console搬到了這里:

【分布式理論12】事務協調者高可用:分布式選舉算法

文章目錄 一、分布式系統中事務協調的問題二、分布式選舉算法1. Bully算法2. Raft算法3. ZAB算法 三、小結與比較 一、分布式系統中事務協調的問題 在分布式系統中,常常有多個節點(應用)共同處理不同的事務和資源。前文 【分布式理論9】分布式…

免費deepseek的API獲取教程及將API接入word或WPS中

免費deepseek的API獲取教程: 1 https://cloud.siliconflow.cn/中注冊時填寫邀請碼:GAejkK6X即可獲取2000 萬 Tokens; 2 按照圖中步驟進行操作 將API接入word或WPS中 1 打開一個word,文件-選項-自定義功能區-勾選開發工具-左側的信任中心-信任中心設置…

【SFRA】筆記

GK_SFRA_INJECT(x) SFRA小信號注入函數,向控制環路注入一個小信號。如下圖所示,當前程序,小信號注入是在固定占空比的基礎疊加小信號,得到新的占空比,使用該占空比控制環路。 1.2 GK_SFRA_COLLECT(x, y) SFRA數據收集函數,將小信號注入環路后,該函數收集環路的數據,以…

論文筆記-WSDM2024-LLMRec

論文筆記-WSDM2024-LLMRec: Large Language Models with Graph Augmentation for Recommendation LLMRec: 基于圖增強的大模型推薦摘要1.引言2.前言2.1使用圖嵌入推薦2.2使用輔助信息推薦2.3使用數據增強推薦 3.方法3.1LLM作為隱式反饋增強器3.2基于LLM的輔助信息增強3.2.1用戶…

Ubuntu 系統 cuda12.2 安裝 MMDetection3D

DataBall 助力快速掌握數據集的信息和使用方式,會員享有 百種數據集,持續增加中。 需要更多數據資源和技術解決方案,知識星球: “DataBall - X 數據球(free)” 貴在堅持! ---------------------------------------…

Tomcat的升級

Tomcat 是一個開源的 Java Servlet 容器,用于部署 Java Servlet 和 JavaServer Pages(JSP)。隨著新版本的發布,Tomcat 通常會帶來性能改進、安全增強、新特性和對最新 Java 版本的更好支持。升級 Tomcat 服務器通常涉及到以下幾個…

Python常見面試題的詳解10

1. 哪些操作會導致 Python 內存溢出,怎么處理? 要點 1. 創建超大列表或字典:當我們一次性創建規模極為龐大的列表或字典時,會瞬間占用大量的內存資源。例如,以下代碼試圖創建一個包含 10 億個元素的列表,在…

多個用戶如何共用一根網線傳輸數據

前置知識 一、電信號 網線(如以太網線)中傳輸的信號主要是 電信號,它攜帶著數字信息。這些信號用于在計算機和其他網絡設備之間傳輸數據。下面是一些關于網線傳輸信號的詳細信息: 1. 電信號傳輸 在以太網中,數據是…

華為昇騰 910B 部署 DeepSeek-R1 蒸餾系列模型詳細指南

本文記錄 在 華為昇騰 910B(65GB) * 8 上 部署 DeepSeekR1 蒸餾系列模型(14B、32B)全過程與測試結果。 NPU:910B3 (65GB) * 8 (910B 有三個版本 910B1、2、3) 模型:DeepSeek-R1-Distill-Qwen-14B、DeepSeek…

【前端】Vue組件庫之Element: 一個現代化的 UI 組件庫

文章目錄 前言一、官網1、官網主頁2、設計原則3、導航4、組件 二、核心功能:開箱即用的組件生態1、豐富的組件體系2、特色功能亮點 三、快速上手:三步開啟組件化開發1、安裝(使用Vue 3)2、全局引入3、按需導入(推薦&am…