??我叫憶_恒心,一名喜歡書寫博客的研究生👨?🎓。
如果覺得本文能幫到您,麻煩點個贊
👍唄!
近期會不斷在專欄里進行更新講解博客~~~ 有什么問題的小伙伴 歡迎留言提問歐,喜歡的小伙伴給個三連支持一下唄。👍????
Qt5.9專欄
定期更新Qt的一些項目Demo
項目與比賽專欄
定期更新比賽的一些心得,面試項目常被問到的知識點。
如何在暑期快速掌握學習人工智能知識能力:從零到入門的NLP學習秘籍
1 前言
隨著人工智能的迅速發展,掌握AI知識已成為現代社會的重要技能。然而,僅僅了解工具的使用方法是不夠的,還需要深入理解其背后的原理,避免誤用和滯后性。無論你是剛入學的研究生還是正在職場打拼的打工人,都可能會面臨相似的困惑:如何快速入門自然語言處理(NLP)。
作為一名研一新生或者初次接觸NLP的職場人士,希望這篇文章能為你提供實用的指導和幫助。😊
整理了之前的研究生學習筆記 -
自然語言處理(NLP)入門指南,研一學習筆記-小白NLP入門學習筆記
2 學習新知識的小技巧
2.1 調整心態
首先,要調整好自己的心態。無論你現在是研究生階段還是在職場打拼,更多時候是你在為導師或上司工作,而不僅僅是學習。在這個過程中,你可能會遇到一些雜事打亂你的計劃。
2.2 明確學習方向
其次,必須對自己的學習有一個清晰的認識和規劃。如果你已經聯系上了導師或師兄師姐,并對自己的學習方向有了大致的了解,那么恭喜你,接下來就是要努力學習了。
但實際上,很多人可能會面臨以下情況:
- 沒有聯系上導師或上司
- 沒有聯系上直系師兄師姐
- 學習方向不明確,只知道自己學的是NLP
- 導師或上司只給了一堆論文或資料讓你看,啥也沒說
不要慌,大多數實驗室或職場的科研工作其實是沒有人帶的。你應該認真閱讀這篇博文,了解如何度過研一或入職初期。
2.3 研究生暑假期間的任務
在暑假期間,了解自己的學習方向,至少知道研究方向的名稱。
你應該養成閱讀論文的習慣:
- 學會閱讀英文文獻
- 學會查找外國文獻
- 能夠理解外文文獻
3 學習的小小建議
3.1 學習方向
以我所學習的自然語言處理方向為例,首先你要知道這個方向的一個大題目標是啥。
首先,對Ai模型保持一定的探索。
以下面為例:
比如我之前寫過的一篇文章。以ChatGPT為例進行自然語言處理學習——入門自然語言處理
目前人工智能最為火熱的ChatGPT
相信各位小伙伴最近都聽過ChatGPT
,GPT-4
,百度的文言一心
、Kimi
甚至有些同學也已經玩上了這些工具,大家都知道這是人工智能的產物,但是ChatGPT
有哪些功能,我們進行一個簡單的介紹。
我們輸入一句:
作為一名剛入門自然語言處理的同學,第一堂課的學習,你能給些建議嗎?
即使這個輸入,可能含有錯別字。
那這背后運用的是那些技術的呢?
是CV
還是自然語言處理
0 什么是自然語言處理
上述設計到的模型所用的人工智能領域技術是自然語言處理,那么什么是自然語言處理呢?
我們來看一下維基百科上是如何進行定義的:
計算機科學與語言學領域交叉的一門學科,目的是讓計算機能夠理解、解釋、生成人類語言。
這么說可能會優點抽象,簡單來說就是:
自然語言處理 (Nautral Language Process, NLP
) =自然語言理解(Natural Language Understand, NLU
) + 自然語言生成
(Natural Language Generate, NLG
)。
可能這在你看來是很神奇的一件事情,但其實ChatGPT
也就做了這兩部分的內容。
總的來說:NLP = NLU + NLR
。
ChatGPT
可以說是自然語言處理綜合應用的一個典型的模型了
自然語言處理技術可以看出是兩個階段。
我們以ChatGPT
為例,他是如何做到這些功能的呢?
(通過一個圖 人–>電腦 電腦—人)
以ChatGPT
為例,我們每一次向他輸入一段話的時候,會發生哪些事情呢?
其中詞法分析、句法分析、語義分析
屬于NLU
任務,對話管理
、生成回復
屬于NLG
任務。
我門進行一個簡單的小結。
1. 請教師兄師姐或同事
請教師兄師姐或同事是最直接的方式。通常情況下,你的師兄師姐或同事做什么,你大概率也會繼續做下去,因為科研需要時間積累。
準研二不清楚就去問準研三的師兄。準研三的師兄都是寶藏!
上班可以多去Github上逛逛
2. 聯系不上導師或同事

如果聯系不上導師或沒有從事相關工作的同事,可以去學校官網查看導師的研究方向,或者公司其他組查看AI方向的項目,特別是近兩年導師或公司發表的文章或項目研究方向,這大概率就是你將來需要做的方向。
在沒有師兄師姐或同事帶的情況下,你需要對大方向進行了解,方便自己后期找論文或資料看時縮小范圍:
- 直接拿老師或上司發表的近三年論文或項目報告來讀
- 用文獻管理工具批量下載相關參考文獻
- 上GitHub找相關方向的知識點
- 上知網查看其他人的碩士論文
這是我讀研一時發現的方法,雖然我沒怎么用,但名校的畢業論文比頂刊的英文論文好讀多了,而且通俗易懂。
3.2 學習筆記
這里列出了一些我研一時的學習筆記:
-
我的研一筆記
-
機器學習入門筆記
-
神經網絡基礎學習筆記
研一上學期剛開始看文獻時,顯得很吃力,后悔得不行。以上是當時學習的部分筆記。學習時做好記錄是必要的,后面翻看起來比較方便,不容易忘記。
4 論文閱讀
當你對自己的研究方向有一定了解后,就可以開始大量閱讀論文了。
小建議
對于一些較新的細分方向,通常沒有很好的視頻講解。這時,你應該直接去找相關論文閱讀。
第一步:英語基礎較弱
建議先查看知網上的名校碩士/博士論文,看看是否有學者做過類似工作。盡量選擇畢業論文。
小技巧:
知網在下載碩士或博士論文時通常不是PDF格式,可以通過首頁的國際版下載成PDF格式。
第二步:看英文文獻
學會使用文獻管理工具,并借助一些英文閱讀工具完成論文閱讀。
一邊看論文,一邊養成管理文章的習慣。
可以參考我之前寫的文章:研究生入門工具
第三步:記錄文章知識盲點
針對知識盲區進行基礎學習,比如遇到LSTM、RNN這些基礎知識時,如果存在困惑就應進行有針對性的學習。這種系統學習的方式體驗感極佳。
5 基礎學習
如果開學前已經和導師取得聯系,導師一般會發一些論文給你看。按照上面的論文閱讀建議走,你就會大致知道需要補充哪些知識,從而進行系統學習。
如果時間充足,建議按照下面的學習流程走一遍,可能需要一個月左右的時間。
- Python的學習請查看機器學習初學者公眾號
- 關于機器學習可以先看吳恩達的機器學習課程
- 深度學習入門:魚書(非常推薦)
- NLP入門:
- 選一篇英文綜述
- 補充基礎知識:Word2Vec數學基礎
- 看論文
- 看完上面的內容可以專攻NLP
- 補一下基礎知識:Word2Vec
看一些論文綜述對研究領域有大致了解、補充基礎知識點
學習建議
- Python的學習請查看機器學習初學者公眾號,主要學習科學工具包、SKlearn等使用
- 關于機器學習可以先看吳恩達的課程,研一這門課基本上是必修課,到時會重新學,所以看一遍做一下習題就差不多了
- 深度學習方面,魚書是必看的,可以補充神經網絡的知識
現在回憶起來 這本真是神書啊! 首先書不厚,講得非常基礎好懂,而且提供了豐富的代碼!超級棒,感覺可以先看這本書再去看吳恩達的視頻會更好,至少他這部分的神經網絡,我覺得比吳恩達的手推公式好太多了(適合數學基礎比較差的同學)
多寫代碼:
6 寫論文的工具
之前寫了一篇關于科研論文學習的工具,寫文章必備神器!!!
獲得比較多的好評,我自己寫文章的時候,也經常翻出來查查對應的內容!
科研論文寫作神器——讓你事半功倍的SCI論文寫作神器
7 多練習編碼
當然,學習機器學習不僅需要理論知識,還需要實際動手練習。這里有一段使用Python和Scikit-learn庫的簡單機器學習代碼示例,展示了如何訓練一個基本的分類模型。
# 導入必要的庫
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score# 加載數據集
iris = datasets.load_iris()
X = iris.data
y = iris.target# 將數據集拆分為訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 標準化數據
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)# 訓練KNN分類器
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)# 進行預測
y_pred = knn.predict(X_test)# 計算準確率
accuracy = accuracy_score(y_test, y_pred)
print(f'模型準確率: {accuracy:.2f}')
這段代碼使用鳶尾花數據集,訓練了一個K近鄰(KNN)分類器,并評估了模型在測試集上的準確率。通過這段代碼,你可以了解數據預處理、模型訓練和評估的基本流程。希望這對你的學習有所幫助!
8 小結
持續學習!
無論你是剛入學的研究生還是職場中的打工人,學習自然語言處理(NLP)都需要正確的心態和明確的方向。調整好心態,明確學習目標,利用暑期時間閱讀相關文獻和論文,補充基礎知識是入門的關鍵。通過請教師兄師姐或同事,使用文獻管理工具,并記錄學習筆記,可以有效提升學習效率。掌握了這些技能和方法,你將能夠在NLP領域邁出堅實的第一步。希望這篇文章能為你提供實用的指導和幫助。
喜歡文章的小伙伴們,麻煩點擊下方三連支持一下哦!歡迎在評論下方留下你讀研期間的疑惑。
??我叫憶_恒心,一名喜歡書寫博客的研究生👨?🎓。
如果覺得本文能幫到您,麻煩點個贊
👍唄!近期會不斷在專欄里進行更新講解博客~~~ 有什么問題的小伙伴 歡迎留言提問歐,喜歡的小伙伴給個三連支持一下唄。👍????
Qt5.9專欄
定期更新Qt的一些項目Demo
項目與比賽專欄
定期更新比賽的一些心得,面試項目常被問到的知識點。