【Python短期內快速掌握學習人工智能知識能力】:從零到入門的NLP學習秘籍

??我叫憶_恒心,一名喜歡書寫博客的研究生👨?🎓。
如果覺得本文能幫到您,麻煩點個贊👍唄!

近期會不斷在專欄里進行更新講解博客~~~ 有什么問題的小伙伴 歡迎留言提問歐,喜歡的小伙伴給個三連支持一下唄。👍????
Qt5.9專欄定期更新Qt的一些項目Demo
項目與比賽專欄定期更新比賽的一些心得面試項目常被問到的知識點。


如何在暑期快速掌握學習人工智能知識能力:從零到入門的NLP學習秘籍

1 前言

隨著人工智能的迅速發展,掌握AI知識已成為現代社會的重要技能。然而,僅僅了解工具的使用方法是不夠的,還需要深入理解其背后的原理,避免誤用和滯后性。無論你是剛入學的研究生還是正在職場打拼的打工人,都可能會面臨相似的困惑:如何快速入門自然語言處理(NLP)。

作為一名研一新生或者初次接觸NLP的職場人士,希望這篇文章能為你提供實用的指導和幫助。😊

整理了之前的研究生學習筆記 -
自然語言處理(NLP)入門指南,研一學習筆記-小白NLP入門學習筆記

2 學習新知識的小技巧

2.1 調整心態

首先,要調整好自己的心態。無論你現在是研究生階段還是在職場打拼,更多時候是你在為導師或上司工作,而不僅僅是學習。在這個過程中,你可能會遇到一些雜事打亂你的計劃。

2.2 明確學習方向

其次,必須對自己的學習有一個清晰的認識和規劃。如果你已經聯系上了導師或師兄師姐,并對自己的學習方向有了大致的了解,那么恭喜你,接下來就是要努力學習了。

但實際上,很多人可能會面臨以下情況:

  • 沒有聯系上導師或上司
  • 沒有聯系上直系師兄師姐
  • 學習方向不明確,只知道自己學的是NLP
  • 導師或上司只給了一堆論文或資料讓你看,啥也沒說

不要慌,大多數實驗室或職場的科研工作其實是沒有人帶的。你應該認真閱讀這篇博文,了解如何度過研一或入職初期。

2.3 研究生暑假期間的任務

在暑假期間,了解自己的學習方向,至少知道研究方向的名稱。

你應該養成閱讀論文的習慣:

  • 學會閱讀英文文獻
  • 學會查找外國文獻
  • 能夠理解外文文獻

3 學習的小小建議

3.1 學習方向

以我所學習的自然語言處理方向為例,首先你要知道這個方向的一個大題目標是啥。
首先,對Ai模型保持一定的探索
以下面為例:
比如我之前寫過的一篇文章。以ChatGPT為例進行自然語言處理學習——入門自然語言處理
目前人工智能最為火熱的ChatGPT
image-20230417100959287

相信各位小伙伴最近都聽過ChatGPTGPT-4,百度的文言一心Kimi甚至有些同學也已經玩上了這些工具,大家都知道這是人工智能的產物,但是ChatGPT有哪些功能,我們進行一個簡單的介紹。

我們輸入一句:

作為一名剛入門自然語言處理的同學,第一堂課的學習,你能給些建議嗎?

即使這個輸入,可能含有錯別字。

image-20230417101215054

那這背后運用的是那些技術的呢?

CV還是自然語言處理

0 什么是自然語言處理

上述設計到的模型所用的人工智能領域技術是自然語言處理,那么什么是自然語言處理呢?

我們來看一下維基百科上是如何進行定義的:

計算機科學與語言學領域交叉的一門學科,目的是讓計算機能夠理解、解釋、生成人類語言。

這么說可能會優點抽象,簡單來說就是:

自然語言處理 (Nautral Language Process, NLP) =自然語言理解(Natural Language Understand, NLU) + 自然語言生成
(Natural Language Generate, NLG)。

可能這在你看來是很神奇的一件事情,但其實ChatGPT也就做了這兩部分的內容。

總的來說:NLP = NLU + NLR

ChatGPT可以說是自然語言處理綜合應用的一個典型的模型了

image-20230417104322724

自然語言處理技術可以看出是兩個階段。

我們以ChatGPT為例,他是如何做到這些功能的呢?

(通過一個圖 人–>電腦 電腦—人)

ChatGPT為例,我們每一次向他輸入一段話的時候,會發生哪些事情呢?

image-20230323073852717

其中詞法分析、句法分析、語義分析屬于NLU任務,對話管理生成回復屬于NLG任務。

我門進行一個簡單的小結。

image-20230417104630271

1. 請教師兄師姐或同事

請教師兄師姐或同事是最直接的方式。通常情況下,你的師兄師姐或同事做什么,你大概率也會繼續做下去,因為科研需要時間積累。

準研二不清楚就去問準研三的師兄。準研三的師兄都是寶藏!
上班可以多去Github上逛逛

2. 聯系不上導師或同事

![在這里插入圖片描述](https://img-blog.csdnimg.cn/direct/54463fad9在這里插入圖片描述
fa9489fa3a381a1b001e85e.png)

如果聯系不上導師或沒有從事相關工作的同事,可以去學校官網查看導師的研究方向,或者公司其他組查看AI方向的項目,特別是近兩年導師或公司發表的文章或項目研究方向,這大概率就是你將來需要做的方向。

在沒有師兄師姐或同事帶的情況下,你需要對大方向進行了解,方便自己后期找論文或資料看時縮小范圍:

  • 直接拿老師或上司發表的近三年論文或項目報告來讀
  • 用文獻管理工具批量下載相關參考文獻
  • 上GitHub找相關方向的知識點
  • 上知網查看其他人的碩士論文

這是我讀研一時發現的方法,雖然我沒怎么用,但名校的畢業論文比頂刊的英文論文好讀多了,而且通俗易懂。

3.2 學習筆記

這里列出了一些我研一時的學習筆記:
在這里插入圖片描述

  1. 我的研一筆記

  2. 機器學習入門筆記

  3. 神經網絡基礎學習筆記

研一上學期剛開始看文獻時,顯得很吃力,后悔得不行。以上是當時學習的部分筆記。學習時做好記錄是必要的,后面翻看起來比較方便,不容易忘記。

4 論文閱讀

當你對自己的研究方向有一定了解后,就可以開始大量閱讀論文了。

小建議

對于一些較新的細分方向,通常沒有很好的視頻講解。這時,你應該直接去找相關論文閱讀。

第一步:英語基礎較弱

建議先查看知網上的名校碩士/博士論文,看看是否有學者做過類似工作。盡量選擇畢業論文。

小技巧:

知網在下載碩士或博士論文時通常不是PDF格式,可以通過首頁的國際版下載成PDF格式。

第二步:看英文文獻

學會使用文獻管理工具,并借助一些英文閱讀工具完成論文閱讀。
一邊看論文,一邊養成管理文章的習慣。
可以參考我之前寫的文章:研究生入門工具
絕對干活

第三步:記錄文章知識盲點

針對知識盲區進行基礎學習,比如遇到LSTM、RNN這些基礎知識時,如果存在困惑就應進行有針對性的學習。這種系統學習的方式體驗感極佳。

5 基礎學習

如果開學前已經和導師取得聯系,導師一般會發一些論文給你看。按照上面的論文閱讀建議走,你就會大致知道需要補充哪些知識,從而進行系統學習。

如果時間充足,建議按照下面的學習流程走一遍,可能需要一個月左右的時間。

  1. Python的學習請查看機器學習初學者公眾號
  2. 關于機器學習可以先看吳恩達的機器學習課程
  3. 深度學習入門:魚書(非常推薦)
  4. NLP入門:
    1. 選一篇英文綜述
    2. 補充基礎知識:Word2Vec數學基礎
    3. 看論文
    • 看完上面的內容可以專攻NLP
  • 補一下基礎知識:Word2Vec

看一些論文綜述對研究領域有大致了解、補充基礎知識點

學習建議

  • Python的學習請查看機器學習初學者公眾號,主要學習科學工具包、SKlearn等使用
  • 關于機器學習可以先看吳恩達的課程,研一這門課基本上是必修課,到時會重新學,所以看一遍做一下習題就差不多了
  • 深度學習方面,魚書是必看的,可以補充神經網絡的知識
    在這里插入圖片描述

現在回憶起來 這本真是神書啊! 首先書不厚,講得非常基礎好懂,而且提供了豐富的代碼!超級棒,感覺可以先看這本書再去看吳恩達的視頻會更好,至少他這部分的神經網絡,我覺得比吳恩達的手推公式好太多了(適合數學基礎比較差的同學

多寫代碼:

6 寫論文的工具

之前寫了一篇關于科研論文學習的工具,寫文章必備神器!!!

獲得比較多的好評,我自己寫文章的時候,也經常翻出來查查對應的內容!
科研論文寫作神器——讓你事半功倍的SCI論文寫作神器
在這里插入圖片描述

7 多練習編碼

當然,學習機器學習不僅需要理論知識,還需要實際動手練習。這里有一段使用Python和Scikit-learn庫的簡單機器學習代碼示例,展示了如何訓練一個基本的分類模型。

# 導入必要的庫
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score# 加載數據集
iris = datasets.load_iris()
X = iris.data
y = iris.target# 將數據集拆分為訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 標準化數據
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)# 訓練KNN分類器
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)# 進行預測
y_pred = knn.predict(X_test)# 計算準確率
accuracy = accuracy_score(y_test, y_pred)
print(f'模型準確率: {accuracy:.2f}')

這段代碼使用鳶尾花數據集,訓練了一個K近鄰(KNN)分類器,并評估了模型在測試集上的準確率。通過這段代碼,你可以了解數據預處理、模型訓練和評估的基本流程。希望這對你的學習有所幫助!

8 小結

持續學習!
無論你是剛入學的研究生還是職場中的打工人,學習自然語言處理(NLP)都需要正確的心態和明確的方向。調整好心態,明確學習目標,利用暑期時間閱讀相關文獻和論文,補充基礎知識是入門的關鍵。通過請教師兄師姐或同事,使用文獻管理工具,并記錄學習筆記,可以有效提升學習效率。掌握了這些技能和方法,你將能夠在NLP領域邁出堅實的第一步。希望這篇文章能為你提供實用的指導和幫助。

喜歡文章的小伙伴們,麻煩點擊下方三連支持一下哦!歡迎在評論下方留下你讀研期間的疑惑。


??我叫憶_恒心,一名喜歡書寫博客的研究生👨?🎓。
如果覺得本文能幫到您,麻煩點個贊👍唄!

近期會不斷在專欄里進行更新講解博客~~~ 有什么問題的小伙伴 歡迎留言提問歐,喜歡的小伙伴給個三連支持一下唄。👍????
Qt5.9專欄定期更新Qt的一些項目Demo
項目與比賽專欄定期更新比賽的一些心得面試項目常被問到的知識點。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/23638.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/23638.shtml
英文地址,請注明出處:http://en.pswp.cn/web/23638.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Echarts 在折線圖的指定位置繪制一個圖標展示

文章目錄 需求分析需求 在線段交匯處用一個六邊形圖標展示 分析 可以使用 markPoint 和 symbol 屬性來實現。這是一個更簡單和更標準的方法來添加標記點在運行下述代碼后,你將在瀏覽器中看到一個折線圖,其中在 [3, 35] (即圖表中第四個數據點 Thu 的 y 值為 35 的位置)處…

Java反射Reflect機制詳解

文章目錄 引言反射的基本概念反射基本原理反射應用場景反射基本使用獲取類的Class對象獲取構造方法并實例化對象獲取和調用方法獲取和修改字段反射工具類 反射源碼解讀獲取Class對象的源碼調用方法的源碼 反射優缺點優點缺點 為什么需要反射總結 引言 Java反射是Java語言中的一…

【干貨】視頻文件抽幀(opencv和ffmpeg方式對比)

1 廢話不多說,直接上代碼 opencv方式 import time import subprocess import cv2, os from math import ceildef extract_frames_opencv(video_path, output_folder, frame_rate1):"""使用 OpenCV 從視頻中抽取每秒指定幀數的幀,并保存到指定文件夾…

linux系統使用達夢數據庫

在Linux系統中使用達夢數據庫,首先需要確保已經正確安裝了達夢數據庫軟件。以下是一個基本的使用示例,假設您已經安裝了達夢數據庫并且配置好了相關環境變量。 連接到數據庫: 使用 dsql 命令連接到數據庫 dsql -h hostname -u username -p…

寶貝,帶上WebAssembly,換個姿勢來優化你的前端應用

在你沒崛起之前,臉是用來丟的 大家好,我是柒八九。一個專注于前端開發技術/Rust及AI應用知識分享的Coder 此篇文章所涉及到的技術有 WebAssemblyRustWeb Worker(comlink)wasm-packPhotonffmpeg.wasm腳手架生成前端項目因為,行文字數所限,有些概念可能會一帶而過亦或者提供對…

BOM是什么東西

BOM(Byte Order Mark,字節順序標記)是一個Unicode字符,通常出現在文本文件的開頭。它的作用包括以下幾個方面: 1. 指示文件的編碼方式 BOM可以幫助軟件識別文本文件使用的字符編碼。不同的編碼方式可能會使用不同的B…

經濟與安全兼顧:茶飲店購買可燃氣體報警器的價格考量

可燃氣體報警器在如今的社會中扮演著至關重要的角色。它們用于檢測環境中的可燃氣體濃度,及早發現潛在的火災隱患,保護人們的生命和財產安全。 在這篇文章中,佰德將介紹可燃氣體報警器的安裝、檢定以及價格,通過實際案例和數據&a…

PCL 生成空間橢圓點云

目錄 一、算法原理二、代碼實現三、結果展示本文由CSDN點云俠原創,原文鏈接。如果你不是在點云俠的博客中看到該文章,那么此處便是不要臉的爬蟲。 一、算法原理 設橢圓在 X O Y XOY XOY平面上,參數方程為:

怎么保障TikTok直播網絡穩定?

TikTok,這個近年來風靡全球的社交媒體平臺,已成為電商引流的新方向,尤其是其直播功能。然而,對于打算進軍TikTok直播領域的商家和主播而言,確保網絡穩定無疑是首要任務。那么,TikTok直播專線究竟是什么呢&a…

牛啊后續:如何一行C#代碼實現解析類型的Summary注釋(可用于數據字典快速生成)...

前言:下午有小伙伴要求,讓我繼續做個解析實體類注釋信息的內容。所以我也順便加入進來。以下開始正文實戰操作: 項目需要勾選輸出api文檔文件。這樣就可以讓所有實體類的summary信息被寫入到輸出目錄下。如果有多個xml文件也沒關系&#xff0…

小程序 UI 風格美不勝收

小程序 UI 風格美不勝收 小程序 UI 風格美不勝收

PostgreSQL的視圖pg_stat_replication

PostgreSQL的視圖pg_stat_replication pg_stat_replication 是 PostgreSQL 提供的一個系統視圖,用于顯示主服務器上當前正在進行的復制會話的信息。它可以幫助數據庫管理員監控和管理主從復制的狀態,確保數據的正確同步和高可靠性。 pg_stat_replicati…

MyEclipse中properties文件中文亂碼(Unicode字符)解決辦法

程序代碼園發文地址:MyEclipse中properties文件中文亂碼(Unicode字符)解決辦法-程序代碼園小說,Java,HTML,Java小工具,程序代碼園,http://www.byqws.com/ ,MyEclipse中properties文件中文亂碼(Unicode字符)解決辦法htt…

Django學習三:views業務層中通過models對實體對象進行的增、刪、改、查操作。

文章目錄 前言一、Django ORM介紹二、項目快速搭建三、操作1、view.pya、增加操作b、刪除操作c、修改操作d、查詢操作 2、urls.py 前言 上接博文:Django學習二:配置mysql,創建model實例,自動創建數據庫表,對mysql數據…

一周發文9篇!MIMIC-IV數據庫周報(5.22~5.28)

重癥醫學數據庫(MIMIC)是由計算生理學實驗室開發的公開數據集,其中包括與數千個重癥監護病房入院相關的去識別化健康數據,致力于推動臨床信息學、流行病學和機器學習的研究。 MIMIC數據庫于2003年在美國國立衛生研究院的資助下&am…

2024上海初中生古詩文大會倒計時4個半月:單選題真題示例和獨家解析

現在距離2024年初中生古詩文大會還有4個半月時間,我們來看10道選擇題真題和詳細解析,了解古詩文大會的考察方式和知識點,從而更好地備考。 以下題目截取自我獨家制作的在線真題集,都是來自于歷屆真題,去重、合并后&am…

數據倉庫緩慢變化維介紹

緩慢變化維(Slowly Changing Dimensions, SCD)是數據倉庫設計中的一個重要概念,用于處理維度表中隨時間緩慢變化的屬性。維度表中的數據通常描述業務實體(如客戶、產品、員工等),而這些實體的某些屬性&…

面試成功的不二法門:詳解Vue3答題章法

前言 面試題在網絡上有如海洋之深,對于同一知識點,每個人的理解也各有千秋。我們在面試中常常會遇到一個瞬息間腦海里一片空白的情況,其實這并不是因為我們不懂,而是因為我們在回答的時候缺乏一個清晰的思路。那么問題來了&#x…

《魔法與科技的融合:SpringBoot運維的現代傳說》

揭開了SpringBoot應用部署的神秘面紗。從云平臺的選型到Docker的容器化魔法,再到Kubernetes的集群力量,每一步都充滿了奇幻色彩。文章以輕松幽默的筆觸,帶領讀者穿梭于現代應用部署的各個角落,探索自動化部署的奧秘,學…

關于圖像過曝問題的排查思路

1、問題背景 讀者提問,圖像在室外遇到過曝的問題,有什么排查思路和改善方法。 2、問題分析 1)先檢查一下sensor驅動,對照 sensor datasheet 確認下最小曝光行設置的是否正確, 因為室外高亮場景一般曝光行走的都比較…