習題集:
-
【單選題】在大模型微調中,與提示工程和RAG相比,微調的獨特優勢在于( )
A. 無需外部工具即可提升模型表現
B. 能讓模型學習特定領域知識,提升底層能力
C. 可以更高效地檢索知識
D. 能直接提升模型的知識邊界,無需訓練 -
【多選題】以下關于機器學習和傳統編程的說法正確的是( )
A. 傳統編程是已知規則編寫函數,機器學習是通過數據尋找規則
B. 機器學習和傳統編程都需要事先明確參數值
C. 機器學習的目標是利用訓練集找到合適的模型參數
D. 傳統編程中函數的參數是固定不變的 -
【單選題】在計算損失函數時,將差值平方的主要目的不包括( )
A. 避免正負誤差相互抵消
B. 放大誤差影響,便于找到合適參數
C. 簡化計算過程
D. 更準確地評估模型在單個樣本上的表現 -
【多選題】關于代價函數(Cost Function),下列說法正確的是( )
A. 代價函數用于評估模型在整個訓練集上的表現
B. 通常計算所有樣本損失的平均值作為代價函數
C. 尋找代價函數最小值等同于尋找模型的最優參數
D. 不同模型的代價函數計算方法一定相同 -
【單選題】梯度下降算法中,調整參數的方向是( )
A. 梯度方向
B. 梯度的反方向
C. 隨機方向
D. 與梯度垂直的方向 -
【多選題】學習率(Learning Rate)對模型訓練的影響有( )
A. 合適的學習率能讓模型在較短時間找到合適參數
B. 過低的學習率會增加訓練耗時和資源消耗
C. 過高的學習率可能導致模型跳過最優解
D. 學習率的大小不影響模型訓練結果,只影響訓練速度 -
【單選題】在模型訓練中,batch size設置較大時,可能會出現的問題是( )
A. 訓練速度變慢
B. 模型泛化性能下降
C. 模型無法收斂
D. 對硬件資源要求降低 -
【多選題】關于eval steps和epoch,下列說法正確的是( )
A. eval steps控制使用驗證集評估模型的間隔步驟數
B. epoch是對訓練集進行一次完整的迭代
C. 過小的epoch值可能導致訓練結束時未找到最優模型參數
D. 通常在對訓練集完整迭代后才使用驗證集評估模型 -
【單選題】神經網絡中,激活函數的主要作用是( )
A. 加快模型訓練速度
B. 引入非線性變換,增強模型表達能力
C. 減少模型參數數量
D. 簡化神經網絡結構 -
【多選題】以下屬于神經網絡結構組成部分的有( )
A. 神經元
B. 激活函數
C. 參數(權重)
D. 訓練集 -
【單選題】在使用梯度下降算法訓練神經網絡時,若學習率設置過大,模型可能會出現( )
A. 訓練損失不斷下降,驗證損失也不斷下降
B. 訓練損失不斷下降,但驗證損失上升
C. 訓練損失不變,甚至變大
D. 訓練損失和驗證損失都不變 -
【多選題】在大模型微調訓練過程中,正向傳播的目的是計算( )
A. 單個樣本的損失函數
B. 所有樣本的損失函數之和
C. 代價函數
D. 模型的輸出結果,用于與真實結果對比計算損失 -
【單選題】在神經網絡表達式 Y = σ ( W ? X ) Y = \sigma(W \cdot X) Y=σ(W