練習題
-
【單選題】在自然語言處理的法務咨詢場景中,以下哪種模型選擇最為合適?
A. 通用大語言模型
B. 經過數學領域微調的模型
C. 面向法律領域訓練的模型
D. 視覺模型 -
【多選題】以下哪些屬于模型非功能性需求?( )
A. 模型對不同語言的支持能力
B. 模型的響應速度要求
C. 模型運行的成本預算
D. 模型在高并發場景下的穩定性 -
【單選題】在模型性能優化中,以下哪種方法不屬于減少大模型處理請求數和運算量的策略?
A. 使用上下文緩存技術
B. 選擇較小規模模型
C. 合并或去除重復請求進行批處理
D. 利用空閑資源進行批量推理 -
【多選題】關于模型實時監控與預警,以下說法正確的是?( )
A. 只需監控模型準確率,其他指標不重要
B. 數據漂移檢測能幫助發現輸入數據與訓練數據分布的差異
C. 自動告警閾值設置得越低越好,以便及時發現問題
D. 詳細記錄模型請求信息有助于定位問題根源 -
【單選題】在建立評測基線模型時,以下哪種做法是合理的?
A. 直接使用最復雜的模型作為基線
B. 從簡單的基礎算法開始構建基線模型
C. 不參考歷史版本,完全重新構建基線模型
D. 只在一種業務場景下構建基線模型 -
【多選題】在成本優化中,優化系統性能節約成本的方法有哪些?( )
A. 用大模型替換小模型
B. 上下文緩存高頻重復查詢結果
C. 批量推理合并或去重請求
D. 增加token數量 -
【單選題】對于對話、咨詢、搜索類業務場景,以下哪個不是常用的性能評估數據集?
A. ShareGPT
B. MMLU
C. HumanEval
D. 以上都不是 -
【多選題】在模型性能優化的用戶感知優化方面,以下哪些方法可以減少用戶等待時間?( )
A. 流式輸出
B. 分塊處理
C. 展示任務進度
D. 完善錯誤處理機制 -
【單選題】在GPU實例規格選擇中,不影響模型運行所需內存大小計算的因素是?
A. 模型參數量
B. 模型功能
C. KV Cache占用
D. 精度設置 -
【多選題】在容災性設計中,通用應用容災方案包括以下哪些內容?( )
A. 跨地域、跨可用區部署
B. 創建備用環境
C. 定期演練預測試
D. 啟用降級與熔斷機制 -
【單選題】在模型選擇的評估方法中,若要測試模型的復雜推理能力,以下哪種公開數據集較為合適?
A. MMLU
B. BBH
C. HumanEval
D. LongBench -
【多選題】以下關于業務需求分析的說法,正確的是?( )
A. 業務需求分析是大模型部署的第一步
B. 業務場景不清晰可能導致模型選擇錯誤
C. 只需考慮功能性需求,非功能性需求不重要
D. 不同業務場景對模型的功能性和非功能性需求差異大 -
【單選題】在模型性能優化中,通過精簡輸入內容,要求模型生成簡潔回答來減少Tokens的輸入和輸出,這種方法主要針對以下哪種需求?
A. 系統性能提升
B. 用戶感知優化
C. 成本優化
D. 穩定性保障 -
【多選題】在評測基線管理中,定期測試與對比包括哪些維度?( )
A. 時間維度
B. 空間維度
C. 場景維度
D. 模型維度 -
【單選題】在成本優化的云上部署成本優化中,以下哪種計費方式適用于業務場景不穩定,對成本敏感的情況?
A. 預付費(包年包月)
B. 按量付費
C. 搶占式實例
D. 以上都不合適 -
【多選題】在模型性能優化中,并行化處理包括以下哪些方式?( )
A. 數據并行
B. 模型并行
C. 流水線并行
D. 任務并行 -
【單選題】在建立基線模型時,參考歷史版本性能數據的目的是什么?
A. 為了復用歷史版本代碼
B. 為了快速構建基線模型
C. 為了評估新模型的改進或退化情況
D. 為了減少測試工作量 -
【多選題】以下哪些屬于模型實時監控與預警的關鍵指標?( )
A. 模型準確率
B. 模型響應速度
C. 模型錯誤率
D. 模型參數量 -
【單選題】在自然語言處理的通用任務中,如開放域問答,通常使用以下哪種模型?
A. 經過特定領域微調的模型
B. 通用大語言模型
C. 視覺模型
D. 語音處理模型 -
【多選題】在容災性設計的降級與熔斷機制中,降級是指?( )
A. 暫時停止對故障模型的調用
B. 切換至備份模型
C. 采用簡單的規則引擎來提供兜底服務
D. 對故障模型進行修復 -
【單選題】已知某模型在FP8精度下,參數量為300億,每個參數占用4字節,計算該模型本身占用顯存約為多少GB?( )
A. 11.25
B. 12
C. 22.5
D. 24 -
【多選題】在模型性能優化中,用戶感知優化的方法有( )
A. 完善錯誤處理機制,設置自動重試和錯誤降級方案
B. 提供用戶反饋入口,持續改進系統
C. 展示任務進度,讓用戶了解系統處理情況
D. 采用模型壓縮與量化技術加速推理 -
【單選題】以下關于自動化擴縮容的說法,錯誤的是?
A. 水平伸縮計算資源可以利用彈性伸縮(ESS)動態調整ECS/GPU實例數量
B. 函數計算(FC)可以按需分配資源,實現自動化擴縮容
C. 自動化擴縮容只能提升系統性能,對成本優化沒有幫助
D. 負載均衡(SLB)可以分散流量壓力?