【Machine Learning Q and AI 讀書筆記】- 03 小樣本學習

Machine Learning Q and AI 中文譯名 大模型技術30講,主要總結了大模型相關的技術要點,結合學術和工程化,對LLM從業者來說,是一份非常好的學習實踐技術地圖.

本文是Machine Learning Q and AI 讀書筆記的第3篇,對應原書第三章 《小樣本學習》.

TL;DR

小樣本學習,其實就是Few-Shot, 要注意,這里討論的的Few-Shot不是提示詞工程(Prompt Engineering)范疇內的.

Few-Shot

Few-shot learning is a flavor of supervised learning for small training sets with a very small example-to-class ratio. In regular supervised learning, we train models by iterating over a training set where the model always sees a fixed set of classes. In few shot learning, we are working on a support set from which we create multiple training tasks to assemble training episodes where each training task consists of different classes.

少樣本學習(Few-shot learning)是一種針對小規模訓練集的監督學習方法,其樣本與類別比例極低。在傳統的監督學習中,我們通過迭代訓練集來訓練模型,模型總是面對固定的類別集合。而在少樣本學習中,我們從一個支撐集(support set)中創建多個訓練任務,組裝成多個訓練場景(training episodes),每個訓練任務都包含不同的類別。

在小樣本學習中,每個標簽下的樣本數遠小于常規機器學習任務。定義小樣本學習任務一般用N-way K-shot. 其中 N N N代表標簽數, K K K代表樣本數.

數據集和術語

Rather than fitting the model to the training dataset, we can think of few-shot learning as “learning to learn.” In contrast to supervised learning, we don’t have a training dataset but a so-called support set. From the support set, we sample training tasks that mimic the use-case scenario during prediction. For example, for 3-way 1-shot learning, a training task consists of 3 classes with 1 example each. With each training task comes a query image that is to be classified. The model is trained on several training tasks from the support set; this is called an episode.

監督學習中,我們讓模型擬合訓練集,并且在測試集上對模型進行評估. 通常來說,訓練集中每個標簽都會有很多個樣本. Iris數據集每個標簽有50個樣本,這是非常少的. Deep Learning常用的MNIST數據集,每個標簽有5000個樣本,還是被認為是少的.

小樣本學習可以認為是讓模型“學會如何學習”,而不是在訓練集上擬合.

支撐集

支撐集的概念如下圖所示:
3-way 1-shot

回合

小樣本學習模擬使用模型推理的各個場景,從支撐集中抽樣,形成訓練任務,每個訓練任務都附帶一個用于推理的查詢集,模型會從支撐集中抽樣形成的訓練任務上進行訓練,每次訓練完成,稱為一個回合(episode).

基類和基集

在測試階段,模型將接收到一個和訓練階段標簽不同的任務,在訓練中遇到的標簽稱為基類,支撐集通常也稱為基集.

在這里插入圖片描述


總結

小樣本學習有許多不同的類型,最常見的是元學習,本質上是更新模型參數以便模型更好的適應新的任務.

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/79244.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/79244.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/79244.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

PETR和位置編碼

PETR和位置編碼 petr檢測網絡中有2種類型的位置編碼。 正弦編碼和petr論文提出的3D Position Embedding。transformer模塊輸入除了qkv,還有query_pos和key_pos。這里重點記錄下query_pos和key_pos的生成 query pos的生成 先定義reference_points, shape為(n_query…

Ubuntu搭建 Nginx以及Keepalived 實現 主備

目錄 前言1. 基本知識2. Keepalived3. 腳本配置4. Nginx前言 ?? 找工作,來萬碼優才:?? #小程序://萬碼優才/r6rqmzDaXpYkJZF 爬蟲神器,無代碼爬取,就來:bright.cn Java基本知識: java框架 零基礎從入門到精通的學習路線 附開源項目面經等(超全)【Java項目】實戰CRU…

文章記單詞 | 第56篇(六級)

一,單詞釋義 interview /??nt?vju?/: 名詞:面試;采訪;面談動詞:對… 進行面試;采訪;接見 radioactive /?re?di???kt?v/:形容詞:放射性的&#xff…

MATLAB函數調用全解析:從入門到精通

在MATLAB編程中,函數是代碼復用的核心單元。本文將全面解析MATLAB中各類函數的調用方法,包括內置函數、自定義函數、匿名函數等,幫助提升代碼效率! 一、MATLAB函數概述 MATLAB函數分為以下類型: 內置函數&#xff1a…

哈希表筆記(二)redis

Redis哈希表實現分析 這份代碼是Redis核心數據結構之一的字典(dict)實現,本質上是一個哈希表的實現。Redis的字典結構被廣泛用于各種內部數據結構,包括Redis數據庫本身和哈希鍵類型。 核心特點 雙表設計:每個字典包含兩個哈希表&#xff0…

PDF嵌入隱藏的文字

所需依賴 <dependency><groupId>com.itextpdf</groupId><artifactId>itext-core</artifactId><version>9.0.0</version><type>pom</type> </dependency>源碼 /*** PDF工具*/ public class PdfUtils {/*** 在 PD…

RAG工程-基于LangChain 實現 Advanced RAG(預檢索-查詢優化)(下)

Multi-Query 多路召回 多路召回流程圖 多路召回策略利用大語言模型&#xff08;LLM&#xff09;對原始查詢進行拓展&#xff0c;生成多個與原始查詢相關的問題&#xff0c;再將原始查詢和生成的所有相關問題一同發送給檢索系統進行檢索。它適用于用戶查詢比較寬泛、模糊或者需要…

【業務領域】PCIE協議理解

PCIE協議理解 提示&#xff1a;這里可以添加系列文章的所有文章的目錄&#xff0c;目錄需要自己手動添加 PCIE學習理解。 文章目錄 PCIE協議理解[TOC](文章目錄) 前言零、PCIE掌握點&#xff1f;一、PCIE是什么&#xff1f;二、PCIE協議總結物理層切速 鏈路層事務層6.2 TLP的路…

Jupyter notebook快捷鍵

文章目錄 Jupyter notebook鍵盤模式快捷鍵&#xff08;常用的已加粗&#xff09; Jupyter notebook鍵盤模式 命令模式&#xff1a;鍵盤輸入運行程序命令&#xff1b;這時單元格框線為藍色 編輯模式&#xff1a;允許你往單元格中鍵入代碼或文本&#xff1b;這時單元格框線是綠色…

Unity圖片導入設置

&#x1f3c6; 個人愚見&#xff0c;沒事寫寫筆記 &#x1f3c6;《博客內容》&#xff1a;Unity3D開發內容 &#x1f3c6;&#x1f389;歡迎 &#x1f44d;點贊?評論?收藏 &#x1f50e;Unity支持的圖片格式 ??BMP:是Windows操作系統的標準圖像文件格式&#xff0c;特點是…

Spark-小練試刀

任務1&#xff1a;HDFS上有三份文件&#xff0c;分別為student.txt&#xff08;學生信息表&#xff09;result_bigdata.txt&#xff08;大數據基礎成績表&#xff09;&#xff0c; result_math.txt&#xff08;數學成績表&#xff09;。 加載student.txt為名稱為student的RDD…

內存安全的攻防戰:工具鏈與語言特性的協同突圍

一、內存安全&#xff1a;C 開發者永恒的達摩克利斯之劍 在操作系統內核、游戲引擎、金融交易系統等對穩定性要求苛刻的領域&#xff0c;內存安全問題始終是 C 開發者的核心挑戰。緩沖區溢出、懸空指針、雙重釋放等經典漏洞&#xff0c;每年在全球范圍內造成數千億美元的損失。…

OceanBase數據庫-學習筆記1-概論

多租戶概念 集群和分布式 隨著互聯網、物聯網和大數據技術的發展&#xff0c;數據量呈指數級增長&#xff0c;單機數據庫難以存儲和處理如此龐大的數據。現代應用通常需要支持大量用戶同時訪問&#xff0c;單機數據庫在高并發場景下容易成為性能瓶頸。單點故障是單機數據庫的…

計算機網絡——鍵入網址到網頁顯示,期間發生了什么?

瀏覽器做的第一步工作是解析 URL&#xff0c;分清協議是http還是https&#xff0c;主機名&#xff0c;路徑名&#xff0c;然后生成http消息&#xff0c;之后委托操作系統將消息發送給 Web 服務器。在發送之前&#xff0c;還需要先去查詢dns&#xff0c;首先是查詢緩存瀏覽器緩存…

Qwen3本地化部署,準備工作:SGLang

文章目錄 SGLang安裝deepseek運行Qwen3-30B-A3B官網:https://github.com/sgl-project/sglang SGLang SGLang 是一個面向大語言模型和視覺語言模型的高效服務框架。它通過協同設計后端運行時和前端編程語言,使模型交互更快速且具備更高可控性。核心特性包括: 1. 快速后端運…

全面接入!Qwen3現已上線千帆

百度智能云千帆正式上線通義千問團隊開源的最新一代Qwen3系列模型&#xff0c;包括旗艦級MoE模型Qwen3-235B-A22B、輕量級MoE模型Qwen3-30B-A3B。千帆大模型平臺開源模型進一步擴充&#xff0c;以多維開放的模型服務、全棧模型開發、應用開發工具鏈、多模態數據治理及安全的能力…

藍橋杯Python(B)省賽回憶

Q&#xff1a;為什么我要寫這篇博客&#xff1f; A&#xff1a;在藍橋杯軟件類競賽&#xff08;Python B組&#xff09;的備賽過程中我在網上搜索關于藍橋杯的資料&#xff0c;感謝你們提供的參賽經歷&#xff0c;對我的備賽起到了整體調整的幫助&#xff0c;讓我知道如何以更…

數據轉儲(go)

? 隨著時間推移&#xff0c;數據庫中的數據量不斷累積&#xff0c;可能導致查詢性能下降、存儲壓力增加等問題。數據轉儲作為一種有效的數據管理策略&#xff0c;能夠將歷史數據從生產數據庫中轉移到其他存儲介質&#xff0c;從而減輕數據庫負擔&#xff0c;提高系統性能&…

Git Stash 詳解

Git Stash 詳解 在使用 Git 進行版本控制時&#xff0c;經常會遇到需要臨時保存當前工作狀態的情況。git stash 命令就是為此設計的&#xff0c;它允許你將未提交的更改暫存起來&#xff0c;在處理其他任務或分支后&#xff0c;再恢復這些更改。 目錄 基本概念常用命令示例和…

Windows下Dify安裝及使用

Dify安裝及使用 Dify 是開源的 LLM 應用開發平臺。提供從 Agent 構建到 AI workflow 編排、RAG 檢索、模型管理等能力&#xff0c;輕松構建和運營生成式 AI 原生應用。比 LangChain 更易用。 前置條件 windows下安裝了docker環境-Windows11安裝Docker-CSDN博客 下載 Git下載…