embbding you should know

pingmian/2025/7/5 2:09:14/文章來源:https://blog.csdn.net/weixin_43859829/article/details/149087411

embedding：就是將詞向量或者圖向量采用權重升維度，更好的去表達這個特征；nn.Embedding 是 PyTorch 中的查表式嵌入層（lookup‐table），用于將離散的整數索引（如詞 ID、實體 ID、離散特征類別等）映射到一個連續的、可訓練的低維向量空間。它通過維護一個形狀為 (num_embeddings, embedding_dim) 的權重矩陣，實現高效的“索引 → 向量”轉換。為避免顯式構造稀疏的 one-hot 張量，PyTorch 直接根據索引做“取行”操作，效率更高、內存更省。

import torch
import torch.nn as nn# 假設詞匯表大小為10，每個詞嵌入的維度為3
vocab_size = 10
embedding_dim = 256
embedding_layer = nn.Embedding(vocab_size, embedding_dim)
input_indices = torch.tensor([[1, 3, 5, 2, 7],[1, 3, 5, 2, 7]]) # [2,5]
embedded_input = embedding_layer(input_indices) #[2,5,256]

簡單吧；

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/87395.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/87395.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/87395.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！