huggingface 筆記：PretrainModel

1 from_pretrained

從預訓練模型配置中實例化一個 PyTorch 預訓練模型
默認情況下，模型使用 model.eval() 設置為評估模式（Dropout 模塊被禁用）
- 要訓練模型，應該首先使用 model.train() 將其設置回訓練模式

pretrained_model_name_or_path	需要加載的模型，可以是：一個字符串，huggingface.co 上一個模型庫中的預訓練模型ID。一個目錄路徑，包含使用 `save_pretrained()` 保存的模型權重，例如 `./my_model_directory/`。
from_tf	(bool, 可選，默認為 False) - 從 TensorFlow 檢查點保存文件中加載模型權重
force_download	(bool, 可選，默認為 False) - 是否強制（重新）下載模型權重和配置文件，覆蓋已存在的緩存版本
local_files_only	(bool, 可選，默認為 False) - 是否只查看本地文件（即，不嘗試下載模型）

torch_dtype

(str 或 torch.dtype, 可選) — 覆蓋默認的 torch.dtype，并在特定的數據類型下加載模型

torch.float16 或 torch.bfloat16 或 torch.float：在指定的數據類型下加載
"auto" - 將嘗試使用模型的 config.json 文件中的 torch_dtype 條目。如果沒有找到此條目，則檢查checkpoint中第一個浮點類型的權重的數據類型，并使用該數據類型加載模型。

device_map

quantization_config

huggingface 筆記：AutoTokenizer,AutoClass-CSDN博客

一個量化配置參數字典

from transformers import LlamaModelm=LlamaModel.from_pretrained('meta-llama/Meta-Llama-3-8B')
m

m.can_generate()
#False

返回模型的輸入嵌入，即將詞匯映射到隱藏狀態的 PyTorch 模塊

m.get_input_embeddings()
#Embedding(128256, 4096)

獲取模型的內存占用（以字節為單位）

m.get_memory_footprint()
#30019706880

返回模型的輸出嵌入，即將隱藏狀態映射到詞匯的 PyTorch 模塊

初始化權重

resize_token_embeddings(new_num_tokens)

嵌入矩陣中的新令牌數量。
- 增加大小將在末尾添加新初始化的向量。
- 減少大小將從末尾移除向量。
- 如果未提供或為 None，則只返回指向模型的輸入令牌 torch.nn.Embedding 模塊的指針，不進行任何操作。

set_input_embeddings(value: nn.Module)

自定義模型的輸入嵌入層，通過提供一個新的 nn.Module 來替換默認的輸入嵌入

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/15545.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/15545.shtml
英文地址，請注明出處：http://en.pswp.cn/web/15545.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！