Hugging Face-環境配置

打開anaconda prompt

conda activate pytorch
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple transformers datasets tokenizers

pycharm

?找到pytorch下的python.exe

#將模型下載到本地調用
from transformers import AutoModelForCausalLM,AutoTokenizer#將模型和分詞工具下載到本地,并指定保存路徑
model_name = "uer/gpt2-chinese-cluecorpussmall"
cache_dir = "model/uer/gpt2-chinese-cluecorpussmall"#下載模型
AutoModelForCausalLM.from_pretrained(model_name, cache_dir=cache_dir)
#下載分詞工具
AutoTokenizer.from_pretrained(model_name,cache_dir=cache_dir)print(f"模型分詞器已下載到:{cache_dir}")

    from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline# 設置具體包含config.json的目錄
    model_dir = r"D:\pycharm\sth\demo\transFormers_test\model\uer\gpt2-chinese-cluecorpussmall\models--uer--gpt2-chinese-cluecorpussmall\snapshots\c2c0249d8a2731f269414cc3b22dff021f8e07a3"# 將模型和分詞工具下載到本地,并指定保存路徑
    model = AutoModelForCausalLM.from_pretrained(model_dir)
    tokenizer = AutoTokenizer.from_pretrained(model_dir)# 使用模型和分詞器創建生成文本的pipeline
    generator = pipeline("text-generation", model=model, tokenizer=tokenizer,device="cuda")# 生成內容
    # output = generator("你好,我是一款語言模型,",max_length=50,num_return_sequences=1)output = generator("你好,我是一款語言模型,",num_return_sequences=1, # 設置返回多少個獨立的生成序列max_length=50,truncation=True,# 生成文本以適應文本最大長度temperature=0.7,# 控制文本生成的隨機性,值越高,生成多樣性越好top_k=50, # 限制模型在每一步生成時僅從概率最高的k個詞中隨機選擇下一個詞top_p=0.9, # 進一步限制模型生成時的詞匯選擇范圍,選擇一組概率累計達到p的詞匯,模型只會從這個概率集合中采樣clean_up_tokenization_spaces=True # 設置生成文本分詞時的空格是否保留
    )
    print(output)
    
    from datasets import load_dataset, load_from_disk# # 在線加載
    dataset = load_dataset("lansinuote/ChnSentiCorp", cache_dir="E:/DeepLearning/data")
    # # 保存為可本地加載的格式
    save_path = "E:/DeepLearning/data/my_chn_senti_corp"
    # dataset.save_to_disk(save_path)
    # 從本地加載
    loaded_dataset = load_from_disk(save_path)
    print(loaded_dataset)test_data = dataset["test"]
    print(test_data)
    for data in test_data:print(data)
    

    本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
    如若轉載,請注明出處:http://www.pswp.cn/web/90941.shtml
    繁體地址,請注明出處:http://hk.pswp.cn/web/90941.shtml
    英文地址,請注明出處:http://en.pswp.cn/web/90941.shtml

    如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

    相關文章

    cnn中池化層作用

    一、池化層概述 在卷積神經網絡中,池化層是核心組件之一,主要作用是逐步降低特征圖的空間尺寸即寬和高,從而減少計算量、控制過擬合并增強模型的魯棒性。 核心作用 降維與減少計算量 壓縮特征圖的尺寸,顯著減少后續層的參數數量和…

    寫一個音樂爬蟲

    今天我們寫一個網易云音樂的爬蟲,爬取網易云音樂熱歌榜音樂鏈接并下載,這里用到了之前引用的BeautifulSoup和requests。 BeautifulSoup是一個Python庫,用于從HTML和XML文件中提取數據。它提供了一種簡單的方式來遍歷文檔樹和搜索文檔樹中的元…

    戰斗公式和傷害走配置文件

    故事背景,上次屬性計算用的配置,這次傷害計算也走配置,下面是測試代碼和測試數據local formulas {[100001]{id 100001,name "基礎傷害",formula "function (self,tag,ishit,iscritial,counterratio)\n if ishit1 then\n …

    線性代數 上

    文章目錄線性代數知識整理一、求行列式1、 套公式2、利用性質,化為可套公式3、抽象行列式4、抽象向量二、代數余子式的線性組合三、求AnA^nAn四、證明A可逆五、求A的逆1、定義法2、初等變換3、公式六、求秩七、線性表示的判定八、線性無關九、求極大線性無關組十、等…

    紅帽AI推理服務器三大特點

    生成式人工智能(Gen AI)的迅猛發展,對大型語言模型(LLM)的部署提出了更高的性能、靈活性和效率要求。無論部署在何種環境中,紅帽AI推理服務器都為用戶提供經過強化并獲得官方支持的vLLM發行版,配…

    開始記錄一步步學習pcl

    安裝參考,大神寫的非常詳細,一步到位 https://blog.csdn.net/qq_36812406/article/details/144307648?ops_request_misc%257B%2522request%255Fid%2522%253A%25220e215e6ac266b90ded12ed6b2eab1257%2522%252C%2522scm%2522%253A%252220140713.13010233…

    Linux系統Centos7 安裝mysql5.7教程 和mysql的簡單指令

    目錄 一. 安裝 MySQL 官方 Yum 倉庫 二. 安裝 MySQL 5.7 1.查看可用的mysql版本倉庫 2.啟用MySql5.7倉庫 3.禁用更高版本的倉庫(可選) 4.導入 MySQL GPG 公鑰 5.安裝MySql5.7 三. 啟動 MySQL 服務 1.啟動 MySQL 服務 2. 設置開機自啟 3.查看服…

    嵌入式——C語言:指針③

    一、函數指針和指針函數(一)指針函數:是函數,函數的返回值是指針1.不能返回局部變量的值2.指針函數返回的地址可以作為下一個函數調用的參數(二)函數指針:是指針,指針指向一個函數in…

    OpenCV(05)直方圖均衡化,模板匹配,霍夫變換,圖像亮度變換,形態學變換

    【OpenCV(01)】基本圖像操作、繪制,讀取視頻 【OpenCV(02)】圖像顏色處理,灰度化,二值化,仿射變換 【OpenCV(03)】插值方法,邊緣填充&#xff0…

    常見的未授權訪問漏洞靶場-練習教程

    一.Redis未授權訪問漏洞1.首先需要準備一個vps和vulhub靶場,然后進入目錄。命令:進入靶場目錄:cd /etc/vulhub-master/redis/4-unacc 啟動靶場:docker-compose up -d2.然后啟動我們kali,下載redis服務然后連接redis,并執行命令。…

    EAP(基于事件的異步編程模式)

    📜 1. 核心思想 📌 事件驅動解耦 異步操作通過事件通知結果,調用者無需阻塞線程,通過事件處理器響應操作完成、錯誤或取消。 📌 線程池與UI線程協同 耗時操作在后臺線程池執行,完成后通過 SynchronizationC…

    【三橋君】如何解決后端Agent和前端UI之間的交互問題?——解析AG-UI協議的神奇作用

    ?你好,我是 ?三橋君? 📌本文介紹📌 >> 一、引言 在智能體(Agent)領域,MCP、A2A、ANP等協議已經規范了Agent與工具、Agent與Agent之間的通信,但Agent與用戶之間的交互一直缺乏標準化。…

    面試官:詳細說說Kafka rebalance 的策略以及具體過程

    hello啊,各位觀眾姥爺們!!!本baby今天又來報道了!哈哈哈哈哈嗝🐶 程序員各種工具大全 Kafka 的 Rebalance(再平衡) 是消費者組(Consumer Group)在消費者數量…

    C++入門自學Day2-- c++類與對象(初識)

    一、面向對象和面向過程1、什么是面向過程(Process-Oriented Programming, POP)📌 定義面向過程強調的是 過程(過程函數),即:按照步驟(流程)組織代碼。程序結構 數據結構…

    DAO組織智能合約開發:從理論到實踐

    目錄 DAO組織智能合約開發:從理論到實踐 1. DAO概述:去中心化自治組織 2. DAO核心組件設計 2.1 架構設計 2.2 關鍵智能合約 3. 治理代幣實現 3.1 ERC20擴展合約 4. 提案管理系統實現 4.1 提案狀態機 4.2 提案合約實現 5. DAO核心合約實現 5.1 DAO合約架構 5.2 提案類型擴展 6…

    Ubuntu系統完整配置教程

    Ubuntu系統完整配置教程 目錄 配置鏡像源安裝網絡服務虛擬機中安裝CUDAPython開發環境配置Java開發環境配置 1. 配置鏡像源 1.1 備份原始源文件 sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup1.2 編輯源文件 sudo nano /etc/apt/sources.list1.3 各大鏡像源…

    【mysql慢查詢】

    mysql慢查詢慢查詢慢查詢日志配置慢查詢 慢查詢是指執行時間超過指定閾值的SQL語句。在MySQL中,默認情況下執行時間超過10秒的查詢會被認為是慢查詢,但這個閾值可以根據需要進行調整。 慢查詢日志配置 -- 查看當前慢查詢配置 SHOW VARIABLES LIKE slo…

    django 按照外鍵排序

    在Django中,使用外鍵(ForeignKey)進行排序是一種常見的需求,特別是在處理數據庫關系時,如用戶和訂單之間的關系(一個用戶有多個訂單)。下面是如何在使用Django ORM時進行基于外鍵的排序。 定義模…

    JAVA_EIGHTEEN_特殊文件

    目錄 Properties屬性文件 XML的作用和應用場景 日志技術 Properties屬性文件 約束:只能是鍵值對 鍵不能重復 文件后綴一般是.properties結尾的 是一個Map集合(鍵值對集合) 核心作用:Properties是用來代表屬性文件的&#…

    第二十二節 MATLAB轉置向量、MATLAB追加向量

    MATLAB中轉置操作能夠將一個行向量改變成一個列向量,反之亦然。MATLAB中轉置操作使用一個單引號()來表示。詳細例子在MATLAB中建立一個腳本文件,輸入下述代碼:r [ 1 2 3 4 ]; tr r; v [1;2;3;4]; tv v; disp(tr); …