昇思25天學習打卡營第17天|文本解碼原理--以MindNLP為例

文本解碼就是根據當前已經輸入的內容不斷地預測下一個詞,前期通過大量的文本文章等輸入,讓模型學習好以后,根據已學習的內容,不斷預測下一個詞。就像鸚鵡學舌一樣你不斷的叫他說你好大帥哥,你好大帥哥。后面某一天,當你說你好的時候,他會自然的接著說大帥哥。文本解碼同理。
不過內容量會大很多,除了會說你好大帥哥,也會說你好大美女。那AI是怎么知道應該說哪個。他會看前文,因為我們喂給他文章里面,“女”這個詞總是關聯出現大美女,所以當前面出現女,接著說你好的時候,他就知道大美女的概率高于大帥哥,就是優先出現大帥哥。

import mindspore
from mindnlp.transformers import GPT2Tokenizer, GPT2LMHeadModeltokenizer = GPT2Tokenizer.from_pretrained("iiBcai/gpt2", mirror='modelscope')# add the EOS token as PAD token to avoid warnings
model = GPT2LMHeadModel.from_pretrained("iiBcai/gpt2", pad_token_id=tokenizer.eos_token_id, mirror='modelscope')# encode context the generation is conditioned on
input_ids = tokenizer.encode('I enjoy walking with my cute dog', return_tensors='ms')mindspore.set_seed(0)
# set top_k = 50 and set top_p = 0.95 and num_return_sequences = 3
sample_outputs = model.generate(input_ids,do_sample=True,max_length=50,top_k=5,top_p=0.95,num_return_sequences=3
)print("Output:\n" + 100 * '-')
for i, sample_output in enumerate(sample_outputs):print("{}: {}".format(i, tokenizer.decode(sample_output, skip_special_tokens=True)))
Output:
----------------------------------------------------------------------------------------------------
0: I enjoy walking with my cute dog."My dog loves the smell of the dog. I'm so happy that she's happy with me."I love to walk with my dog. I'm so happy that she's happy
1: I enjoy walking with my cute dog. I'm a big fan of my cat and her dog, but I don't have the same enthusiasm for her. It's hard not to like her because it is my dog.My husband, who
2: I enjoy walking with my cute dog, but I'm also not sure I would want my dog to walk alone with me."She also told The Daily Beast that the dog is very protective."I think she's very protective of

類似 這個示例,當輸入I enjoy walking with my cute dog的時候,AI會一直續寫下去,總體看上去,效果還是很不錯的。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/44255.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/44255.shtml
英文地址,請注明出處:http://en.pswp.cn/web/44255.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

好用的源代碼加密軟件有哪些?5款源代碼防泄密軟件推薦

源代碼作為軟件產品的核心組成部分,其安全性直接關系到整個軟件系統的安全。源代碼的泄露可能導致企業的技術秘密暴露,商業競爭力下降,甚至可能引發經濟損失和法律責任問題。因此,對源代碼進行加密保護,已經成為企業不…

windows安裝啟動mysql8.0版本的簡單流程

1.下載mysql8.0.25版本 MySQL :: Download MySQL Community Server (Archived Versions) 2.解壓到D盤的mysql文件夾,并修改環境變量 配置環境變量: winr鍵>輸入control system>高級系統設置>點擊環境變量 雙擊path后,新建 將bin目錄粘貼進去,再點擊確定 在cmd命令行…

【JavaScript 報錯】未定義的變量或函數:Uncaught ReferenceError

🔥 個人主頁:空白詩 文章目錄 一、錯誤原因分析1. 變量未定義2. 函數未定義3. 塊級作用域問題 二、解決方案1. 確保變量已定義2. 確保函數已定義3. 正確使用塊級作用域 三、實例講解四、總結 在JavaScript開發中,Uncaught ReferenceError 是一…

C#使用異步方式調用同步方法的實現方法

使用異步方式調用同步方法,在此我們使用異步編程模型(APM)實現 1、定義異步委托和測試方法 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading; using System.Threading.Task…

算法學習day10(貪心算法)

貪心算法:由局部最優->全局最優 貪心算法一般分為如下四步: 將問題分解為若干個子問題找出適合的貪心策略求解每一個子問題的最優解將局部最優解堆疊成全局最優解 一、擺動序列(理解難) 連續數字之間的差有正負的交替&…

Maven Nexus3 私服搭建、配置、項目發布指南

maven nexus私服搭建 訪問nexus3官方鏡像庫,選擇需要的版本下載:Docker Nexus docker pull sonatype/nexus3:3.49.0 創建數據目錄并賦權 sudo mkdir /nexus-data && sudo chown -R 200 /nexus-data 運行(數據目錄選擇硬盤大的卷進行掛載) …

mysql快速精通(五)數據庫備份與還原

主打一個實用 對于重要數據我們常常進行備份以應對突發情況,以下使用Navicat對數據進行備份,想了解sql語句的自尋 備份?? 還原??

自動化回復信息工具的開發分享!

在當今信息爆炸的時代,無論是個人還是企業,都面臨著大量的信息處理和回復工作,為了提高效率,自動化回復信息工具變得越來越重要。 本文旨在分享一個簡單但實用的自動化回復信息工具的五段源代碼開發過程,幫助讀者理解…

DNS正向解析,反向解析

目錄 一、正向解析 1.下載DNS軟件包 2.修改主配置文件 3.創建區域文件 4.配置DNS 5.測試 二、反向解析 1.修改主配置文件 2.創建區域文件 3.測試 一、正向解析 1.下載DNS軟件包 [rootwww ~]# yum indtall -y bind注意: 下載軟件前需要配置倉庫&…

DolphinScheduler本地安裝部署與遠程任務調度管理實踐應用

文章目錄 前言1. 安裝部署DolphinScheduler1.1 啟動服務 2. 登錄DolphinScheduler界面3. 安裝內網穿透工具4. 配置Dolphin Scheduler公網地址5. 固定DolphinScheduler公網地址 前言 本篇教程和大家分享一下DolphinScheduler的安裝部署及如何實現公網遠程訪問,結合內…

自動駕駛AVM環視算法--540度全景的算法實現和exe測試demo

參考:金書世界 540度全景影像是什么 540度全景影像是在360度全景影像基礎上的升級功能,它增加了更多的攝像頭來收集周圍的圖像數據。通常,這些攝像頭分布在車輛的更多位置,例如車頂、車底等,以便更全面地捕捉車輛周圍…

無人機游學技術及前景分析

一、技術概述 無人機,即無人駕駛飛行器,通過遠程控制或自主飛行控制系統進行操作。隨著科技的快速發展,無人機技術日益成熟,不僅廣泛應用于軍事偵察、打擊等領域,也逐漸滲透到民用市場,包括農業植保、影視…

PostgreSQL17索引優化之支持并行創建BRIN索引

PostgreSQL17索引優化之支持并行創建BRIN索引 最近連續寫了幾篇關于PostgreSQL17優化器改進的文章,其實感覺還是挺有壓力的。對于原理性的知識點,一方面是對這些新功能也不熟悉,為了盡可能對于知識點表述或總結做到準確,因此需要…

華為認證試題有題庫嗎?華為認證題庫怎么領取?

在競爭激烈的就業環境下,若你擁有華為認證將可以提高個人綜合能力,更好的適應行業變化。相信大家都有聽說過想考取華為初級認證并不困難,因為它有專門的題庫供考生備考。 那么,到底華為認證試題有題庫嗎?華為認證題庫要怎么領取…

java并發編程之美-第1章 并發編程線程基礎-線程的創建與運行

文章目錄 1.什么是線程2. 線程創建和運行 1.什么是線程 進程是操作系統進行資源分配和調度的基本單位,線程是 CPU 分配的基本單位。 程序計數器用來記錄線程當前要執行的指令地址。CPU一般是使用時間片輪轉方式讓線程輪詢占用的,程序計數器是記錄線程…

【Django】報錯‘staticfiles‘ is not a registered tag library

錯誤截圖 錯誤原因總結 在django3.x版本中staticfiles被static替換了,所以這地方換位static即可完美運行 錯誤解決

callBack方式實現threejs點擊事件Raycaster

我用的的示例類發方式來初始化場景。 類里面定義點擊方法。 initMouse(fun) {window.addEventListener("click", (event) > {this.clickObject(event, fun);});}// 鼠標事件clickObject(event, fun) {// 計算點擊位置的歸一化設備坐標const mouse new THREE.Ve…

IO模型理論學習

1、什么是IO 計算機視角下的io AIO

“泰迪·曲靖師范學院數學與統計學院數據科學教學實訓平臺”工作室簽約揭牌儀式圓滿結束

為深化校企合作,實現應用型人才培養目標。泰迪智能科技攜手曲靖師范學院數學與統計學院共建“數據科學教學實訓平臺工作室”。 2024年7月10日,“?泰迪數學與統計學院數據科學教學實訓平臺”工作室揭牌儀式在曲靖師范學院舉行。泰迪智能科技昆明分公司院…

LPRNet 車牌識別部署 rk3588(pt-onnx-rknn)包含各個步驟完整板端代碼

雖然車牌識別技術很成熟了,但完全沒有接觸過。一直想搞一下、整一下、試一下、折騰一下,工作之余找了一個簡單的例子入個門。本博客簡單記錄一下 LPRNet 車牌識別部署 rk3588流程,訓練參考 LPRNet 官方代碼。 1、導出onnx ??導出onnx很容易…