AI大模型探索之路-基礎篇5:GLM-4解鎖國產大模型的全能智慧與創新應用

目錄

  • 前言
  • 一、GLM4大模型總體概述
  • 二、GLM4和GPT4功能對比
  • 三、GLM4和GPT4性能對比
    • 1、基礎能力(英文)
    • 2、指令跟隨能力
    • 3、對齊能力
    • 4、長文本能力
    • 5、多模態-文生圖
  • 四、GLM-4 ALL Tools
    • 1、文生圖
    • 2、代碼解釋器
    • 3、網頁瀏覽
    • 4、Function Call
    • 5、多工具自動調用
  • 五、開發者平臺對比
  • 六、大模型生態對比
  • 七、開放平臺注冊使用
    • 1、賬號注冊
    • 2、生成API KEY
    • 3、額度查看
    • 4、知識庫
    • 5、應用中心
    • 6、體驗中心
    • 7、知識庫應用測試
  • 八、API簡單測試
  • 總結


前言

隨著人工智能技術的飛速發展,大型預訓練語言模型已成為推動行業進步的重要力量。它們在理解自然語言、生成文本、執行復雜任務等方面展現出驚人的能力。在此背景下,國產大模型GLM-4的問世,不僅展現了中國在AI領域的實力,也為國內外研究者和開發者提供了新的研究與應用平臺。

一、GLM4大模型總體概述

在這里插入圖片描述

北京時間2024年1月16日,標志著國內人工智能重要進展的一刻,清華智譜AI在舉辦 developers 大會時,向公眾介紹了全新一代的基座模型——GLM-4。這一模型不僅性能卓越,更加入了創新的“ALL Tools”功能,同時發布了配套工具GLMS和API接口GLM-4-API,并啟動了GLM-4Assistant API的邀請內測,體現了其在多方面的應用潛力。
1)模型功能方面:新一代的GLM-4是一個長文本多模態的大模型,具有128K的長對話上下文長度,支持豐富的應用如圖文互譯、自動代碼執行、聯網操作以及穩定的全自動Function call。這些特性使得GLM-4成為一個多功能且強大的智能系統
2)模型性能方面:GLM-4的整體性能相比前代GLM-3有了顯著提升,提升了60%,其綜合能力已接近世界頂尖模型Gemini Ultra和GPT-4,特別是在中文處理能力上甚至超越了GPT-4,堪稱國產版的GPT-4。

二、GLM4和GPT4功能對比

在這里插入圖片描述
GLM-4擁有類似ChatGPT ALL Tools功能,可以識別用戶意圖,靈活調用不同功能可以根據人類意圖,靈活調用CoaView3進行繪圖與修改、調用代碼解釋器完成復雜計算、調用Function cal來調用外部工具AP1、聯網、以及多工具組合調用;
目前ALL Tools功能只能在智譜清言中使用,暫時無法通過調用API實現,估計之后會在GLM AssistantAPI中實現
智譜清言
s://chatglm.cn/

三、GLM4和GPT4性能對比

在各項評測中,GLM-4的性能表現幾乎達到GPT-4的95%,尤其在中文對齊能力方面有著超越的表現。無論是基礎能力(英文)、指令跟隨能力、對齊能力還是長文本處理能力,GLM-4都顯示出了與GPT-4相匹敵甚至超越的水平。此外,在多模態文生圖方面,GLM-4也表現出色,與DALLE3相當。

1、基礎能力(英文)

GLM-4 在 MMLU、GSM8K、MATH、BBH、HellaSwag、HumanEval 等數據集上,分別達到 GPT-4 94%、95%、91%、99%、90%、100%的水平。
在這里插入圖片描述

2、指令跟隨能力

GLM-4 在 IFEval 的 prompt 級別上中、英分別達到 GPT-4 的88%、85%的水平,在 Instruction 級別上中、英分別達到 GPT-4 的90%、89%的水平。
在這里插入圖片描述

3、對齊能力

GLM-4 在中文對齊能力上整體超過 GPT-4。
在這里插入圖片描述

4、長文本能力

我們在 LongBench(128K)測試集上對多個模型進行評測,GLM-4 性能超過 Claude 2.1;在「大海撈針」(128K)實驗中,GLM-4 的測試結果為 128K 以內全綠,做到100%精準召回。
在這里插入圖片描述

5、多模態-文生圖

CogView3 在文生圖多個評測指標上,相比 DALLE3 約在 91.4% ~99.3%的水平之間。
在這里插入圖片描述

四、GLM-4 ALL Tools

GLM-4能夠根據用戶的指令自主理解和規劃任務,自由調用網頁瀏覽器、代碼解釋器和多模態文生圖等工具完成復雜任務。這包括基于上下文的AI繪畫創作、復雜計算任務的自動代碼執行、高效的網頁信息檢索等。此外,GLM-4還支持多工具的自動調用,進一步提高了處理復雜問題的能力。

簡單來講,即只需一個指令,GLM-4 會自動分析指令,結合上下文選擇決定調用合適的工具。

1、文生圖

利用CogView3,GLM-4不只是能夠生成圖像,它還可以根據用戶提供的詳細文本描述進行創作。更為驚人的是,它可以在多次迭代中接受用戶的反饋,實時調整圖像細節,直至用戶滿意為止。這一過程涉及到復雜的視覺理解與圖像生成技術,而GLM-4能夠無縫地完成這一切。
在這里插入圖片描述

2、代碼解釋器

GLM-4 能夠通過自動調用 python 解釋器,進行復雜計算(例如復雜方程、微積分等),在 GSM8K、MATH、Math23K 等多個評測集上都取得了接近或同等 GPT-4 All Tools 的水平。
在這里插入圖片描述

通過內置的代碼解釋器,GLM-4可以執行復雜的程序代碼。無論是高級的數據分析任務還是需解決特定數學問題的算法,GLM-4都能提供開箱即用的解決方案。此外,它還能夠處理多線程和復雜控制流,這使得它能夠應對實際開發中的復雜場景。

3、網頁瀏覽

GLM-4 能夠自行規劃檢索任務、自行選擇信息源、自行與信息源交互,在準確率上能夠達到 78.08,是 GPT-4 All Tools 的116%。
在這里插入圖片描述

GLM-4的網頁瀏覽功能使它成為一個強大的信息檢索工具。模型可以自主地在互聯網上搜索信息、篩選相關數據,并直接與網頁內容交云,從而提供最新最準確的信息響應用戶查詢。

4、Function Call

GLM-4 能夠根據用戶提供的 Function 描述,自動選擇所需 Function 并生成參數,以及根據 Function 的返回值生成回復;同時也支持一次輸入進行多次 Function 調用,支持包含中文及特殊符號的 Function 名字。這一方面 GLM-4 All Tools 與 GPT-4 Turbo 相當。

在這里插入圖片描述

通過Function Call功能,GLM-4可以接受一個函數的描述,然后自動找到對應的函數并產生恰當的參數來執行它。這意味著即使用戶不具備編程知識,也能夠利用GLM-4完成一系列專業任務。此外,對于需要多次執行的命令,GLM-4支持批量處理,極大提高了效率。

5、多工具自動調用

在處理一些需要綜合利用多種工具才能解決的問題時,GLM-4展現了其卓越的聯合作戰能力。例如,一個復雜的問題可能需要網絡搜索獲取信息、代碼解釋器計算結果以及文生圖來制作圖表展示。GLM-4可以流暢地在這些工具之間切換,無需用戶進行任何額外的操作或指令輸入,所有的工作都在后臺自動完成。
在這里插入圖片描述

五、開發者平臺對比

GPT有提供給開發人員使用的API開發者平臺,我們注冊后可以進行ChatGPT的體驗,獲取API KEY調用相關API,實現自己的AI應用開發。
在這里插入圖片描述

為了方便開發者利用這些高級功能,清華智譜提供了MaaS開放平臺,類似于OpenAI的API開發者平臺。對于國內用戶而言,GLM的平臺更為便捷,不受網絡限制。
在這里插入圖片描述

六、大模型生態對比

清華智譜在生態上基本上完全對標OpenAI來打造的,例如有對標ChatGPT的智譜清言,有對標GPT4的GLM4; 也有對比GPTs的GLMs,另外GLM也有開發自己的Store,以及后面推出GLM4-Assistant API。

智譜清言OpenAI
GLM-4GPT-4
GLMsGPTs
GLM StoreGPT Store
GLM-4 Assistant APIOpenAI Assistant API

七、開放平臺注冊使用

開放平臺的注冊過程簡單明了,用戶注冊后,并獲得初始的API KEY。新用戶會獲得一定額度的免費token,以便測試和使用。充值也極為方便,支持微信和支付寶支付。此外,開放平臺上還有知識庫和應用中心等功能,允許用戶上傳自己的知識庫,并在無代碼的環境中開發應用。體驗中心則可以讓用戶直接體驗大模型的功能,進行實際的對話和測試。

1、賬號注冊

首先,用戶需要通過https://open.bigmodel.cn/login訪問開放平臺的注冊頁面。這個過程非常直觀和友好,不需要特殊的網絡技巧,確保了國內外的用戶都能輕松進入。完成注冊后,用戶將獲得一個賬戶,這是開啟GLM-4之旅的第一步。
在這里插入圖片描述

2、生成API KEY

擁有賬戶后,用戶登錄平臺并自動獲得一個獨一無二的API KEY,這是調用GLM-4 API的憑證。如果需要,用戶還可以在賬戶設置中生成更多的API KEY,或對已有的KEY進行管理,以滿足不同開發環境和場景的需要。
在這里插入圖片描述

3、額度查看

開放平臺為用戶提供了一個初始的免費token額度,讓用戶能夠體驗GLM-4的功能而無需擔心費用。一旦用戶的免費額度用完,可以通過微信或支付寶等便捷的支付方式進行充值,這既方便又安全。
在這里插入圖片描述

4、知識庫

知識庫是應用開發的核心,尤其是在構建智能問答系統時。開放平臺向用戶提供了易于操作的界面來上傳和管理自己的知識庫。這些知識庫可以包含結構化數據、文檔、圖片等,用于訓練模型或增強其回答質量。
在這里插入圖片描述

知識庫準備:自己本地整理一個word或者PDF的問答類的知識庫信息,如下:
在這里插入圖片描述

5、應用中心

在應用中心,用戶可以發現如何無代碼創建自己的AI應用。平臺提供了詳細的指導和模板,使得即便是沒有編程背景的用戶也能夠利用GLM-4的能力,打造個性化的AI服務。

比如我們前面很多篇章中講到的知識庫應用;提前準備好知識庫;填寫好相關機器人應用的信息,即可在體驗中心進行體驗使用。

在這里插入圖片描述

6、體驗中心

為了測試和展示大模型的能力,體驗中心提供了多種預設的場景和應用示例。用戶可以直接與GLM-4進行互動,體驗它的多功能性。同時,用戶也可以從體驗中心切換到自己定制的應用,實時觀察和評估它們的性能。
同時在體驗中心,我們可以體驗大模型的功能,進行對話聊天;也可以從右側菜單欄中,切換為應用
在這里插入圖片描述

切換為應用后,就可以看到我們前面自己創建的額“問答測試機器人了”,可以直接進行體驗測試;另外也可以在右邊欄中查看關聯的知識庫情況。
在這里插入圖片描述

7、知識庫應用測試

當用戶基于自己的知識庫對模型進行提問時,可以準確評估GLM-4對于特定信息的處理能力。這種測試不僅可以用來檢驗模型的效果,還能夠幫助用戶理解和改善知識庫的結構和內容,以獲得更優的用戶體驗。
對自己前面上傳的知識庫,進行問答測試,發現精準度還是非常高的。
在這里插入圖片描述

八、API簡單測試

安裝依賴

pip install --upgrade zhipuai

請求示例

from zhipuai import ZhipuAI
client = ZhipuAI(api_key="") # 填寫您自己的APIKey
response = client.chat.completions.create(model="glm-4",  # 填寫需要調用的模型名稱messages=[{"role": "user", "content": "作為一名營銷專家,請為智譜開放平臺創作一個吸引人的slogan"},{"role": "assistant", "content": "當然,為了創作一個吸引人的slogan,請告訴我一些關于您產品的信息"},{"role": "user", "content": "智譜AI開放平臺"},{"role": "assistant", "content": "智啟未來,譜繪無限一智譜AI,讓創新觸手可及!"},{"role": "user", "content": "創造一個更精準、吸引人的slogan"}],
)
print(response.choices[0].message)

輸出:

{"created": 1703487403,"id": "8239375684858666781","model": "glm-4","request_id": "8239375684858666781","choices": [{"finish_reason": "stop","index": 0,"message": {"content": "智繪藍圖,AI驅動 —— 智譜AI,讓每一刻創新成為可能。","role": "assistant"}}],"usage": {"completion_tokens": 217,"prompt_tokens": 31,"total_tokens": 248}
}

總結

GLM-4的推出不僅是國產AI技術的一大飛躍,也為國內外的研究者和開發者提供了更多的可能性。其強大的功能和卓越的性能,無疑將在未來的AI領域中發揮重要作用。隨著開放平臺的不斷完善和大模型生態的逐漸成熟,我們有理由期待GLM-4將帶來更多的創新和應用。

在這里插入圖片描述

🎯🔖更多專欄系列文章:AIGC-AI大模型探索之路

如果文章內容對您有所觸動,別忘了點贊、?關注,收藏!加入我,讓我們攜手同行AI的探索之旅,一起開啟智能時代的大門!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/15536.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/15536.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/15536.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【學習筆記】關于建模時需要調整的變量

在進行回歸分析時,選擇調整變量(也就是模型中的協變量)需要謹慎考慮。調整的變量并不一定必須是混雜因素,但通常情況下,目的是為了控制那些可能扭曲主要自變量和因變量關系的混雜因素。除了混雜因素,還有幾…

C語言之指針進階(3),函數指針

目錄 前言: 一、函數指針變量的概念 二、函數指針變量的創建 三、函數指針變量的使用 四、兩段特殊代碼的理解 五、typedef 六、函數指針數組 總結: 前言: 本文主要講述C語言指針中的函數指針,包括函數指針變量的概念、創建…

【面試干貨】事務的并發問題(臟讀、不可重復讀、幻讀)與解決策略

【面試干貨】事務的并發問題(臟讀、不可重復讀、幻讀)與解決策略 一、臟讀(Dirty Read)二、不可重復讀(Non-repeatable Read)三、幻讀(Phantom Read)四、總結 💖The Begi…

Stable Diffusion——U-ViT用于擴散建模的 ViT 主干網

1.概述 擴散模型是最近出現的強大的深度生成模型,可用于生成高質量圖像。擴散模型發展迅速,可應用于文本到圖像生成、圖像到圖像生成、視頻生成、語音合成和 3D 合成。 除了算法的改進,骨干網的改進在擴散建模中也發揮著重要作用。一個典型…

nginx代理前端html

正常配置,通過www.example.com或192.168.20.12:80訪問server {listen 80;server_name example.com www.example.com;root /var/www/html;index index.html index.htm;location / {try_files $uri $uri/ 404;} }解釋: listen 80;:監聽 HTTP 端…

汽車R155法規中,汽車獲取到的VTA證書,E后面的數字表示什么意思?

標簽: 汽車R155法規中,汽車獲取到的VTA證書,E后面的數字表示什么意思?; 汽車;VTA認證; 有些廠商汽車拿到的VTA證書上面寫著E9, 有些廠商汽車拿到的VTA證書上面寫著E5,E9與E5有什么差…

嵌入式之音頻基礎知識

聲音特性 1、響度:人主觀上感覺聲音的大小(俗稱音量),由“振幅”和人離聲源的距離決定,振幅越大響度越大,人和聲源的距離越小,響度越大; 2、音調:聲音的高低&#xff0…

多商戶消費券系統源碼(ThinkPHP+FastAdmin+微信公眾號)

打造智能促銷新體驗 一、引言:消費券系統的時代意義 在當今這個數字化高速發展的時代,電子商務和移動支付已經成為人們日常生活的重要組成部分。隨著市場競爭的加劇,多商戶消費券系統作為一種創新的促銷手段,正逐漸受到商家和消…

k8s筆記 | helm包管理

什么是Helm kubenetes包管理器,是查找,分享和使用軟件構件 kubernetes的最佳方式; 可以做什么 從頭開始創建新的chart將chart打包成歸檔(tgz)文件與存儲chart的倉庫進行交互與現有的kubernates集群中安裝和卸載chart管理與Helm一起安裝的 …

從零訓練yolov8

1.收集數據 2.數據標注 pip install labelimg3.劃分數據集 0.2的驗證機0.8的訓練集 import os from shutil import copyfile from sys import exit import randomsource r"D:\Data\imgs\screenc" \\ target_train r"D:\Data\imgs\datasets\mydata\images\t…

aws msk加密方式和問控制連接方式

msk加密方式 msk提供了兩種加密方式 靜態加密傳輸中加密 創建集群時可以指定加密方式,參數如下 aws kafka create-cluster --cluster-name "ExampleClusterName" --broker-node-group-info file://brokernodegroupinfo.json --encryption-info file:/…

Android四大組件 Broadcast廣播機制

一 概述 廣播 (Broadcast) 機制用于進程或線程間通信,廣播分為廣播發送和廣播接收兩個過程,其中廣播接收者 BroadcastReceiver 是 Android 四大組件之一。BroadcastReceiver 分為兩類: 靜態廣播接收者:通過 AndroidManifest.xm…

flutter 實現旋轉星球

先看效果 planet_widget.dart import dart:math; import package:flutter/material.dart; import package:vector_math/vector_math_64.dart show Vector3; import package:flutter/gestures.dart; import package:flutter/physics.dart;class PlanetWidget extends StatefulW…

echarts-樹圖、關系圖、桑基圖、日歷圖

樹圖 樹圖主要用來表達關系結構。 樹圖的端點也收symbol的調節 樹圖的特有屬性: 樹圖的方向: layout、orient子節點收起展開:initialTreeDepth、expandAndCollapse葉子節點設置: leaves操作設置:roam線條&#xff1a…

告別 Dart 中的 Future.wait([])

作為 Dart 開發人員&#xff0c;我們對異步編程和 Futures 的強大功能并不陌生。過去&#xff0c;當我們需要同時等待多個 future 時&#xff0c;我們依賴 Future.wait([]) 方法&#xff0c;該方法返回一個 List<T>。然而&#xff0c;這種方法有一個顯著的缺點&#xff1…

2、xss-labs之level2

1、打開頁面 2、傳入xss代碼 payload&#xff1a;<script>alert(xss)</script>&#xff0c;發現返回<script>alert(xss)</script> 3、分析原因 打開f12&#xff0c;沒什么發現 看后端源碼&#xff0c;在這form表單通過get獲取keyword的值賦給$str&am…

跑大模型的經驗

LLama2: 1. 使用torchrun來跑&#xff1a; torchrun --nproc_per_node 1 example_text_completion.py \--ckpt_dir llama-2-7b/ \--tokenizer_path tokenizer.model \--max_seq_len 128 --max_batch_size 4 關于集群分布式torchrun命令踩坑記錄&#xff08;自用&#xff09;…

【Vue】input框自動聚焦且輸入驗證碼后跳至下一位

場景&#xff1a;PC端 樣式&#xff1a; <div class"verification-code-input"><input v-model"code[index]" v-for"(_, index) in 5" :key"index" type"text" maxlength"1" input"handleInput(i…

渲染管線——應用階段

知識必備——CPU和GPU 應用階段都做了什么 應用階段為渲染準備了什么 1.把不可見的數據剔除 2.準備好模型相關數據&#xff08;頂點、法線、切線、貼圖、著色器等等&#xff09; 3.將數據加載到顯存中 4.設置渲染狀態&#xff08;設置網格需要使用哪個著色器、材質、光源屬性等…

說些什么好呢

大一&#xff1a;提前學C和C。學完語法去洛谷或者Acwing二選一&#xff0c;刷300道左右題目。主要培養編程思維&#xff0c;讓自己的邏輯能夠通過代碼實現出來。 現在對算法有點感興趣但是沒有天賦&#xff0c;打不了acm&#xff0c;為就業做準備咯。 大二(算法競賽)&#xff1…