AI大模型:(一)1.大模型的發展與局限

? ? ? ?說起AI大模型不得不說下機器學習的發展史,機器學習包括傳統機器學習、深度學習,而大模型(Large Models)屬于機器學習中的深度學習(Deep Learning)領域,具體來說,它們通常基于神經網絡架構。

1.機器學習的發展史

? ? ? ?機器學習技術的發展歷程可以追溯到20世紀50年代,當時提出了感知機、神經網絡等概念。80年代末期,反向傳播算法的發明,給機器學習帶來了希望,掀起了基于統計模型的機器學習熱潮。21世紀以來,隨著數據量的增加、計算能力的提升和算法的改進,機器學習技術進入了深度學習時代,取得了令人矚目的成就。機器學習技術在很多領域都有應用,例如圖像識別、自然語言處理、推薦系統等,為人類社會帶來了巨大的價值和意義。

機器學習技術的發展可以分為以下幾個階段:

1. 早期階段:上世紀50年代到70年代初期,機器學習被視為人工智能的一個子領域。這個階段的主要方法是基于符號邏輯的推理和規則表達,例如專家系統、決策樹等。1943年Warren McCulloch和Walter Pitts就提出首個神經網絡模型,模擬神經元的工作方式。1949年Donald Hebb提出Hebbian學習理論,為神經網絡學習奠定了基礎。但1969年由于Marvin Minsky和Seymour Papert指出感知機的局限性,加之當時計算能力不足和數據稀缺限制了機器學習的發展,導致神經網絡研究陷入低谷。

2. 統計學習階段:20世紀80年代到90年代初期,機器學習開始采用統計學習方法,如最小二乘法、最大似然估計等。這個階段的代表性算法包括神經網絡、支持向量機、樸素貝葉斯等。但這個階段是已統計學習為主的階段,因為1990年開始神經網絡因計算復雜性和理論限制再次遇冷,研究轉向統計學習。

3.深度學習階段:2006年以來,隨著計算能力的提升和數據量的增加,深度學習開始崛起。深度學習是一種基于神經網絡的機器學習方法,可以處理大規模、高維度的數據。深度學習的代表性算法包括卷積神經網絡(CNN)、循環神經網絡(RNN)、生成對抗網絡(GAN)等。

4.現代發展階段:自2017年Transformer架構的提出,一統深度學習領域的江湖之后,徹底改變了自然語言處理領域,BERT、GPT等模型相繼問世。大規模預訓練模型(如GPT-3、GPT-4)在多個任務上表現出色,推動了通用人工智能(AGI)的研究。強化學習、自監督學習、聯邦學習等新興方向快速發展。

5.未來趨勢:研究如何讓機器具備更廣泛的智能,如AI與生物醫學、量子計算的融合。確保AI技術的公平性、透明性和安全性。目前大模型還有更大的挑戰這也是我們后邊要說的局限性。

2.GPT大模型發展歷程

? ? ? ?大模型的發展,必然離不開GPT,為什么要說他,不僅他是現在最優秀的模型之一。還因為他驗證了隨著模型尺寸變大、學習的知識更多,模型的性能會大幅提升。這就是OpenAI 在 2020 年發表的論文《Scaling Laws for Neural Language Models》中提出了 Scaling Laws。雖然這篇論文在2020年提出,但當時卻影響甚微。因為從GPT2開始部分閉源了,GPT3已經完全閉源,雖然在GPT3 中生成1750億相比GPT2 1.7億的參數有了100倍的能力提升,由于閉源,加之GPT只基于 Transformer 的解碼器(Decoder-only)架構,沒有編碼器部分,行業內也并未有太大的影響。直到2022 年 11 月,OpenAI 發布了基于 GPT 模型的人工智能對話應用服務ChatGPT。ChatGPT沿用了InstructGPT的訓練技術,并針對對話能力進行了優化。它結合了人類生成的對話數據進行訓練,展現出豐富的世界知識、復雜問題求解能力、多輪對話上下文追蹤與建模能力以及與人類價值觀對齊的能力。ChatGPT還支持插件機制,擴展了功能,超越了以往所有人機對話系統的能力水平,引發了社會的高度關注。雖然GPT沒有在技術上突破,但他用實踐證明了scaling laws。從ChatGPT發布后,行業內多家巨頭爭相大知識量訓練自家模型,也就短短幾個月讓模型學習全網人類幾百年的知識。灌注了大量的知識后,再進行微調,人類對齊就產生現在的通用大模型。現在百模齊放,離不開GPT的貢獻。OpenAI始終把創建安全、通用的大模型為自己的使命,他的成功有一定的偶然,但也是必然的。

3.大模型的發展局限性

? ? ? 大模型分為推理學習、數據學習,舉個相似的例子,推理學習和數據學習就像數據與物理的關系,正在輸出.....待完善!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/73838.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/73838.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/73838.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

rust學習筆記17-異常處理

今天聊聊rust中異常錯誤處理 1. 基礎類型&#xff1a;Result 和 Option&#xff0c;之前判斷空指針就用到過 Option<T> 用途&#xff1a;表示值可能存在&#xff08;Some(T)&#xff09;或不存在&#xff08;None&#xff09;&#xff0c;適用于無需錯誤信息的場景。 f…

Python:單繼承方法的重寫

繼承&#xff1a;讓類和類之間轉變為父子關系&#xff0c;子類默認繼承父類的屬性和方法 單繼承&#xff1a; class Person:def eat(self):print("eat")def sing(self):print("sing") class Girl(Person):pass#占位符&#xff0c;代碼里面類下面不寫任何東…

記錄一下aes加密與解密

該文章只做拓展后續會更新&#xff1b;如有出錯請指出 首先需要先引入相關依賴 crypto-js 然后直接開始存儲 export function aesEncrypt(message: string, key: string) {return aes.encrypt(message, key).toString(); } 之后是解密方式 function decrypt(content: any, key…

[免費]直接整篇翻譯pdf工具-支持多種語言

<閑來沒事寫篇博客填補中文知識庫漏洞> 如題&#xff0c;[免費][本地]工具基于開源倉庫&#xff1a; 工具 是python&#xff01;太好了&#xff0c;所以各個平臺都可以&#xff0c;我這里基于windows. 1. 先把github代碼下載下來&#xff1a; git clone https://githu…

UI設計中的用戶反饋機制:提升交互體驗的關鍵

hello寶子們...我們是艾斯視覺擅長ui設計和前端數字孿生、大數據、三維建模、三維動畫10年經驗!希望我的分享能幫助到您!如需幫助可以評論關注私信我們一起探討!致敬感謝感恩! 在數字化產品泛濫的今天&#xff0c;用戶與界面的每一次交互都在無形中塑造著他們對產品的認知。一個…

Hessian 矩陣是什么

Hessian 矩陣是什么 目錄 Hessian 矩陣是什么Hessian 矩陣的性質及舉例說明**1. 對稱性****2. 正定性決定極值類型****特征值為 2(正),因此原點 ( 0 , 0 ) (0, 0) (0,0) 是極小值點。****3. 牛頓法中的應用****4. 特征值與曲率方向****5. 機器學習中的實際意義**一、定義與…

Nginx 代理訪問一個 Web 界面時缺少內容

1. 資源路徑問題 Web 頁面中的靜態資源&#xff08;如圖片、CSS、JavaScript 文件&#xff09;可能使用了相對路徑或絕對路徑&#xff0c;而這些路徑在代理后無法正確加載。 解決方法&#xff1a; 檢查資源路徑&#xff1a;打開瀏覽器的開發者工具&#xff08;按 F12&#xf…

GPU視頻編解碼:Jetson VPI+multimedia_api視頻編解碼入門(一)

目錄 一.Pipline與工具棧 二.硬件設備概況 三.GPU視頻編解碼框架 四.VPI編譯使用實例 五. jetson_multimedia_api編譯使用實例 一.Pipline與工具棧 二.硬件設備概況 三.GPU視頻編解碼框架 jetson設備目前不支持VPF框架&#xff0c;關于VPF的使用我在下節PC段使用X86進行安…

《深入理解AOP編程:從基礎概念到Spring實現》

AOP編程 AOP(Aspect Oriented Programing) 面向切面編程 Spring動態代理開發 以切面為基本單位的程序開發&#xff0c;通過切脈你間的彼此協同&#xff0c;相互調用&#xff0c;完成程序構建 切面切入點額外功能 OOP(Object Oriented Programing)面向對象編程 java 以對象為基本…

C# 零基礎入門篇(19.DateTime 使用指南)

## 一、概述 DateTime 是 C# 中用于表示日期和時間的結構&#xff0c;位于 System 命名空間中。它提供了豐富的屬性和方法&#xff0c;用于處理日期和時間的創建、格式化、比較和計算。 ## 二、創建 DateTime 對象 ### &#xff08;一&#xff09;使用默認構造函數 DateTime…

Docker 實踐與應用舉例

一、引言 在當今快速發展的信息技術領域&#xff0c;容器化技術已成為推動軟件開發、部署和運維變革的關鍵力量。Docker 作為容器化技術的領軍者&#xff0c;以其高效、便捷、可移植等特性&#xff0c;被廣泛應用于各種場景。它能夠將應用程序及其依賴項打包成一個獨立的容器&…

C++初階——類和對象(一)

C初階——類和對象&#xff08;一&#xff09; 一、面向過程和面向對象 1.面向過程 面向過程的程序設計&#xff08;Procedure-Oriented Programming&#xff09;&#xff0c;簡稱POP&#xff0c;是一種是以程序執行流程為核心的編程范式。它是先分析出解決問題所需要的的步…

Skyeye 云智能制造辦公系統 VUE 版本 v3.15.13 發布

Skyeye 云智能制造&#xff0c;采用 Springboot winUI 的低代碼平臺、移動端采用 UNI-APP。包含 30 多個應用模塊、50 多種電子流程&#xff0c;CRM、PM、ERP、MES、ADM、EHR、筆記、知識庫、項目、門店、商城、財務、多班次考勤、薪資、招聘、云售后、論壇、公告、問卷、報表…

Obsidian Copilot:打造你的專屬 AI 筆記助手

Obsidian Copilot作為一款非常受歡迎的Obsidian插件&#xff0c;不僅極大地提升了用戶的筆記管理和信息檢索效率&#xff0c;還通過其多樣化的AI功能為用戶帶來了前所未有的便捷體驗。本文將詳細介紹Obsidian Copilot的核心特點、使用方法及個人體驗分享。 核心特點 Obsidian…

每日一題--計算機網絡

一、基礎概念類問題 1. TCP 和 UDP 的區別是什么&#xff1f; 回答示例&#xff1a; TCP&#xff1a;面向連接、可靠傳輸&#xff08;通過三次握手建立連接&#xff0c;丟包重傳&#xff09;、保證數據順序&#xff08;如文件傳輸、網頁訪問&#xff09;。 UDP&#xff1a;無…

使用 Spring 的 FactoryBean 創建和獲取 Bean 對象

在Spring框架中&#xff0c;FactoryBean接口提供了一種強大的機制來創建復雜的bean實例。本文將基于提供的代碼示例&#xff0c;詳細介紹如何通過FactoryBean創建bean對象&#xff0c;并展示如何獲取這些bean實例以及它們所屬的FactoryBean實例。 示例代碼類 定義 MyBean 接口…

制造業數字化轉型,汽車裝備制造企業數字化轉型案例,智能制造數字化傳統制造業數字化制造業數字化轉型案例

《某制造業企業信息化整體解決方案》PPT展示了一個汽車裝備企業的整體信息化解決方案&#xff0c;闡述了該企業的業務特點和現狀&#xff0c;主要包括按訂單生產、多級計劃和產品跟蹤等&#xff0c;分析了信息化建設的主要困難&#xff0c;如信息管理手工化、過程數據追溯困難、…

軟鏈接 使用筆記 linux命令 if判斷

目錄 1>0判斷怎么寫&#xff1a; 1. 使用 [ ] 進行數值比較&#xff1a; 2. 使用 (( )) 進行數學運算&#xff1a; 3. 使用 [[ ]]&#xff08;主要用于字符串比較&#xff0c;不推薦用于數學運算&#xff09;&#xff1a; 軟鏈接 使用筆記 1>0判斷怎么寫&#xff1a…

pycharm-python國際象棋遊戲代碼

嗯&#xff0c;用戶的問題是“pycharm寫關於python國際象棋遊戲代碼”&#xff0c;也就是要用PyCharm來寫一個Python的國際象棋游戲代碼。我需要先整理一下用戶提供的搜索結果&#xff0c;看看有什么相關的信息可以利用。 首先看搜索結果中的各個網頁內容。網頁1主要講的是象棋…

【Film】MovieAgent:自動化電影生成通過多智能體CoT規劃

論文概覽 自動化電影生成根據劇本概要和角色庫創建具有一 致角色、同步字幕和音頻的長篇視頻。它涉及自動化敘 事規劃、場景結構化, 和鏡頭構圖,復制現實世界電影制作的層次推理。 核心貢獻 提出MovieAgent,通過多智能體鏈式思維(CoT)規劃實現自動化電影生成。首次探索并…