大模型,英文名叫Large Model,也被稱為基礎模型(Foundation Model)。我們通常說的大模型,主要指的是其中最常用的一類——大語言模型(Large Language Model,簡稱LLM)。除此之外,還有視覺大模型、多模態大模型等。所有這些類別合在一起,被稱為廣義的大模型;而狹義的大模型則特指「大語言模型」。
「大模型的本質」 本質是基于深度神經網絡的超大規模參數系統,通過對海量數據的訓練實現知識的壓縮與智能的涌現?。其核心在于利用巨大的參數規模(通常十億級以上)和復雜的網絡結構,模擬人腦的認知過程,從而完成多領域的智能任務。
「神經網絡的基礎」神經網絡是AI領域目前最基礎的計算模型。它通過模擬大腦中神經元的連接方式,能夠從輸入數據中學習并生成有用的輸出。
?