🔥 先說明,不是廣子,不是廣子!!!單純分享這個工具給大家,畢竟最近使用 DeepSeek 太容易崩了,每天深度思考一次之后就開始轉圈圈用不了,然后就找到了這個工具使用
一、前言 – DeepSeek
最近大家都知道DeepSeek 最近非常非常火🔥,我看了一下 DeepSeek 的深度思考推理能力是大家最喜歡用的一個功能,也是它相比于其他 AI 更加高明的情況,我們官網現在所用的 DeepSeek
一般指的就是最新的版本 DeepSeek-V3
但是一個 AI 它總有進階的過程吧,就類似于我們用的豆包一樣,基于大數據的搜索,此時我們看到的 DeepSeek
就是處于 DeepSeek-V3
的時期,
那么 deepseek-V3
和 deepseek-R1
的區別在哪?
- DeepSeek-V3(基礎模型) + 推理能力(訓練) = DeepSeek-R1
相當于 DeepSeek-V3
就是基礎智商,而 R1 就是基于基礎智商訓練得到 DeepSeek-R1
DeepSeek-V3
:通用的自然語言處理模型
- DeepSeek V3 采用混合專家(MoE)架構,主要面向自然語言處理(NLP)任務,旨在提供高效、可擴展的解決方案。
- 其優勢在于高效的多模態處理能力(文本、圖像、音頻、視頻)和較低的訓練成本(557.6萬美元,僅需2000塊H800 GPU)。
- 在基準測試中,V3的表現接近GPT-4o和Claude-3.5-Sonnet,但更注重綜合場景的適用性。
DeepSeek-R1
:專注于高級推理任務
- 專為復雜推理任務設計,強化在數學、代碼生成和邏輯推理領域的性能。
- 通過大規模強化學習(RL)和冷啟動技術,R1在無需大量監督微調(SFT)的情況下,實現了與OpenAI o1系列相當的推理能力。
二、初步介紹
如果要使用的話,可以去 Qwen官網,或者 阿里云百煉,都是可以的
【獲得 Qwen 的 API】:教程
通義千問(Qwen):由阿里巴巴集團旗下的通義實驗室自主研發的超大規模語言模型。
以下是其一些核心特點和優勢:
1、多語言支持
- 支持多種語言,包括但不限于中文、英文、法語、西班牙語、葡萄牙語、俄語、阿拉伯語、日語、韓語、越南語、泰語、印尼語等。
- 可以為全球用戶提供服務,并在跨語言交流中表現出色。
2、強大的對話能力
- 經過大量訓練,能夠進行自然流暢的多輪對話,理解上下文關系,保持對話連貫性。
- 在開放域問答、任務型對話、情感陪伴等方面表現優異。
3、豐富的知識庫
- 基于阿里巴巴集團內部的歷史積累以及互聯網上的海量數據進行訓練,擁有廣泛的知識覆蓋范圍。
- 可以回答從科學常識到最新技術趨勢的各種問題。
4、內容生成能力
- 擅長生成各種類型的內容,例如文章、詩歌、故事、劇本、郵件、報告等。
同時還具備代碼寫作能力,可以理解和生成多種編程語言的代碼片段。
三、深入了解
1, Qwen vs DeepSeek
Qwen2.5-Max
其實也是類似于 DeepSeek-V3
的基礎模型,而 Qwen2.5-Max
的比 DeepSeek-V3
的智商還高,在 Chatbot Arena【大模型盲測綁定】 上排名 幾乎把很多 開源、閉源、前沿非推理模型都比了下去,如下:
Chatbot Arena 大模型盲測榜單:是通過匿名的方式去把大模型兩兩組隊,然后讓用戶進行盲測,然后用戶給體驗好的進行投票
注意:這個也是免費的,界面很像那個 ChatGPT,如下:
2, 代碼編寫及實況預覽
我們先來看看它的知識儲備
- 現在和我們暫時也就兩個月左右的時差
然后我們來測試,先讓它做一個代碼并進行實況預覽,如下:
- 它這個實況預覽還是不錯的
3, 中文寫作
其實 R1 在大眾中的爆火,我感覺就離不開它的寫作能力,當時讓它給我寫的一篇駢文,不得不說第一眼驚艷到我了 ,深度思考真的不錯哈
但是我用 Qwen
生成類似的中文的話,效果還是差上不少的:
但是要比另外 用 V3生成的要相對好上一丟丟,我相信 Qwen2.
5 應該也能很快退出它的推理模型
4, 圖片視頻
這個就是它相比于 DeepSeek
更加方便的地方了,它可以生成圖片和視頻,如下:
我也測試調了一下它的圖片生成,發現有點過于 AI 化,但是如果再進行更詳細的語言描述和調整的話就會好上很多,比我以前看到的一些AI圖還是要好不少的,而且圖片生成免費,速度也挺快的,這點很贊 👍
- 視頻生成的話,還是有點太慢了,我測了一下估摸著至少得7、8分鐘 一個視頻,而且還有點容易崩,如下:
如果對視頻生成感興趣的,可以去 混元 AI,這個挺好的,但是要收費
看了上面的功能,其實我們就可以讓 AI 幫我們生成一些不知道怎么描述的圖片,比如:裝修圖,可以先讓 AI 給我們生成提示詞,然后再用 AI 生成圖片
然后再利用我們生成的提示詞生成圖片即可
值得一提的是:Qwen 2.5
有三個全家桶,針對數學的 Qwen 2.5-Math、常規的大語言模型 Qwen2.5 和專門針對編程的 Qwen2.5-Coder 模型
感興趣的可以去搜一些相關知識
四、小結
總的來說,這個 Qwen2.5
的功能還是挺齊全的,代碼的實況預覽也是可以的,比 DeepSeek V3 是要相對好些,但是如果要和 DeepSeek R1 比的話,就還是相對差一些,畢竟現在 DeepSeek
有點卡,本地部署顯卡也帶不動,用 Qwen 2.5- Max
是個不錯的選擇啦,當然啦,也期望 Qwen 2.5-Max 也能早日推出它的推理模型,