2025年2月深度實測!DeepSeek、OpenAI o1、Gemini打造爆款應用及對比

我在網上看到了關于DeepSeek R1的各種說法,這是一個開源模型,其能力即便不比OpenAI o1等付費模型強,也與之相當:

在這里插入圖片描述

由于我在日常工作中廣泛使用這些人工智能模型(使用Cursor AI),我決定看看哪種模型最適合我。

在進行了200次Cursor請求后,我將分享我的實驗結果。
在這里插入圖片描述

一、實驗設置

我從lmarena排行榜上挑選了前兩名的模型,即DeepSeek R1和OpenAI的o1:

以及競爭對手——Gemini-Exp-1206……

我設計了三個實際的編碼挑戰來測試每個模型的能力:

情緒追蹤網絡應用程序

  • 基于日歷的情緒記錄
  • 可視化情緒追蹤
  • 圖表數據可視化

在這里插入圖片描述

由o1設計的情緒追蹤器

隨機食譜生成器

  • 與MealDB API集成
  • 類別過濾
  • 收藏管理
    在這里插入圖片描述

由DeepSeek R1設計的食譜生成器

“抓鼴鼠”游戲

  • 實時動畫
  • 音效
  • 難度遞進
    在這里插入圖片描述

由Gemini設計的“抓鼴鼠”游戲

二、如何測試每個模型

我對這三個挑戰都采用了完全相同的流程:

  1. 編寫小型需求文檔
    我列出了每個項目應包含內容的簡要清單,比如“使用日歷庫”“使用本地存儲來存儲數據”或“從外部API獲取數據”。
  2. 向人工智能索要完整代碼
    我向模型提出需求,然后等待生成代碼。如果代碼有漏洞或缺少某些功能,我會提供具體反饋(比如“情緒的顏色編碼有問題”等),直到代碼能夠正常運行。
  3. 對結果進行評分
    一旦應用程序運行起來,我就會根據我的檢查清單對其進行測試。主要功能是否可用?代碼結構是否整潔?從用戶角度看是否良好?我會給每個模型一個最終評級。
  4. 進行比較
    在使用這三個模型完成了所有三個應用程序后,我收集了我的筆記并進行了整理。

下圖是代碼生成的流程。
在這里插入圖片描述

以下是一個示例產品需求文檔(PRD)的樣子:

---
name: "Mood Tracker"
about: "Modern mood tracking web app with data visualization"
date_created: "2025-01-26"
project_name: "MoodTracker"
tech_stack: ["NextJS 15", "TypeScript", "Shadcn", "Tailwind CSS", "Chart.js", "date-fns"]
version: "1.3"
---# ?? Mood Tracker PRDA modern web application for logging daily moods and visualizing emotional trends with charts.---## 1. **Success Criteria**1. **Core Functionality**-

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/70294.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/70294.shtml
英文地址,請注明出處:http://en.pswp.cn/web/70294.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

OpenCV機器學習(6)樸素貝葉斯分類器(Naive Bayes Classifier)cv::ml::NormalBayesClassifier的使用

操作系統:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 編程語言:C11 算法描述 cv::ml::NormalBayesClassifier 是 OpenCV 機器學習模塊中的一部分,用于實現樸素貝葉斯分類器(Naive Bayes Classifier&a…

LLaVA-CoT: Let Vision Language Models Reason Step-by-Step論文解讀

文章目錄 前言一、摘要一、引言二、文獻綜述1. Visual reasoning with large language models2. Chain-of-thought in large language models3. Inference time scaling 三、方法1. Enhancing Reasoning Capability through Structured Thinking1. Reasoning Stages2. Data Pre…

Linux 和 Windows 區別

1. 文件組織 (1)目錄結構 Linux:采用**單一根目錄(/)**結構,所有文件和設備都掛載在這個目錄下。 典型目錄: /home/(用戶目錄)/etc/(配置文件)/bin/(系統可執行文件)/dev/(設備文件)/mnt/(掛載點)Windows:采用多個驅動器(C:\, D:\),每個分區是一個獨立的…

java基礎語知識(8)

類之間的關系 在類之間,最常見的關系有: 依賴(“uses-a”);聚合(“has-a”);繼承(“is-a”)。 依賴:一種使用關系,即一個類的實現需要另一個類的協助&#x…

Linux系統中常見的詞GNU是什么意思?

GNU 是 “GNU’s Not Unix” 的遞歸縮寫,它是一個自由軟件項目,旨在創建一個完全自由的操作系統。這個名字反映了GNU項目的核心理念:它試圖創建一個類Unix的系統,但不是Unix本身。 GNU 項目由 理查德斯托曼(Richard S…

安卓burp抓包,bypass ssl pinning

好久好久沒有發東西了。主要是懶。。。 這幾天在搞apk滲透,遇到了burp無法抓包問題,覺得可以寫下來。 問題描述 1. 一臺安卓手機,裝了面具,可以拿到root 2. 電腦上有burp,設置代理 3.手機和電腦連同一個網段&…

抖音試水AI分身;騰訊 AI 戰略調整架構;百度旗下小度官宣接入DeepSeek...|網易數智日報

抖音試水AI分身,字節旗下AI智能體平臺扣子已與抖音打通,相關功能內測中 2月19日消息,鈦媒體App獨家獲悉,字節旗下AI智能體開發平臺扣子(Coze)已與抖音打通,抖音創作者可在扣子智能體平臺打造AI分…

Python爬蟲實戰:爬取豆瓣電影

目錄 引言 1. 爬蟲基礎 1.1 什么是爬蟲? 1.2 Python爬蟲常用庫 2. 實戰:抓取豆瓣電影Top250 2.1 安裝依賴庫 2.2 發送HTTP請求 ?編輯 2.3 解析HTML ?編輯 2.4 存儲數據 2.5 完整代碼 3. 進階:處理分頁和動態內容 3.1 抓取多頁…

請談談 Vue 中的響應式原理,如何實現?

一、Vue2響應式原理:Object.defineProperty的利與弊 實現原理: // 數據劫持核心實現 function defineReactive(obj, key, val) {const dep new Dep(); // 依賴收集容器Object.defineProperty(obj, key, {get() {if (Dep.target) { // 當前Watcher實例…

第6章:基于LangChain如何開發Agents,附帶客戶支持智能體示例

本文主要介紹了 LangChain4j 中的 Agent(代理) 概念,以及如何使用 LangChain4j 構建代理系統,重點提供了一個客戶支持系統的智能體樣例 代理(Agents)| LangChain4j 注意: 請注意,“A…

Android 中使用 FFmpeg 進行音視頻處理

1. FFmpeg 基礎知識 1.1 什么是 FFmpeg? FFmpeg 是一個開源的多媒體處理工具,支持音視頻的編碼、解碼、轉碼、裁剪、合并、濾鏡、流媒體等功能。它是一個命令行工具,支持多種音視頻格式和編解碼器。1.2 為什么在 Android 中使用 FFmpeg? Android 自帶的多媒體 API(如 Med…

Matplotlib 高級圖表繪制與交互式可視化(ipywidgets)

目錄: ipywidgets 介紹 1. 什么是 ipywidgets 直接開始: 動態調整正弦波頻率 隨機散點圖 啟用交互式模式 使用滑塊和下拉菜單調整圖表樣式 使用布局管理器創建復雜界面 使用動畫創建動態圖表 最后: 綜合示例:動態儀表盤 ipywidgets 介紹 1. 什么是 ipywidgets i…

【FAQ】HarmonyOS SDK 閉源開放能力 —Live View Kit (1)

1.問題描述: 客戶端創建實況窗后,通過Push kit更新實況窗內容,這個過程是自動更新的還是客戶端解析push消息數據后填充數據更新?客戶端除了接入Push kit和創建實況窗還需要做什么工作? 解決方案: 通過Pu…

uvm中的激勵是如何發送出去的

在UVM中,Sequence生成的激勵(Transaction)通過以下協作流程發送到Driver并最終驅動到DUT,其核心機制如下: --------------- --------------- ------------ ----- | Sequence | → | Seque…

SpringAI系列 - ToolCalling篇(二) - 如何設置應用側工具參數ToolContext(有坑)

目錄 一、引言二、集成ToolContext示例步驟1: 在`@Tool`標注的工具方法中集成`ToolConext`參數步驟2:`ChatClient`運行時動態設置`ToolContext`參數三、填坑一、引言 在使用AI大模型的工具調用機制時,工具參數都是由大模型解析用戶輸入上下文獲取的,由大模型提供參數給本地…

【RabbitMQ業務冪等設計】RabbitMQ消息是冪等的嗎?

在分布式系統中,RabbitMQ 自身不直接提供消息冪等性保障機制,但可通過業務邏輯設計和技術組合實現消息處理的冪等性。以下是 8 種核心實現方案及最佳實踐: 一、消息唯一標識符 (Message Deduplication) 原理 每條消息攜帶全局唯一ID&#xff…

網絡可靠性要求

目錄 一、背景介紹 二、環路引發的危害 1、廣播風暴 2、MAC 地址表震蕩 三、STP生成樹 1、STP的作用 2、STP工作過程 3、根橋選舉 4、根端口選舉 5、指定端口選舉 6、BPDU報文分析 7、計時器 8、端口狀態轉化 總結 一、背景介紹 為了提高網絡可靠性,交換網絡…

《STL 六大組件之容器探秘:深入剖析 string》

目錄 一、string 類簡介二、string 類的常用接口1. 構造函數(constructor function)2. 與容量相關的接口(capacity)3. 與迭代器有關的接口(iterator)4. 與元素訪問有關的接口(element access&am…

Unreal5從入門到精通之在編輯器中更新 UserWidgets

前言 在虛幻中創建越來越復雜和靈活的 UserWidget 藍圖時,一個問題是它們在編輯器中的外觀與它們在游戲中的最終外觀可能有很大不同。 庫存面板示例 假設你想創建一個通用的庫存顯示小部件。我們可以在整個 UI 中使用它,無論我們需要在哪里顯示某些內容。 標題,描述所顯示…

計算機網絡-OSI七層參考模型與數據封裝,網絡安全零基礎入門到精通實戰教程!

目錄 一、網絡 1、網絡的定義 2、網絡的分類 3、網絡的作用 4、網絡的數據傳輸方式 5、網絡的數據通訊方式 二、OSI七層參考模型 1、網絡參考模型定義 2、分層的意義 3、分層與功能 4、TCP\IP五層模型 三、參考模型的協議 1、物理層 2、數據鏈路層 3、網絡層 4…