OpenAI全球招外包大軍，手把手訓練ChatGPT取代碼農；碼農：我自己「殺」自己

news/2025/7/22 17:37:27/文章來源:https://blog.csdn.net/CDB3399/article/details/132338189

目錄

前言

OpenAI招了一千多名外包人員，訓練AI學會像人類一樣一步步思考。如果ChatGPT「學成歸來」，碼農恐怕真的危了？

碼農真的危了！

當時OpenAI也說，ChatGPT最合適的定位，應該是編碼輔助工具。

用ChatGPT來debug，效果拔群

ChatGPT有一個強大的優勢：我們可以在對話中與系統互動，更詳細地對問題進行說明，從而獲得正確的答案。

碼農：我自己「殺」自己

咱們來排一排，那些會寫代碼的AI。

谷歌的Pitchfork

AlphaCode：吊打72%程序員

Copilot：代碼補全神器

前言

OpenAI招了一千多名外包人員，訓練AI學會像人類一樣一步步思考。如果ChatGPT「學成歸來」，碼農恐怕真的危了？

福利：文末有chat-gpt純分享，無魔法，無限制

碼農真的危了！

最近有消息稱，OpenAI已經在悄悄地訓練ChatGPT，讓它學習人類的思考過程，從而真正掌握軟件工程，徹底代替「初級碼農」。

OpenAI招外包大軍，教AI學人類思考

會編程的AI，幾家硅谷大廠都在做。

DeepMind的AlphaCode，據說「吊打72%人類程序員」，但尚未開放；傳聞中谷歌的「神秘項目」Pitchfork，也還在醞釀中；而微軟的GitHub Copilot主要是一個代碼補全工具。

要說完全代替人類碼農，它們還不夠格。

但如果真的讓ChatGPT學會了用人類思維去編程，這些友商/自家的產品恐怕要被吊打。

而從種種跡象看來，OpenAI似乎正在下一盤大棋。

根據Semafor的報道，在過去的六個月里，OpenAI已經從拉美和東歐等地區招募了大約1000名外包人員，來訓練他們的AI碼代碼。

這個新聞中，有兩個「華點」。

首先，為什么地點選在拉美和東歐？這個咱們都明白，現在硅谷的泡沫戳破了，各家互聯網大廠都在絞盡腦汁「降本增效」，有的靠裁員，有的就去其他國家找廉價勞動力。

第二個「華點」是，這些外包人員中，很多人并不是計算機專業的畢業生，也不具備高級的編程技能。他們的作用是，編寫OpenAI期待實現的「自動化」基本代碼。

具體來說，其中的60%從事「數據標注」工作——創建大量的圖像、音頻片段等信息，用來訓練人工智能工具或自動駕駛汽車。

另外的40%則是實打實的程序員，他們正在為OpenAI的模型「手搓」數據，從而讓AI學習軟件工程任務。

此前，OpenAI一直是用從GitHub上抓取的代碼訓練其模型。

而這次，OpenAI想建立的數據集中，不僅有代碼，還包括背后用自然語言編寫的人類解釋。

論文地址：https://arxiv.org/abs/2107.03374

對此，Semafor特地采訪了一位南美的開發者，而他曾無償為OpenAI完成了5小時的編碼測試。

在這個測試中，他被要求處理兩個任務。

首先，他會得到一個編程問題，OpenAI要求他用書面的英語解釋自己將如何處理這個問題。

然后，他需要提供一個解決方案。

如果他發現了一個bug，OpenAI就會要求他詳細說明問題是什么，應該如何糾正，而不是簡單地修復。

「他們很可能是想用一種非常特殊的訓練數據來投喂這個模型，在這種情況下，就需要展示人類是如何一步步思考的。」這位開發者說。

此前的ChatGPT，寫的代碼就被揪出過不少問題。

原因在于，ChatGPT沒有任何標記了對錯的內部記錄，它其實是一個統計模型。ChatGPT的答案，本質上就是從構成GPT-3的互聯網數據語料庫中收集的概率結果。

當時OpenAI也說，ChatGPT最合適的定位，應該是編碼輔助工具。

但想象一下，如果OpenAI真的教會了ChatGPT「像人類一樣一步一步思考」，那它完全可以代替一些需要死記硬背的寫代碼工作，后果就是，一些「初級」碼農被徹底淘汰。

現在，硅谷的高管們正在設想這樣的產品，讓幾乎沒有編程經驗的人士向AI描述自己的創意和愿景，然后就能構建出任何自己想要的東西，無論是一個網站，還是一個游戲。

幾天前，特斯拉的前人工智能主管Andrej Karpathy剛剛在推特上說：「最熱門的新編程語言是英語」。

用ChatGPT來debug，效果拔群

這可能并不是一個玩笑，比如當紅炸子雞ChatGPT，就很有潛力。

最近，一項來自美因茨大學和倫敦大學學院的研究發現，ChatGPT不僅可以出色地修復bug，而且開發者還能通過對話來顯著提高成功率。

研究人員表示，ChatGPT的debug性能與常見的深度學習方法CoCoNut和Codex相差無幾，并且明顯優于標準的自動程序修復方法（APR）。

論文地址：https://arxiv.org/abs/2301.08653

用ChatGPT來解決代碼問題并不新鮮，但與人類對話的獨特能力，使它比其他方法和模型更具優勢。

為了評估ChatGPT的debug性能，研究人員使用QuixBugs基準的40個純Python問題對其進行了測試，然后手動檢查建議的解決方案是否正確。

由于ChatGPT給出的答案存在一定的隨機性，因此研究人員針對每個問題都會單獨測試4次。

與其他自動程序修復的基準不同，QuixBugs包含了相對較小的問題（代碼行數少），而這非常適合在對話系統中使用。

在測試過程中，研究人員刪除了所有的注釋，并詢問ChatGPT這段代碼是否有bug以及如何修復它。

比如，圖1中就是一個關于BITCOUNT問題的例子。其中，第1-2行是向ChatGPT提出的需求；從第4行開始是錯誤的代碼片段。

對于這個例子，我們希望ChatGPT的回答能解決第7行的錯誤，即n?= n - 1應該被替換為n &= n - 1。做為回應，ChatGPT要么給出一段修復完的代碼，要么給出一個描述告訴我們應該如何修改。

結果顯示，ChatGPT解決了40個bug中的19個，與CoCoNut（19）和Codex（21）相當，但標準的APR方法只解決了其中的7個問題。

當然，因為ChatGPT和Codex都是來自于同一個語言模型系列，所以解決問題的數量差不多也就不足為奇了。

此外，如果我們仔細觀察結果還可以發現，ChatGPT并不是每次都能解決基準測試中的bug。僅在BUCKETSORT和FLATTEN這兩個問題上，四次都發現了bug，而其他的通常只能成功1-2次。

也就是說，用戶在實際使用時，可能需要嘗試數次才能獲得正確的結果。

ChatGPT有一個強大的優勢：我們可以在對話中與系統互動，更詳細地對問題進行說明，從而獲得正確的答案。

實際測試結果，也確實如此。

經過與模型更進一步的對話，研究人員成功地將ChatGPT的正確率刷新到了77.5%，也就是修復了40個錯誤中的31個，遠超SOTA。

至少，目前看來，這件事是完全有可能的：開發人員將不再需要編寫樣板代碼。

相反，他們可以專注于復雜的應用程序架構或網絡安全等領域。

也就是說，雖然ChatGPT可能會完成某些編程工作，例如編寫通用函數或樣板代碼，但它不會完全取代程序員。因為程序員的工作需要的不僅僅是寫代碼。

成為一名程序員需要技巧——能夠構建程序、遵循邏輯并生成比各部分總和更宏大的東西。

碼農：我自己「殺」自己

顯然，ChatGPT不是碼農們做出的第一個「自我迭代」的產品。

咱們來排一排，那些會寫代碼的AI。

谷歌的Pitchfork

去年11月，坊間傳聞，谷歌正在醞釀一個秘密項目，這個產品會通過機器學習訓練代碼，自己編自己，自己修復bug，還能自己更新。

據知情人士透露，這個項目起初是由Alphabet的登月部門——X部門開發的，代號為Pitchfork，去年夏天被轉移到了谷歌實驗室。

根據內部資料，Pitchfork的作用是「教代碼自行編寫、自行重寫」。

它能夠學習不同的編程風格，并且根據這些風格寫出代碼。

一名谷歌員工表示，開發Pitchfork的初衷是希望建立一個工具，將谷歌的Python代碼庫更新到新版本。

AlphaCode：吊打72%程序員

2022年2月，DeepMind推出了「AlphaCode」系統，可以使用人工智能生成代碼。

根據DeepMind的說法，AlphaCode可以與人類匹敵。

DeepMind使用編程競賽平臺Codeforces上托管的10個現有競賽來測試AlphaCode，它的總體排名位于前 54.3%，也就是說，它擊敗了46%的參賽者。

DeepMind聲稱，在使用編程競賽平臺Codeforces進行檢測時，AlphaCode解決了100萬個樣本中34.2%的問題。

另外在過去6個月參加過比賽的用戶中，AlphaCode的數據排到了前28%，可以說「吊打72%人類程序員」！

當時，DeepMind就指出，雖然AlphaCode目前只適用于具有競爭性編程領域，但顯然，它未來的能力絕不會止步于此。

它為創造某些工具打開了大門，而這些工具將使編程變得更容易被人們接受，并且有朝一日可以完全實現自動化。

Copilot：代碼補全神器

再往前，在2021年，GitHub與OpenAI共同推出了一款AI編程神器——GitHub Copilot。

輸入代碼時，Copilot會自動提示程序中接下來可能出現的代碼片段，就像一個經過訓練用Python或JavaScript說話的自動補全機器人。

Copilot能夠填充必要的代碼塊，只要它們不是特別復雜或者特別有創造性，這對于相當于手工勞動的編程，可太有用了。

2022年6月22日，Copilot正式面向C端上線，定價10美元/月或100美元/年，并向學生用戶和流行開源項目的維護者免費提供。

現在，成千上萬的開發者都在用Copilot。在十幾種最流行的語言編寫代碼中——有高達40%是依靠它來生成的。

GitHub預測，開發人員將在五年內使用Copilot編寫多達80%的代碼。

微軟首席技術官Kevin Scott還表示：「我們確信：GitHub Copilot可以應用到數千種不同類型的工作中。」

不過，因為涉嫌侵權，在發布不到5個月后，Copilot已經被憤怒的程序員一舉告上法庭，索賠90億美元。

而學會「軟件工程思維」的ChatGPT，能吊打它們嗎？按OpenAI的速度，恐怕我們不用等太久。充電君會在第一時間給你帶來最新、最全面的解讀，別忘了三聯一波哦

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

?關注公眾號：資源充電吧
回復:Chat GPT
充電君發你：免費暢享使用中文版哦
點擊小卡片關注下，回復：IT

想要的資料全都有?

?

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/40487.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/40487.shtml
英文地址，請注明出處：http://en.pswp.cn/news/40487.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

常用的Elasticsearch查詢DSL

常用的Elasticsearch查詢DSL

1.基本查詢 GET /index_name/_search {"query": {"match": {"dispatchClass": "1"}} }2.多條件查詢 GET /index_name/_search {"query": {"bool": {"must": [{"match": {"createUser&…

閱讀更多...

計算機競賽 opencv 圖像識別指紋識別 - python

計算機競賽 opencv 圖像識別指紋識別 - python

0 前言 🔥 優質競賽項目系列，今天要分享的是 🚩 基于機器視覺的指紋識別系統 🥇學長這里給一個題目綜合評分(每項滿分5分) 難度系數：3分工作量：3分創新點：4分該項目較為新穎，適…

閱讀更多...

Vue引入Echarts報錯 import * as echarts from “echarts“；

Vue引入Echarts報錯 import * as echarts from “echarts“；

項目場景： 已經下載好echarts cnpm i echarts Vue引入Echarts import echarts from echarts mounted() {this.myChart echarts.init(document.querySelector(.right))this.myChart.setOption({title: {text: 消費列表,left: center},...問題描述原因分析&#…

閱讀更多...

【100天精通python】Day38：GUI界面編程_PyQT從入門到實戰（中）

【100天精通python】Day38：GUI界面編程_PyQT從入門到實戰（中）

目錄專欄導讀 4 數據庫操作 4.1 連接數據庫 4.2 執行 SQL 查詢和更新： 4.3 使用模型和視圖顯示數據 5 多線程編程 5.1 多線程編程的概念和優勢 5.2 在 PyQt 中使用多線程 5.3 處理多線程間的同步和通信問題 5.3.1 信號槽機制 5.3.2 線程安全的數據訪問 Q…

閱讀更多...

日常BUG——通過命令行創建vue項目報錯

日常BUG——通過命令行創建vue項目報錯

😜作者：是江迪呀??本文關鍵詞：日常BUG、BUG、問題分析??每日一言 ：存在錯誤說明你在進步！ 一、問題描述在使用vue命令行創建一個vue項目時，出現一下的錯誤： vue create my…

閱讀更多...

UDP數據報結構分析（面試重點）

UDP數據報結構分析（面試重點）

在傳輸層中有UDP和TCP兩個重要的協議，下面將針對UDP數據報的結構進行分析 UDP結構圖示 UDP報頭結構的分析 UDP報頭有4個屬性，分別是源端口，目的端口，UDP報文長度，校驗和，它們都占16位2個字節，所…

閱讀更多...

.devos勒索病毒解密方法|勒索病毒解決|勒索病毒恢復|數據庫修復

.devos勒索病毒解密方法|勒索病毒解決|勒索病毒恢復|數據庫修復

導言： 隨著科技的迅猛發展，網絡安全問題也日益凸顯。近期，一種名為 .devos 的勒索病毒在網絡安全領域引起了廣泛的關注和警惕。本文91數據恢復將探討如何解密被其加密的數據文件，并提供預防措施以避免受到類似威脅的侵害。如不幸…

閱讀更多...

【java面向對象中static關鍵字】

【java面向對象中static關鍵字】

提綱 static修飾成員變量static修飾成員變量的應用場景static修飾成員方法static修飾成員方法的應用場景static的注意事項static的應用知識：代碼塊static的應用知識：單例設計模式 static靜態的意思，可以修飾成員變量，成員方法&a…

閱讀更多...

FPGA_學習_14_第一個自寫模塊的感悟和ila在線調試教程與技巧（尋找APD的擊穿偏壓）

FPGA_學習_14_第一個自寫模塊的感悟和ila在線調試教程與技巧（尋找APD的擊穿偏壓）

前一篇博客我們提到了，如果要使用算法找到Vbr，通過尋找APD采集信號的噪聲方差的劇變點去尋找Vbr是一個不錯的方式。此功能的第一步是在FPGA中實現方差的計算，這個我們已經在上一篇博客中實現了。繼上一篇博客之后，感覺過了很久了…

閱讀更多...

【Image captioning】ruotianluo/self-critical.pytorch之1—數據集的加載與使用

【Image captioning】ruotianluo/self-critical.pytorch之1—數據集的加載與使用

【Image captioning】ruotianluo/self-critical.pytorch之1—數據集的加載與使用作者：安靜到無聲個人主頁數據加載程序示意圖使用方法示例代碼 #%%from __future__ import absolute_import from __future__ import division from __future__ import print_…

閱讀更多...

Flink-網絡流控及反壓剖析

Flink-網絡流控及反壓剖析

參考： Apache Flink學習網

閱讀更多...

開源，微信小程序美食便簽地圖(FoodNoteMap)的設計與開發

開源，微信小程序美食便簽地圖(FoodNoteMap)的設計與開發

目錄 0 前言 1 美食便簽地圖簡介 2 美食便簽地圖小程序端開發 2.1技術選型 2.2前端UI設計 2.3主頁界面 2.4個人信息界面 2.5 添加美食界面 2.6美食便簽界面 2.8 美食好友界面 2.9 美食圈子界面 2.10 子頁面-店鋪詳情界面 2.11 后臺數據緩存 2.12 訂閱消息通知 2.1…

閱讀更多...

Redis為什么能如此之快

Redis為什么能如此之快

推薦閱讀 AI文本 OCR識別最佳實踐 AI Gamma一鍵生成PPT工具直達鏈接玩轉cloud Studio 在線編碼神器玩轉 GPU AI繪畫、AI講話、翻譯,GPU點亮AI想象空間資源分享「java、python面試題」來自UC網盤app分享，打開手機app，額外獲得1T空間 https://dr…

閱讀更多...

“深入探索JVM內部機制：解密Java虛擬機原理“

“深入探索JVM內部機制：解密Java虛擬機原理“

標題：深入探索JVM內部機制：解密Java虛擬機原理摘要：本文將深入探索Java虛擬機（JVM）的內部機制，揭示其工作原理和關鍵組成部分，包括類加載、內存管理、垃圾回收、即時編譯和運行時數據區域等。…

閱讀更多...

探索區塊鏈世界：去中心化應用（DApp）的嶄新前景

探索區塊鏈世界：去中心化應用（DApp）的嶄新前景

隨著科技的不斷發展，區塊鏈技術逐漸引領著數字時代的潮流。在這個充滿創新和變革的領域中，去中心化應用（DApp）成為了備受矚目的焦點。DApp 不僅改變了傳統應用程序的范式，還在金融、社交、游戲等多個領域展現出了廣闊的…

閱讀更多...

GRPC 鏈接 NODE 和 GOLANG

GRPC 鏈接 NODE 和 GOLANG

GRPC 鏈接 NODE 和 GOLANG GRPC 了解什么是GRPC gRPC 采用了 Protocol Buffers 作為數據序列化和反序列化的協議，可以更快速地傳輸數據，并支持多種編程語言的跨平臺使用gRPC 提供“統一水平層”來對此類問題進行抽象化。開發人員在本機平臺中編寫專…

閱讀更多...

打造專屬照片分享平臺：快速上手Piwigo網頁搭建

打造專屬照片分享平臺：快速上手Piwigo網頁搭建

文章目錄通過cpolar分享本地電腦上有趣的照片：部署piwigo網頁前言1.Piwigo2. 使用phpstudy網頁運行3. 創建網站4. 開始安裝Piwogo 總結 🍀小結🍀 🎉博客主頁：小智_x0___0x_ 🎉歡迎關注：&#x…

閱讀更多...

深度學習1：通過模型評價指標優化訓練

深度學習1：通過模型評價指標優化訓練

P(Positive)表示預測為正樣本，N(negative)表示預測為負樣本，T(True)表示預測正確,F(False)表示預測錯誤。 TP：正樣本預測正確的數量（正確檢測） FP：負樣本預測正確數量（誤檢測） TN…

閱讀更多...

【AI實戰】BERT 文本分類模型自動化部署之 dockerfile

【AI實戰】BERT 文本分類模型自動化部署之 dockerfile

【AI實戰】BERT 文本分類模型自動化部署之 dockerfile BERTBERT 文本分類模型基于中文預訓練bert的文本分類模型針對多分類模型的loss函數樣本不均衡時多標簽分類時 dockerfile編寫 dockerfilebuild鏡像運行docker測試服務參考本文主要介紹： 基于BERT的文本分類模…

閱讀更多...

卷積神經網絡CNN

卷積神經網絡CNN

卷積神經網絡CNN 1 應用領域1 檢測任務2 分類和檢索3 超分辨率重構4 醫學任務5 無人駕駛6 人臉識別 2 卷積的作用3 卷積特征值計算方法4 得到特征圖表示5 步長和卷積核大小對結果的影響1 步長2 卷積核 6 邊緣填充方法7 特征圖尺寸計算與參數共享8 池化層的作用9 整體網絡架構10…

閱讀更多...

最新文章