全球首位 AI 程序員正式上線,這個月薪只要三千的同事能幹什麼?

愛範兒 於 17/12/2024 發表 收藏文章
説到「編程」,我們常常會想到那個不太友善的程序員笑話:

虛假的程序員:從零開始編寫代碼,勤勤懇懇修改、優化、註釋;

真正的程序員:熟練掌握「Ctrl + C」和「Ctrl + V」。

▲圖源:Laravel

不過,由 Cognition Labs 開發的全球首位 AI 程序員「Devin AI」或許可以讓你把「複製粘貼」這一步都省了,你可以直接把 TA 當成你的「程序員同事」,讓 TA 幫你幹活。

既然被稱為「程序員」,那 TA 就不可能白白乾活。Devin AI 的服務起價為每月 500 美元(約合 3624 元),還真不算便宜。不過相比之下,這個價格比國內一線大廠程序員的平均工資還是低了不少。

▲圖源:COGNITION

Devin AI 實際上是一個由人工智能驅動的編碼平台,配備了命令行、代碼編輯器和瀏覽器等常見的開發者工具,它可以在編寫代碼片段、檢測錯誤和建議改進等方面協助開發人員完成代碼編寫,幾乎覆蓋了編程工作的全流程。

值得一提的是,Devin AI 還可以通過機器學習算法分析代碼模式,從先前的經驗中持續學習,這極大地提高了其編碼效率,還能保持與最新編程趨勢的同步。

作為一位「編程助理」,Devin AI 可以輔助程序員完成下面的工作:

  • 代碼補全:Devin AI 能夠通過分析代碼上下文和語法預測下一行代碼,加快編碼效率;
  • 錯誤檢測:Devin AI 可以檢測代碼中的常見錯誤和問題,幫助開發人員識別和修復 bug;
  • 代碼重構:Devin AI 會提供代碼重構建議,能夠幫助開發人員編寫更簡潔、更高效的代碼;
  • 代碼優化:Devin AI 可以分析代碼性能,提出優化建議,以提高速度和效率;
  • 多人協作:Devin AI 甚至可以作為協作工具,允許多個開發人員同時在同一項目上工作。

官方建議,Devin AI 在處理小型前端錯誤和極端情況、進行針對性的代碼重構以及為待辦事項列表中的任務創建初稿 PR(Pull Request)等場景下最為實用。

▲圖源:SHIFTMAG

當然,作為一位名副其實的「AI 程序員」,除了輔助編程開發以外,TA 還可以「獨立完成任務」供開發人員審核。官方介紹 Devin AI 是「一位不知疲倦並且技術嫺熟的團隊成員」。

據官方介紹,Devin AI 能夠自主規劃和執行需要數千個決策的複雜工程任務。這也就意味着開發者可以化身「產品經理」,將開發需求和任務等等「告訴」Devin AI,其就可以進行獨立的成果產出。

針對這項功能,官方還貼心地給出了 Devin AI 的「使用指南」,就像你平時叮囑同事一樣:

  • 給 Devin AI 分配「你自己知道如何完成」的任務;
  • 告訴 Devin AI 如何測試或者檢查自己的工作;
  • 將會話時間保持在大約 3 小時以內,並且儘量將大型任務分解;
  • 提前將你的詳細需求告知 Devin AI;
  • 通過在對話中給出反饋、採納建議的知識,或者手動添加你自己的知識,來強化對 Devin AI 的訓練。

▲圖源:Xeven Solutions

關於 Devin AI 在具體場景下的表現,官方展示了幾個有趣的用例,我們能夠從中一窺這位「程序員」有多厲害。

Devin AI 可以學習和使用「不熟悉」的技術。其在閲讀了一篇博客文章後,現學現賣,自主編寫代碼,在 Modal 上運行 ControlNet 並且生成了一張帶有隱藏文字「SARA」的圖片:


Devin AI 還可以端到端構建和部署應用。在演示中,其根據需求製作了一個模擬「Game of Life」的交互式網站,並且逐步添加了用户提出的功能,然後將這個應用程序部署到 Netlify 中:


Devin AI 甚至可以訓練和微調自己的 AI 模型。演示人員僅僅提供了一個指向 GitHub 研究存儲庫的鏈接,其就對某個大語言模型進行了「微調」:


此外,Devin AI 還可以實現自動查找和修復代碼庫中的錯誤,處理開源倉庫中的錯誤和功能請求等等。

在「SWE-bench」這項「具有挑戰性」的基準測試中,Devin AI 正確解決了 13.86% 的問題,遠超之前 1.96% 的最佳水平。即使確切給出了需要編輯的文件,之前最好的模型 Claude 2 也只能解決 4.8% 的問題。

令人驚歎的是,Devin AI 甚至已經通過了現實世界的工程師面試,還在流行的自由職業平台「Upwork」上找到了一份工作。

Devin AI 成為「自由職業者」的新聞還曾引起過不小的爭議。一位有着幾十年軟件工程師經驗的 YouTube 博主質疑其演示視頻造假,表示這些內容是「自導自演」、「無用功」,並且對其實際能力和效率提出了質疑。

無論是不是商業炒作,Devin AI 目前都已經全面推出。真正的編程表現如何,不妨再等等看,交由時間和用户評判。

▲圖源:COGNITION

在 Devin AI 正式推出後不久,OpenAI 也宣佈推出了 ChatGPT Canvas 的多項更新,其中就包括直接運行 Python 代碼功能,更新後的 Canvas 可以根據要求搜索 API 文檔,指導模型編寫並執行代碼,還可以開發小工具和遊戲等。

可以看到,即使是規模大如 OpenAI 這樣的人工智能企業,也在不斷對「AI 編程」加註。在這樣的背景之下,我們自然會想到那個「終極」問題:

TA 離取代真正的程序員還有多遠?


資料來源:愛範兒(ifanr)
標籤: AI 程序員  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→