背景
字節跳動正式發布中國首個AI原生集成開發環境工具(AI IDE)——AI編程工具Trae國內版。 該工具模型搭載doubao-1.5-pro,支持切換滿血版DeepSeek R1&V3, 可以幫助各階段開發者與AI流暢協作,更快、更高質量地完成編程工作,提升開發效率。
安裝試用后,效果確實不錯,無論是編程還是開發環境的自動化構建,都能實現較高程度的自動化。
本文演示了一個實際編程案例,在一臺配備Intel CPU和集成顯卡的個人PC上,對比GPU/CPU在一些耗時運算方面的性能差異,并通過圖表展示對比結果。涉及基本的神經網絡模型 編程,如python環境配置、矩陣運算、前向傳播、反向傳播,基于Intel集成顯卡GPU的開發環境配置等。
運行環境
builder模式實施任務
向Trae描述任務需求
本機是 i7-1260P + Iris Xe + 16G內存, 請編寫程序,對比一下使用CPU和GPU進行某些深度學習運算的性能差異。
只需根幾秒的時間, trae就已經完成了代碼編寫 gpu_cpu_benchmark.py,并輸出了python環境依賴庫清單requirements.txt
生成依賴并自動安裝
requirements.txt如下圖所示,當然,依賴文件并不是一步到位 直接生成的。而是經歷了多個版本的疊代。
比如 ,一開始trae推薦的是以下版本的torch
pip install torch==2.3.0 torchvision==0.18.0 intel-extension-for-pytorch==2.3.0 memory-profiler==0.61
但是因版本匹配問題失敗,因此, trace又調整了軟件包版本。
包括在使用intel集成顯卡的時候與Nvidia GPU編程不同, trae提示:
檢測到PyTorch安裝需要額外源地址,現在添加Intel官方源重新安裝依賴。
pip install -r requirements.txt --extra-index-url https://pytorch-extension.intel.com/release-whl/stable/xpu/us/
評測程序運行
測評程序分別使用cpu、XPU(即intel的集成顯卡)進行矩陣運算、前向傳播、反向傳播等方面的運算。
GPU滿負荷工作:
評測結果
評測程序最終自動輸出了評測結果,如下圖所示。結果表明, 這臺集成顯卡的GPU性能實在一般, 只有矩陣運算比CPU強,其他方面如前向傳播、反向傳播和內存使用,都比CPU要弱。后續有機會換個顯卡再試。
這臺集成顯卡的GPU性能實在一般, 只有矩陣運算比CPU強,其他方面如前向傳播、反向傳播和內存使用,都比CPU要弱。后續有機會換個顯卡再試。