Ubuntu下使用AMD APP編寫OpenCL程序

對于Ubuntu或其近親(Lubuntu、Kubuntu、Mint等)編寫OpenCL程序也不會太難。由于本例用的是AMD APP SDK,因此需要AMD的GPU以及相關驅動。首先,去AMD官網下載GPU驅動——AMD Catalyst。如果你用的是APU并且還有一塊獨立顯卡的話,通過AMD Catalyst Control Center可以選擇使用哪個GPU。像我現在用的聯想Z475筆記本,搭載了AMD APU A6-3420M以及一塊AMD Radeon HD 7400M,但是相比較而言,還是APU自帶的6620G的GPU性能更強一些,因此我這邊設置的是采用AMD Radeon HD 6620G。

在Linux下,AMD官方的GPU驅動是.run文件,只需使用sudo sh xxx.run即可安裝。安裝時采用默認安裝即可。

然后去developer.amd.com開發者網站下載AMD APP SDK。下載完成之后,將lib里面的動態庫文件(xxx.so)取出來,并且把include里的頭文件取出來。在你的OpenCL工程中把頭文件的路徑以及動態加載庫都設置好。在你用-l的時候,如果動態庫文件后綴名為.so.1,那么得把文件名后綴.1去掉。因為-l只能連接.a、.lib、.so等這些后綴的庫文件。


下面我們將舉一個最簡單的例子,首先看主機端代碼:

復制代碼
/*============================================================================Name        : OpenCLTest.cAuthor      : Zenny ChenVersion     :Copyright   : Your copyright noticeDescription : Hello World in C, Ansi-style============================================================================*/#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <CL/cl.h>static int GetCurrentLocationFilePath(char pDst[512], const char *filename)
{if(pDst == NULL || filename == NULL)return 0;int size = readlink("/proc/self/exe", pDst, 512);while(pDst[size - 1] != '/')size--;strcpy(&pDst[size], filename);int retSize = strlen(filename) + size;pDst[retSize] = '\0';return retSize;
}int main(void)
{/*Step1: Getting platforms and choose an available one.*/cl_uint numPlatforms;   //the NO. of platformscl_int  status = clGetPlatformIDs(0, NULL, &numPlatforms);if (status != CL_SUCCESS){puts("Error: Getting platforms!");return 0;}cl_platform_id platforms[16];/*For clarity, choose the first available platform. */if(numPlatforms > 0){status = clGetPlatformIDs(numPlatforms, platforms, NULL);if(status != CL_SUCCESS){puts("Failed to get platform IDs");return 0;}}/*Step 2:Query the platform and choose the first GPU device if has one.Otherwise use the CPU as device.*/cl_uint             numDevices = 0;cl_device_id        devices[16];clGetDeviceIDs(platforms[0], CL_DEVICE_TYPE_GPU, 0, NULL, &numDevices);if(numDevices == 0)    //no GPU available.
    {puts("No devices available!");return 0;}else{printf("The number of available devices is: %u\n", numDevices);clGetDeviceIDs(platforms[0], CL_DEVICE_TYPE_GPU, numDevices, devices, NULL);}/*Step 3: Create context.*/cl_context context = clCreateContext(NULL,1, devices,NULL,NULL,NULL);/*Step 4: Creating command queue associate with the context.*/cl_command_queue commandQueue = clCreateCommandQueue(context, devices[0], 0, NULL);/*Step 5: Create program object */char filePath[512];GetCurrentLocationFilePath(filePath, "test.cl");FILE *fp = fopen(filePath, "r");if(fp == NULL){puts("OpenCL kernel source file open failed!");return 0;}fseek(fp, 0, SEEK_END);long fileLength = ftell(fp);fseek(fp, 0, SEEK_SET);char *source = (char*)malloc(fileLength + 1);fread(source, 1, fileLength, fp);fclose(fp);size_t sourceSize[] = {fileLength};cl_program program = clCreateProgramWithSource(context, 1, (const char**)&source, sourceSize, NULL);free(source);if(program == NULL){puts("Failed to create the program!");return 0;}/*Step 6: Build program. */status = clBuildProgram(program, 1,devices,NULL,NULL,NULL);if(status != CL_SUCCESS){puts("Failed to build the program!");return 0;}/*Step 7: Initial input,output for the host and create memory objects for the kernel*/int input[128];for(int i = 0; i < 128; i++)input[i] = i + 1;cl_mem inputBuffer = clCreateBuffer(context, CL_MEM_READ_ONLY|CL_MEM_COPY_HOST_PTR, sizeof(input), input, NULL);cl_mem outputBuffer = clCreateBuffer(context, CL_MEM_WRITE_ONLY , sizeof(input), NULL, NULL);/*Step 8: Create kernel object */cl_kernel kernel = clCreateKernel(program, "test", NULL);/*Step 9: Sets Kernel arguments.*/status = clSetKernelArg(kernel, 0, sizeof(cl_mem), &inputBuffer);status = clSetKernelArg(kernel, 1, sizeof(cl_mem), &outputBuffer);/*Step 10: Running the kernel.*/size_t global_work_size[1] = { 128 };status = clEnqueueNDRangeKernel(commandQueue, kernel, 1, NULL, global_work_size, NULL, 0, NULL, NULL);/*Step 11: Read the cout put back to host memory.*/int output[128];status = clEnqueueReadBuffer(commandQueue, outputBuffer, CL_TRUE, 0, sizeof(input), output, 0, NULL, NULL);/*Step 12: Clean the resources.*/status = clReleaseKernel(kernel);               //Release kernel.status = clReleaseProgram(program);             //Release the program object.status = clReleaseMemObject(inputBuffer);       //Release mem object.status = clReleaseMemObject(outputBuffer);status = clReleaseCommandQueue(commandQueue);   //Release  Command queue.status = clReleaseContext(context);             //Release context.for(int i = 0; i < 128; i++){if(output[i] != i + 2){printf("Error occurred @%d!", i);return 0;}}puts("Pass!");return 1;
}
復制代碼

在編譯選項中,使用-std=gnu99或-std=gnu11。上述代碼為純C語言,因此即便你沒有安裝g++也完全沒關系。

下面看看內核源代碼:

復制代碼
/*============================================================================Name        : OpenCLTest.cAuthor      : Zenny ChenVersion     :Copyright   : Your copyright noticeDescription : Simple OpenCL kernel source============================================================================*/__kernel void test(__global int* in, __global int* out)
{int index = get_global_id(0);out[index] = in[index] + 1;
}
復制代碼

將此文件放在可執行文件相同路徑下,然后我們就能正常運行了。

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/448600.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/448600.shtml
英文地址,請注明出處:http://en.pswp.cn/news/448600.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

jdk的安裝與配置

Linux一、安裝JDK 從sun網站上直接下載JDK&#xff1a;http://java.sun.com/j2se/1.4.2/download.html提供了兩個下載j2re-1_4_2_10-linux-i586.bin 13.75 MB, j2re-1_4_2_10-linux-i586-rpm.bin 13.27 MB&#xff1a;1、RPM in self-extracting file (j2re-1_4_2_10-linux…

李洋瘋狂C語言之n個人報數,報到3的退出,最后留在場上的是原來的第幾位(約瑟夫環)

今天老師布置了個題目&#xff0c;約瑟夫環&#xff0c;俗稱猴子選大王。n個人報數&#xff0c;報到3的退出&#xff0c;最后留在場上的時原來的第幾位 #include <stdio.h>int main() {int i, n, q, p 0; //計數 i ,人數 n ,報數 p ,場上人數 qprintf ("input…

搭建Vue腳手架(vue-cli)并創建一個項目

1、 安裝nodejs環境 官網下載&#xff1a;https://nodejs.org/en/download/ 一直默認就行&#xff0c;路徑可以改變但要記得到 安裝完成后cmd&#xff0c;輸入node -v ,npm -v 如果能看到node和npm的版本號了&#xff0c;說明已經安裝成功 2、安裝vue-cli 有npm和cnpm兩種方式…

NPM 使用介紹

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到教程。 NPM是隨同NodeJS一起安裝的包管理工具&#xff0c;能解決NodeJS代碼部署上的很多問題&#xff0c;常見的使用場景有以下幾種&#xff1a…

人生致命的八個經典問題

問題一&#xff1a;如果你家附近有一家餐廳&#xff0c;東西又貴又難吃&#xff0c;桌上還爬著蟑螂&#xff0c;你會因為它很近很方便&#xff0c;就一而再、再而三地光臨嗎&#xff1f; 回答&#xff1a;你一定會說&#xff0c;這是什么爛問題&#xff0c;誰那么笨&#xff0c…

RabbitMQ學習總結(5)——發布和訂閱實例詳解

2019獨角獸企業重金招聘Python工程師標準>>> 一、Publish/Subscribe&#xff08;發布/訂閱&#xff09;&#xff08;using the Java Client&#xff09; 在前面的教程中,我們創建了一個work Queue&#xff08;工作隊列&#xff09;。工作隊列背后的假設是每個任務是…

iOS有哪些數據類型/基本數據類型?

簡述 本文主要探究使用OC作為iOS開發語言時&#xff0c;我們能使用哪些數據類型。 一切類型始于C。 C語言的類型 基本數據類型&#xff1a; 基本數據類型&#xff08;fundamental data types&#xff09;也叫原始數據類型&#xff08;primitive data types&#xff09; 整型、字…

李洋瘋狂C語言之將”you are come from shanghai ”倒置為”shanghai from come are you”,將句子中的單詞位置倒置,而不改變單詞內部結構

題目: 編寫一個C函數,將”you are come from shanghai ”倒置為”shanghai from come are you”,及將句子中的單詞位置倒置,而不改變單詞內部結構 #include <stdio.h> #include <string.h> void change(char *p1, char *p2); //函數聲明 int main() {char str[] …

馬桶怎么清洗才干凈無異味?

方法/步驟 在馬桶水箱中一定要放上潔廁寶&#xff1a; 潔廁寶里面含有多種去除馬桶中雜質以及異味的功能&#xff0c;另外它還帶有香香的味道&#xff0c;我們一按沖馬桶的按鈕&#xff0c;放出來的總是藍色的水&#xff0c;十分的美觀和好看&#xff0c;但是這并不是花瓶般的作…

白話解說:阻塞和非阻塞,同步和異步

阻塞和非阻塞&#xff0c;同步和異步是node.js里經常遇到的詞匯&#xff0c;舉例說明&#xff1a; 我要看足球比賽&#xff0c;但是媽媽叫我燒水&#xff0c;電視機在客廳&#xff0c;燒水要在廚房。家里有2個水壺&#xff0c;一個是普通的水壺&#xff0c;另一個是水開了會叫的…

蘇嵌點滴(一)

來蘇嵌也有12天了&#xff0c;也漸漸開始習慣這樣的生活&#xff0c;每天睜眼到閉眼&#xff0c;全都是代碼。每天都得學習很多新的知識&#xff0c;C語言學到現在也學得差不多了&#xff0c;還有明天一天課。 指針、數組這些C語言中的重點&#xff0c;還是需要一點時間消化的…

Mysql學習總結(8)——MySql基本查詢、連接查詢、子查詢、正則表達查詢講解...

2019獨角獸企業重金招聘Python工程師標準>>> 查詢數據指從數據庫中獲取所需要的數據。查詢數據是數據庫操作中最常用&#xff0c;也是最重要的操作。用戶可以根據自己對數據的需求&#xff0c;使用不同的查詢方式。通過不同的查詢方式&#xff0c;可以獲得不同的數據…

安裝OpenCL和AMD驅動程序

我們將安裝AMD OpenCL軟件開發工具包&#xff08;SDK&#xff09;和AMD驅動程序。 userubuntu:~$ mkdir AMD-APP-SDK-v2.5-lnx64 userubuntu:~$ cd AMD-APP-SDK-v2.5-lnx64/ userubuntu:~$ wgethttp://developer.amd.com/Downloads/AMD-APP-SDK-v2.5-lnx64.tgz userubuntu:~$ t…

Node.js -- Stream 使用小例 ( 流運用 :讀取、寫入、寫出、拷貝)

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到教程。 Stream 是一個抽象接口&#xff0c;Node 中有很多對象實現了這個接口。例如&#xff0c;對http 服務器發起請求的request 對象就是一個 …

李洋瘋狂C語言之有關“you are come from shanghai”逆序(二)

今天將指針和函數全部學完了&#xff0c;之前這題的做法&#xff0c;現在看來有點繁瑣&#xff0c;于是乎做了一些修改&#xff0c;下面是新的代碼 //you are from shanghai逆序#include <stdio.h> #include <string.h> //下面要用到strlenvoid reverse(c…

sync - 清空文件系統緩沖區

總覽 (SYNOPSIS) sync [OPTION] 描述 (DESCRIPTION) 強迫把更改的塊寫入磁盤&#xff0c; 并更新超級塊。 --help顯示幫助然后終止。--version顯示版本信息然后終止。 轉載于:https://www.cnblogs.com/fanweisheng/p/11101219.html

學會用好 Visual Studio Code

前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到教程。 Visual Studio Code是個牛逼的編輯器&#xff0c;啟動非常快&#xff0c;完全可以用來代替其他文本文件編輯工具。又可以用來做開發&…

蘇嵌點滴(二)

今天把指針和函數講完了&#xff0c;這些都還能接受&#xff0c;之后老師和我們講了遞歸&#xff0c;有點難度。 晚上電腦還出了點狀況&#xff0c;一個晚自習全用來重裝系統和學習軟件套裝X_X&#xff0c;調試完已經接近下課&#xff0c;遞歸還沒來得及看。 放學后&#xff…

Maven學習總結(五)——聚合與繼承

2019獨角獸企業重金招聘Python工程師標準>>> Maven學習總結(五)——聚合與繼承 一、聚合 如果我們想一次構建多個項目模塊&#xff0c;那我們就需要對多個項目模塊進行聚合 1.1、聚合配置代碼 1 <modules> 2 <module>模塊一</module> 3 …

19-6/28作業:100以內偶數求和

?作業要求 ?分析思路 在循環里面增加約束&#xff0c;使累加1變成累加2 ?do-while循環代碼 public class GaoSiFor { public static void main(String[] args) { //定義兩個變量 int sum 0; int i 0; //開始循環 do{ //…