【人工智能124種任務大集合】-集齊了自然語言處理(NLP),計算機視覺(CV),語音識別,多模態等任務

大家好,我是微學AI,今天給大家介紹一下人工智能124種任務大集合,任務集合主要包括4大類:自然語言處理(NLP)、計算機視覺(CV)、語音識別、多模態任務。
在這里插入圖片描述

我這里整理了124種應用場景任務大集合,每個任務目錄如下:

  1. 句子嵌入(Sentence Embedding):將句子映射到固定維度的向量表示形式。
  2. 文本排序(Text Ranking):對一組文本進行排序,以確定它們與給定查詢的相關性。
  3. 分詞(Word Segmentation):將連續的文本切分成單詞或詞塊的過程。
  4. 詞性標注(Part-of-Speech):對句子中的每個詞匯標注其相應的詞性。
  5. 標記分類(Token Classification):將輸入的文本序列中的每個標記分類為預定義的類別。
  6. 命名實體識別(Named Entity Recognition):識別文本中具有特定意義的命名實體,如人名、地點、組織等。
  7. 關系抽取(Relation Extraction):從文本中抽取出實體之間的關系或聯系。
  8. 信息抽取(Information Extraction):從非結構化文本中提取結構化的信息,如實體、關系和屬性等。
  9. 句子相似度(Sentence Similarity):衡量兩個句子之間的語義相似度或相關性。
  10. 文本翻譯(Translation):將一種語言的文本轉換為另一種語言的過程。
  11. 自然語言推理(NLI:Natural Language Inference):判斷給定的前提和假設之間的邏輯關系,包括蘊含、矛盾和中立等。
  12. 情感分類(Sentiment Classification):將文本分為積極、消極或中性等情感類別。
  13. 人像摳圖(Portrait Matting):從圖像中準確地分離人物主體與背景。
  14. 通用摳圖(Universal Matting):從圖像中準確地分離目標物體與背景,不限于人像。
  15. 人體檢測(Human Detection):檢測圖像或視頻中的人體位置。
  16. 圖像目標檢測(Image Object Detection):在圖像中檢測和定位多個目標對象。
  17. 圖像去噪(Image Denoising):降低圖像中的噪聲水平,改善圖像質量。
  18. 圖像去模糊(Image Deblurring):恢復模糊圖像的清晰度和細節。
  19. 視頻穩定化(Video Stabilization):對視頻進行抖動校正,使其穩定且平滑。
  20. 視頻超分辨率(Video Super-Resolution):通過增加視頻的像素級別細節來提高其分辨率。
  21. 文本分類(Text Classification):將文本分類為預定義的類別或標簽。
  22. 文本生成(Text Generation):根據給定輸入生成連續文本的過程。
  23. 零樣本分類(Zero-Shot Classification):將數據分類為模型從未在訓練階段見過的類別。
  24. 任務導向對話(Task-Oriented Conversation):進行與特定任務相關的對話和問答。
  25. 對話狀態跟蹤(Dialog State Tracking):跟蹤多輪對話中的用戶意圖和系統狀態的變化。
  26. 表格問答(Table Question Answering):根據表格數據回答相關問題。
  27. 文檔導向對話生成(Document-Grounded Dialog Generation):基于文檔內容生成相關對話回復。
  28. 文檔導向對話重新排序(Document-Grounded Dialog Rerank):對生成的對話回復進行排序,以選擇最佳回復。
  29. 文檔導向對話檢索(Document-Grounded Dialog Retrieval):從候選對話中檢索與文檔相關的最佳對話。
  30. 文本糾錯(Text Error Correction):自動糾正文本中的拼寫錯誤或語法錯誤。
  31. 圖像字幕生成(Image Captioning):根據圖像內容生成對圖像的描述性文字。
  32. 視頻字幕生成(Video Captioning):根據視頻內容生成對視頻的描述性文字。
  33. 圖像人像風格化(Image Portrait Stylization):將圖像中的人物主體應用藝術風格轉換。
  34. 光學字符識別(OCR Detection):從圖像中檢測和識別文字。
  35. 表格識別(Table Recognition):從圖像中自動識別表格結構和內容。
  36. 無線表格識別(Lineless Table Recognition):從無線表格圖像中自動識別表格結構和內容。
  37. 文檔視覺語義嵌入(Document-VL Embedding):將文檔映射到視覺語義空間的向量表示形式。
  38. 車牌檢測(License Plate Detection):在圖像中檢測和定位車輛的車牌區域。
  39. 填充掩碼(Fill-Mask):根據上下文和部分信息填充給定的掩碼。
  40. 特征提取(Feature Extraction):從輸入數據中提取有意義的特征表示。
  41. 動作識別(Action Recognition):識別視頻中的動作或行為。
  42. 動作檢測(Action Detection):在視頻中檢測和定位特定動作或行為。
  43. 直播分類(Live Category):對直播視頻進行分類,如體育、新聞、游戲等。
  44. 視頻分類(Video Category):對視頻進行分類,如電影、音樂、體育等。
  45. 多模態嵌入(Multi-Modal Embedding):將多種不同模態的數據映射到共享的向量空間。
  46. 生成式多模態嵌入(Generative Multi-Modal Embedding):將多模態數據映射到向量表示,并且能夠生成與之相關的數據。
  47. 多模態相似度(Multi-Modal Similarity):衡量多模態數據(例如圖像和文本)之間的相似性或相關性。
  48. 視覺問答(Visual Question Answering):根據給定的圖像和問題回答相關問題。
  49. 視頻問答(Video Question Answering):根據給定的視頻和問題回答相關問題。
  50. 視頻嵌入(Video Embedding):將視頻序列映射到固定維度的向量表示形式。
  51. 文本到圖像合成(Text-to-Image Synthesis):根據給定的文本描述合成相應的圖像。
  52. 文本到視頻合成(Text-to-Video Synthesis):根據給定的文本描述合成相應的視頻。
  53. 人體二維關鍵點(Body 2D Keypoints):檢測和跟蹤圖像中的人體關鍵點。
  54. 人體三維關鍵點(Body 3D Keypoints):在三維空間中檢測和跟蹤人體關鍵點。
  55. 手部二維關鍵點(Hand 2D Keypoints):檢測和跟蹤圖像中的手部關鍵點。
  56. 卡片檢測(Card Detection):在圖像中檢測和定位特定類型的卡片。
  57. 內容檢查(Content Check):檢查文本或圖像中是否存在不良、敏感或違法內容。
  58. 人臉檢測(Face Detection):檢測圖像或視頻中的人臉位置。
  59. 人臉活體檢測(Face Liveness):判斷圖像或視頻中的人臉是否為真實的活體,而非照片或視頻。
  60. 人臉識別(Face Recognition):識別圖像或視頻中的人臉,并將其與已知的身份進行匹配。
  61. 面部表情識別(Facial Expression Recognition):識別圖像或視頻中人臉的表情狀態,如快樂、悲傷、憤怒等。
  62. 面部屬性識別(Face Attribute Recognition):識別圖像或視頻中人臉的屬性,如年齡、性別、種族等。
  63. 面部二維關鍵點(Face 2D Keypoints):檢測和跟蹤圖像中的面部關鍵點。
  64. 面部質量評估(Face Quality Assessment):評估圖像或視頻中人臉圖像的質量。
  65. 視頻多模態嵌入(Video Multi-Modal Embedding):將多模態數據(如圖像和文本)映射到共享的向量空間。
  66. 圖像色彩增強(Image Color Enhancement):增強圖像的色彩飽和度、對比度和亮度等。
  67. 虛擬試衣(Virtual Try-On):通過計算機生成的技術,將虛擬服裝應用到真實人體圖像上,以實現在線試穿效果。
  68. 圖像上色(Image Colorization):將灰度圖像恢復為彩色圖像的過程。
  69. 視頻上色(Video Colorization):將黑白視頻恢復為彩色視頻的過程。
  70. 圖像分割(Image Segmentation):將圖像分成多個不同的區域或對象。
  71. 圖像駕駛感知(Image Driving Perception):利用計算機視覺技術提取圖像中與駕駛相關的信息,如車道線、交通標志等。
  72. 圖像深度估計(Image Depth Estimation):根據單目或雙目圖像估計場景中物體的深度或距離。
  73. 室內布局估計(Indoor Layout Estimation):根據室內圖像估計房間的布局結構。
  74. 視頻深度估計(Video Depth Estimation):根據視頻中的幀間信息估計場景中物體的深度或距離。
  75. 全景深度估計(Panorama Depth Estimation):在全景圖像中估計場景中物體的深度或距離。
  76. 圖像風格遷移(Image Style Transfer):將一個圖像的風格應用到另一個圖像上,以生成具有新風格的圖像。
  77. 面部圖像生成(Face Image Generation):生成逼真的面部圖像,可以用于人臉數據增強、數據生成等應用。
  78. 圖像超分辨率(Image Super-Resolution):通過增加圖像的像素級細節來提高其分辨率。
  79. 圖像去塊效應(Image Debanding):減少圖像中由壓縮引起的塊狀偽影或條紋噪聲。
  80. 圖像人像增強(Image Portrait Enhancement):改善圖像中人物主體的外觀、膚色等特征。
  81. 商品檢索嵌入(Product Retrieval Embedding):將商品映射到向量表示形式,以支持商品相關性檢索。
  82. 圖像到圖像生成(Image-to-Image Generation):根據給定的輸入圖像生成相應的輸出圖像。
  83. 圖像分類(Image Classification):將圖像分類為預定義的類別或標簽。
  84. 光學字符識別(OCR Recognition):從圖像中檢測和識別印刷體或手寫體的文字。
  85. 美膚(Skin Retouching):對人臉圖像進行美化處理,去除皮膚瑕疵、磨皮等。
  86. 常見問題解答(FAQ Question Answering):根據常見問題回答用戶的提問。
  87. 人群計數(Crowd Counting):根據圖像或視頻中的人群密度估計人數。
  88. 視頻單目標跟蹤(Video Single Object Tracking):在視頻序列中跟蹤單個目標對象。
  89. 圖像人物再識別(Image ReID - Person):根據圖像中的人物外觀特征進行身份再識別。
  90. 文本驅動分割(Text-Driven Segmentation):根據給定的文本描述,對圖像或視頻中的對象進行分割。
  91. 電影場景分割(Movie Scene Segmentation):將電影或視頻分割為不同的場景,每個場景代表一個獨立的情節或事件。
  92. 商店分割(Shop Segmentation):將商店內的物體或區域從圖像或視頻中分割出來,用于商品展示、智能監控等應用。
  93. 圖像修復(Image Inpainting):根據已有的圖像內容,填補缺失或損壞的部分,恢復原始圖像的完整性。
  94. 圖像按范例繪制(Image Paint-By-Example):根據給定的范例圖像,將其他圖像修改為具有相似繪畫風格或效果的圖像。
  95. 可控圖像生成(Controllable Image Generation):通過控制輸入參數或向量,生成具有特定屬性、風格或特征的圖像。
  96. 視頻修復(Video Inpainting):根據已有的視頻內容,填補缺失或損壞的幀或區域,恢復原始視頻的完整性。
  97. 視頻人像摳像(Video Human Matting):將視頻中的人物從背景中分割出來,以便進行后續的編輯或特效處理。
  98. 人體重建(Human Reconstruction):基于給定的圖像、視頻或傳感器數據,重建人體的三維模型或姿態信息。
  99. 視頻幀插值(Video Frame Interpolation):對給定的兩個視頻幀之間的幀進行生成,以增加視頻的幀率或平滑過渡。
  100. 視頻去隔行(Video Deinterlace):將隔行掃描的視頻轉換為逐行掃描,提高視頻播放的質量和流暢度。
  101. 全身人體關鍵點檢測(Human Wholebody Keypoint Detection):在圖像或視頻中檢測和定位人體的關鍵點,例如頭部、手、腳等。
  102. 靜態手勢識別(Hand Static):通過分析手掌形狀、手指姿勢等信息,識別圖像或視頻中的靜態手勢。
  103. 人臉、人體和手部檢測(Face-Human-Hand Detection):檢測和定位圖像或視頻中的人臉、人體和手部區域。
  104. 人臉情緒分析(Face Emotion):通過分析人臉表情,判斷圖像或視頻中人臉所表達的情緒狀態。
  105. 商品分割(Product Segmentation):將圖像或視頻中的商品或產品從背景中分割出來,用于商品識別、廣告推薦等應用。
  106. 參考視頻對象分割(Referring Video Object Segmentation):根據給定的參考圖像或視頻,對圖像或視頻中的對象進行分割。
  107. 視頻摘要(Video Summarization):根據視頻的內容和特征,生成視頻的摘要或概覽,提供視頻瀏覽和檢索的便利性。
  108. 圖像天空變換(Image Sky Change):將圖像中的天空部分替換為不同的天空背景,改變圖像的氛圍和環境。
  109. 翻譯評估(Translation Evaluation):根據給定的翻譯結果,評估其質量、準確性以及與原文的一致性。
  110. 視頻對象分割(Video Object Segmentation):將視頻中的對象從背景中分割出來,以便進行后續的編輯或特效處理。
  111. 視頻多目標跟蹤(Video Multi-Object Tracking):在視頻中同時跟蹤多個移動目標,實時定位和追蹤目標的位置。
  112. 多視角深度估計(Multi-View Depth Estimation):通過多個視圖或圖像,估計場景中物體的三維深度信息。
  113. 少樣本檢測(Few-Shot Detection):在只有少量標注樣本的情況下,進行目標檢測任務,提高模型的泛化能力。
  114. 人體形狀重塑(Body Reshaping):根據圖像或視頻中的人體區域,調整人體的形狀、姿態或比例,改變人體外貌。
  115. 人臉融合(Face Fusion):將一個人的面部特征或表情融合到另一個人的頭像上,生成具有兩者特點的合成圖像。
  116. 圖像匹配(Image Matching):在圖像庫或數據庫中,找到與給定圖像最相似或匹配的圖像。
  117. 圖像質量評估 - 主觀評分(Image Quality Assessment - MOS):通過主觀評分的方法,評估圖像的質量,反映人眼對圖像的感知。
  118. 圖像質量評估 - 降質度量(Image Quality Assessment - Degradation):通過客觀度量的方法,評估圖像在不同變換或壓縮條件下的質量。
  119. 視覺高效調優(Vision Efficient Tuning):通過自動化的方法,快速調優和優化視覺模型和算法,提升計算效率和準確性。
  120. 三維目標檢測(Object Detection 3D):在三維空間中,檢測和定位目標物體的位置、尺寸和姿態。
  121. 壞圖像檢測(Bad Image Detecting):識別和檢測出圖像中存在的噪點、模糊、失真等不良或低質量的圖像。
  122. Nerf重建精度評估(NeRF Reconstruction Accuracy):評估神經輻射場(NeRF)模型在建立3D場景重建時的準確性和質量。
  123. Siamese UIE:Siamese網絡用于UIE任務,即輸入用戶界面元素識別或生成的相關問題。
  124. 數學公式識別(LatexOCR):圖片中數學公式的latex識別。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/35896.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/35896.shtml
英文地址,請注明出處:http://en.pswp.cn/news/35896.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

JavaScript基礎之基于數據類型和引用數據類型

原文合集地址如下,有需要的朋友可以關注 本文地址 數據類型 JavaScript的數據類型有7中,包括6個基本類型和一個引用類型 基本數據類型:number, string, boolean, null, undefined, symbol 引用數據類型:object(數組…

工業物聯網數據橋接教程:Modbus 橋接到 MQTT

Modbus 介紹 Modbus 是一種串行通信協議,用于連接工業自動化設備,最初由 Modicon 公司開發,誕生于 1979 年,現在已成為通用的通訊標準之一,廣泛用于工業自動化場景。 Modbus 采用主從模式,支持多種傳輸方…

PyTorch深度學習實戰(11)——卷積神經網絡

PyTorch深度學習實戰(11)——卷積神經網絡 0. 前言1. 全連接網絡的缺陷2. 卷積神經網絡基本組件2.1 卷積2.2 步幅和填充2.3 池化2.3 卷積神經網絡完整流程 3. 卷積和池化相比全連接網絡的優勢4. 使用 PyTorch 構建卷積神經網絡4.1 使用 PyTorch 構建 CNN…

H5移動端附件下載

目錄 H5移動端附件下載 1. 使用 window.open() 進行下載 2. 使用 a 標簽創建隱藏的可下載鏈接 3. 使用 iframe 進行下載 4. 使用 FileSaver.js 插件下載 4.1 Vue項目中導入并使用下載附件 4.2 FileSaver.js 的其他知識 H5移動端附件下載 1. 使用 window.open() 進行下載…

ClickHouse的數據類型

1.整數型 固定長度的整型,包括有符號整型或無符號整型。整型范圍(-2n-1~2n-1-1): Int8 - [-128 : 127] Int16 - [-32768 : 32767] Int32 - [-2147483648 : 2147483647] Int64 - [-9223372036854775808 : 9223372036854775807]無符…

Linux學習之sed多行模式

N將下一行加入到模式空間 D刪除模式空間中的第一個字符到第一個換行符 P打印模式空間中的第一個字符到第一個換行符 doubleSpace.txt里邊的內容如下: goo d man使用下邊的命令可以實現把上邊對應的內容放到doubleSpace.txt。 echo goo >> doubleSpace.txt e…

sealos安裝k8s

一、前言 1、我前面文章有寫過使用 kubeadm 安裝的方式,大家可以去參考 (二)k8s集群安裝,有一系列的k8s文章說明 2、安裝k8s的方式有很多 kubeadmsealoskubespray等等 3、關于sealos來安裝 k8s ,也是非常建議大家去…

Idea 反編譯jar包

實際項目中,有時候會需要更改jar包源碼來達到業務需求,本文章將介紹一下如何通過Idea來進行jar反編譯 1、Idea安裝decompiler插件 2、找到decompiler插件文件夾 decompiler插件文件夾路徑為:idea安裝路徑/plugins/java-decompiler/lib 3、…

可獨立創建應用的SaaS多租戶低代碼平臺之租戶的應用管理說明

在IT系統中,“租戶”(tenant)通常用于指代一種多租戶架構(multi-tenancy),它是一種軟件架構模式,允許多個用戶或組織共享相同的應用程序或系統實例,但彼此之間的數據和配置被隔離開來…

C#軟件外包開發框架

C# 是一種由微軟開發的多范式編程語言,常用于開發各種類型的應用程序,從桌面應用程序到移動應用程序和Web應用程序。在 C# 開發中,有許多框架和庫可供使用,用于簡化開發過程、提高效率并實現特定的功能。下面和大家分享一些常見的…

代駕小程序怎么做

代駕小程序是一款專門為用戶提供代駕服務的手機應用程序。它具有以下功能: 1. 預約代駕:代駕小程序允許用戶在需要代駕服務時提前進行預約。用戶可以選擇出發地點、目的地以及預計用車時間,系統會自動匹配最合適的代駕司機,并確保…

黑馬B站八股文學習筆記

視頻地址:https://www.yuque.com/linxun-bpyj0/linxun/vy91es9lyg7kbfnr 大綱 基礎篇 基礎篇要點:算法、數據結構、基礎設計模式 1. 二分查找 要求 能夠用自己語言描述二分查找算法能夠手寫二分查找代碼能夠解答一些變化后的考法 算法描述 前提&a…

div 中元素居中的N種常用方法

本文主要記錄幾種常用的div盒子水平垂直都居中的方法。本文主要參考了該篇博文并實踐加以記錄說明以加深理解記憶 css之div盒子居中常用方法大全 本文例子使用的 html body結構下的div 盒子模型如下&#xff1a; <body><div class"container"><div c…

休息是不可能休息的

654.最大二叉樹 分析&#xff1a;相比較遍歷順序構建二叉樹&#xff0c;這個相對簡單。 思路&#xff1a;每次找到數組最大值&#xff0c;然后分割數組 class Solution { public:TreeNode*judge(vector<int>&nums){if(nums.size()0) return nullptr;int maxNum0,in…

Springboot 實踐(1)MyEclipse2019創建maven工程

項目講解步驟&#xff0c;基于本機已經正確安裝Java 1.8.0及MyEclipse2019的基礎之上&#xff0c;Java及MyEclipse的安裝&#xff0c;請參考其他相關文檔&#xff0c;Springboot 實踐文稿不再贅述。項目創建講解馬上開始。 一、首先打開MyEclipse2019&#xff0c;進入工作空間選…

Linux系統下安裝Git軟件

環境說明 Linux系統&#xff1a;CentOS 7.9 安裝GCC等 JDK版本&#xff1a;jdk-8u202-linux-x64.tar.gz Maven版本&#xff1a;apache-maven-3.8.8-bin.tar.gz 在以上環境下安裝Git&#xff08;git-2.41.0.tar.gz&#xff09;軟件。 查看是否安裝Git軟件 查看Git版本&#…

如何建設指標管理平臺,實現企業運營效率提升

隨著企業數字化轉型的深入推進&#xff0c;建設指標管理平臺已經成為企業數字化轉型的重要組成部分。 建設指標管理平臺可以幫助企業更好地了解業務數據和業務指標&#xff0c;實現數據可視化和智能化分析&#xff0c;提高企業的決策效率和管理水平。 在過去&#xff0c;企業通…

【深入了解PyTorch】PyTorch分布式訓練:多GPU、數據并行與模型并行

【深入了解PyTorch】PyTorch分布式訓練:多GPU、數據并行與模型并行 PyTorch分布式訓練:多GPU、數據并行與模型并行1. 分布式訓練簡介2. 多GPU訓練3. 數據并行4. 模型并行5. 總結PyTorch分布式訓練:多GPU、數據并行與模型并行 在深度學習領域,模型的復雜性和數據集的巨大規…

最小路徑和——力扣64

文章目錄 題目描述動態規劃題目描述 動態規劃 class Solution {public:int minPathSum(vector<vector<int>>

Python爬蟲(十一)_案例:使用正則表達式的爬蟲

本章將結合先前所學的爬蟲和正則表達式知識&#xff0c;做一個簡單的爬蟲案例&#xff0c;更多內容請參考:Python學習指南 現在擁有了正則表達式這把神兵利器&#xff0c;我們就可以進行對爬取到的全部網頁源代碼進行篩選了。 下面我們一起嘗試一下爬取內涵段子網站&#xff1…