百度云智能媒體內容分析一體機(MCA)建設

導讀 :本文主要介紹了百度智能云MCA產品的概念和應用。

媒體信息海量且復雜,采用人工的方式對視頻進行分析處理,面臨著效率低、成本高的困難。于是,MCA應運而生。它基于百度自研的視覺AI、ASR、NLP技術,為用戶提供音視頻、圖片、文本的內容分析能力,實現標簽提取、智能封面提取、高光片段分析等功能。

01 背景與目標

對于涉及廣電新聞、娛樂社交等UGC、AIGC的企業來說,有效地收集、整理、分析和呈現視頻內容,不僅能幫助企業在競爭中拔得頭籌,還有利于做出更優的業務決策。可是,這會面臨一些挑戰:

  • 標簽要覆蓋大量業務場景,否則就需要建設多個數據集,不易于統計和分析;

  • 分析維度應支持自由配置,否則無法滿足個性化的業務需求;

  • 支持分析不同格式的媒體內容,同時,處理視頻的速度要快。

百度智能云媒體內容分析(Media Content Analysis),就是為了幫助企業提高內容分析的效率、縮減平臺的人力成本,而建設的一體機產品:

MCA將AI技術落地于媒體行業內容分析場景,可以助力企業內容推薦與搜索業務發展,賦能媒體行業,助力產業升級。

02 技術方案

根據公開信息可知,MCA的定位是“實現智能媒體內容分析的一體機產品”,用戶可以選擇公有云或私有化的部署方式,自定義配置內容分析的維度,并呈現可視化的分析結果。

AI技術托底(大模型):MCA借助百度強大的 AI 技術、沉淀已久的海量級數據,針對視頻場景進行專門的優化,可以達到最優的識別效果。

影視綜知識圖譜(業內領先):根據影視劇/綜藝類視頻的場景、人臉、標題等內容,推理返回劇集名稱、別稱、演員表、一句話簡介、上映時間、地點等信息,幫助補充視頻標簽。

公眾人臉庫(專業):基于百度百科的海量人臉數據,收錄了領導人、藝術家、影視明星、體育明星、社會活動家等國內外公眾人物,總數量超70萬。

召回率提升(高效):對比人工瀏覽視頻內容標注出的視頻標簽的數量,使用視頻內容分析MCA的結構化標簽數量提升了10倍左右,能夠準確描述視頻中的細節內容、提升視頻的搜全率。

2.1 整體架構

按照功能劃分,MCA的層級架構如圖所示:

業務系統的核心功能如圖所示:

MCA產品的主要功能如下:

a. 智能視頻標簽:為視頻文件或直播流的內容打標簽,可輸出視頻的場景、公眾人物、地點、實體和關鍵詞等結構化標簽信息;

b. 智能圖片標簽:對圖片內容進行打標簽,可輸出圖片中公眾人物、logo、實體和關鍵詞等結構化標簽信息;

c. 智能封面:通過對視頻、圖像等內容理解,從圖像清晰度、構圖美學和精彩程度等方面分析,生成視頻的靜態封面、動態封面、視頻封面;

d. 精彩視頻分析:通過場景切分、音頻特征分析等技術,提取影視綜長視頻中的高光時刻。

2.2 技術實現的細節闡釋

登錄百度智能云平臺官網,進入“一念 > 內容分析”產品頁面。

2.2.1 智能標簽

登錄成功、進入產品頁面后,進入智能標簽 > 視頻內容分析,點擊“創建視頻內容分析”,創建分析任務。

MCA支持三種視頻導入方式:本地文件導入、BOS 地址導入、在線地址導入。

輸入限制:

  • 文件格式:3gpp、asf/wmv、avi、flv/f4v、mkv、mov/mp4/m4a、mp3、mp2、mpeg/mpg、ts/ogg、mts、wmv/wma、rm/rmvb、webm等;

  • 視頻編碼標準:H.264、H.263/H.263+、MPEG-1/2/4、VP8/9、Quicktime、RealVideo、WMV、MJPEG等;

  • 音頻編碼標準:MP1、MP2、MP3、AAC、AC-3、WMA、PCM、ADPCM、AMR、RealAudio、Vorbis、DSD等;

  • 分析時長6小時以內,分辨率大于30X30;

  • 分析視頻的audio、video編碼信息須至少存在一個,不能為空;

  • 可批量上傳音視頻文件,最多可同時上傳20個文件。

分析過程中可以看到分析狀態(排隊中→分析中→分析完成/分析失敗)。如果分析失敗,可以將鼠標移到分析失敗旁邊的圖標上查看失敗原因。若分析完成,則可查看分析結果。

點擊分析完成視頻的“查看詳情”按鈕,即可查看視頻分析的結果.

右側的頁簽可以查看不同維度的中間分析結果,下側為標簽提取結果。

2.2.2 智能封面

開啟后,系統將結合清晰度、人臉、構圖、場景識別等特征信息,綜合輸出視頻中適合做封面的圖片。

點擊智能封面分析,進入智能封面分析頁面。

點擊創建智能封面分析,創建分析任務。

分析過程中可以看到分析狀態(排隊中→分析中→分析完成/分析失敗)。

點擊分析完成視頻的“查看詳情”按鈕,即可查看視頻的封面結果。


2.2.3 精彩視頻分析

登錄成功、進入產品頁面后,點擊精彩視頻分析,進入精彩視頻分析頁面。

點擊創建精彩視頻分析,創建分析任務。

分析過程中可以看到分析狀態(排隊中→分析中→分析完成)。

分析完成后,點擊“查看詳情”按鈕,即查看視頻的精彩片段。


2.2.4 自定義庫

系統支持自定義LOGO庫與自定義人臉庫、自定義文本庫功能。

自定義人臉庫,區別于公共人物庫,目的在于可以讓客戶管理自身業務所需的人臉集,是公共庫的重要補充。

  • 人臉照片的要求:正面的(證件照類型的正面)或微微側面的(五官顯示完整)、面部光線均勻(輪廓清晰,無口罩、帽子、深色墨鏡遮擋,無濃妝)。對于戴眼鏡的人臉,眼鏡框不可遮擋眼睛區域,鏡片應無色或不嚴重反光。

  • 畫質:畫質清晰、面部區域不要有字幕、水印等遮擋物。

  • 數量:一個人物需要5張左右照片。

自定義人臉庫的關系如下:

支持用戶配置自定義LOGO庫,并綁定在模板上。

自定義文本庫創建后,用戶可選擇將其關聯為黑庫或白庫。

03 總結

在大模型的加持下,MCA能夠更好地幫助企業降本增效:

  • 業務提效:對比人工瀏覽視頻內容標注出的視頻標簽,使用媒體內容分析 MCA 可提升 3~5 倍的分析效率。

  • 部署靈活:可通過SaaS、API接口調用、私有化部署的方式接入MCA服務,輕松適配多種業務場景,滿足企業各種業務需求,能快速實現集成和落地。

  • 管理便捷:支持創建普通用戶和超級管理員用戶,普通用戶僅能使用產品功能,不具備用戶管理權限,超級管理員用戶具備用戶管理權限;不同用戶之前的視頻分析歷史任務可以互相隔離。

————END————

推薦閱讀

產品分享|百度智能云旗下,作為“行業首創”的媒體內容分析MCA是什么_智能媒體分析-CSDN博客

干貨分享|視頻的結構化標簽問題_長視頻內容結構化標簽-CSDN博客

玩轉百度云 AI 服務:成為海量視頻的超級管理員!-CSDN博客

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/41360.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/41360.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/41360.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Vue 性能革命:揭秘前端優化的終極技巧;Vue優化技巧,解決Vue項目卡頓問題

目錄 Vue優化路徑 一、使用key 二、使用凍結對象 三、使用函數式組件 四、使用計算屬性 五、使用非實時綁定的表單項 六、保持對象引用穩定 6.1、保持對象引用穩定定義 6.2、保持對象引用穩定與不穩定的例子 6.3、vue2判斷數據是否變化是通過hasChanged函數實現的 ①…

2024年【四川省安全員B證】考試及四川省安全員B證考試題

題庫來源:安全生產模擬考試一點通公眾號小程序 2024年【四川省安全員B證】考試及四川省安全員B證考試題,包含四川省安全員B證考試答案和解析及四川省安全員B證考試題練習。安全生產模擬考試一點通結合國家四川省安全員B證考試最新大綱及四川省安全員B證…

golang項目中gorm框架的配置和具體使用

最近在改造golang項目,從postgre數據庫遷移到達夢數據庫,我還想在改造后的項目使用 gorm 操作數據庫,保持較小的改動。查找了不少資料,最終從以下兩篇文章中借鑒了不少 1、Gorm 入門介紹與基本使用 這篇知乎文章詳細介紹了 gorm 框…

C語言 -- 操作符詳解?

C語言 -- 操作符詳解? 1. 操作符的分類2. 二進制和進制轉換?2.1 2進制轉10進制?2.1.1 10進制轉2進制數字? 2.2 2進制轉8進制和16進制?2.2.1 2進制轉8進制?2.2.2 2進制轉16進制? 3. 原碼、反碼、補碼?4. 移位操作符?4.1 左移操作符? 4.2 右移操作符?5. 位操作符&…

Symfony實戰手冊:PHP框架的高級應用技巧

引言 Symfony是一個功能強大且廣泛應用于PHP應用程序開發的框架,它提供了許多高級特性和工具,可以幫助開發人員更高效地構建和管理復雜的Web應用程序。以下是Symfony框架的幾個關鍵方面及其高級應用技巧: 1. 路由和控制器 Symfony的路由組…

suricata7 rule格式

suricata 7.0.5 suricata rule由三部分組成, action, header, options action,決定當前規則匹配上后需要執行的動作header,定義當前規則的協議,IP地址,端口,方向options,定義了具體的規則 一、 action 合法的action值有&#x…

Linux_共享內存通信

目錄 1、共享內存原理 2、申請共享內存 2.1 ftok 2.2 測試shmget、ftok 2.3 查看系統下的共享內存 3、關聯共享內存 3.1 測試shmat 4、釋放共享內存 4.1 測試shmctl 5、實現共享內存通信 6、共享內存的特性 結語 前言: 在Linux下,有一…

爆!Java高級特性之Stream API詳解

爆!Java高級特性之Stream API詳解 Java 8引入的Stream API可以說是一個革命性的特性,讓我們告別了又臭又長的for循環,迎來了函數式編程的春天。今天就讓我們來一起深入了解這個讓人又愛又恨的Stream API吧! 什么是Stream? Stream就像一個高級的迭代器,允許我們以…

分支與循環

目錄 1. if語句 1)if 2) else 3)分支中包含多條語句 4)if嵌套 2.關系操作符 3.條件操作符 4.邏輯操作符:&& || ! 1) 邏輯取反運算符 !?編輯 2 與運算符?編輯 3) 或運算符?編輯 4) 閏年的判斷 5) 短路 …

LangChain 概述 (模塊索引)

文章目錄 一、下載二、核心功能1、流式傳輸 streaming 三、LCEL四、組成部分1、Promp template2、Example selectors (示例選擇器)3、Chat models (聊天模型)4、Messages (消息)5、LLMs (大語言模型) 一、下載 二、核心功能 其中包括以下內容: 從模型中返回結構化的…

若依 Vue 前端分離 3.8.8 版中生成的前端代碼中關于下拉框只有下拉箭頭的問題

生成代碼修改前 <el-form-item label"課程學科" prop"subject"><el-select v-model"queryParams.subject" placeholder"請選擇課程學科" clearable><el-optionv-for"dict in course_subject":key"dict…

Mysql中常用函數的使用示例

場景 基礎知識回顧&#xff1a;mysql中常用函數的使用示例。 注&#xff1a; 博客&#xff1a;霸道流氓氣質-CSDN博客 實現 數學函數 -- ABS(x)返回x的絕對值 SELECT ABS(-1),ABS(2); -- PI()返回圓周率 SELECT PI(); -- SQRT(x)返回非負數x的二次方根 SELECT SQRT(4); -…

【博士每天一篇文獻-算法】Adult neurogenesis acts as a neural regularizer

閱讀時間&#xff1a;2023-12-20 1 介紹 年份&#xff1a;2022 作者&#xff1a;Lina M. Tran&#xff0c;Adam Santoro&#xff0c;谷歌DeepMind 期刊&#xff1a; Proceedings of the National Academy of Sciences 引用量&#xff1a;13 代碼&#xff1a;https://github.c…

A4-C四驅高防輪式巡檢機器人

在當今數字化和智能化迅速發展的時代&#xff0c;旗晟智能帶來了一款革命性的創新產品——A4-C四驅高防輪式巡檢機器人。這款機器人以其卓越的性能和多功能性&#xff0c;為工業巡檢領域帶來了全新的解決方案。 一、產品亮點 1、四驅動力與高防護設計 四驅高防輪式巡檢機器人…

ASUS/華碩槍神4 G532L G732L系列 原廠win10系統 工廠文件 帶F12 ASUS Recovery恢復

華碩工廠文件恢復系統 &#xff0c;安裝結束后帶隱藏分區&#xff0c;一鍵恢復&#xff0c;以及機器所有驅動軟件。 系統版本&#xff1a;Windows10 原廠系統下載網址&#xff1a;http://www.bioxt.cn 需準備一個20G以上u盤進行恢復 請注意&#xff1a;僅支持以上型號專用…

GPT-2怎么做翻譯任務?

首先需要知道的是GPT-2無論在訓練還是推理過程都是只使用了transformer decoder&#xff0c;并沒有使用encoder結構&#xff0c;那么它是怎么做的翻譯任務呢&#xff1f; 使用transformer encoderdecoder的著名架構有&#xff1a; 最原始的transformer model&#xff08;Atte…

計算機應用數學--第一次作業

第一次作業計算題編程題 &#xff08;20分&#xff09; 第一次作業 計算題 &#xff08;20分&#xff09;求 E ( X ) E(X) E(X)&#xff0c; V a r ( X ) Var(X) Var(X) &#xff08;1&#xff09; X X X 服從 [ a , b ] [a,b] [a,b] 均勻分布。 &#xff08;2&#xff09;…

操作系統期末必考概念大綱(整理·全)

第一章 1、 操作系統的概念 2、 計算機發展的四個階段 3、 手工操作階段、批處理系統階段、多道程序系統階段、分時操作系統階段、通用操作系統階段 4、 批處理系統&#xff08;聯機、脫機&#xff09; 5、 操作系統的6個基本類型 6、 多道批處理特征 7、 分時系統特點 8、 算法…

第二節-K8s詞匯表

關鍵字詞匯表 https://kubernetes.io/zh-cn/docs/reference/glossary/?fundamentaltrue API Group (API 組)Kubernetes API 中的一組相關路徑。 API 服務器亦稱作:kube-apiserver API 服務器是 Kubernetes 控制平面的組件&#xff0c; 該組件負責公開了 Kubernetes API&…

2024年智慧教育與社會科學國際會議 (ICSSS 2024)

2024年智慧教育與社會科學國際會議 (ICSSS 2024) 2024 International Conference on Smart Education and Social Sciences 【重要信息】 大會地點&#xff1a;北京 大會官網&#xff1a;http://www.icicsss.com 投稿郵箱&#xff1a;icicssssub-conf.com 【注意&#xff1a;稿…