音視頻技術開發周刊 | 306

每周一期,縱覽音視頻技術領域的干貨。

新聞投稿:contribute@livevideostack.com。

d209dad83951c929fb35ce711deff569.png

人工智能研究人員聲稱,通過Zoom音頻檢測擊鍵的準確率為93%

通過記錄按鍵并訓練深度學習模型,三位研究人員聲稱,基于單個按鍵的聲音特征,他們在解釋遠程按鍵方面的準確率達到了90%以上。

https://arstechnica.com/gadgets/2023/08/type-softly-researchers-can-guess-keystrokes-by-sound-with-93-accuracy/

GitHub 1.1萬星,模擬軟件開發流程,開源框架MetaGPT爆火

隨著大型語言模型(LLM)的日漸成熟,利用其構建 AI 智能體成為一個新的研究方向。已有研究使用 LLM 驅動多智能體自主完成了一些任務。然而,現有研究主要集中在簡單任務上,缺乏對復雜任務的探索。這主要是因為大型語言模型存在「幻覺」問題,特別是當多個智能體相互作用時,幻覺會進一步被放大,以至于無法用于復雜任務。最近,一個名為「MetaGPT」的開源框架嘗試解決這個問題。

對話Sam Altman與Greg Brockman:初心和過去,信念和現在,責任和未來

近日,硅谷著名投資人Reid Hoffman和Aria Finger聯手對Sam Altman和Greg Brockman進行了一場訪談,訪談涉及到主題有:OpenAI的使命,人工智能對教育、醫療等行業的變革性影響,人工智能如何面對監管,OpenAI成功的關鍵,未來的發展暢想。?

cd426fb5fe7d38db3a978bc59a0aaf97.png

麥肯錫:ChatGPT等生成式AI加速,美國30%工作時間將實現自動化

全球頂級咨詢調查機構麥肯錫發布了《生成式AI與美國未來工作》的深度調查報告,詳細分析了生成式AI對美國勞動力市場的影響。

AI日報|ChatGPT更聰明了;為什么蘋果不主動在AI領域炫技?

此前有消息稱,OpenAI 購買了 AI.com,以便將其重定向到 ChatGPT 網頁界面,這引起了一陣騷動。

OpenAI CEO親自示范!自定義指令上手攻略,調教專屬定制化AI助手

OpenAI推出了ChatGPT的自定義指令功能后,似乎沒有收到用戶們的熱情回應,Altman本人都下場親自教大家使用。

NeRF與三維重建相關

本文對室外神經輻射場使用深度先驗進行了全面的研究和評估,涵蓋了常見的深度傳感技術和大多數應用方式。

b0992e62a62bef624f5976ba7595f649.png

ICASSP 2023說話人識別方向論文合集(二)

本文是 ICASSP 2023說話人識別方向論文合集系列第二期,整理了 Speaker Verification 后16篇和 Speaker Diarization 部分的17篇。

基于AI和NPU的Codec變革——VPU與NPU的協同創新

在這個快速變化的數字媒體時代,Codec技術在視頻和音頻處理中扮演著至關重要的角色。AI的崛起為Codec帶來了前所未有的機遇和挑戰,同時VPU與NPU的發展與協同創新,使得Codec能夠更好地適應復雜的場景和需求。

面對算力瓶頸,如何利用CPU解決全鏈路智能編碼?

英特爾是半導體行業和計算創新領域的全球領先廠商。與合作伙伴一起,英特爾推動了人工智能、5G、智能邊緣等轉折性技術的創新和應用突破,驅動智能互聯世界。

業內首次!快手直播盛夏巔峰之夜應用全鏈路4K+HDR直播技術

2023快手直播盛夏巔峰之夜近期在上海舉行,在4小時的直播中,快手首次采用了全鏈路4K+HDR直播技術,實現了從清晰度到光影色彩的全面提升,為觀眾呈現了一場極致的視覺盛宴,這也是該項技術在業內大型直播活動中的首次應用。

eda8d9cae90dad1697e321c9919b297c.png

MediaUni——面向未來的流媒體傳輸網絡設計與實踐

本文從應用對流媒體傳輸網絡的要求、MediaUni定位與系統架構、MediaUni技術剖析、基于MediaUni的應用落地和流媒體傳輸網絡的未來5個方面展開介紹。

超低延時直播技術的前世今生

據中國互聯網絡信息中心發布的《中國互聯網絡發展狀況統計報告》顯示,截止到 2022 年 6 月我國網絡直播用戶規模達到了 7.16 億,占網民整體的 68.1% 。

華為參與制定標準,無線短距通訊“卷王”來了

一年一度的華為HDC(開發者大會)如約而至,帶來了萬眾矚目的HarmonyOS 4.0,盤古大模型、方舟引擎等一系列前沿技術,也亮相新一代無線短距通信技術:星閃 NearLink。

a36a35ca3e0d582d23c098b5ba13fa00.png

自動駕駛與GNSS之戀

GNSS是所有衛星導航定位系統的總稱,凡是可以通過捕獲跟蹤其衛星信號實現定位的系統,均可納入GNSS系統的范圍。GNSS信號是廣播式,即只要你能收到信號,就可以實現定位,不需要用戶和衛星進行交互,即理論上來說,GNSS系統的用戶容量是無限的。

目前主流車企都使用的哪些車機芯片和智能駕駛芯片?

目前市面關于自動駕駛行泊一體的解決方案基本都用到多顆SoC的策略,常見組合包括低算力TDA4 * 2方案、TDA4 + 3J3方案、高算力Orin * 2(*4)方案、MDC610 * 2方案等等,多顆SoC是如何聯合工作的是個很有意思的問題,今天拿TI的雙TDA4方案做一下解讀,其中的思路可以幫助理解其它多SoC方案。

9192d57b185bfb8016905885315b85ac.png

大有可為的模擬芯片

模擬芯片負責處理連續的模擬信號。半導體市場主要包括集成電路(即芯片)、分立器件、光電子器件、傳感器等四大類產品,其中集成電路市場占比最大。

00b27d5ebe475dd3e7cac6b62c0bbda1.png

Pro Tools現已免費提供MPEG-H制作插件

Fraunhofer IIS的MPEG-H制作插件現已免費提供給Pro Tools Ultimate客戶。前不久,Fraunhofer IIS宣布與Avid建立戰略合作伙伴關系。Avid為Pro Tools Ultimate客戶提供MPEG-H制作功能,代表著合作關系愈加深入,從而為音頻創作開啟無限創意可能。

https://www.audioblog.iis.fraunhofer.com/cn/mpegh-pro-tools

1d2a994fc69857dba802ebdbd0b92bf0.png

音頻編解碼學習--MDCT 學習

在音頻編解碼中,MDCT變換是一個非常重要的基礎概念,它在MP3和OGG介紹中都有涉及到。MDCT變換是一種數學變換,它將時域信號轉換為頻域信號,這對于音頻編解碼來說非常關鍵。

b1f22c2e368137977b3d1942ac3f03e9.png

Spectral sensor及其在手機領域的應用

Spectral sensor可以說是多光譜成像的一個變種。多光譜成像一般是用在食品、工業檢測,以及地球遙感成像領域。

CVPR 2023 Tutorial Talk | 走向統一的視覺理解界面

如果我們對計算機視覺模型進行類似的預測,現在我們正在應對不同類型的圖像級任務,如圖像分類、圖像描述,以及像素級任務圖像分割等。實際上我們感興趣的是,如何遵循類似語言模型的發展路徑,進行統一,并增進計算機視覺模型的人類-AI 交互。

3d7d7da44bd0733159179bb649a04747.png

告別VR噩夢!Meta Reality Labs破解虛擬痛點,重塑全新VR世界

在SIGGRAPH 2023大會上,來自Meta Reality Labs的兩個原型機讓我們看到了「未來的一瞥」。

顯示技術專家Karl談Vision Pro:用虛擬屏替代物理屏是荒謬想法

近眼顯示技術專家卡爾·古塔格(Karl Guttag)對蘋果Vision Pro的分析。

CVPR 2023教程 | 多模態智能體-鏈接大模型

在 Linjie Li 的演講中,她回答了多模態智能體中的重要問題之一:如何用大模型將多模態智能體串聯起來。

33fb2bd7fabd7f3d49c5ba8228f2571b.png

全球半導體行業格局與演變趨勢

過去五年里,芯片制造行業發生了重大變化,例如英特爾將桂冠輸給了兩個相對較新的競爭者——三星和臺積電。

NVIDIA使擴展現實流更具可擴展性,可定制給企業和開發人員

各行各業的組織都在使用擴展現實(XR)來重新設計工作流程并提高生產力,無論是沉浸式培訓還是協作式設計。

https://blogs.nvidia.com/blog/2023/08/08/cloudxr-suite-simplifies-enterprise-streaming/

d7e20edd6e462c7f31f3d645632d37de.png

室溫超導:一個反復上演 “狼來了” 的研究領域

一隊韓國學者發布兩篇論文,宣布物理學領域重大突破,世界震動之余又將信將疑。一些同行試圖通過重復實驗或計算驗證可行性,也有一些學者提醒公眾別激動得太早。如今復現實驗有了新進展 —— 整體不樂觀,不過出現了積極的證據 —— 學界還在疑惑,資本市場已被點燃。

專訪騰訊技術專家張賢國:十余年視頻編碼老兵,對技術仍保有敬畏之心

Vision Pro的發布,點燃了空間計算新時代的熱潮。作為騰訊云架構平臺部香農實驗室(以下簡稱香農實驗室)的技術負責人,張賢國向我們分享了香農實驗室在視頻編解碼和空間媒體處理能力的最新進展與布局。

對話咔嚓剪輯金邦飛 | 如果把我的人生類比成播放器去開發與設計...

至今,多媒體的發展史大約有40年的時間,這40年里, 一代代技術人不斷投身于多媒體事業的汪洋。LiveVideoStack此次采訪金邦飛——深耕該領域的技術老兵。關注多媒體技術標桿的時代故事。

d3d9e95c599883ab3b79c5b372405e8d.png

LiveVideoStackCon 2023 深圳站 已啟動

LiveVideoStackCon 2023 深圳站音視頻技術大會以「沉浸·新視界」為主題。經過近十年的快速發展,多媒體生態正在向精致優化發展,更注重細節、成本,內卷和出海成為壓力輸出口。一方面,在現有市場及業務競爭仍舊相當激烈的環境下,企業開始更多關注于如何降低成本、追求更高的利潤,以及面向用戶提供更優質的服務與體驗;另一方面,對于不斷涌現的更多新的技術、場景,逐步探索并利用其創造更多的業務、產品與商業價值是各企業持續關注的目標。本次深圳站,我們擬邀請幾十位來自海內外的音視頻領域的專家聚集一堂,與你共同分享他們的專業見解。(點此查看大會講師名單,更多精彩敬請期待)。

4bf8e0a9e76d2851eaa981dc3762e203.png

d2e7f8c6fb8b07ac4464ab72899e9877.png

點擊閱讀原文?

跳轉LiveVideoStackCon 2023 深圳站 官網,了解更多信息

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/39226.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/39226.shtml
英文地址,請注明出處:http://en.pswp.cn/news/39226.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

eclipse 導入項目js報錯問題

eclipse 導入項目后會出現項目中的js文件報錯(紅叉),如下圖所示,有時候報錯的文件很多,需要集中處理。 解決辦法: 右鍵項目名稱》Properties》MyEclipse》JavaScript》Include Path,在右側選擇“…

vim鍵盤圖

國外:http://www.viemu.com/a_vi_vim_graphical_cheat_sheet_tutorial.html,原創,有SVG圖,有分步驟的圖。 國內翻譯:[https://blog.csdn.net/qq_41052753/article/details/101031847 有幾個配色,很高清&…

【華為Datacom 綜合拓撲案例—分享篇】

拓撲圖 題目要求 實驗要求: 1、PC1\PC2\PC3\PC4采用DHCP自動獲取IP地址,SW5作為服務器,SW3和SW4作為中繼 創建地址池ip pool huawei1和ip pool huawei2,租期都為2天 2、SW3與SW4做鏈路聚合,采用LACP模式。SW3作為主…

【Java 集合框架API接口】Collection,List,Set,Map,Queue,Deque

博主:_LJaXi Or 東方幻想郷 專欄: Java | 從跨行業到跨平臺 開發工具:IntelliJ IDEA 2021.1.3 Java集合框架 API接口 Collection接口List接口HashSet, TreeSetSet接口使用 HashSet 實現使用 TreeSet 實現 HashMap、TreeMapMap接口…

SQL-每日一題【1341. 電影評分】

題目 表:Movies 表:Users 請你編寫一個解決方案: 查找評論電影數量最多的用戶名。如果出現平局,返回字典序較小的用戶名。查找在 February 2020 平均評分最高 的電影名稱。如果出現平局,返回字典序較小的電影名稱。 …

Nokia5110使用方法及實例編寫51單片機

文章目錄 Nokia5110實物圖引腳和原理圖51單片機實例軟件模擬SPI實現控制Nokia5110顯示字符發送字節時序圖(圖片太多了,關鍵圖片已截取出來)初始化需要配置實例編寫回顧接線結束Nokia5110 Nokia是諾基亞拆下來的屏幕。使用SPI控制 84x48 的點陣 LCD,可以顯示 4 行漢字,采用…

ZZULIOJ 1194: 總成績排序(結構體專題),Java

ZZULIOJ 1194: 總成績排序(結構體專題),Java 題目描述 有一學生成績表,包括學號、姓名、3門課程成績。請按如下規則排序:按總成績降序排序,若總成績相同,則按姓名升序排序。 輸入 首先輸入一…

MySQL 約束

查看約束 select * from information_schema.table_constraints where table_name要查看的表名按約束的作用范圍 列級約束: 將此約束聲明在對應字段的后面 表級約束:在表中所有字段都聲明完,在所有字段的后面聲明的約束,可以聲明…

屏蔽惡意域名的DNS查詢

因為有一些惡意域名, 已經在防火墻上做了封禁了, 但是如果收到中毒主機的請求, 還是要去做一次DNS查詢, 因此被上級單位通告, 因此想把惡意域名的DNS查詢封禁做到防火墻下聯的AC上面, 一方面因為防火墻的策略優先級DNS代理比較靠后, 另一方面也是為了減小防火墻壓力, 簡化配置:…

【leetcode】鏈表part2

24. 兩兩交換鏈表中的節點 迭代方法 public static ListNode swapPairs(ListNode head) {// 輸入:head [1,2,3,4]// 輸出:[2,1,4,3]ListNode dummy new ListNode(0);dummy.next head;ListNode cur dummy;while (cur.next ! null && cur.ne…

數據結構的樹存儲結構

數據結構的樹存儲結構 之前介紹的所有的數據結構都是線性存儲結構。本章所介紹的樹結構是一種非線性存儲結構,存儲的是具有“一對多”關系的數據元素的集合。 (A) (B) 圖 1 樹的示例 圖 …

【Java】2021 RoboCom 機器人開發者大賽-高職組(復賽)題解

7-8 人工智能打招呼 號稱具有人工智能的機器人,至少應該能分辨出新人和老朋友,所以打招呼的時候應該能有所區別。本題就請你為這個人工智能機器人實現這個功能:當它遇到陌生人的時候,會說:“Hello X, how are you?”其…

chatglm2-6b模型在9n-triton中部署并集成至langchain實踐 | 京東云技術團隊

一.前言 近期, ChatGLM-6B 的第二代版本ChatGLM2-6B已經正式發布,引入了如下新特性: ①. 基座模型升級,性能更強大,在中文C-Eval榜單中,以51.7分位列第6; ②. 支持8K-32k的上下文&#xff1b…

三種目標檢測方法(基于傳統數字圖像處理的識別方法、基于傳統機器學習的識別方法和基于深度學習的識別方法)的區別

問題描述:圖像檢測分為了基于傳統數字圖像處理的識別方法、基于傳統機器學習的識別方法和基于深度學習的識別方法,但是有時迷惑三者的區別是什么呢? 問題解答: 第一,基于傳統數字圖像處理的識別方法和其他兩者的區分…

【Linux】進程地址空間

目錄 一、回顧我們以前學習的地址空間二、進程地址空間三、進程地址空間的作用四、解決一個地址出現兩個值的問題 一、回顧我們以前學習的地址空間 這個內存布局真是的我們實實在在的內存嘛&#xff1f; 答案是不是的 下面我們來驗證 1 #include<stdio.h>2 #include<a…

從三個主要需求市場分析,VR全景創業的潛力發展

VR全景&#xff0c;5G時代朝陽產業&#xff0c;其實拍攝制作很簡單&#xff0c;就是利用一套專業的相機設備去給商家拍攝&#xff0c;結合后期專業的3DVR全景展示拍攝制作平臺&#xff0c;打造3D立體環繞的效果&#xff0c;將線下商家真實環境1&#xff1a;1還原到線上&#xf…

使用docker快速搭建wordpress服務,并指定域名訪問

文章目錄 引入使用docker快速跑起服務創建數據庫安裝wordpress服務配置域名 引入 wordpress是一個基于PHP語言編寫的開源的內容管理系統&#xff08;CMS&#xff09;&#xff0c;它有豐富的插件和主題&#xff0c;可以非常簡單的創建各種類型的網站&#xff0c;包括企業網站、…

Java異步方法CompletableFuture類的使用

Java中常用的異步方法 1、使用線程&#xff1a;你可以創建一個新的線程來執行異步操作。這可以通過直接創建Thread對象并啟動它&#xff0c;或者使用線程池來管理線程的生命周期。 new Thread(() -> {// 異步操作代碼 }).start(); 2、使用線程池Executor框架&#xff1a;E…

Spring Boot 支持多種環境,包括開發環境、測試環境、預發布環境和生產環境。

Spring Boot 支持多種環境&#xff0c;包括開發環境、測試環境、預發布環境和生產環境。不同的環境具有不同的配置&#xff0c;可以在不同的環境中對應用程序進行測試、驗證和部署。以下是每種環境的用途和相應的代碼案例。 開發環境 開發環境是開發人員在本地進行開發的環境&…

AI Chat 設計模式:15. 橋接模式

本文是該系列的第十五篇&#xff0c;采用問答式的方式展開&#xff0c;問題由我提出&#xff0c;答案由 Chat AI 作出&#xff0c;灰色背景的文字則主要是我的一些思考和補充。 問題列表 Q.1 如果你是第一次接觸橋接模式&#xff0c;那么你會有哪些疑問呢&#xff1f;A.1Q.2 什…