【AI News | 20250604】每日AI進展

AI Repos

1、jaaz
Jaaz是一款免費開源的AI設計代理,作為Lovart的本地替代品,它能實現圖像、海報、故事板的設計、編輯和生成。Jaaz集成了LLM,可智能生成提示并批量生成圖像,支持Ollama、Stable Diffusion等本地及API模型。用戶可通過聊天編輯圖像,實現對象移除、風格轉換等功能。它提供創意畫布,并計劃支持視頻生成。Jaaz可在macOS和Windows上使用,支持Claude、OpenAI、Gemini等API,或通過Ollama實現100%免費本地使用。
在這里插入圖片描述

2、agentic-doc
LandingAI發布Agentic Document Extraction Python庫,該庫封裝了Agentic Document Extraction API,能從復雜文檔(PDF、圖片、URL)中提取結構化數據,并返回分層JSON及元素位置。它支持百頁以上長文檔處理、自動重試、并發和限速,并提供可視化調試工具。該庫簡化了API調用,實現了大型文件自動分割并行處理,具備錯誤處理和批處理能力,極大地提升了文檔數據提取的效率和準確性,適用于Python 3.9-3.12版本。

3、memvid
Memvid是一款創新的AI記憶管理解決方案,通過將文本數據編碼成視頻文件,實現了數百萬文本塊的閃電般語義搜索和亞秒級檢索。它比傳統向量數據庫更節省RAM和存儲空間,能將知識庫壓縮為緊湊的視頻文件。Memvid具備視頻數據庫、語義搜索、內置聊天、PDF支持、超快檢索和高效存儲等核心功能,且支持離線使用和多種LLM。它適用于數字圖書館、教育內容、新聞檔案、企業知識庫、科研論文和個人筆記等多種場景。

AI News

1、Manus推出文生視頻功能,挑戰Sora,加速AI視頻創作普及
AI初創公司Manus近日推出“文生視頻”功能,允許用戶通過文本指令快速生成視頻,目前已向Basic、Plus和Pro會員開放。此舉旨在與OpenAI的Sora競爭,Sora同樣提供文生視頻服務,且需付費使用。Manus的Pro會員月費為199美元,與Sora價格相近。Manus的目標是滿足用戶快速生成高質量視頻的需求,并計劃未來向所有用戶開放此功能,以推動AI視頻創作的普及和行業發展,為內容創作者提供高效工具。

2、松下發布多模態生成AI “OmniFlow”,實現文本、圖像、音頻自由轉換
松下聯合研發出“OmniFlow”多模態生成AI,其創新之處在于能夠實現文本、圖像、音頻之間的“任意對任意”自由轉換。該技術通過靈活結合不同數據格式的生成AI,即便在小樣本情況下也能學習高精度模型,顯著降低了傳統多模態AI所需的大量數據采集成本。OmniFlow在文本轉圖像和文本轉音頻任務中表現出色,訓練數據量可減少至1/60。這項技術未來有望應用于工廠和生活等多個領域,為客戶帶來便利。

3、PlayDiffusion開源,實現語音“局部修改”且不留痕跡
Play AI開源發布了基于擴散模型的語音編輯工具PlayDiffusion,專為語音局部修改設計。該模型顛覆了傳統文本轉語音系統需重生成整段音頻的模式,允許用戶直接替換、刪除或調整音頻中的特定部分,同時保持其他未修改部分的一致性,實現“所聽即所得”的無痕編輯。PlayDiffusion能智能調整節奏、語調和音色,聽感自然。它還可作為高性能非自回歸TTS模型,推理速度提升50倍,適用于播客制作、AI配音等場景,標志著語音生成領域向“精確、靈活、自然”轉型。

4、Claude Code將向Pro用戶開放,降低AI編碼門檻
Anthropic的AI編碼助手Claude Code,此前僅限Max訂閱或API用戶。近期網絡動態顯示,Anthropic計劃將其開放給每月20美元的Claude Pro用戶,大幅降低使用門檻。Claude Code以其強大的代碼庫理解和終端集成能力著稱,支持代碼重構、調試等。此舉將吸引更多開發者,加速AI輔助編碼的普及,并加劇AI編碼工具市場的競爭。Pro用戶將獲得定額使用權限,其核心功能預計保持不變。

5、谷歌推出AI Edge Gallery,實現智能手機離線運行AI模型
谷歌低調發布實驗性應用Google AI Edge Gallery,利用LiteRT技術使智能手機能離線運行Hugging Face平臺上的開源AI模型,支持圖像生成、文本處理等功能。此舉提升了數據隱私和處理速度,是本地化AI的重要突破。該應用目前支持Android設備,通過GitHub分發,性能媲美早期云端模型。AI Edge Gallery的推出標志著谷歌在邊緣AI領域的戰略布局,有望重新定義AI應用部署方式,加速AI在無網絡連接地區的普及。

6、Resemble AI開源語音克隆模型ChatterBox AI,性能超越ElevenLabs
Resemble AI發布了首款開源文本轉語音模型ChatterBox,該模型具備卓越的零樣本語音克隆、情緒控制和超低延遲特性。ChatterBox在盲測中表現優于ElevenLabs,且支持情緒夸張調節,適用于多種應用場景。其內置的PerTh神經水印技術旨在解決倫理問題。ChatterBox的開源發布標志著語音克隆技術的民主化,盡管存在濫用風險,但其MIT許可證和社區規范呼吁旨在平衡開放創新與負責任使用。

7、Exa聯手OpenRouter,400+AI模型解鎖實時網絡搜索能力
Exa與OpenRouter合作,為超過400種大語言模型(LLMs)提供實時網絡搜索功能,顯著提升AI模型的信息獲取能力。通過RAG技術,模型可動態獲取最新網絡信息,解決傳統LLMs知識更新局限。開發者僅需簡單配置即可讓模型調用Exa的搜索結果,廣泛應用于聊天機器人、學術研究和商業分析等場景。此舉降低開發門檻,預示AI與網絡數據深度融合的趨勢,使AI從“靜態知識庫”轉變為“動態信息樞紐”。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/82522.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/82522.shtml
英文地址,請注明出處:http://en.pswp.cn/web/82522.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Docker load 后鏡像名稱為空問題的解決方案

在使用 docker load命令從存檔文件中加載Docker鏡像時,有時會遇到鏡像名稱為空的情況。這種情況通常是由于在保存鏡像時未正確標記鏡像名稱和標簽,或者在加載鏡像時出現了意外情況。本文將介紹如何診斷和解決這一問題。 一、問題描述 當使用 docker lo…

SQL進階之旅 Day 14:數據透視與行列轉換技巧

【SQL進階之旅 Day 14】數據透視與行列轉換技巧 開篇 歡迎來到“SQL進階之旅”系列的第14天!今天我們將探討數據透視與行列轉換技巧,這是數據分析和報表生成中的核心技能。無論你是數據庫開發工程師、數據分析師還是后端開發人員,行轉列或列…

haribote原型系統改進方向

在時鐘中斷、計時器和鍵盤輸入方面,一些創新性的改進方向: 時鐘中斷 (PIT / inthandler20) 動態節拍 (Tickless Kernel):當前的 PIT 中斷以固定頻率(約 100Hz)觸發,即使系統空閑或沒有即將到期的計時器&…

LabVIEW基于 DataSocket從 OPC 服務器讀取數據

LabVIEW 中基于 DataSocket 函數從 OPC 服務器讀取數據的功能,為工業自動化等場景下的數據交互提供了解決方案。通過特定函數實現 URL 指定、連接建立與管理、數據讀取,相比傳統 Socket 通信和 RESTful API ,在 OPC 服務器數據交互場景有適配…

SimpleDateFormat 和 DateTimeFormatter 的異同

在Java開發中Date類型轉String類型是比較常見的,其中最常用的是以下幾種方式: 1. 使用SimpleDateFormat(Java 8之前) import java.text.SimpleDateFormat; import java.util.Date;public class DateToStringExample {public sta…

《前端面試題:CSS對瀏覽器兼容性》

CSS瀏覽器兼容性完全指南:從原理到實戰 跨瀏覽器兼容性是前端開發的核心挑戰,也是面試中的高頻考點。查看所有css屬性對各個瀏覽器兼容網站:https://caniuse.com 一、瀏覽器兼容性為何如此重要? 在當今多瀏覽器生態中&#xff0c…

【stm32開發板】單片機最小系統原理圖設計

一、批量添加網絡標簽 可以選擇浮動工具中的N,單獨為引腳添加網絡標簽。 當芯片引腳非常多的時候,選中芯片,右鍵選擇扇出網絡標簽/非連接標識 按住ctrl鍵即可選中多個引腳 點擊將引腳名稱填入網絡名 就完成了引腳標簽的批量添加 二、電源引…

golang連接sm3認證加密(app)

文章目錄 環境文檔用途詳細信息 環境 系統平臺:Linux x86-64 Red Hat Enterprise Linux 7 版本:4.5 文檔用途 golang連接安全版sm3認證加密數據庫,驅動程序詳見附件。 詳細信息 1.下載Linux golang安裝包 go1.17.3.linux-amd64.tar.gz 1.1. 解壓安…

node實例應用

打開vscode,創建node項目,直接進入一個干凈的文件夾,打開控制臺 一 項目初始化 1. 初始化包管理 npm init -y2. 安裝express npm install express4.17.1 3. 根目錄下創建app.js,引入express // 引入expree const express require(express)// 創建實例 const …

Springboot——整合websocket并根據type區別處理

文章目錄 前言架構思想項目結構代碼實現依賴引入自定義注解定義具體的處理類定義 TypeAWebSocketHandler定義 TypeBWebSocketHandler 定義路由處理類配置類,綁定point制定前端頁面編寫測試接口方便跳轉進入前端頁面 測試驗證結語 前言 之前寫過一篇類似的博客&…

vscode命令行debug

vscode命令行debug 一般命令行debug會在遠程連服務器的時候用上,命令行debug的本質是在執行時暴露一個監聽端口,通過進入這個端口,像本地調試一樣進行。 這里提供兩種方式: 直接在命令行中添加debugpy,適用于python…

Hot100 Day02(移動0,乘最多水的容器、三數之和、接雨水)

移動零 題目鏈接 題目描述: 思路:上述藍色箭頭代表當前遍歷的元素,紅色數字則是當前空位0的位置,每一次遇到非0元素,就是講該元素的位置和空位0的位置進行交換,同時空位0的下標1. 代碼 class Solution …

(eNSP)配置WDS手拉手業務

1.實驗拓撲 2.基礎配置 [SW1]dis cu # sysname SW1 # vlan batch 10 100 110 120 # dhcp enable # interface Vlanif10ip address 192.168.10.2 255.255.255.0 # interface Vlanif100ip address 192.168.100.2 255.255.255.0dhcp select interfacedhcp server excluded-ip-add…

lua的筆記記錄

類似python的eval和exec 可以偽裝成其他格式的文件,比如.dll 希望在異常發生時,能夠讓其沉默,即異常捕獲。而在 Lua 中實現異常捕獲的話,需要使用函數 pcall,假設要執行一段 Lua 代碼并捕獲里面出現的所有錯誤&#xf…

【DeepSeek】【Dify】:用 Dify 對話流+標題關鍵詞注入,讓 RAG 準確率飛躍

1 構建對話流處理數據 初始準備 文章大綱摘要 數據標注和清洗 代碼執行 特別注解 2 對話流測試 準備工作 大綱生成 清洗片段 整合分段 3 構建知識庫 構建 召回測試 4 實戰應用測試 關鍵詞提取 智能總結 測試 1 構建對話流處理數據 初始準備 構建對話變量 用…

RabbitMQ 開機啟動配置教程

RabbitMQ 開機啟動配置教程 在本教程中,我們將詳細介紹如何配置 RabbitMQ 以實現開機自動啟動。此配置適用于手動安裝的 RabbitMQ 版本。 環境準備 操作系統:CentOS 7RabbitMQ 版本:3.8.4Erlang 版本:21.3 步驟 1. 安裝 Erla…

第N1周:one-hot編碼案例

🍨 本文為🔗365天深度學習訓練營中的學習記錄博客 🍖 原作者:K同學啊 一、one-hot編碼概念 自然語言處理(NLP)中的文本數字化:文字對于計算機來說就僅僅只是一個個符號,計算…

Linux 云服務器部署 Flask 項目(含后臺運行與 systemd 開機自啟)

一、準備工作 在開始正式部署之前,請確認以下前提條件已經準備好: 你有一臺運行 Linux 系統(CentOS 或 Ubuntu)的服務器; 服務器有公網 IP,本例中使用:111.229.204.102; 你擁有該服務器的管理員權限(可以使用 sudo); 打算使用 Flask 構建一個簡單的 Web 接口; 服務…

散貨拼柜業務:多貨主財務結算如何高效管理?

散貨拼柜業務滿足了小批量發貨客戶的需求,由于無法滿足海運整柜的條件,其模式通常涉及多個貨主共同分攤同一集裝箱的運輸項目。這種業務模型雖然在成本上具備優勢,但其復雜的財務結算過程往往給公司帶來了挑戰。 散貨拼柜業務的特點在于其小…

數據結構(7)—— 二叉樹(1)

目錄 前言 一、 樹概念及結構 1.1樹的概念 1.2樹的相關概念 1.3數的表示 1.二叉樹表示 2.孩子兄弟表示法 3.動態數組存儲 1.4樹的實際應用 二、二叉樹概念及結構 2.1概念 2.2特殊的二叉樹 1.滿二叉樹 2. 完全二叉樹 2.3二叉樹的性質 2.4二叉樹的存儲結構 1.順序存儲 2.鏈式存儲…