阿里巴巴開源移動端多模態LLM工具——MNN

在這里插入圖片描述

MNN 是一個高效且輕量級的深度學習框架。它支持深度學習模型的推理和訓練,并在設備端的推理和訓練方面具有行業領先的性能。目前,MNN 已集成到阿里巴巴集團的 30 多個應用中,如淘寶、天貓、優酷、釘釘、閑魚等,覆蓋了直播、短視頻拍攝、搜索推薦、以圖搜貨、互動營銷、權益發放、安全風控等 70 多個使用場景。此外,MNN 還被用于嵌入式設備,如物聯網。

MNN-LLM 是一個基于 MNN 引擎開發的大型語言模型運行時解決方案。該項目的使命是將 LLM 模型部署在每個人的本地平臺上(手機/PC/物聯網)。它支持流行的大型語言模型,如千問、百川、智譜、LLAMA 等。

MNN-Diffusion 是一個基于 MNN 引擎開發的穩定擴散模型運行時解決方案。該項目的使命是在每個人的平臺上本地部署穩定擴散模型。

在這里插入圖片描述
在阿里巴巴內部,MNN作為Walle系統中的計算容器基礎模塊,Walle系統是首個端到端、通用且大規模的設備-云協同機器學習生產系統,該系統已在頂級系統會議OSDI’22上發表。MNN的關鍵設計原則和廣泛的基準測試結果(與TensorFlow、TensorFlow Lite、PyTorch、PyTorch Mobile、TVM的對比)可以在OSDI論文中找到。基準測試的腳本和說明放在“/benchmark”路徑下。

主要特點

輕量級
  • 針對設備進行優化,無依賴項,可輕松部署到移動設備和各種嵌入式設備。
  • iOS 平臺:armv7+arm64 平臺的靜態庫大小約為 12MB,鏈接的可執行文件大小增加約為 2M。
  • Android 平臺:核心 so 文件大小約為 800KB(armv7a - c++_shared)。
  • 使用 MNN_BUILD_MINI 可以將包大小減少約 25%,但限制了固定模型輸入大小。
  • 支持 FP16 / Int8 量化,可以將模型大小減少 50%-70%。
多功能性
  • 支持 TensorflowCaffeONNXTorchscripts,并支持常見的神經網絡,如 CNNRNNGANTransformer
  • 支持具有多輸入或多輸出的 AI 模型,各種維度格式,動態輸入,控制流。
  • MNN 支持近似全量的 AI 模型操作符。轉換器支持 178 個 Tensorflow 操作符,52 個 Caffe 操作符,163 個 Torchscripts 操作符,158 個 ONNX 操作符。
  • 支持 iOS 8.0+、Android 4.3+ 以及具有 POSIX 接口的嵌入式設備。
  • 支持多設備混合計算。目前支持 CPU 和 GPU。
高性能
  • 通過大量優化的匯編代碼實現核心計算,以充分利用 ARM / x64 CPU。
  • 使用 Metal / OpenCL / Vulkan 支持移動設備上的 GPU 推理。
  • 使用 CUDA 和 tensorcore 支持 NVIDIA GPU,以獲得更好的性能。
  • 卷積和轉置卷積算法高效且穩定。Winograd 卷積算法廣泛用于更好地處理對稱卷積,如 3x3、4x4、5x5、6x6、7x7。
  • 支持 FP16 半精度計算的新架構 ARM v8.2 速度提升兩倍。使用 sdot 和 VNNI 的 ARM v8.2 速度提升 2.5 倍。

支持的架構/精度MNN如下所示:

  • S:支持且運行良好,深度優化,推薦使用
  • A:支持且運行良好,可以使用
  • B:支持但有bug或未優化,不推薦使用
  • C:不支持
架構 / 精度常規FP16BF16Int8
CPUNativeBCBB
x86/x64-SSE4.1ABBA
x86/x64-AVX2SBBA
x86/x64-AVX512SBBS
ARMv7aSS (ARMv8.2)SS
ARMv8SS (ARMv8.2)S(ARMv8.6)S
GPUOpenCLASCS
VulkanAACA
MetalASCS
CUDAASCA
NPUCoreMLACCC
HIAIACCC
NNAPIBBCB

News 🔥

[2025/05/12] android app 支持 qwen2.5 omni 3b and 7b

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

代碼:https://github.com/alibaba/MNN/

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/906081.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/906081.shtml
英文地址,請注明出處:http://en.pswp.cn/news/906081.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Vue.js---watch 的實現原理

4.7 watch 的實現原理 watch本質上就是使用了effect以及options.scheduler 定義watch函數: // watch函數:傳入參數source以及回調函數function watch(source , cb) {effect(() > source.foo,{scheduler(){// 回調函數cb()}})}watch接收兩個參數分別是source和c…

SpringBoot3+AI

玩一下AI 1. SSE協議 我們都知道tcp,ip,http,https,websocket等等協議,今天了解一個新的協議SSE協議(Server-Sent Events) SSE(Server-Sent Events) 是一種允許服務器…

vscode中Debug c++

在vscode中Debug ros c程序 1 在Debug模式下編譯 如果用命令行catkin_make,在輸入catkin_make時加上一個參數: catkin_make -DCMAKE_BUILD_TYPEDebug 或者直接修改CMakelist.txt,添加以下代碼: SET(CMAKE_BUILD_TYPE "D…

【ROS2】 核心概念6——通信接口語法(Interfaces)

古月21講/2.6_通信接口 官方文檔:Interfaces — ROS 2 Documentation: Humble documentation 官方接口代碼實戰:https://docs.ros.org/en/humble/Tutorials/Beginner-Client-Libraries/Single-Package-Define-And-Use-Interface.html ROS 2使用簡化的描…

C#里與嵌入式系統W5500網絡通訊(2)

在嵌入式代碼里,需要從嵌入式的MCU訪問W5500芯片。 這個是通過SPI通訊來實現的,所以要先連接SPI的硬件通訊線路。 接著下來,就是怎么樣訪問這個芯片了。 要訪問這個芯片,需要通過SPI來發送數據,而發送數據又要有一定的約定格式, 于是芯片廠商就定義下面的通訊格式: …

SuperYOLO:多模態遙感圖像中的超分辨率輔助目標檢測之論文閱讀

摘要 在遙感影像(RSI)中,準確且及時地檢測包含數十像素的多尺度小目標仍具有挑戰性。現有大多數方法主要通過設計復雜的深度神經網絡來學習目標與背景的區分特征,常導致計算量過大。本文提出一種兼顧檢測精度與計算代價的快速準確…

計算機軟件的基本組成

計算機軟件的基本組成 一, 計算機軟件的分類 軟件按其功能分類, 可分為系統軟件和應用軟件 圖解 (1)系統軟件 系統軟件是一組保證計算機系統高效, 正確運行的基礎軟件, 軟件通常作為系統資源提供給用戶使用. 系統軟件主要有操作系統(OS), 數據庫管理系統(DBMS), 語言處理程…

unity開發游戲實現角色篩選預覽

RenderTexture通俗解釋 RenderTexture就像是Unity中的"虛擬相機膠片",它可以: 捕獲3D內容:將3D場景或對象"拍照"記錄下來 實時更新:不是靜態圖片,而是動態視頻,角色可以動起來 用作…

Spring源碼主線全鏈路拆解:從啟動到關閉的完整生命周期

Spring源碼主線全鏈路拆解:從啟動到關閉的完整生命周期 一文看懂 Spring 框架從啟動到銷毀的主線流程,結合原理、源碼路徑與偽代碼三位一體,系統學習 Spring 底層機制。 1. 啟動入口與環境準備 原理說明 Spring Boot 應用入口是標準 Java 應…

SAP RF 移動屏幕定制

SAP RF 移動屏幕定制 ITSmobile 是 SAP 當前將移動設備連接到 SAP 系統的技術基礎。它基于 SAP Internet Transaction Server (ITS),從 Netweaver 2004 開始作為 Netweaver 平臺的一部分提供。ITSmobile 提供了一個框架,用于為任何 SAP 事務生成基于 HT…

Spark,數據提取和保存

以下是使用 Spark 進行數據提取(讀取)和保存(寫入)的常見場景及代碼示例(基于 Scala/Java/Python,不含圖片操作): 一、數據提取(讀取) 1. 讀取文件數據&a…

如何用mockito+junit測試代碼

Mockito 是一個流行的 Java 模擬測試框架,用于創建和管理測試中的模擬對象(mock objects)。它可以幫助開發者編寫干凈、可維護的單元測試,特別是在需要隔離被測組件與其他依賴項時。 目錄 核心概念 1. 模擬對象(Mock Objects) 2. 打樁(Stubbing) 3. 驗…

最新缺陷檢測模型:EPSC-YOLO(YOLOV9改進)

目錄 引言:工業缺陷檢測的挑戰與突破 一、EPSC-YOLO整體架構解析 二、核心模塊技術解析 1. EMA多尺度注意力模塊:讓模型"看得更全面" 2. PyConv金字塔卷積:多尺度特征提取利器 3. CISBA模塊:通道-空間注意力再進化 4. Soft-NMS:更智能的重疊框處理 三、實…

【Linux網絡與網絡編程】12.NAT技術內網穿透代理服務

1. NAT技術 之前我們說到過 IPv4 協議中IP 地址數量不充足的問題可以使用 NAT 技術來解決。還提到過本地主機向公網中的一個服務器發起了一個網絡請求,服務器是怎么將應答返回到該本地主機呢?(如何進行內網轉發?) 這就…

uniapp的適配方式

文章目錄 前言? 一、核心適配方式對比📏 二、rpx 單位:uni-app 的核心適配機制🧱 三、默認設計稿適配(750寬)🔁 四、字體 & 屏幕密度適配🛠 五、特殊平臺適配(底部安全區、劉海…

JAVA EE(進階)_進階的開端

別放棄浸透淚水的昨天,晨光已為明天掀開新篇 ——陳長生. ?主頁:陳長生.-CSDN博客? 📕上一篇:JAVA EE_HTTP-CSDN博客 1.什么是Java EE Java EE(Java Pla…

SQL腳本規范

主要作用:數據庫的備份和遷移 SQL腳本規范 每一個sql語句必須與;結束 腳本結構: { 刪庫,建庫 刪表,建表 插入初始數據 } 建庫語法: CREATE DATABASE 數據庫名CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; CHARA…

std::ratio<1,1000> 是什么意思?

author: hjjdebug date: 2025年 05月 14日 星期三 09:45:24 CST description: std::ratio<1,1000> 是什么意思&#xff1f; 文章目錄 1. 它是一種數值嗎&#xff1f;2. 它是一種類型嗎&#xff1f;3. std:ratio 是什么呢&#xff1f;4. 分析一個展開后的模板函數5.小結: …

測試--測試分類 (白盒 黑盒 單元 集成)

一、按照測試目標分類&#xff08;測試目的是什么&#xff09; 主類別細分說明1. 界面測試UI內容完整性、一致性、準確性、友好性&#xff0c;布局排版合理性&#xff0c;控件可用性等2. 功能測試檢查軟件功能是否符合需求說明書&#xff0c;常用黑盒方法&#xff1a;邊界值、…

整理了 2009 - 2025 年的【199 管綜真題 + 解析】PDF,全套共 34 份文件

每年真題原卷 ? 每年詳細解析 ? &#x1f4c2;【管綜真題 2009-2025】 &#x1f4c2;【管綜解析 2009-2025】 目錄樹&#xff1a; ├── 2009-2025管綜真題 PDF │ ├── 2009年199管綜真題.pdf │ ├── 2010年199管綜真題.pdf │ ├── 2011年199管綜真題.pd…