pybind11 導出 C++ map 在 Python 層 get 訪問慢的優化方案

pybind11 導出 C++ map 在 Python 層 get 訪問慢的優化方案

問題描述

通過 pybind11 導出 C++ 的 std::mapstd::unordered_map,在 Python 代碼中頻繁使用 get 方法訪問 value 時,性能非常低下。其主要原因是:

  • pybind11 的 map 綁定會導致每次訪問都跨越 Python/C++ 邊界,開銷很大。
  • 如果在 Python 層高頻訪問 C++ map,每次都要進入 C++ 層查找,效率遠低于直接用 Python dict。
  • 如果每次都把整個 map 拷貝到 Python(如頻繁調用 get_map_as_dict),則會有更大的性能損耗。

解決方案

1. 批量查找,減少跨界調用

設計 C++ 方法,接收一組 key,批量返回對應的 value,減少 Python/C++ 之間的調用次數。

py::dict batch_get(const std::map<std::string, int>& m, const std::vector<std::string>& keys) {py::dict d;for (const auto& key : keys) {auto it = m.find(key);if (it != m.end()) {d[key.c_str()] = it->second;}}return d;
}

pybind11 綁定:

m.def("batch_get", &batch_get);

Python 調用:

keys = ["a", "b", "c"]
result = mod.batch_get(keys)
# result 是 dict,只包含需要的 key

2. 一次性拷貝 map 到 Python,只在 map 不變時用

如果 map 內容不會頻繁變化,可以只在初始化時拷貝一次,后續都在 Python 層查找。

3. to_dict 緩存優化

如果 map 很大且只讀或低頻變更,可以在 C++ 層實現 to_dict 緩存:

  • 第一次調用時將 map 轉為 Python dict 并緩存。
  • 后續 map 未變時直接返回緩存,性能極高。
  • map 變更時清空緩存,下次再生成。

示例代碼:

#include <pybind11/pybind11.h>
#include <pybind11/stl.h>
#include <optional>namespace py = pybind11;class MapWrapper {
public:std::map<std::string, int> m;std::optional<py::dict> cache;py::dict to_dict() {if (cache.has_value()) {return cache.value();}py::dict d;for (const auto& kv : m) {d[kv.first.c_str()] = kv.second;}cache = d;return d;}void insert(const std::string& key, int value) {m[key] = value;cache.reset(); // 數據變了,清空緩存}
};PYBIND11_MODULE(example, m) {py::class_<MapWrapper>(m, "MapWrapper").def(py::init<>()).def("to_dict", &MapWrapper::to_dict).def("insert", &MapWrapper::insert);
}

Python 用法:

w = example.MapWrapper()
w.insert("a", 1)
d = w.to_dict()  # 第一次生成并緩存
d2 = w.to_dict() # 直接返回緩存,速度極快

總結

  • 跨 Python/C++ 邊界的高頻調用是性能瓶頸,需盡量減少。
  • 推薦批量查找或一次性拷貝到 Python。
  • to_dict 緩存方案適合只讀或低頻變更場景。
  • map 頻繁變更時,建議用 batch_get 等批量查找方法。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87527.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87527.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87527.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

RTC實時時鐘DS1339U-33國產替代FRTC1339M

FRTC1339M是一款實時時鐘&#xff08;RTC&#xff09;芯片&#xff0c;由NYFEA徠飛公司制造。 FRTC13399M串行實時時鐘是一種低功耗的時鐘日期設備&#xff0c;具有兩個可編程的每日時間警報和一個可編程的方波輸出。通過2線雙向總線進行串行地址和數據傳輸。時鐘/日期提供秒、…

網絡常用端口號歸納

ICMP端口號&#xff1a;1IGMP端口號&#xff1a;2TCP端口號&#xff1a;6UDP端口號&#xff1a;17FTP端口號&#xff1a;20(控制信息傳輸)、21&#xff08;數據傳輸&#xff09;SSH端口號&#xff1a;22Telnet端口號&#xff1a;23SMTP端口號&#xff1a;25IPV6端口號&#xff…

Agent learn

1.人物設定&#xff1a; 1.1塑造智能體的思維能力與問題拆解與拆解分析能力 1.2個性化&#xff1a;輸出預期輸出示例&#xff08;設定智能體的-》性格&#xff0c;語言風格&#xff09; 1.3插件&#xff0c;調用工具 1.4可設定結構化表達 1.5調優 1.6常見問題&#xff1a; …

五層協議介紹

層次核心功能典型協議/設備應用層為用戶應用程序提供網絡服務接口&#xff08;如文件傳輸、電子郵件、網頁瀏覽&#xff09;HTTP、FTP、SMTP、DNS、SSH傳輸層提供端到端的可靠或不可靠數據傳輸&#xff0c;處理流量控制和差錯恢復TCP&#xff08;可靠&#xff09;、UDP&#xf…

gin框架 中間件 是在判斷路由存在前執行還是存在后執行的研究

最近有個需求&#xff0c;就是發現我們的驗簽路由中間件會在判斷路由是否存在前執行。我們期望是gin框架先自己判斷路由中間件是否存在&#xff0c;存在了再走后面的中間件&#xff0c;不存在直接返回404.這樣能節省一定的資源。 研究了一下gin框架的源碼&#xff0c; 先說一下…

AGV 無人叉車關鍵技術問題解析:精準定位算法 / 安全避障邏輯 / 系統對接協議全方案

AGV無人叉車作為智能物流的核心裝備&#xff0c;在落地時常面臨定位漂移、系統兼容性差、避障失靈等痛點。本文深度解析5大高頻問題成因與解決方案&#xff0c;助企業規避運營風險&#xff0c;提升效率。 一、定位導航問題&#xff1a;行駛路徑偏移怎么辦&#xff1f; 1.典型…

AI Agent意圖識別

意圖識別&#xff1a;多維度拆解 意圖識別是人機對話系統&#xff08;Conversational AI&#xff09;的“大腦皮層”&#xff0c;負責理解用戶言語背后的真實目的。它將用戶的自然語言輸入映射到一個預定義的意圖類別上。可以說&#xff0c;意圖識別的準確性&#xff0c;直接決…

.net 8 項目 一天快速入門

這里有一個解決方案 這里有一個接口類的項目 這會呢如果還想在建一個項目 我們在解決方案這里右鍵,添加,新建項目 點擊 我現在要建立一個類庫,所以就搜一下類庫,這里的第一個就是我們需要創建的類庫 起個名字,計算類 進來了 可以看到這里有多了一個項目,但是他們…

語音大模型速覽(一)F5-TTS

F5-TTS: A Fairytaler that Fakes Fluent and Faithful Speech with Flow Matching 論文鏈接&#xff1a;https://arxiv.org/pdf/2410.06885代碼鏈接&#xff1a;https://SWivid.github.io/F5-TTS/ 一段話總結 本文提出了 F5-TTS&#xff0c;一種基于流匹配和擴散 Transform…

Codeforces 2021 C Those Who Are With Us

[Problem Discription]\color{blue}{\texttt{[Problem Discription]}}[Problem Discription] 給定一個 nmn \times mnm 的表格 ai,ja_{i,j}ai,j?&#xff0c;你可以恰好進行一次如下操作&#xff1a; 選擇一個格點 (r,c)(r,c)(r,c)。對于所有滿足 iririr 或者 jcjcjc 的格點 (…

chrome插件合集

最近一段時間呢(不到一年)&#xff0c;實現了大概二十幾個chrome插件。很多人不知道的是&#xff0c;其實開發插件很解壓&#xff0c;就好像是我喜歡沿著公園的小路散步一樣&#xff0c;每開發一個插件帶給我的成就感和快樂都是獨特的。我依然記得自己開發出第1個插件時的快樂&…

【機器學習深度學習】模型微調的基本概念與流程

目錄 前言 一、什么是模型微調&#xff08;Fine-tuning&#xff09;&#xff1f; 二、預訓練 vs 微調&#xff1a;什么關系&#xff1f; 三、微調的基本流程&#xff08;以BERT為例&#xff09; 1?? 準備數據 2?? 加載預訓練模型和分詞器 3?? 數據編碼與加載 4?…

大語言模型預訓練數據——數據采樣方法介紹以GPT3為例

大語言模型預訓練數據——數據采樣方法介紹以GPT3為例一、數據采樣核心邏輯二、各列數據含義一、數據采樣核心邏輯 這是 GPT - 3 訓練時的數據集配置&#xff0c;核心是非等比例采樣——不按數據集原始大小分配訓練占比&#xff0c;而是人工設定不同數據集在訓練中被抽取的概率…

針對同一臺電腦,為使用不同 SSH Key 的不同用戶分別設置 Git 遠程倉庫憑據的操作指南

一、準備工作 生成多對 SSH Key 為每個用戶&#xff08;如“個人”、“公司”&#xff09;生成一對獨立的 SSH Key。 示例&#xff08;在 Git Bash 或 Linux 終端中執行&#xff09;&#xff1a; # 個人 ssh-keygen -t rsa -b 4096 -C "personalexample.com" -f ~/.…

【V5.0 - 視覺篇】AI的“火眼金睛”:用OpenCV量化“第一眼緣”,并用SHAP驗證它的“審美”

系列回顧&#xff1a; 在上一篇 《給AI裝上“寫輪眼”&#xff1a;用SHAP看穿模型決策的每一個細節》 中&#xff0c;我們成功地為AI裝上了“透視眼鏡”&#xff0c;看穿了它基于數字決策的內心世界。 但一個巨大的問題暴露了&#xff1a;它的世界里&#xff0c;還只有數字。 它…

Open3D 基于最大團(MAC)的點云粗配準

MAC 一、算法原理1、原理概述2、實現流程3、總結二、代碼實現三、結果展示博客長期更新,本文最新更新時間為:2025年7月1日。 一、算法原理 1、原理概述 最大團(Maximal Cliques, MAC)法在點云配準中的應用,是近年來解決高離群值(outlier)和低重疊場景下配準問題的重要…

Science Robotics發表 | 20m/s自主飛行+避開2.5mm電線的微型無人機!

從山火搜救到災后勘察&#xff0c;時間常常意味著生命。分秒必爭的任務要求無人機在陌生狹窄環境中既要飛得快、又要飛得穩。香港大學機械工程系張富教授團隊在Science Robotics(2025)發表論文“Safety-assured High-speed Navigation for MAVs”提出了微型無人機的安全高速導航…

【數據分析】如何在PyCharm中高效配置和使用SQL

PyCharm 作為 Python 開發者的首選 IDE&#xff0c;其 Professional 版本提供了強大的數據庫集成功能&#xff0c;讓開發者無需切換工具即可完成數據庫操作。本文將手把手教你配置和使用 PyCharm 的 SQL 功能。 一、安裝和配置 PyCharm 老生常談&#xff0c;第一步自然是安裝并…

OpenShift AI - 使用 NVIDIA Triton Runtime 運行模型

《OpenShift / RHEL / DevSecOps 匯總目錄》 說明&#xff1a;本文已經在 OpenShift 4.18 OpenShift AI 2.19 的環境中驗證 文章目錄 準備 Triton Runtime 環境添加 Triton Serving Runtime運行基于 Triton Runtime 的 Model Server 在 Triton Runtime 中運行模型準備模型運行…

物聯網數據安全區塊鏈服務

物聯網數據安全區塊鏈服務 下面是一個專為物聯網數據安全設計的區塊鏈服務實現&#xff0c;使用Python編寫并封裝為RESTful API。該服務確保物聯網設備數據的不可篡改性、可追溯性和安全性。 import hashlib import json import time from datetime import datetime from uui…