【C++指南】string(三):basic_string底層原理與模擬實現詳解

.

💓 博客主頁:倔強的石頭的CSDN主頁
📝Gitee主頁:倔強的石頭的gitee主頁
? 文章專欄:《C++指南》
期待您的關注

文章目錄

    • 引言
    • 一、成員變量與內存管理
      • 1.1 核心成員變量
      • 1.2 內存分配策略
    • 二、默認成員函數的實現與優化
      • 2.1 拷貝構造函數
      • 2.2 賦值運算符重載
      • 2.3 析構函數
    • 三、迭代器與元素訪問
      • 3.1 迭代器實現
      • 3.2 運算符重載
    • 四、容量管理
      • 4.1 reserve:預分配內存
      • 4.2 resize:調整字符串長度
    • 五、修改操作
      • 5.1 清空字符串:`clear`
      • 5.2 push_back與append
      • 5.3 insert與erase
    • 六、其他關鍵函數實現
      • 6.1 查找函數:`find`
        • 查找字符
        • 查找子串
      • 6.2 子串生成:`substr`
      • 6.3 流運算符重載
        • 流插入(`operator<<`)
        • 流提取(`operator>>`)
      • 6.4 比較運算符重載
        • 等于與不等于
        • 大小比較
      • 6.5 交換函數:`swap`
    • 七、性能優化與注意事項
    • 結語

引言

在前文中,我們深入探討了C++標準庫中basic_string的成員變量、默認成員函數及常用操作。
本文作為系列第三篇,將結合模擬實現的代碼,逐行解析basic_string的底層原理,涵蓋構造函數、拷貝控制、容量管理、修改操作等核心功能的實現細節與優化技巧
通過手寫一個簡化版string類,幫助讀者徹底理解std::string的內部工作機制。

一、成員變量與內存管理

1.1 核心成員變量

標準庫的basic_string通過三個核心變量管理字符串:

  • 字符指針 _str:指向動態分配的字符數組。
  • 當前長度 _size:字符串有效字符個數(不含\0)。
  • 總容量 _capacity:當前內存可容納的最大字符數(含\0)。

模擬實現代碼

namespace xc {
class string {
private:char* _str;         // 字符存儲指針size_t _size;       // 有效字符數size_t _capacity;   // 總容量(含\0)
public:static const size_t npos = -1; // 特殊標記
};
}

1.2 內存分配策略

  • 默認構造:初始化為空字符串(_str指向\0)。 注意不能初始化為nullptr,否則調用c_str時,就會對空指針解引用
  • 動態擴容:當_size達到_capacity時,按2倍或需求大小擴容,避免頻繁內存分配。

構造函數實現

// 默認構造(支持傳入C字符串)
string::string(const char* str) : _size(strlen(str)) {_str = new char[_size + 1]; // 多分配1字節存放\0strcpy(_str, str);_capacity = _size;          // 初始容量等于長度
}

二、默認成員函數的實現與優化

2.1 拷貝構造函數

傳統寫法需要手動分配內存并拷貝數據,而現代C++寫法通過“構造臨時對象 + 交換資源”簡化代碼:
(關于swap函數的實現可跳轉6.5查找)

// 傳統寫法(易錯且冗余)
string::string(const string& s) {_str = new char[s._capacity + 1];strcpy(_str, s._str);_size = s._size;_capacity = s._capacity;
}// 現代寫法(利用臨時對象)
string::string(const string& s) {string tmp(s._str); // 調用構造函數swap(tmp);          // 交換資源
}

2.2 賦值運算符重載

通過**“拷貝構造臨時對象 + 交換”**避免自賦值問題,同時減少重復代碼:

 //傳統寫法string& string::operator=(const string& s){if (this != &s){delete[] _str;_str = new char[s._capacity + 1];strcpy(_str, s._str);_size = s._size;_capacity = s._capacity;}return *this;}
// 優化版賦值重載
string& string::operator=(const string& s) {if (this != &s) {       // 防止自賦值string tmp(s);      // 調用拷貝構造swap(tmp);          // 交換資源}return *this;
}

2.3 析構函數

釋放動態內存并將成員變量歸零:

string::~string() {delete[] _str;  // 釋放堆內存_size = 0;_capacity = 0;
}

三、迭代器與元素訪問

3.1 迭代器實現

模擬原生指針的行為,提供begin()end()

using iterator = char*;
iterator begin() { return _str; }
iterator end() { return _str + _size; }

3.2 運算符重載

通過operator[]提供隨機訪問,并使用assert檢查越界:

char& operator[](size_t i) {assert(i < _size);      // 越界檢查return _str[i];
}

四、容量管理

4.1 reserve:預分配內存

若需求容量大于當前容量,重新分配內存并拷貝數據:

void string::reserve(size_t n) {if (n > _capacity) {char* tmp = new char[n + 1]; strcpy(tmp, _str);delete[] _str;      // 釋放舊內存_str = tmp;_capacity = n;      // 更新容量}
}

4.2 resize:調整字符串長度

根據新長度截斷或填充字符:

void string::resize(size_t n, char c) {if (n < _size) {_str[n] = '\0';    // 截斷_size = n;} else {reserve(n);         // 確保容量足夠for (size_t i = _size; i < n; ++i) {_str[i] = c;   // 填充字符}_size = n;_str[_size] = '\0';}
}

五、修改操作

5.1 清空字符串:clear

清空字符串內容但不釋放內存(保留容量):

void string::clear() {_str[0] = '\0';  // 首字符置為結束符_size = 0;       // 長度歸零
}

5.2 push_back與append

  • 尾插字符:檢查擴容后直接寫入:
void string::push_back(char c) {if (_size == _capacity) {reserve(_capacity == 0 ? 4 : 2 * _capacity);}_str[_size++] = c;_str[_size] = '\0';
}
  • 追加字符串:計算長度后擴容并拷貝:
void string::append(const char* str) {size_t len = strlen(str);if (_size + len > _capacity) {reserve(_size + len); // 按需擴容}strcpy(_str + _size, str); // 直接拷貝_size += len;
}

5.3 insert與erase

  • 插入字符:移動后續字符騰出位置:
string& string::insert(size_t pos, char c) {assert(pos <= _size);if (_size == _capacity) reserve(2 * _capacity);size_t end = _size + 1;while (end > pos) {      // 從后向前移動_str[end] = _str[end - 1];end--;}_str[pos] = c;_size++;return *this;
}
  • 刪除字符:覆蓋后續字符并更新長度:
string& string::erase(size_t pos, size_t len) {assert(pos < _size);if (len == npos || len > _size - pos) {_str[pos] = '\0';_size = pos;} else {strcpy(_str + pos, _str + pos + len); // 覆蓋刪除區域_size -= len;}return *this;
}

六、其他關鍵函數實現

6.1 查找函數:find

查找字符
size_t string::find(char c, size_t pos) const {assert(pos < _size);for (size_t i = pos; i < _size; ++i) {if (_str[i] == c) return i;}return npos; // 未找到返回特殊標記
}
查找子串

利用標準庫的strstr函數優化子串查找:

size_t string::find(const char* s, size_t pos) const {assert(pos < _size);const char* ptr = strstr(_str + pos, s); // 直接調用C庫函數return ptr ? ptr - _str : npos;
}

6.2 子串生成:substr

截取從pos開始的len個字符生成新字符串:

string string::substr(size_t pos, size_t len) const {assert(pos <= _size);len = (len == npos) ? _size - pos : len; // 默認取到末尾len = std::min(len, _size - pos);        // 防止越界string result;result.reserve(len);              // 預分配內存for (size_t i = 0; i < len; ++i) {result += _str[pos + i];      // 逐字符追加}return result;
}

6.3 流運算符重載

流插入(operator<<

直接遍歷輸出有效字符:

ostream& operator<<(ostream& os, const xc::string& s) {for (size_t i = 0; i < s.size(); ++i) {os << s[i]; // 支持鏈式調用}return os;
}
流提取(operator>>

優化版輸入,通過緩沖區減少擴容次數:

istream& operator>>(istream& is, xc::string& s) {s.clear();        // 清空原內容char buff[256];   // 局部緩沖區char ch;int idx = 0;while (is.get(ch) && !isspace(ch)) {buff[idx++] = ch;if (idx == 255) {    // 緩沖區滿時批量追加buff[idx] = '\0';s += buff;idx = 0;}}if (idx > 0) {    // 處理剩余字符buff[idx] = '\0';s += buff;}return is;
}

6.4 比較運算符重載

等于與不等于
bool string::operator==(const string& s) const {return strcmp(_str, s._str) == 0; // 直接比較C字符串
}bool string::operator!=(const string& s) const {return !(*this == s); // 復用等于運算符
}
大小比較
bool string::operator<(const string& s) const {return strcmp(_str, s._str) < 0; // 字典序比較
}bool string::operator<=(const string& s) const {return (*this < s) || (*this == s); // 組合邏輯
}bool string::operator>(const string& s) const {return !(*this <= s);
}bool string::operator>=(const string& s) const {return !(*this < s);
}

6.5 交換函數:swap

高效交換兩個字符串的資源(避免深拷貝):

void string::swap(string& s) {std::swap(_str, s._str);      // 交換指針std::swap(_size, s._size);    // 交換長度std::swap(_capacity, s._capacity); // 交換容量
}

七、性能優化與注意事項

  1. substr的優化

    • 避免直接使用newstrcpy,通過reserve預分配內存減少擴容次數。
    • 若需要高性能,可實現“淺拷貝+引用計數”(需處理寫時復制邏輯)。
  2. find的局限性

    • 當前實現為暴力匹配,標準庫可能使用更高效的算法(如KMP)。
  3. 流提取的安全性

    • 緩沖區大小固定為256,若輸入過長可能丟失數據,可動態調整緩沖區大小。
  4. swap的優勢

    • 僅交換指針和元數據,時間復雜度為O(1),適合頻繁交換場景。

結語

通過手寫string類,我們深入理解了basic_string的底層機制。標準庫的實現在此基礎上進行了大量優化(如SSO、內存池),但核心邏輯與本文的模擬實現高度一致。掌握這些原理后,讀者可以更高效地使用std::string,并能在需要時定制自己的字符串類。

相關閱讀

  • 【C++指南】string(一):string從入門到掌握
  • 【C++指南】string(二):深入探究 C++ basic_string:成員變量、函數全解析

關注博主,第一時間獲取更新!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/907044.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/907044.shtml
英文地址,請注明出處:http://en.pswp.cn/news/907044.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AWS云與第三方通信最佳實踐:安全、高效的數據交互方案

引言 在當今的云計算時代,企業經常需要在AWS云環境中存儲和處理數據,同時還需要與第三方應用或服務進行數據交互。如何安全、高效地實現這種通信是許多企業面臨的挑戰。本文將詳細探討幾種AWS云與第三方通信的方案,并分析它們的優缺點,幫助您為自己的業務場景選擇最佳解決…

AE THYRO-AX 功率控制器 THYRISTOR-LEISTUNGSSTELLER THYRISTOR POWER CONTROLLER

AE THYRO-AX 功率控制器 THYRISTOR-LEISTUNGSSTELLER THYRISTOR POWER CONTROLLER

【論文解讀】STaR:不用人類思維鏈指導,模型可以自我進化!

1st author: Eric Zelikman paper: STaR: Bootstrapping Reasoning With Reasoning | OpenReview NeurIPS 2022 code: ezelikman/STaR: Code for STaR: Bootstrapping Reasoning With Reasoning (NeurIPS 2022) 1. 當語言模型學會自我進化 Zelikman 等人提出的 STaR (Self-T…

大語言模型 19 - MCP FastAPI-MCP 實現自己的MCP服務 快速接入API

MCP 基本介紹 官方地址&#xff1a; https://modelcontextprotocol.io/introduction “MCP 是一種開放協議&#xff0c;旨在標準化應用程序向大型語言模型&#xff08;LLM&#xff09;提供上下文的方式。可以把 MCP 想象成 AI 應用程序的 USB-C 接口。就像 USB-C 提供了一種…

用Matlab對單目相機參數的標定步驟(保姆級教程)

前言 在圖像測量及機器視覺應用中&#xff0c;為確定空間物體表面某點的三維幾何位置與其在圖像中對應點之間的相互關系&#xff0c;必須建立相機成像的幾何模型&#xff0c;這些幾何模型參數就是相機參數。 ??在大多數條件下這些參數必須通過實驗與計算才能得到&#xff…

【后端高階面經:架構篇】46、分布式架構:如何應對高并發的用戶請求

一、架構設計原則:構建可擴展的系統基石 在分布式系統中,高并發場景對架構設計提出了極高要求。 分層解耦與模塊化是應對復雜業務的核心策略,通過將系統劃分為客戶端、CDN/邊緣節點、API網關、微服務集群、緩存層和數據庫層等多個層次,實現各模塊的獨立演進與維護。 1.1 …

SQL每日一題(5)

前言&#xff1a;五更&#xff01;五更琉璃&#xff01;不對&#xff01;是&#xff0c;五更佩可&#xff01; 原始數據&#xff1a; new_hires reasonother_column1other_column2校園招聘信息 11社會招聘信息 22內部推薦信息 33獵頭推薦信息 44校園招聘信息 55社會招聘信息…

Kafka Kraft模式集群 + ssl

文章目錄 啟用集群資源規劃準備證書創建相關文件夾配置文件啟動各Kafka節點 故障轉移測試spring boot集成 啟用集群 配置集群時關鍵就是提前梳理好需要的網絡資源&#xff0c;完成對應server.properties文件的配置。在執行前先把這些梳理好&#xff0c;可以方便后面的配置&…

watchEffect

在處理復雜異步邏輯時&#xff0c;Vue 3 的 watchEffect 相比傳統的 watch 具有以下優勢&#xff1a; 1. 自動追蹤依賴 watchEffect 會自動收集其回調中使用的所有響應式依賴&#xff0c;無需手動指定監聽源&#xff1a; import { ref, watchEffect } from vue;const count …

Linux系統平均負載與top、uptime命令詳解

介紹 在Linux系統運維中&#xff0c;系統平均負載是一個重要的性能指標。通過 top和 uptime命令&#xff0c;可以實時監控系統的負載情況&#xff0c;幫助運維人員及時發現并解決系統性能問題。本文將詳細介紹Linux系統平均負載的概念及其計算方法&#xff0c;并深入解析 top和…

前端配置nginx代理

一、定義靜態文件的路徑的兩種方式 1. root 指令 &#xff08;1&#xff09;作用 指定文件系統的 基礎路徑&#xff0c;location 的 URI 會 追加到該路徑后 形成完整路徑。 &#xff08;2&#xff09;語法 location /uri/ {root /path/to/files; } &#xff08;3&#xf…

語音識別技術在人工智能中的應用

姓名&#xff1a;成杰 學號&#xff1a;21021210653 學院&#xff1a;電子工程學院 【嵌牛導讀】 應用語音智能這項識別技術是為了使計算機可以聽懂人類的語言&#xff0c;并執行人類的某項操作。現階段這項技術已經成為人工智能領域的重點研究方向和實現人機語音交互的…

uniapp實現大視頻文件上傳-- 阿里云oss直傳方式 - app、H5、微信小程序

之前的項目文件上傳比較慢&#xff0c;使用預簽名方式上傳H5正常&#xff0c;微信小程序和app使用axios時出現了各種報錯&#xff0c;配置完后還是不行。所以換一種oss直傳方式。 找到一個 實現了的 參考:https://blog.csdn.net/qq_44860866/article/details/129670188

【Java學習筆記】抽象類

抽象類 引入關鍵字&#xff1a;abstract 應用場景&#xff1a;當子類中共有的部分 / 特性可以放到抽象類中 1. 通過子類的方法重寫實現不同的功能 2. 編寫一個方法把共有的部分放入其中&#xff0c;在該方法中調用抽象方法&#xff08;動態綁定機制&#xff09; 3. 便可以實…

EPT(Efficient Prompt Tuning)方法,旨在解決提示調優(Prompt Tuning)中效率與準確性平衡和跨任務一致性的問題

EPT(Efficient Prompt Tuning)方法,旨在解決提示調優(Prompt Tuning)中效率與準確性平衡和跨任務一致性的問題 一、核心原理:分解提示與多空間投影 1. 提示分解:用低秩矩陣壓縮長提示 傳統問題: 長提示(如100個token)精度高但訓練慢,短提示(如20個token)速度快但…

深入剖析Java中的偽共享:原理、檢測與解決方案

在高性能Java應用的開發中&#xff0c;尤其是多線程環境下&#xff0c;開發者往往會關注鎖競爭、線程調度等顯性問題&#xff0c;但有一個隱蔽的性能殺手——偽共享&#xff08;False Sharing&#xff09;?&#xff0c;卻容易被忽視。本文將通過原理分析、代碼案例與實戰工具&…

JMeter 教程:響應斷言

目錄 JMeter 教程&#xff1a;響應斷言的簡單介紹【輕松上手】 ? 什么是響應斷言&#xff1f; &#x1f4cc; 使用場景示例 &#x1f6e0;? 添加響應斷言步驟 1. 選中 HTTP 請求 → 右鍵 → Add → Assertions → Response Assertion 2. 設置斷言內容&#xff1a; ? …

11.11 TypedDict與Pydantic實戰:Python高效狀態管理秘籍

使用 TypedDict 和 Pydantic 管理狀態 關鍵詞:LangGraph 狀態管理, TypedDict 類型化字典, Pydantic 數據模型, 狀態持久化, 多輪對話設計 1. 狀態管理的核心挑戰 在復雜 AI Agent 系統中,狀態管理需要解決三個關鍵問題: #mermaid-svg-0sX3763L7VP2RvuX {font-family:&quo…

ThreadLocal線程本地變量在dubbo服務使用時候遇到的一個坑

我昨天遇到一個問題&#xff0c;就是我springboot項目里面有一個提供代辦服務審核的dubbo接口&#xff0c;這個接口給房源項目調用&#xff0c;但是碰到一個問題就是&#xff0c;房源項目每天凌晨5點會查詢滿足條件過期的數據&#xff0c;然后調用我這邊的代辦審核dubbo接口&am…

[Java實戰]Spring Boot整合達夢數據庫連接池配置(三十四)

[Java實戰]Spring Boot整合達夢數據庫連接池配置&#xff08;三十四&#xff09; 一、HikariCP連接池配置&#xff08;默認&#xff09; 1. 基礎配置&#xff08;application.yml&#xff09; spring:datasource:driver-class-name: dm.jdbc.driver.DmDriverurl: jdbc:dm://…