C++ `std::vector` 详解：使用、特性与最佳实践 – wiki词典

C++ std::vector 详解：使用、特性与最佳实践

1. 引言

std::vector 是 C++ 标准库中最常用、功能最强大的动态数组容器之一。它提供了一种序列容器，可以存储任意类型的元素，并且在运行时自动管理其大小。与 C 风格的静态数组不同，std::vector 允许你在程序执行期间添加或删除元素，而无需手动处理内存分配和释放。这使得 std::vector 成为处理可变大小数据集合的首选工具。

本文将深入探讨 std::vector 的使用方法、核心特性、内存管理机制以及在实际编程中的最佳实践，帮助你更好地理解和高效利用这一强大的容器。

2. 关键特性与优势

std::vector 之所以成为 C++ 中最受欢迎的容器之一，得益于其以下关键特性：

动态大小：与固定大小的数组不同，std::vector 可以在运行时动态地增长和收缩。当元素数量超出当前容量时，它会自动重新分配更大的内存空间来容纳新元素。
连续内存存储：std::vector 中的所有元素都存储在连续的内存区域中，这与 C 风格数组相同。这种连续性使得通过索引进行元素访问（[] 操作符或 at() 方法）具有常数时间复杂度 O(1)，并且对缓存友好，有助于提高性能。
高效的尾部插入/删除：在 std::vector 的末尾添加 (push_back) 或删除 (pop_back) 元素通常是常数时间复杂度 O(1) 操作，因为通常不需要重新分配内存或移动现有元素。
支持随机访问迭代器：由于其连续内存布局，std::vector 支持随机访问迭代器，这意味着可以在常数时间内跳转到任何位置的元素，并进行高效的遍历。
自动内存管理：std::vector 负责其存储的元素的内存管理。当 vector 被销毁时，它会自动释放所有分配的内存，避免了内存泄漏的风险。
与 C 数组兼容：在某些情况下，std::vector 的底层数组可以通过 data() 方法获取，这使得它能够与接受 C 风格数组指针的旧版 API 或库进行互操作。

3. `std::vector` 的常见用法

3.1 声明与初始化

std::vector 的声明和初始化有多种方式：

默认构造：创建一个空的 vector。
“`cpp
#include
#include

std::vector myVector; // 一个空的 int 类型 vector
std::vector stringVector; // 一个空的 string 类型 vector
“`
带大小构造：创建一个包含 n 个默认构造元素的 vector。
cpp std::vector<int> myVectorWithSize(5); // 包含 5 个 int 类型元素，都初始化为 0 std::vector<std::string> stringVectorWithSize(3); // 包含 3 个 string 类型元素，都初始化为空字符串
带大小和初始值构造：创建一个包含 n 个指定初始值的元素的 vector。
cpp std::vector<int> myVectorWithInitialValue(5, 10); // 包含 5 个 int 类型元素，都初始化为 10
列表初始化 (C++11 及更高版本)：使用初始化列表直接初始化 vector。
cpp std::vector<int> myVectorInitialized = {1, 2, 3, 4, 5}; std::vector<std::string> stringVectorInitialized = {"apple", "banana", "cherry"};
拷贝构造：使用另一个 vector 拷贝构造。
cpp std::vector<int> originalVector = {1, 2, 3}; std::vector<int> copiedVector(originalVector); // copiedVector 现在是 {1, 2, 3}
范围构造：使用两个迭代器指定的范围来构造 vector。
cpp std::vector<int> anotherVector = {10, 20, 30, 40, 50}; std::vector<int> subVector(anotherVector.begin() + 1, anotherVector.begin() + 4); // subVector 现在是 {20, 30, 40}

3.2 添加与删除元素

push_back()：在 vector 的末尾添加一个元素。这是最常用的添加元素方式。
cpp std::vector<int> vec; vec.push_back(10); // vec: {10} vec.push_back(20); // vec: {10, 20}
pop_back()：删除 vector 末尾的元素。
cpp vec.pop_back(); // vec: {10} // 注意：pop_back() 不返回被删除的元素
insert()：在指定位置插入一个或多个元素。
cpp std::vector<int> vecInsert = {1, 2, 3}; vecInsert.insert(vecInsert.begin() + 1, 100); // 在索引 1 处插入 100。 vecInsert: {1, 100, 2, 3} vecInsert.insert(vecInsert.begin() + 2, 2, 200); // 在索引 2 处插入两个 200。 vecInsert: {1, 100, 200, 200, 2, 3} std::vector<int> moreElements = {5, 6}; vecInsert.insert(vecInsert.end(), moreElements.begin(), moreElements.end()); // 在末尾插入一个范围。 vecInsert: {1, 100, 200, 200, 2, 3, 5, 6}
insert() 操作的效率相对较低，因为它可能导致所有后续元素都需移动。
erase()：删除指定位置的一个或一个范围的元素。
cpp std::vector<int> vecErase = {1, 2, 3, 4, 5}; vecErase.erase(vecErase.begin() + 2); // 删除索引 2 处的元素 (3)。 vecErase: {1, 2, 4, 5} vecErase.erase(vecErase.begin() + 1, vecErase.begin() + 3); // 删除索引 1 到 2 (不包括 3) 的元素 (2, 4)。 vecErase: {1, 5}
erase() 操作同样效率较低，因为它可能导致所有后续元素都需移动。
clear()：删除 vector 中的所有元素，使其变为空。
cpp std::vector<int> vecClear = {1, 2, 3}; vecClear.clear(); // vecClear 为空

3.3 访问元素

[] 操作符：通过索引访问元素。不进行边界检查。
cpp std::vector<int> data = {10, 20, 30}; int first = data[0]; // first = 10 data[1] = 25; // data: {10, 25, 30} // 警告：访问越界索引会导致未定义行为
at() 方法：通过索引访问元素。进行边界检查，越界时抛出 std::out_of_range 异常。
cpp int third = data.at(2); // third = 30 try { int outOfBounds = data.at(5); // 抛出 std::out_of_range 异常 } catch (const std::out_of_range& e) { // 处理异常 }
front() 和 back()：访问 vector 的第一个和最后一个元素。
cpp std::vector<int> fbData = {1, 2, 3}; int frontElement = fbData.front(); // frontElement = 1 int backElement = fbData.back(); // backElement = 3 // 注意：对空 vector 调用 front() 或 back() 是未定义行为
data() 方法 (C++11 及更高版本)：返回指向 vector 内部数据存储的第一个元素的指针。这允许 vector 与 C 风格数组函数或 API 兼容。
cpp std::vector<int> rawData = {1, 2, 3, 4, 5}; int* ptr = rawData.data(); // 可以通过 ptr 访问或修改元素 ptr[0] = 100; // rawData: {100, 2, 3, 4, 5}

4. 迭代器

std::vector 提供了多种迭代器，用于遍历其元素：

begin() 和 end()：
- begin() 返回指向 vector 第一个元素的迭代器。
- end() 返回指向 vector 最后一个元素之后一个位置的迭代器。它是一个“尾后”迭代器，通常用于判断遍历是否结束。
  “`cpp
  std::vector numbers = {10, 20, 30, 40, 50};
// 使用迭代器遍历
for (std::vector::iterator it = numbers.begin(); it != numbers.end(); ++it) {
std::cout << *it << ” “; // 输出: 10 20 30 40 50
}
std::cout << std::endl;

// C++11 范围 for 循环 (基于迭代器实现)
for (int num : numbers) {
std::cout << num << ” “; // 输出: 10 20 30 40 50
}
std::cout << std::endl;
“`
cbegin() 和 cend() (C++11 及更高版本)：
- 返回 const_iterator，用于只读遍历，确保元素不会被修改。
  cpp for (std::vector<int>::const_iterator it = numbers.cbegin(); it != numbers.cend(); ++it) { // *it = 100; // 错误：不能修改 const_iterator 指向的值 std::cout << *it << " "; } std::cout << std::endl;
rbegin() 和 rend()：
- rbegin() 返回指向 vector 最后一个元素的逆向迭代器。
- rend() 返回指向 vector 第一个元素之前一个位置的逆向迭代器。
  cpp for (std::vector<int>::reverse_iterator rit = numbers.rbegin(); rit != numbers.rend(); ++rit) { std::cout << *rit << " "; // 输出: 50 40 30 20 10 } std::cout << std::endl;
crbegin() 和 crend() (C++11 及更高版本)：
- 返回 const_reverse_iterator，用于只读逆向遍历。
  cpp for (std::vector<int>::const_reverse_iterator crit = numbers.crbegin(); crit != numbers.crend(); ++crit) { std::cout << *crit << " "; } std::cout << std::endl;

5. 容量与大小管理

std::vector 有两个重要的概念：size 和 capacity。

size()：vector 中实际元素的数量。
capacity()：vector 当前已分配的内存可以容纳的元素总数。capacity >= size。

当 vector 的 size 达到 capacity 时，如果再添加元素，vector 需要重新分配一块更大的内存，并将现有元素复制或移动到新内存区域，然后释放旧内存。这个过程称为重新分配 (reallocation)，通常涉及到性能开销。

6. 最佳实践

在使用 std::vector 时，遵循一些最佳实践可以显著提高代码的效率、可读性和健壮性。

6.1 预留容量 (`reserve`)

如果你知道 vector 将要存储的元素大致数量，或者至少可以估算出最大数量，请使用 reserve() 函数预先分配内存。这可以避免多次重新分配和元素复制/移动的开销，从而提高 push_back 操作的效率。

cpp std::vector<int> data; data.reserve(1000); // 预留足够的空间，避免在添加前1000个元素时进行重新分配 for (int i = 0; i < 1000; ++i) { data.push_back(i); }

6.2 避免在循环中进行昂贵的插入/删除操作

在 vector 的开头或中间进行 insert() 或 erase() 操作会导致其后的所有元素移动，这在大型 vector 或频繁操作时会带来显著的性能开销（线性时间复杂度 O(N)）。如果需要频繁地在中间插入或删除，考虑使用 std::list 或 std::deque。

cpp // 效率低下，避免在循环中频繁使用 std::vector<int> myVec = {1, 2, 3, 4, 5}; // 假设要在每个偶数位置插入一个新元素 for (size_t i = 0; i < myVec.size(); ++i) { if (i % 2 == 0) { myVec.insert(myVec.begin() + i, 99); // 每次插入都会移动后续元素 } }
更好的做法是先收集要插入的数据，然后一次性插入，或者考虑使用其他容器。

6.3 使用 `emplace_back` 代替 `push_back` (C++11 及更高版本)

对于非基本类型（如自定义对象），emplace_back() 可以直接在 vector 内部构造对象，避免了先构造临时对象再移动或复制的开销，可能带来性能提升。

“`cpp
struct MyObject {
int id;
std::string name;
MyObject(int i, const std::string& n) : id(i), name(n) {}
};

std::vector objects;
objects.reserve(10);

// push_back 可能涉及一次构造 (临时对象) + 一次移动/复制构造
objects.push_back(MyObject(1, “Alice”));

// emplace_back 直接在 vector 的内存中构造
objects.emplace_back(2, “Bob”);
“`

6.4 优先使用范围 `for` 循环进行遍历

C++11 引入的范围 for 循环 (for (auto& element : vector)) 既简洁又安全，是遍历 vector 的首选方式。它会自动处理迭代器的初始化和递增。

“`cpp
std::vector values = {10, 20, 30};
for (int val : values) { // 只读访问
std::cout << val << ” “;
}
std::cout << std::endl;

for (int& val : values) { // 可读写访问
val *= 2;
}
// values 现在是 {20, 40, 60}
“`

6.5 使用 `at()` 进行安全访问，`[]` 进行性能访问

当你确定索引在有效范围内时（例如在循环中），使用 [] 操作符，因为它没有边界检查的开销，速度更快。
当你不确定索引是否有效时，使用 at() 进行访问，它会抛出 std::out_of_range 异常，有助于调试和防止运行时错误。

6.6 当不再需要内存时，使用“交换技巧”释放内存

clear() 函数会清空 vector 但不一定会释放其 capacity。如果你想彻底释放 vector 占用的内存（将其 capacity 减小到 0），可以使用交换技巧：

“`cpp
std::vector largeVector(1000);
// … 填充数据 …
largeVector.clear(); // size 为 0，但 capacity 可能仍很大

// 释放内存的技巧
std::vector().swap(largeVector); // largeVector 的 capacity 变为 0
// 或者 (C++11+)
// largeVector.shrink_to_fit(); // 请求减小 capacity，但不保证
`` 这个技巧通过与一个空的临时vector交换内容，然后让临时vector` 销毁时释放内存。

6.7 传递 `vector` 参数

按 const 引用传递：如果函数不需要修改 vector 的内容，且 vector 可能很大，应按 const 引用传递 (const std::vector<T>&)，以避免不必要的复制开销。
按值传递：如果函数需要修改 vector 的内容，并且你希望这种修改不影响调用者（即函数需要 vector 的一个独立副本），则按值传递。C++11 后的移动语义可以在某些情况下优化此过程。
按引用传递：如果函数需要修改 vector 的内容，并希望修改反映到调用者，则按引用传递 (std::vector<T>&)。

“`cpp
void printVector(const std::vector& v) {
for (int x : v) {
std::cout << x << ” “;
}
std::cout << std::endl;
}

void modifyVector(std::vector& v) {
if (!v.empty()) {
v[0] = 999;
}
}
“`

7. 何时使用 `std::vector` 与其他容器

std::vector 是许多场景下的默认选择，但了解其优缺点并与其他标准库容器进行比较，能帮助你做出更明智的选择。

7.1 `std::vector` 的适用场景

需要动态数组：当你需要一个可以动态增长和收缩的数组时。
频繁在末尾添加/删除元素：push_back() 和 pop_back() 的平均时间复杂度是 O(1)。
频繁随机访问元素：由于内存连续，通过索引访问元素是 O(1) 操作，且对 CPU 缓存友好。
需要与 C 风格数组兼容：可以通过 data() 方法获取底层数组指针。
内存使用率较高：通常没有额外开销用于节点链接等。

7.2 与其他容器的比较

7.2.1 `std::vector` vs. C 风格数组

C 风格数组：
- 优点：栈上分配时，内存分配/回收开销最小；直接内存访问速度最快。
- 缺点：固定大小，不能动态调整；没有边界检查；没有内置的迭代器和成员函数。
- 何时使用：大小在编译时已知且固定不变，对性能要求极致，且能手动管理内存和边界的场景。

7.2.2 `std::vector` vs. `std::array` (C++11 及更高版本)

std::array：
- 优点：固定大小的数组，但提供现代 C++ 接口（如迭代器、成员函数）；在栈上分配内存（如果元素数量不大），性能接近 C 风格数组。
- 缺点：大小在编译时固定，不能动态调整。
- 何时使用：大小在编译时已知且固定不变，但需要现代 C++ 容器接口的场景。

7.2.3 `std::vector` vs. `std::deque` (双端队列)

std::deque：
- 优点：支持在头部和尾部高效添加/删除元素 (O(1))；支持随机访问 (O(1))。
- 缺点：内存不一定连续，可能不如 std::vector 对缓存友好；插入/删除中间元素效率低 (O(N))。
- 何时使用：需要在两端频繁添加/删除元素，同时又需要随机访问的场景。

7.2.4 `std::vector` vs. `std::list` (双向链表)

std::list：
- 优点：在任何位置插入/删除元素都是 O(1) 操作；不会因为添加元素而导致迭代器失效（除了被删除元素）。
- 缺点：不支持随机访问（只能顺序遍历，O(N)）；内存不连续，对缓存不友好；每个元素额外存储前后指针，内存开销大。
- 何时使用：需要频繁在容器的任意位置插入/删除元素，且不关心随机访问的场景。

7.2.5 `std::vector` vs. `std::forward_list` (单向链表, C++11 及更高版本)

std::forward_list：
- 优点：内存开销比 std::list 略小（只存储一个前向指针）；在任何位置插入/删除元素是 O(1) 操作。
- 缺点：只支持单向遍历；不支持随机访问；没有 size() 方法（需要 O(N) 遍历才能获取大小）。
- 何时使用：需要高效在任意位置插入/删除元素，且只进行单向顺序遍历，对内存极度敏感的场景。

7.2.6 `std::vector` vs. `std::set`/`std::map` (关联容器)

std::set/std::map：
- 优点：基于红黑树实现，提供 O(log N) 的查找、插入和删除操作，元素自动排序（set）或通过键值对存储 (map)。
- 缺点：查找、插入、删除操作不如 vector 的末尾操作快；不支持随机访问；内存开销较大。
- 何时使用：需要高效查找、排序或键值对存储的场景。

8. 结论

std::vector 是 C++ 标准库中一个功能强大且高度优化的序列容器。凭借其动态大小、连续内存存储、高效的随机访问以及与 C 风格数组的良好兼容性，它成为了大多数需要存储同类型元素集合场景的首选。

理解 std::vector 的内存管理机制（尤其是 size 和 capacity 的区别以及重新分配的成本）对于编写高效的 C++ 代码至关重要。通过运用 reserve() 进行预分配、避免中间频繁插入/删除、以及在适当的时候使用 emplace_back() 等最佳实践，你可以最大限度地发挥 std::vector 的性能优势。

虽然 std::vector 功能强大，但它并非万能。在某些特定场景下，如需要频繁在容器中间插入/删除元素（考虑 std::list 或 std::deque）、需要高效的键值查找（考虑 std::map 或 std::unordered_map）或需要固定大小的存储（考虑 std::array），选择其他容器可能更为合适。

总而言之，熟练掌握 std::vector 的使用、特性和最佳实践，是每一位 C++ 程序员提高代码质量和运行效率的关键一步。

1. 引言

2. 关键特性与优势

3. std::vector 的常见用法

3.1 声明与初始化

3.2 添加与删除元素

3.3 访问元素

4. 迭代器

5. 容量与大小管理

相关成员函数：

6. 最佳实践

6.1 预留容量 (reserve)

6.2 避免在循环中进行昂贵的插入/删除操作

6.3 使用 emplace_back 代替 push_back (C++11 及更高版本)

6.4 优先使用范围 for 循环进行遍历

6.5 使用 at() 进行安全访问，[] 进行性能访问

6.6 当不再需要内存时，使用“交换技巧”释放内存

6.7 传递 vector 参数

7. 何时使用 std::vector 与其他容器

7.1 std::vector 的适用场景