2022-02-22

字数统计: 3.3k字 | 阅读时长: 13分

C++ primer 3章字符串、向量和数组

第三章字符串、向量和数组

using声明

使用某个命名空间：例如 using std::cin表示使用命名空间std中的名字cin。
头文件中不应该包含using声明。这样使用了该头文件的源码也会使用这个声明，会带来风险，因为头文件的内容会拷贝到所有用到它的文件中去，容易造成混乱。

string

标准库类型string表示可变长的字符序列。
#include <string>，然后 using std::string;
string对象：注意，不同于字符串字面值。

定义和初始化string对象

初始化string对象的方式：

方式	解释
`string s1`	默认初始化，`s1`是个空字符串
`string s2(s1)`	`s2`是`s1`的副本
`string s2 = s1`	等价于`s2(s1)`，`s2`是`s1`的副本
`string s3("value")`	`s3`是字面值“value”的副本，除了字面值最后的那个空字符外
`string s3 = "value"`	等价于`s3("value")`，`s3`是字面值”value”的副本
`string s4(n, 'c')`	把`s4`初始化为由连续`n`个字符`c`组成的串

拷贝初始化（copy initialization）：使用等号=将一个已有的对象拷贝到正在创建的对象。
直接初始化（direct initialization）：通过括号给对象赋值。

string对象上的操作

string的操作：

操作	解释
`os(cout) << s`	将`s`写到输出流`os`当中，返回`os`
`is(cin) >> s`	从`is`中读取字符串赋给`s`，字符串以空白(空格)分割，返回`is`
`getline(is, s)`	从`is`中读取一行赋给`s`，返回`is`
`s.empty()`	`s`为空返回`true`，否则返回`false`
`s.size()`	返回`s`中字符的个数
`s[n]`	返回`s`中第`n`个字符的引用，位置`n`从0计起
`s1+s2`	返回`s1`和`s2`连接后的结果
`s1=s2`	用`s2`的副本代替`s1`中原来的字符
`s1==s2`	如果`s1`和`s2`中所含的字符完全一样，则它们相等；`string`对象的相等性判断对字母的大小写敏感
`s1!=s2`	同上
`<`, `<=`, `>`, `>=`	利用字符在字典中的顺序进行比较，且对字母的大小写敏感（对第一个不相同的位置进行比较）

string io：
- 执行读操作>>：忽略掉开头的空白（包括空格、换行符和制表符），直到遇到下一处空白为止。
- getline：读取一整行，包括空白符，直到遇见换行符为止。
s.size()返回的时string::size_type类型，记住是一个无符号类型的值(>=0)，不要和int混用
s1+s2使用时，保证至少一侧是string类型。string s1 = "hello" + "world" // 错误，不能把两个字符串字面值直接相加
字符串字面值和string是不同的类型。

处理string对象中的字符

ctype.h vs. cctype

：C++修改了c的标准库，名称为去掉.h，前面加c。

如c++版本为cctype，c版本为ctype.h
- 尽量使用c++版本的头文件，即cctype

cctype头文件中定义了一组标准函数：

函数	解释
`isalnum(c)`	当`c`是字母或数字时为真
`isalpha(c)`	当`c`是字母时为真
`iscntrl(c)`	当`c`是控制字符时为真
`isdigit(c)`	当`c`是数字时为真
`isgraph(c)`	当`c`不是空格但可以打印时为真
`islower(c)`	当`c`是小写字母时为真
`isprint(c)`	当`c`是可打印字符时为真
`ispunct(c)`	当`c`是标点符号时为真
`isspace(c)`	当`c`是空白时为真（空格、横向制表符、纵向制表符、回车符、换行符、进纸符）
`isupper(c)`	当`c`是大写字母时为真
`isxdigit(c)`	当`c`是十六进制数字时为真
`tolower(c)`	当`c`是大写字母，输出对应的小写字母；否则原样输出`c`
`toupper(c)`	当`c`是小写字母，输出对应的大写字母；否则原样输出`c`

遍历字符串：使用范围for（range for）语句： for (auto c: str)，或者 for (auto &c: str)使用引用直接改变字符串中的字符。（C++11）
str[x],[]输入参数为string::size_type类型，给出int整型也会自动转化为该类型

vector

vector是一个容器，也是一个类模板；
#include <vector> 然后 using std::vector;
容器：包含其他对象。
类模板：本身不是类，但可以实例化instantiation出一个类。 vector是一个模板， vector<int>是一个类型。
通过将类型放在类模板名称后面的尖括号中来指定类型，如vector<int> ivec。

定义和初始化vector对象

初始化vector对象的方法

方法	解释
`vector<T> v1`	`v1`是一个空`vector`，它潜在的元素是`T`类型的，执行默认初始化
`vector<T> v2(v1)`	`v2`中包含有`v1`所有元素的副本
`vector<T> v2 = v1`	等价于`v2(v1)`，`v2`中包含`v1`所有元素的副本
`vector<T> v3(n, val)`	`v3`包含了n个重复的元素，每个元素的值都是`val`
`vector<T> v4(n)`	`v4`包含了n个重复地执行了值初始化的对象
`vector<T> v5{a, b, c...}`	`v5`包含了初始值个数的元素，每个元素被赋予相应的初始值
`vector<T> v5={a, b, c...}`	等价于`v5{a, b, c...}`

列表初始化： vector<string> v{"a", "an", "the"}; （C++11）

vector操作

vector支持的操作：

操作	解释
`v.empty()`	如果`v`不含有任何元素，返回真；否则返回假
`v.size()`	返回`v`中元素的个数，`size_type`类型
`v.push_back(t)`	向`v`的尾端添加一个值为`t`的元素
`v[n]`	返回`v`中第`n`个位置上元素的引用
`v1 = v2`	用`v2`中的元素拷贝替换`v1`中的元素
`v1 = {a,b,c...}`	用列表中元素的拷贝替换`v1`中的元素
`v1 == v2`	`v1`和`v2`相等当且仅当它们的元素数量相同且对应位置的元素值都相同
`v1 != v2`	同上
`<`,`<=`,`>`, `>=`	以字典顺序进行比较

范围for语句内不应该改变其遍历序列的大小。
- vector对象（以及string对象）的下标运算符，只能对确知已存在的元素执行下标操作，不能用于添加元素，添加元素需要push_back。

例子：

vector<int> v1;         // size:0,  no values.
vector<int> v2(10);     // size:10, value:0
vector<int> v3(10, 42); // size:10, value:42
vector<int> v4{ 10 };     // size:1,  value:10
vector<int> v5{ 10, 42 }; // size:2,  value:10, 42
vector<string> v6{ 10 };  // size:10, value:""
vector<string> v7{ 10, "hi" };  // size:10, value:"hi"

迭代器iterator

所有标准库容器都可以使用迭代器。
类似于指针类型，迭代器也提供了对对象的间接访问。

使用迭代器

vector<int>::iterator iter。
auto b = v.begin();返回指向第一个元素的迭代器。
auto e = v.end();返回指向最后一个元素的下一个（哨兵，尾后,one past the end）的迭代器（off the end）。
如果容器为空， begin()和 end()返回的是同一个迭代器，都是尾后迭代器。
使用解引用符*访问迭代器指向的元素，感觉迭代器就像是一个指向当前元素的指针，*就是取当前元素。

如auto it = s.begin(); *it = toupper(*it);

| 操作 | 解释 |
| ———————— | ———————————————————————————— |
| *iter | 返回迭代器所指元素的引用 |
| iter->mem | 解引用并获取该元素的mem成员，相当于(*iter).mem |
| ++iter | 令iter指示容器中的下一个元素 |
| --iter | 令iter指示容器中的上一个元素 |
| iter1 == iter2 | 判断两个迭代器是否相等，如果两个迭代器指向同一个元素或者 |
| iter1 != iter2 | 同一个容器的尾后迭代器，则相等，否则不相等。 |
养成使用迭代器和!=的习惯（泛型编程）。
容器：可以包含其他对象；但所有的对象必须类型相同。
迭代器（iterator）：每种标准容器都有自己的迭代器。C++倾向于用迭代器而不是下标遍历元素。
const_iterator：只能读取容器内元素不能改变，类似与常量指针。
箭头运算符：解引用 + 成员访问，it->mem等价于 (*it).mem
谨记：但凡是使用了迭代器的循环体，都不要向迭代器所属的容器添加元素。

迭代器运算

vector和string迭代器支持的运算：

运算符	解释
`iter + n`	迭代器加上一个整数值仍得到一个迭代器，迭代器指示的新位置和原来相比向前移动了若干个元素。结果迭代器或者指示容器内的一个元素，或者指示容器尾元素的下一位置。
`iter - n`	迭代器减去一个整数仍得到一个迭代器，迭代器指示的新位置比原来向后移动了若干个元素。结果迭代器或者指向容器内的一个元素，或者指示容器尾元素的下一位置。
`iter1 += n`	迭代器加法的复合赋值语句，将`iter1`加`n`的结果赋给`iter1`
`iter1 -= n`	迭代器减法的复合赋值语句，将`iter2`减`n`的加过赋给`iter1`
`iter1 - iter2`	两个迭代器相减的结果是它们之间的距离，也就是说，将运算符右侧的迭代器向前移动差值个元素后得到左侧的迭代器。参与运算的两个迭代器必须指向的是同一个容器中的元素或者尾元素的下一位置。
`>`、`>=`、`<`、`<=`	迭代器的关系运算符，如果某迭代器

difference_type：保证足够大以存储任何两个迭代器对象间的距离，其为带符号整形数。

注意的一点是迭代器之间只能减不能加，所以二分查找的程序用的是 mid = beg + (end - beg) / 2, 而非 mid = (beg + end) / 2 ;

数组

相当于vector的低级版，长度固定，如果不清楚元素的确切个数，使用vector。

定义和初始化内置数组

初始化：char input_buffer[buffer_size];，长度必须是常量表达式，不能是变量；或者不写，让编译器自己推断。
数组不允许直接赋值给另一个数组。

访问数组元素

数组下标的类型：size_t ，机器相关的无符号类型。
字符数组的特殊性：结尾处有一个空字符，如 char a[] = "hello"; 。
用数组初始化 vector： int a[] = {1,2,3,4,5}; vector<int> v(begin(a), end(a)); 。
unsigned score[11] = {}; //全部初始化为0

数组和指针

使用数组时，编译器一般会把它转换成指针。
标准库类型限定使用的下标必须是无符号类型，而内置的下标可以处理负值。
指针访问数组：在表达式中使用数组名时，名字会自动转换成指向数组的第一个元素的指针。
- string *p2 = nums; //等价于p2 = &nums[0]
- string *p3 = p2 + 4; //等价于p2 = &nums[4]

为了防止指针指向数组外的元素造成溢出，C++ 11引入了begin()和end()函数。

1
2
3

int ia[] = {0,1,2,3,4,5,6,7,8,9};
int *beg = begin(ia);	//指向ia首元素的指针
int *last = end(ia);	//指向ia尾元素的指针

例子：利用指针将数组元素值全变为0。

#include <iostream>
using std::cout; using std::endl;
int main()
{
    const int size = 10;
    int arr[size];
    for (auto ptr = arr; ptr != arr + size; ++ptr) *ptr = 0; //auto可以推断出ptr是指针
    for (auto i : arr) cout << i << " ";
    cout << endl;
    return 0;
}

C风格字符串

C++支持，但是不好用，而且容易引发程序漏洞，所以最好不要用。

从C继承来的字符串。
用空字符结束（\0）。
对大多数应用来说，使用标准库 string比使用C风格字符串更安全、更高效。
获取 string 中的 cstring ：cstring是string.h的C++版本
string s "12345"

const char *str = s.c_str(); //c_str函数将s字符串返回一个C风格的字符串

C标准库String函数，定义在<cstring> 中：

函数	介绍
`strlen(p)`	返回`p`的长度，空字符不计算在内
`strcmp(p1, p2)`	比较`p1`和`p2`的相等性。如果`p1==p2`，返回0；如果`p1>p2`，返回一个正值；如果`p1<p2`，返回一个负值。
`strcat(p1, p2)`	将`p2`附加到`p1`之后，返回`p1`
`strcpy(p1, p2)`	将`p2`拷贝给`p1`，返回`p1`

尽量使用vector和迭代器，少用数组

指针vs引用

引用总是指向某个对象，定义引用时没有初始化是错的。
给引用赋值，修改的是该引用所关联的对象的值，而不是让引用和另一个对象相关联。

指向指针的指针

定义： int **ppi = π
解引用：**ppi

动态数组

使用 new和 delete表达和c中malloc和free类似的功能，即在堆（自由存储区）中分配存储空间。
定义： int *pia = new int[10]; 10可以被一个变量替代。
释放： delete [] pia;，注意不要忘记[]。

多维数组

多维数组的初始化

int ia[3][4] = {{0,1,2,3},{0,1,2,3},{0,1,2,3}}。
使用范围for语句时，除了最内层的循环外，其他所有循环的控制变量都应该是引用类型。

C++ primer 3章 字符串、向量和数组

第三章 字符串、向量和数组