Skip to content

Latest commit

 

History

History
235 lines (163 loc) · 8.78 KB

cpp-coding-practice.md

File metadata and controls

235 lines (163 loc) · 8.78 KB

C/C++ 代码规范

代码格式在一些语言里不是必需的,比如 C 语言中,你可以在语句之间加任意个;,可以加很多空格;可以一个语句分两行写,也可以把所有代码都放在一行。有些语言就对代码格式非常敏感,比如 Python,同一层级的语句之间一定要有相同的缩进。

代码规范是在代码格式上更进一步的要求,为的是使代码更容易阅读、出现错误更容易查错。

为了代码的整洁、漂亮,代码的风格需要统一,也就是说,同一篇代码、同一个项目的代码风格需要保持一致性。一个人的风格可能是固定的,而一个项目的风格通常需要事先制定。

不同人可能持不同的代码风格,但是也有一些规范是大家共同遵守的。可以多阅读已经写好的、规范的代码,来熟悉一些基本的、大家共同遵守的规范。

下面将介绍一下C语言的代码规范大概该注意哪些地方。

缩进

缩进是非常常见的事情,它被用来显示出代码的层级。一般可以用Tab或者空格来形成缩进。

要输入一个Tab,只要按下键盘上的 Tab 键就好了。

使用Tab做缩进,只需要一个Tab就够了;而使用空格做缩进,一般会使用 2 或 4 个空格为一个缩进。

根据不同的编辑器设置或个人习惯,一个Tab可能会被显示成 2 / 4 / 8 个空格等等。因此,切忌将Tab将空格(Space)和缩进(Tab)混用,这样有可能导致代码显示出来的层次变得混乱,难以阅读。

int foo(int num) {
    // 一级缩进
    if (num % 2 == 0) {
        // 二级缩进
        return num + 1;
    }
    else return num;
}

大括号

一般有两种方式,一种是左大括号“{”放在行末,另一种是{单独占一行。一般第一种更为常见。甚至,会有把else关键字放在if语句大括号的同行。

int foo(int num) {
    if (num % 2 == 0) {
        return num + 1;
    } 
    else return num;
}

大括号换行的写法:

int foo(int num)
{
    if (num % 2 == 0)
    {
        num *= 2;
        num += 1;
    } 
    return num;
}

当然,格式都不是绝对的,可以根据情况灵活调整,只要方便阅读就好。比如如果几条语句比较简单、逻辑关联强,也可以放在一行。

<template class T>
std::vector<T> stack_reverse(std::stack<T> _stack) {
    std::vector<T> result;
    while (!_stack.empty()) { result.pusk_back(_stack.top()); _stack.pop(); }
    return result;
}

空格

比如ifelseforwhile关键字后留空格,可以突出关键字。而相对应的,函数名后的括号要紧跟

void print_vector_int(const std::vector<int> & a) {
    for (auto i : a) std::cout << i << ' ';
    std::cout << std::endl;
}

左右括号()一般紧紧包裹其中的内容,而,;则紧紧跟着其左侧的字符,其右侧要留一个空格。

std::vector<int> a = {1, 2, 3, 4, 5};

双目运算符(如+-===+=<%等)的左右都要留空格。

int num1 = 10 / 2;
int num2 = 20 % 3;
int val = num1 + num2;

单目运算符(如!++--*&等)紧跟它的操作数,前后不留空格。

std::vector<int> a = {
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
};
auto i = a.begin();
while (i != a.end()) {
    std::cout << *i << ' ';
    ++i;
}

方括号[]、成员运算符.->也紧跟其操作数,即前后不留空格。

std::vector<int> a = {1, 2, 3, 4, 5};
a[0] = a[1] + a[2];
a.erase(a.begin());

int val = 10;
auto b = new std::vector<int>();
b->push_back(val);
b->erase(b->begin());

符号命名

养成良好且规范的变量 / 函数命名方式和习惯。

参考阅读:

符号的命名主要有下划线法、驼峰法等,比如find_first_of()namedWindow()等。

宏名枚举名(其实枚举就可以视作一种宏定义)一般采用全大写 + 下划线,比如BGR2GRAYMAX_LENGTHBLUE等。

一般来说,函数、局部变量名、全局变量名、宏名等,可以采用不同的命名法以区分彼此。

变量名也应具有一定的意义,比如tmptemp一般表示临时变量,ijk等一般用作迭代,cnt一般用来计数。

struct MyStruct {
    int val_a;
    int val_b;
    char class_type;
    enum Type {TYPE_A, TYPE_B};
    
    bool isValid() { return val_a > 10 && val_b > 20; }
}

注释

写代码的时候记得添加一些注释。良好的注释可以方便自己和别人阅读和修改代码。

不必要事无巨细,在关键部分给出提示即可。

通常,对于一个函数应该写明其具有的功能、函数各个参数的意义;对于变量要有对其作用的介绍。这样性质的注释一般写在函数或变量的声明处附近。而对于函数的定义部分也最好有相应的解释,可以告诉读者某行或某段代码实现了什么事情、或者为什么这样写。

很多编辑器、IDE可以识别到这些注释,并在鼠标悬停在它们的调用上时显示出函数的原型和注释,很是方便。

函数、变量名本身也应该体现一定的意义。如果得当,那么代码则具有自述性(self-explaining),而不必要额外再写注释了。

不建议用中文拼音为符号命名,更不要用中文缩写,因为中文的缘故,同音词很多,相同拼音首字母的词语更多,别人很难联想到具体是什么词语。既然是用26个英文字母编程,那么也建议使用英语给变量起名。

起变量名在一定程度上也需要一定的英语考究,比如一些词虽然意思相近,但其中的一个会比其他的更合适。

下面是“选猴王”(也就是“约瑟夫问题”)的参考代码:

// return the postion number of the monkey king
int get_monkey_king(int n, int m) {
    std::queue<int> monkeys_queue;
    for (int i = 1; i <= n; ++i) monkeys_queue.push(i);
    cnt = 0;
    while (monkeys_queue.size() > 1) {
        ++cnt;
        auto monkey = monkeys_queue.front();
        monkeys_queue.pop();
        if (cnt == m) cnt = 0; 
        else monkeys_queue.push(monkey);
    }
    std::cout << monkeys_queue.front() << std::endl;
}

int main() {
    std::cin >> n >> m;
    std::cout << get_monkey_king(n, m);
}

关于命名空间

首先了解命名空间是什么,此处略。

之前我们说到,using 指令使得我们可以使用命名空间中的符号,而 using namespace std; 这样的指令可以使我们省去诸如 std::cinstd::endl 等标识符之前的 std::。这样用在小型程序里一般没有什么问题,但是在较大的项目中可能会出现重名现象。

建议少用或者不用这样的指令,这样也能让自己熟悉哪些东西是在哪些空间里。不过,也可以只将需要的几个标识符写出来,比如:

using std::cin;
using std::cout;
using std::endl;

编码问题

再次重申,在编码、写文件时,请使用 Unicode 编码,它更为通用,使用范围更广泛。虽然一些 Windows 平台上的 IDE,如 Dev-C++ 等只支持 GBK 编码,但是请不要将就它们,计算机不是一门守旧的科学。

关于编码问题我们在“开始编程”章节的“代码规范”进行了一些讲述,这里补充一个关于 C/C++ 的知识点。

当在简体中文版的 Windows 上使用 gcc 编译链接 UTF-8 格式且含有中文的源代码生成可执行文件时,你可能会惊讶的发现窗口中输出了一堆乱码。这是由于 gcc 自动推断出文件的编码(UTF-8)并以 UTF-8 格式输出可执行文件(即其中的字符串以 UTF-8 的形式硬编码进了可执行文件),而这样编码的程序在简中版的 Windows 上执行时就会发生问题(即以错误的方式读取了)。这大概也是为什么Dev-C++只支持GBK编码的原因。

一个妥协举措是给 gcc 加上一个参数 -fexec-charset=GBK,这样输出的可执行文件就能正常执行了。

关于具体的信息,可以查询有关“控制台代码页”的信息。


另请参阅