分类 C++ 下的文章

Explicit和隐式转换

隐式转换

C++编译器在进行类型转换时,如果数据类型满足下面两种情况,编译器将会进行隐式转换(implicit conversions)

  1. C++内建类型(char,short,int,double)之间默认含有隐式转换
  2. class如果提供了单参数构造函数(single-argument constructors)隐式类型转换运算符(operator())这两个函数也支持隐式转换

class的隐式转换

单参数构造函数

单参数构造函数是指只用一个参数即可以调用的构造函数。该函数可以是只定义了一个参数,也可以是虽定义了多个参数但第一个参数以后的所有参数都有缺省值。

什么情况会发生隐式类型转换,和构造函数参数类型有关。

class Name
{
public:
    Name(const string &str): _str(str)
    {
        cout << "Invoke contructor, parameter: " << str << endl;
    }

    string _str;
};

int main()
{
    string s = "Hello World";
    Name name(s);

    string t = "HeHe";
    name = t;      // t隐式转换为Name类型,执行其构造函数

    // char ch = 'a';
    // name = ch; //Error 构造函数参数类型为string 而不是char
}

输出为

Invoke contructor, parameter: Hello World
Invoke contructor, parameter: HeHe
class Rational
{                                   // 有理数类
public:
    Rational(int numerator = 0,     // 转换int到
        int denominator = 1){}        // 有理数类Rational

    Rational(Name name){}             // 转换Name类型到 有理数类Rational

    Rational(string str){}           // 转换string类型 到有理数类
};

int main()
{
    char ch = 'a';
    string str;
    Name name(str);

    int i = 3;
    Rational ra;

    //以下右边都进行了隐式转换
    ra = i;        // 执行Rational(int numerator = 0,int denominator = 1)转换
    ra = ch;       //执行Rational(int numerator = 0,int denominator = 1)转换
    ra = str;      //执行Rational(string str)转转
    ra = name;     //执行Rational(Name name)转换
}

从以上两个例子可以看到:在单参数构造函数中隐式转换很容易发生。

隐式类型转换运算符

就是 operator 关键字,其后跟一个类型符号。

class Rational
{                                   // 有理数类
public:
    operator double() const           // 转换Rational类成 double类型
    {
    }

    operator string () const            // 转换Rational类成 string类型
    {
    }
};

string str;
Rational ra;
int i;

str = ra;     // 执行operator string ()转换string 运行崩溃
i = 1*ra;     //执行operator double()转换成double型
cout<<ra;     //执行operator double() 转换成double型输出随机浮点数

所以避开类型转换运算符!

隐式转化的消除

隐式类型转换运算符

不提供这种operator转换运算符。使用等同的函数来替代转换运算符;
用asDouble函数代替operator double函数。

double asDouble() const;           //转变 Rational 成double
cout << ra.asDouble();             //相当于提供一个接口

单参数构造函数

使用关键字explicit (这个需要编译器支持!)
编译器会拒绝为了隐式类型转换而调用构造函数。显式类型转换依然合法。

class Name
{                                   // for names of things
public:
    explicit Name(const string &s)  // 转换 string 到  Name
    {

    }
};

int main()
{
    string str;
    Name name(str);

    name = static_cast<Name> (str);//Right 显式转换
    name = str;                    //Error explicit禁止隐式类型转换
}

用GDB调试程序

GDB的命令概貌

启动gdb后,就你被带入gdb的调试环境中,就可以使用gdb的命令开始调试程序了,gdb的命令可以使用help命令来查看,如下所示:

/home/hchen> gdb

gdb的命令很多,gdb把之分成许多个种类。help命令只是例出gdb的命令种类,如果要看种类中的命令,可以使用help \<class> 命令,如:help breakpoints,查看设置断点的所有命令。也可以直接help \<command>来查看命令的帮助。

gdb中,输入命令时,可以不用打全命令,只用打命令的前几个字符就可以了,当然,命令的前几个字符应该要标志着一个唯一的命令,在Linux下,你可以敲击两次TAB键来补齐命令或者函数名的全称,如果有重复的,那么gdb会把其例出来。

要退出gdb时,只用发quit或命令简称q就行了。

启动GDB

一般来说GDB主要调试的是C/C++的程序。要调试C/C++的程序,首先在编译时,我们必须要把调试信息加到可执行文件中。使用编译器(cc/gcc/g++)的 -g 参数可以做到这一点。如:

> cc -g hello.c -o hello
> g++ -g hello.cpp -o hello

如果没有-g,你将看不见程序的函数名、变量名,所代替的全是运行时的内存地址。当你用-g把调试信息加入之后,并成功编译目标代码以后,让我们来看看如何用gdb来调试他。

启动GDB的方法有以下几种:

1、gdb <program>
   program也就是你的执行文件,一般在当然目录下。

2、gdb <program> core
   用gdb同时调试一个运行程序和core文件,core是程序非法执行后core dump后产生的文件。

3、gdb <program> <PID>
   如果你的程序是一个服务程序,那么你可以指定这个服务程序运行时的进程ID。gdb会自动attach上去,并调试他。program应该在PATH环境变量中搜索得到。

GDB启动时,可以加上一些GDB的启动开关,详细的开关可以用gdb -help查看。我在下面只例举一些比较常用的参数:

-symbols <file>
-s <file>
    从指定文件中读取符号表。

-se file
    从指定文件中读取符号表信息,并把他用在可执行文件中。

-core <file>
-c <file>
    调试时core dump的core文件。

-directory <directory>
-d <directory>
    加入一个源文件的搜索路径。默认搜索路径是环境变量中PATH所定义的路径。

在GDB中运行程序

当以gdb \<program>方式启动gdb后,gdb会在PATH路径和当前目录中搜索\<program>的源文件。如要确认gdb是否读到源文件,可使用l或list命令,看看gdb是否能列出源代码。

在gdb中,运行程序使用r或是run命令。程序的运行,你有可能需要设置下面四方面的事。

  1. 程序运行参数。
    set args 可指定运行时参数。(如:set args 10 20 30 40 50)
    show args 命令可以查看设置好的运行参数。

  2. 运行环境。
    path \<dir> 可设定程序的运行路径。
    show paths 查看程序的运行路径。
    set environment varname [=value] 设置环境变量。如:set env USER=hchen
    show environment [varname] 查看环境变量。

  3. 工作目录。
    cd \<dir> 相当于shell的cd命令。
    pwd 显示当前的所在目录。

    1. 程序的输入输出。
      info terminal 显示你程序用到的终端的模式。
      使用重定向控制程序输出。如:run > outfile
      tty命令可以指写输入输出的终端设备。如:tty /dev/ttyb

GDB中运行UNIX的shell程序

在gdb环境中,你可以执行UNIX的shell的命令,使用gdb的shell命令来完成:

shell <command string>

调用UNIX的shell来执行\,环境变量SHELL中定义的UNIX的shell将会被用来执行\,如果SHELL没有定义,那就使用UNIX的标准shell:/bin/sh。(在Windows中使用Command.com或cmd.exe)

还有一个gdb命令是make:

make <make-args>

可以在gdb中执行make命令来重新build自己的程序。这个命令等价于“shell make ”。

调试已运行的程序

两种方法:

  1. 在UNIX下用ps查看正在运行的程序的PID(进程ID),然后用gdb \<program> PID格式挂接正在运行的程序。
  2. 先用gdb \<program>关联上源代码,并进行gdb,在gdb中用attach命令来挂接进程的PID。并用detach来取消挂接的进程。

暂停 / 恢复程序运行

调试程序中,暂停程序运行是必须的,GDB可以方便地暂停程序的运行。你可以设置程序的在哪行停住,在什么条件下停住,在收到什么信号时停往等等。以便于你查看运行时的变量,以及运行时的流程。

当进程被gdb停住时,你可以使用info program 来查看程序的是否在运行,进程号,被暂停的原因。

在gdb中,我们可以有以下几种暂停方式:断点(BreakPoint)、观察点(WatchPoint)、捕捉点(CatchPoint)、信号(Signals)、线程停止(Thread Stops)。如果要恢复程序运行,可以使用c或是continue命令。

一、设置断点(BreakPoint)

我们用break命令来设置断点。正面有几点设置断点的方法:

break <function>
    在进入指定函数时停住。C++中可以使用class::function或function(type,type)格式来指定函数名。

break <linenum>
    在指定行号停住。

break +offset
break -offset
    在当前行号的前面或后面的offset行停住。offiset为自然数。

break filename:linenum
    在源文件filename的linenum行处停住。

break filename:function
    在源文件filename的function函数的入口处停住。

break *address
    在程序运行的内存地址处停住。

break
    break命令没有参数时,表示在下一条指令处停住。

break ... if <condition>
    ...可以是上述的参数,condition表示条件,在条件成立时停住。比如在循环境体中,可以设置break if i=100,表示当i为100时停住程序。

查看断点时,可使用info命令,如下所示:(注:n表示断点号)

info breakpoints [n]
info break [n]

二、设置观察点(WatchPoint)

观察点一般来观察某个表达式(变量也是一种表达式)的值是否有变化了,如果有变化,马上停住程序。我们有下面的几种方法来设置观察点:

watch <expr>
    为表达式(变量)expr设置一个观察点。一量表达式值有变化时,马上停住程序。

rwatch <expr>
    当表达式(变量)expr被读时,停住程序。

awatch <expr>
    当表达式(变量)的值被读或被写时,停住程序。

info watchpoints
    列出当前所设置了的所有观察点。

三、设置捕捉点(CatchPoint)

你可设置捕捉点来补捉程序运行时的一些事件。如:载入共享库(动态链接库)或是C++的异常。设置捕捉点的格式为:

catch <event>

当event发生时,停住程序。event可以是下面的内容:

  1. throw 一个C++抛出的异常。(throw为关键字)
  2. catch 一个C++捕捉到的异常。(catch为关键字)
  3. exec 调用系统调用exec时。(exec为关键字,目前此功能只在HP-UX下有用)
  4. fork 调用系统调用fork时。(fork为关键字,目前此功能只在HP-UX下有用)
  5. vfork 调用系统调用vfork时。(vfork为关键字,目前此功能只在HP-UX下有用)
  6. load 或 load \<libname> 载入共享库(动态链接库)时。(load为关键字,目前此功能只在HP-UX下有用)
  7. unload 或 unload \<libname> 卸载共享库(动态链接库)时。(unload为关键字,目前此功能只在HP-UX下有用)

    tcatch
    只设置一次捕捉点,当程序停住以后,应点被自动删除。

四、维护停止点

上面说了如何设置程序的停止点,GDB中的停止点也就是上述的三类。在GDB中,如果你觉得已定义好的停止点没有用了,你可以使用delete、clear、disable、enable这几个命令来进行维护。

clear
    清除所有的已定义的停止点。

clear <function>
clear <filename:function>
    清除所有设置在函数上的停止点。

clear <linenum>
clear <filename:linenum>
    清除所有设置在指定行上的停止点。

delete [breakpoints] [range...]
    删除指定的断点,breakpoints为断点号。如果不指定断点号,则表示删除所有的断点。range 表示断点号的范围(如:3-7)。其简写命令为d。

比删除更好的一种方法是disable停止点,disable了的停止点,GDB不会删除,当你还需要时,enable即可,就好像回收站一样。

disable [breakpoints] [range...]
    disable所指定的停止点,breakpoints为停止点号。如果什么都不指定,表示disable所有的停止点。简写命令是dis.

enable [breakpoints] [range...]
    enable所指定的停止点,breakpoints为停止点号。

enable [breakpoints] once range...
    enable所指定的停止点一次,当程序停止后,该停止点马上被GDB自动disable。

enable [breakpoints] delete range...
    enable所指定的停止点一次,当程序停止后,该停止点马上被GDB自动删除。

五、停止条件维护

前面在说到设置断点时,我们提到过可以设置一个条件,当条件成立时,程序自动停止,这是一个非常强大的功能,这里,我想专门说说这个条件的相关维护命令。一般来说,为断点设置一个条件,我们使用if关键词,后面跟其断点条件。并且,条件设置好后,我们可以用condition命令来修改断点的条件。(只有break和watch命令支持if,catch目前暂不支持if)

condition <bnum> <expression>
    修改断点号为bnum的停止条件为expression。

condition <bnum>
    清除断点号为bnum的停止条件。

还有一个比较特殊的维护命令ignore,你可以指定程序运行时,忽略停止条件几次。

ignore <bnum> <count>
    表示忽略断点号为bnum的停止条件count次。

六、为停止点设定运行命令

我们可以使用GDB提供的command命令来设置停止点的运行命令。也就是说,当运行的程序在被停止住时,我们可以让其自动运行一些别的命令,这很有利行自动化调试。对基于GDB的自动化调试是一个强大的支持。

commands [bnum]
... command-list ...
end

为断点号bnum指写一个命令列表。当程序被该断点停住时,gdb会依次运行命令列表中的命令。例如:

break foo if x>0
commands
printf "x is %d/n",x
continue
end

断点设置在函数foo中,断点条件是x>0,如果程序被断住后,也就是,一旦x的值在foo函数中大于0,GDB会自动打印出x的值,并继续运行程序。

如果你要清除断点上的命令序列,那么只要简单的执行一下commands命令,并直接在打个end就行了。

七、断点菜单

在C++中,可能会重复出现同一个名字的函数若干次(函数重载),在这种情况下,break \<function>不能告诉GDB要停在哪个函数的入口。当然,你可以使用break \<function(type)>也就是把函数的参数类型告诉GDB,以指定一个函数。否则的话,GDB会给你列出一个断点菜单供你选择你所需要的断点。你只要输入你菜单列表中的编号就可以了。如:

(gdb) b String::after
[0] cancel
[1] all
[2] file:String.cc; line number:867
[3] file:String.cc; line number:860
[4] file:String.cc; line number:875
[5] file:String.cc; line number:853
[6] file:String.cc; line number:846
[7] file:String.cc; line number:735
> 2 4 6
Breakpoint 1 at 0xb26c: file String.cc, line 867.
Breakpoint 2 at 0xb344: file String.cc, line 875.
Breakpoint 3 at 0xafcc: file String.cc, line 846.
Multiple breakpoints were set.
Use the "delete" command to delete unwanted
 breakpoints.
(gdb)

可见,GDB列出了所有after的重载函数,你可以选一下列表编号就行了。0表示放弃设置断点,1表示所有函数都设置断点。

八、恢复程序运行和单步调试

当程序被停住了,你可以用continue命令恢复程序的运行直到程序结束,或下一个断点到来。也可以使用step或next命令单步跟踪程序。

continue [ignore-count]
c [ignore-count]
fg [ignore-count]
    恢复程序运行,直到程序结束,或是下一个断点到来。ignore-count表示忽略其后的断点次数。continue,c,fg三个命令都是一样的意思。

step <count>
    单步跟踪,如果有函数调用,他会进入该函数。进入函数的前提是,此函数被编译有debug信息。很像VC等工具中的step in。后面可以加count也可以不加,不加表示一条条地执行,加表示执行后面的count条指令,然后再停住。

next <count>
    同样单步跟踪,如果有函数调用,他不会进入该函数。很像VC等工具中的step over。后面可以加count也可以不加,不加表示一条条地执行,加表示执行后面的count条指令,然后再停住。

set step-mode
set step-mode on
    打开step-mode模式,于是,在进行单步跟踪时,程序不会因为没有debug信息而不停住。这个参数有很利于查看机器码。

set step-mod off
    关闭step-mode模式。

finish
    运行程序,直到当前函数完成返回。并打印函数返回时的堆栈地址和返回值及参数值等信息。

until 或 u
    当你厌倦了在一个循环体内单步跟踪时,这个命令可以运行程序直到退出循环体。

stepi 或 si
nexti 或 ni
    单步跟踪一条机器指令!一条程序代码有可能由数条机器指令完成,stepi和nexti可以单步执行机器指令。与之一样有相同功能的命令是“display/i $pc” ,当运行完这个命令后,单步跟踪会在打出程序代码的同时打出机器指令(也就是汇编代码)

九、信号(Signals)

信号是一种软中断,是一种处理异步事件的方法。一般来说,操作系统都支持许多信号。尤其是UNIX,比较重要应用程序一般都会处理信号。UNIX定义了许多信号,比如SIGINT表示中断字符信号,也就是Ctrl+C的信号,SIGBUS表示硬件故障的信号;SIGCHLD表示子进程状态改变信号;SIGKILL表示终止程序运行的信号,等等。信号量编程是UNIX下非常重要的一种技术。

GDB有能力在你调试程序的时候处理任何一种信号,你可以告诉GDB需要处理哪一种信号。你可以要求GDB收到你所指定的信号时,马上停住正在运行的程序,以供你进行调试。你可以用GDB的handle命令来完成这一功能。

handle <signal> <keywords...>
    在GDB中定义一个信号处理。信号<signal>可以以SIG开头或不以SIG开头,可以用定义一个要处理信号的范围
    (如:SIGIO-SIGKILL,表示处理从SIGIO信号到SIGKILL的信号,其中包括SIGIO,SIGIOT,SIGKILL三个信号),
    也可以使用关键字all来标明要处理所有的信号。一旦被调试的程序接收到信号,运行程序马上会被GDB停住,以供调试。
    其<keywords>可以是以下几种关键字的一个或多个。

    nostop
        当被调试的程序收到信号时,GDB不会停住程序的运行,但会打出消息告诉你收到这种信号。
    stop
        当被调试的程序收到信号时,GDB会停住你的程序。
    print
        当被调试的程序收到信号时,GDB会显示出一条信息。
    noprint
        当被调试的程序收到信号时,GDB不会告诉你收到信号的信息。
    pass
    noignore
        当被调试的程序收到信号时,GDB不处理信号。这表示,GDB会把这个信号交给被调试程序会处理。
    nopass
    ignore
        当被调试的程序收到信号时,GDB不会让被调试程序来处理这个信号。


info signals
info handle
    查看有哪些信号在被GDB检测中。

十、线程(Thread Stops)

如果你程序是多线程的话,你可以定义你的断点是否在所有的线程上,或是在某个特定的线程。GDB很容易帮你完成这一工作。

break <linespec> thread <threadno>
break <linespec> thread <threadno> if ...
    linespec指定了断点设置在的源程序的行号。threadno指定了线程的ID,注意,这个ID是GDB分配的,你可以通过“info threads”
    命令来查看正在运行程序中的线程信息。如果你不指定thread <threadno>则表示你的断点设在所有线程上面。你还可以为某线程指定断点条件。如:

    (gdb) break frik.c:13 thread 28 if bartab > lim

当你的程序被GDB停住时,所有的运行线程都会被停住。这方便你你查看运行程序的总体情况。而在你恢复程序运行时,所有的线程也会被恢复运行。那怕是主进程在被单步调试时。

查看栈信息

当程序被停住了,你需要做的第一件事就是查看程序是在哪里停住的。当你的程序调用了一个函数,函数的地址,函数参数,函数内的局部变量都会被压入“栈”(Stack)中。你可以用GDB命令来查看当前的栈中的信息。

下面是一些查看函数调用栈信息的GDB命令:

backtrace
bt
    打印当前的函数调用栈的所有信息。如:

    (gdb) bt
    #0  func (n=250) at tst.c:6
    #1  0x08048524 in main (argc=1, argv=0xbffff674) at tst.c:30
    #2  0x400409ed in __libc_start_main () from /lib/libc.so.6

    从上可以看出函数的调用栈信息:__libc_start_main --> main() --> func()


backtrace <n>
bt <n>
    n是一个正整数,表示只打印栈顶上n层的栈信息。

backtrace <-n>
bt <-n>
    -n表一个负整数,表示只打印栈底下n层的栈信息。

如果你要查看某一层的信息,你需要在切换当前的栈,一般来说,程序停止时,最顶层的栈就是当前栈,如果你要查看栈下面层的详细信息,首先要做的是切换当前栈。

frame <n>
f <n>
    n是一个从0开始的整数,是栈中的层编号。比如:frame 0,表示栈顶,frame 1,表示栈的第二层。

up <n>
    表示向栈的上面移动n层,可以不打n,表示向上移动一层。

down <n>
    表示向栈的下面移动n层,可以不打n,表示向下移动一层。

上面的命令,都会打印出移动到的栈层的信息。如果你不想让其打出信息。你可以使用这三个命令:

select-frame <n> 对应于 frame 命令。
up-silently <n> 对应于 up 命令。
down-silently <n> 对应于 down 命令。

查看当前栈层的信息,你可以用以下GDB命令:

frame 或 f
    会打印出这些信息:栈的层编号,当前的函数名,函数参数值,函数所在文件及行号,函数执行到的语句。

info frame
info f
    这个命令会打印出更为详细的当前栈层的信息,只不过,大多数都是运行时的内内地址。比如:函数地址,调用函数的地址,被调用函数的地址,
    目前的函数是由什么样的程序语言写成的、函数参数地址及值、局部变量的地址等等。如:
        (gdb) info f
        Stack level 0, frame at 0xbffff5d4:
         eip = 0x804845d in func (tst.c:6); saved eip 0x8048524
         called by frame at 0xbffff60c
         source language c.
         Arglist at 0xbffff5d4, args: n=250
         Locals at 0xbffff5d4, Previous frame's sp is 0x0
         Saved registers:
          ebp at 0xbffff5d4, eip at 0xbffff5d8

 info args
    打印出当前函数的参数名及其值。

 info locals
    打印出当前函数中所有局部变量及其值。

 info catch
    打印出当前的函数中的异常处理信息。

查看源程序

一、显示源代码

GDB 可以打印出所调试程序的源代码,当然,在程序编译时一定要加上-g的参数,把源程序信息编译到执行文件中。不然就看不到源程序了。当程序停下来以后,GDB会报告程序停在了那个文件的第几行上。你可以用list命令来打印程序的源代码。还是来看一看查看源代码的GDB命令吧。

list <linenum>
    显示程序第linenum行的周围的源程序。

list <function>
    显示函数名为function的函数的源程序。

list
    显示当前行后面的源程序。

list -
    显示当前行前面的源程序。

一般是打印当前行的上5行和下5行,如果显示函数是是上2行下8行,默认是10行,当然,你也可以定制显示的范围,使用下面命令可以设置一次显示源程序的行数。

set listsize <count>
    设置一次显示源代码的行数。

show listsize
    查看当前listsize的设置。

list命令还有下面的用法:

list <first>, <last>
    显示从first行到last行之间的源代码。

list , <last>
    显示从当前行到last行之间的源代码。

list +
    往后显示源代码。

一般来说在list后面可以跟以下这们的参数:

<linenum>   行号。
<+offset>   当前行号的正偏移量。
<-offset>   当前行号的负偏移量。
<filename:linenum>  哪个文件的哪一行。
<function>  函数名。
<filename:function> 哪个文件中的哪个函数。
<*address>  程序运行时的语句在内存中的地址。

二、搜索源代码

不仅如此,GDB还提供了源代码搜索的命令:

forward-search <regexp>
search <regexp>
    向前面搜索。

reverse-search <regexp>
    全部搜索。

其中,\<regexp>就是正则表达式,也主一个字符串的匹配模式,关于正则表达式,我就不在这里讲了,还请各位查看相关资料。

三、指定源文件的路径

某些时候,用-g编译过后的执行程序中只是包括了源文件的名字,没有路径名。GDB提供了可以让你指定源文件的路径的命令,以便GDB进行搜索。

directory <dirname ... >
dir <dirname ... >
    加一个源文件路径到当前路径的前面。如果你要指定多个路径,UNIX下你可以使用“:”,Windows下你可以使用“;”。
directory
    清除所有的自定义的源文件搜索路径信息。

show directories
    显示定义了的源文件搜索路径。

四、源代码的内存

你可以使用info line命令来查看源代码在内存中的地址。info line后面可以跟“行号”,“函数名”,“文件名:行号”,“文件名:函数名”,这个命令会打印出所指定的源码在运行时的内存地址,如:

(gdb) info line tst.c:func
Line 5 of "tst.c" starts at address 0x8048456 <func+6> and ends at 0x804845d <func+13>.

还有一个命令disassemble,你可以查看源程序的当前执行时的机器码,这个命令会把目前内存中的指令dump出来。如下面的示例表示查看函数func的汇编代码。

(gdb) disassemble func

查看运行时数据

在你调试程序时,当程序被停住时,你可以使用print命令(简写命令为p),或是同义命令inspect来查看当前程序的运行数据。print命令的格式是:

print <expr>
print /<f> <expr>
    <expr>是表达式,是你所调试的程序的语言的表达式(GDB可以调试多种编程语言),<f>是输出的格式,比如,如果要把表达式按16进制的格式输出,那么就是/x。

一、表达式

print和许多GDB的命令一样,可以接受一个表达式,GDB会根据当前的程序运行的数据来计算这个表达式,既然是表达式,那么就可以是当前程序运行中的const常量、变量、函数等内容。可惜的是GDB不能使用你在程序中所定义的宏。

表达式的语法应该是当前所调试的语言的语法,由于C/C++是一种大众型的语言,所以,本文中的例子都是关于C/C++的。(而关于用GDB调试其它语言的章节,我将在后面介绍)

在表达式中,有几种GDB所支持的操作符,它们可以用在任何一种语言中。

@
    是一个和数组有关的操作符,在后面会有更详细的说明。

::
    指定一个在文件或是一个函数中的变量。

{<type>} <addr>
    表示一个指向内存地址<addr>的类型为type的一个对象。

二、程序变量

在GDB中,你可以随时查看以下三种变量的值:

  1. 全局变量(所有文件可见的)
  2. 静态全局变量(当前文件可见的)
  3. 局部变量(当前Scope可见的)

如果你的局部变量和全局变量发生冲突(也就是重名),一般情况下是局部变量会隐藏全局变量,也就是说,如果一个全局变量和一个函数中的局部变量同名时,如果当前停止点在函数中,用print显示出的变量的值会是函数中的局部变量的值。如果此时你想查看全局变量的值时,你可以使用“::”操作符:

file::variable
function::variable

可以通过这种形式指定你所想查看的变量,是哪个文件中的或是哪个函数中的。例如,查看文件f2.c中的全局变量x的值:

gdb) p 'f2.c'::x

当然,“::”操作符会和C++中的发生冲突,GDB能自动识别“::” 是否C++的操作符,所以你不必担心在调试C++程序时会出现异常。

另外,需要注意的是,如果你的程序编译时开启了优化选项,那么在用GDB调试被优化过的程序时,可能会发生某些变量不能访问,或是取值错误码的情况。这个是很正常的,因为优化程序会删改你的程序,整理你程序的语句顺序,剔除一些无意义的变量等,所以在GDB调试这种程序时,运行时的指令和你所编写指令就有不一样,也就会出现你所想象不到的结果。对付这种情况时,需要在编译程序时关闭编译优化。一般来说,几乎所有的编译器都支持编译优化的开关,例如,GNU的C/C++编译器GCC,你可以使用“-gstabs”选项来解决这个问题。关于编译器的参数,还请查看编译器的使用说明文档。

三、数组

有时候,你需要查看一段连续的内存空间的值。比如数组的一段,或是动态分配的数据的大小。你可以使用GDB的“@”操作符,“@”的左边是第一个内存的地址的值,“@”的右边则你你想查看内存的长度。例如,你的程序中有这样的语句:

int *array = (int *) malloc (len * sizeof (int));

于是,在GDB调试过程中,你可以以如下命令显示出这个动态数组的取值:

p *array@len

@的左边是数组的首地址的值,也就是变量array所指向的内容,右边则是数据的长度,其保存在变量len中,其输出结果,大约是下面这个样子的:

(gdb) p *array@len
$1 = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40}

如果是静态数组的话,可以直接用print数组名,就可以显示数组中所有数据的内容了。

四、输出格式

一般来说,GDB会根据变量的类型输出变量的值。但你也可以自定义GDB的输出的格式。例如,你想输出一个整数的十六进制,或是二进制来查看这个整型变量的中的位的情况。要做到这样,你可以使用GDB的数据显示格式:

x  按十六进制格式显示变量。
d  按十进制格式显示变量。
u  按十六进制格式显示无符号整型。
o  按八进制格式显示变量。
t  按二进制格式显示变量。
a  按十六进制格式显示变量。
c  按字符格式显示变量。
f  按浮点数格式显示变量。

    (gdb) p i
    $21 = 101

    (gdb) p/a i
    $22 = 0x65

    (gdb) p/c i
    $23 = 101 'e'

    (gdb) p/f i
    $24 = 1.41531145e-43

    (gdb) p/x i
    $25 = 0x65

    (gdb) p/t i
    $26 = 1100101

五、查看内存

你可以使用examine命令(简写是x)来查看内存地址中的值。x命令的语法如下所示:

x/<n/f/u> <addr>

n、f、u是可选的参数。

n 是一个正整数,表示显示内存的长度,也就是说从当前地址向后显示几个地址的内容。
f 表示显示的格式,参见上面。如果地址所指的是字符串,那么格式可以是s,如果地十是指令地址,那么格式可以是i。
u 表示从当前地址往后请求的字节数,如果不指定的话,GDB默认是4个bytes。u参数可以用下面的字符来代替,b表示单字节,h表示双字节,w表示四字节,g表示八字节。当我们指定了字节长度后,GDB会从指内存定的内存地址开始,读写指定字节,并把其当作一个值取出来。

\<addr>表示一个内存地址。

n/f/u三个参数可以一起使用。例如:

命令:x/3uh 0x54320 表示,从内存地址0x54320读取内容,h表示以双字节为一个单位,3表示三个单位,u表示按十六进制显示。

六、自动显示

你可以设置一些自动显示的变量,当程序停住时,或是在你单步跟踪时,这些变量会自动显示。相关的GDB命令是display。

display <expr>
display/<fmt> <expr>
display/<fmt> <addr>

expr是一个表达式,fmt表示显示的格式,addr表示内存地址,当你用display设定好了一个或多个表达式后,只要你的程序被停下来,GDB会自动显示你所设置的这些表达式的值。

格式i和s同样被display支持,一个非常有用的命令是:

display/i $pc

$pc是GDB的环境变量,表示着指令的地址,/i则表示输出格式为机器指令码,也就是汇编。于是当程序停下后,就会出现源代码和机器指令码相对应的情形,这是一个很有意思的功能。

下面是一些和display相关的GDB命令:

undisplay <dnums...>
delete display <dnums...>

删除自动显示,dnums意为所设置好了的自动显式的编号。如果要同时删除几个,编号可以用空格分隔,如果要删除一个范围内的编号,可以用减号表示(如:2-5)

disable display <dnums...>
enable display <dnums...>

disable和enalbe不删除自动显示的设置,而只是让其失效和恢复。

info display

查看display设置的自动显示的信息。GDB会打出一张表格,向你报告当然调试中设置了多少个自动显示设置,其中包括,设置的编号,表达式,是否enable。

七、设置显示选项

GDB中关于显示的选项比较多,这里我只例举大多数常用的选项。

set print address
set print address on
    打开地址输出,当程序显示函数信息时,GDB会显出函数的参数地址。系统默认为打开的,如:

    (gdb) f
    #0  set_quotes (lq=0x34c78 "<<", rq=0x34c88 ">>")
        at input.c:530
    530         if (lquote != def_lquote)


set print address off
    关闭函数的参数地址显示,如:

    (gdb) set print addr off
    (gdb) f
    #0  set_quotes (lq="<<", rq=">>") at input.c:530
    530         if (lquote != def_lquote)

show print address
    查看当前地址显示选项是否打开。

set print array
set print array on
    打开数组显示,打开后当数组显示时,每个元素占一行,如果不打开的话,每个元素则以逗号分隔。这个选项默认是关闭的。与之相关的两个命令如下,我就不再多说了。

set print array off
show print array

set print elements <number-of-elements>
    这个选项主要是设置数组的,如果你的数组太大了,那么就可以指定一个<number-of-elements>来指定数据显示的最大长度,当到达这个长度时,GDB就不再往下显示了。如果设置为0,则表示不限制。

show print elements
    查看print elements的选项信息。

set print null-stop <on/off>
    如果打开了这个选项,那么当显示字符串时,遇到结束符则停止显示。这个选项默认为off。

set print pretty on
    如果打开printf pretty这个选项,那么当GDB显示结构体时会比较漂亮。如:

        $1 = {
          next = 0x0,
          flags = {
            sweet = 1,
            sour = 1
          },
          meat = 0x54 "Pork"
        }

set print pretty off
    关闭printf pretty这个选项,GDB显示结构体时会如下显示:

        $1 = {next = 0x0, flags = {sweet = 1, sour = 1}, meat = 0x54 "Pork"}

show print pretty
    查看GDB是如何显示结构体的。


set print sevenbit-strings <on/off>
    设置字符显示,是否按“/nnn”的格式显示,如果打开,则字符串或字符数据按/nnn显示,如“/065”。

show print sevenbit-strings
    查看字符显示开关是否打开。

set print union <on/off>
    设置显示结构体时,是否显式其内的联合体数据。例如有以下数据结构:

    typedef enum {Tree, Bug} Species;
    typedef enum {Big_tree, Acorn, Seedling} Tree_forms;
    typedef enum {Caterpillar, Cocoon, Butterfly}
                  Bug_forms;

    struct thing {
      Species it;
      union {
        Tree_forms tree;
        Bug_forms bug;
      } form;
    };

    struct thing foo = {Tree, {Acorn}};

    当打开这个开关时,执行 p foo 命令后,会如下显示:
        $1 = {it = Tree, form = {tree = Acorn, bug = Cocoon}}

    当关闭这个开关时,执行 p foo 命令后,会如下显示:
        $1 = {it = Tree, form = {...}}

show print union
    查看联合体数据的显示方式

set print object <on/off>
    在C++中,如果一个对象指针指向其派生类,如果打开这个选项,GDB会自动按照虚方法调用的规则显示输出,如果关闭这个选项的话,GDB就不管虚函数表了。这个选项默认是off。

show print object
    查看对象选项的设置。

set print static-members <on/off>
    这个选项表示,当显示一个C++对象中的内容是,是否显示其中的静态数据成员。默认是on。

show print static-members
    查看静态数据成员选项设置。

set print vtbl <on/off>
    当此选项打开时,GDB将用比较规整的格式来显示虚函数表时。其默认是关闭的。

show print vtbl
    查看虚函数显示格式的选项。

八、历史记录

当你用GDB的print查看程序运行时的数据时,你每一个print都会被GDB记录下来。GDB会以$1, $2, $3 .....这样的方式为你每一个print命令编上号。于是,你可以使用这个编号访问以前的表达式,如$1。这个功能所带来的好处是,如果你先前输入了一个比较长的表达式,如果你还想查看这个表达式的值,你可以使用历史记录来访问,省去了重复输入。

九、GDB环境变量

你可以在GDB的调试环境中定义自己的变量,用来保存一些调试程序中的运行数据。要定义一个GDB的变量很简单只需。使用GDB的set命令。GDB的环境变量和UNIX一样,也是以$起头。如:

set $foo = *object_ptr

使用环境变量时,GDB会在你第一次使用时创建这个变量,而在以后的使用中,则直接对其賦值。环境变量没有类型,你可以给环境变量定义任一的类型。包括结构体和数组。

show convenience
    该命令查看当前所设置的所有的环境变量。

这是一个比较强大的功能,环境变量和程序变量的交互使用,将使得程序调试更为灵活便捷。例如:

set $i = 0
print bar[$i++]->contents

于是,当你就不必,print bar[0]->contents, print bar1->contents地输入命令了。输入这样的命令后,只用敲回车,重复执行上一条语句,环境变量会自动累加,从而完成逐个输出的功能。

十、查看寄存器

要查看寄存器的值,很简单,可以使用如下命令:

info registers
    查看寄存器的情况。(除了浮点寄存器)

info all-registers
    查看所有寄存器的情况。(包括浮点寄存器)

info registers <regname ...>
    查看所指定的寄存器的情况。

寄存器中放置了程序运行时的数据,比如程序当前运行的指令地址(ip),程序的当前堆栈地址(sp)等等。你同样可以使用print命令来访问寄存器的情况,只需要在寄存器名字前加一个$符号就可以了。如:p $eip。

改变程序的执行

一旦使用GDB挂上被调试程序,当程序运行起来后,你可以根据自己的调试思路来动态地在GDB中更改当前被调试程序的运行线路或是其变量的值,这个强大的功能能够让你更好的调试你的程序,比如,你可以在程序的一次运行中走遍程序的所有分支。

一、修改变量值

修改被调试程序运行时的变量值,在GDB中很容易实现,使用GDB的print命令即可完成。如:

(gdb) print x=4

x=4这个表达式是C/C++的语法,意为把变量x的值修改为4,如果你当前调试的语言是Pascal,那么你可以使用Pascal的语法:x:=4。

在某些时候,很有可能你的变量和GDB中的参数冲突,如:

(gdb) whatis width
type = double
(gdb) p width
$4 = 13
(gdb) set width=47
Invalid syntax in expression.

因为,set width是GDB的命令,所以,出现了“Invalid syntax in expression”的设置错误,此时,你可以使用set var命令来告诉GDB,width不是你GDB的参数,而是程序的变量名,如:

(gdb) set var width=47

另外,还可能有些情况,GDB并不报告这种错误,所以保险起见,在你改变程序变量取值时,最好都使用set var格式的GDB命令。

二、跳转执行

一般来说,被调试程序会按照程序代码的运行顺序依次执行。GDB提供了乱序执行的功能,也就是说,GDB可以修改程序的执行顺序,可以让程序执行随意跳跃。这个功能可以由GDB的jump命令来完:

jump <linespec>

指定下一条语句的运行点。\<linespce>可以是文件的行号,可以是file:line格式,可以是+num这种偏移量格式。表式着下一条运行语句从哪里开始。

jump <address>

这里的\<address>是代码行的内存地址。

注意,jump命令不会改变当前的程序栈中的内容,所以,当你从一个函数跳到另一个函数时,当函数运行完返回时进行弹栈操作时必然会发生错误,可能结果还是非常奇怪的,甚至于产生程序Core Dump。所以最好是同一个函数中进行跳转。

熟悉汇编的人都知道,程序运行时,有一个寄存器用于保存当前代码所在的内存地址。所以,jump命令也就是改变了这个寄存器中的值。于是,你可以使用“set $pc”来更改跳转执行的地址。如:

set $pc = 0x485

三、产生信号量

使用singal命令,可以产生一个信号量给被调试的程序。如:中断信号Ctrl+C。这非常方便于程序的调试,可以在程序运行的任意位置设置断点,并在该断点用GDB产生一个信号量,这种精确地在某处产生信号非常有利程序的调试。

语法是:signal \<singal>,UNIX的系统信号量通常从1到15。所以\<singal>取值也在这个范围。

single命令和shell的kill命令不同,系统的kill命令发信号给被调试程序时,是由GDB截获的,而single命令所发出一信号则是直接发给被调试程序的。

四、强制函数返回

如果你的调试断点在某个函数中,并还有语句没有执行完。你可以使用return命令强制函数忽略还没有执行的语句并返回。

return
return <expression>

使用return命令取消当前函数的执行,并立即返回,如果指定了\<expression>,那么该表达式的值会被认作函数的返回值。

五、强制调用函数

call <expr>

表达式中可以一是函数,以此达到强制调用函数的目的。并显示函数的返回值,如果函数返回值是void,那么就不显示。

另一个相似的命令也可以完成这一功能——print,print后面可以跟表达式,所以也可以用他来调用函数,print和call的不同是,如果函数返回void,call则不显示,print则显示函数返回值,并把该值存入历史数据中。

在不同语言中使用GDB

GDB支持下列语言:C, C++, Fortran, PASCAL, Java, Chill, assembly, 和 Modula-2。一般说来,GDB会根据你所调试的程序来确定当然的调试语言,比如:发现文件名后缀为“.c”的,GDB会认为是C程序。文件名后缀为“.C, .cc, .cp, .cpp, .cxx, .c++”的,GDB会认为是C++程序。而后缀是“.f, .F”的,GDB会认为是Fortran程序,还有,后缀为如果是“.s, .S”的会认为是汇编语言。

也就是说,GDB会根据你所调试的程序的语言,来设置自己的语言环境,并让GDB的命令跟着语言环境的改变而改变。比如一些GDB命令需要用到表达式或变量时,这些表达式或变量的语法,完全是根据当前的语言环境而改变的。例如C/C++中对指针的语法是*p,而在Modula-2中则是p^。并且,如果你当前的程序是由几种不同语言一同编译成的,那到在调试过程中,GDB也能根据不同的语言自动地切换语言环境。这种跟着语言环境而改变的功能,真是体贴开发人员的一种设计。

下面是几个相关于GDB语言环境的命令:

show language
    查看当前的语言环境。如果GDB不能识为你所调试的编程语言,那么,C语言被认为是默认的环境。

info frame
    查看当前函数的程序语言。

info source
    查看当前文件的程序语言。

如果GDB没有检测出当前的程序语言,那么你也可以手动设置当前的程序语言。使用set language命令即可做到。

当set language命令后什么也不跟的话,你可以查看GDB所支持的语言种类:

(gdb) set language
The currently understood settings are:

local or auto    Automatic setting based on source file
c                Use the C language
c++              Use the C++ language
asm              Use the Asm language
chill            Use the Chill language
fortran          Use the Fortran language
java             Use the Java language
modula-2         Use the Modula-2 language
pascal           Use the Pascal language
scheme           Use the Scheme language

于是你可以在set language后跟上被列出来的程序语言名,来设置当前的语言环境。

参考链接

C++ class默认生成的函数

一般情况下,编译器会生成以下函数:

  • default构造函数
  • 复制构造函数
  • 重载赋值操作符
  • 析构函数

这些函数并不是都会生成,而是当这些函数被调用,而又没有明确定义的情况下,编译器才会生成相应的函数

default构造函数

当没有明确定义构造函数时生成,但是只有明确定义了构造函数(无论是不是默认构造函数),都不会再生成

复制构造函数和重载赋值操作符

编译器默认生成的版本只是单纯地将来源对象中每个非静态成员拷贝给目标成员
在明确定义的复制构造函数或者赋值操作符中,一般都会先判断来源对象和目标对象是否是同一个对象
什么时候编译器不会默认生成重载赋值操作符函数?(复制构造函数可能也是一样)

  1. 当类中有static const成员时
  2. 基类中将赋值操作符函数声明为private

C++要实现不可复制基类要点

  1. 将复制构造函数和重载赋值操作符明确声明为private
  2. 只写函数声明,不可实现函数,即使是空的函数体
class Uncopyable
{
    //这两个函数声明为protected是因为既可以避免Uncopyable可以被实例化,但是又不会影响子类
    protected:
        Uncopyap(){}
        ~Uncopyable(){}
    private:
        Uncopyable(const Uncopyable &);// 这两个函数不可以实现
        Uncopyable &operator=(const Uncopyable &);
}

析构函数

生成的析构函数什么时候是virtual的?
当基类的析构函数被声明为virtual时, 这种情况下,析构函数的虚属性主要来自基类。

类与类的关系

依赖关系

假设B类的变化引起了A类的变化,则说明A类依赖于B类。
依赖关系通常表现为下面三种情形:

  • B类是A类中的(某中方法的)局部变量;
  • B类是A类方法当中的一个参数;(大多数情况)
  • B类向A类发送消息,从而影响B类发生变化;

在UML类图设计中,依赖关系用由类A指向类B的带箭头虚线表示。
依赖关系

泛化关系(继承关系)

泛化关系有三个要求:

  • 子类与父类应该完全一致,父类所具有的属性、操作,子类应该都有;
  • 子类中除了与父类一致的信息以外,还包括额外的信息;
  • 可以使用父类的实例的地方,也可以使用子类的实例;

在UML类图设计中,继承用一条带空心三角箭头的实线表示,从子类指向父类,或者子接口指向父接口。
泛化关系

实现关系

实现接口定义,属于泛化关系的一种
在UML类图设计中,实现用一条带空心三角箭头的虚线表示,从类指向实现的接口。
实现关系

关联关系

和关系数据库中的一对多,一对一和多对多一样,这些关系就是通过A类与B类将对方的对象作为成员属性表示的
在UML类图设计中,关联类A指向被关联类B的带箭头实线表示单向关联,使用双箭头或者不使用箭头表示双向关联,在关联的两端可以标注关联双方的角色和多重性标记。
关联关系

常见标记及含义:

0..1:0个或1个实例
0..*:对实例个数没有限制
1:只能有1个实例
1..*:至少一个实例

聚合关系

属于关联关系的一种,表示的是整体和部分的关系,整体与部分可以分开。是一种弱“拥有”关系。
具体表现为A类的成员属性中有B类对象,但是这个B类对象可以不在A类创建对象时创建,两个对象的生命周期是不一致的。
在UML类图设计中,聚合关系以空心菱形加实线箭头表示。
聚合关系

组合关系

属于关联关系的一种,也是整体与部分的关系,但是整体与部分不可以分开.是一种强“拥有”关系。
具体表现为A类的成员属性中有B类对象,但是这个B类对象必须在A类创建对象时创建。
在UML类图设计中,组合关系以实心菱形加实线箭头表示。
组合关系

总结

其实类之间的关系就只有三种:依赖关系(函数参数)泛化关系(继承)关联关系(类成员属性)

参考链接

协程与libco

协程是一种轻量级的用户态线程。

协程的优点

首先看看同步和异步编程的优点
同步编程优缺点:

  • 优点:逻辑清晰,开发简单
  • 缺点:吞吐量低,时延大

异步编程优缺点:

  • 优点:吞吐量高,时延小
  • 缺点:逻辑分散,开发复杂

协程同时拥有同步和异步编程的优点,可以实现同步编程,异步调用

协程与事件驱动

协程和事件驱动对比其实没有性能上的提升,但是协程让我们用同步编程的方式来写事件驱动。

协程实现原理

很多语言都支持协程,比如python,go等,协程切换的时候只要变更上下文环境即可。 但是由于像C/C++这样的语言,使用的是传统的内存管理方式,本身语言层面很难实现,所以要借助一些库,比如linux的glibc库中就提供了一系列函数来实现上下文的环境的切换。 boost也自带了一个协程库。
但是无论哪一种库,它实现的原理无非就是切换栈的内存位置,保存并修改CPU寄存器的值,最后只要IP寄存器一概,指令的地址就跳到了新的地方。 总的来说C/C++实现协程主要由两方面的内存管理:

  • 栈,由于需要保存协程运行过程中数据,所以需要自己实现协程栈的管理
  • 寄存器数据
  • 还有一些管理逻辑,比如如何切换调用栈。比如如何保存寄存器数据,保存那些寄存器数据等等

libco通过给每一个线程分配一个数组(数组大小为128)作为协程栈,栈底就是线程本身。在协程让出CPU时,把协程从栈顶删除,恢复协程时,把协程压入栈顶。 libco切换协程时,把寄存器数据保存到内存中.协程切换是由一个叫coctx_swap函数完成。coctx_swap是基于glibc源码修改了一个swapcotext高性能版本,据说切换效率可以达到1000W+/s

协程与IO

由于操作系统并不知道协程的存在,因此在协程中直接执行IO操作的时候,还是会把协程阻塞。但是我们希望协程做到在执行IO操作的时候,它可以让出CPU,让别的协程继续执行,当IO完成之后再唤醒。那如何在现有代码在调用read/write时,自动切换出去呢?

libco解决方法是epoll+NonBlocking IO+ IO Hooking。libco提供了一份hook的IO函数,在协程真正调用系统的read/write函数前先把判断数据是否准备好,如果没有准备好,放入到epoll中监听,协程主动让出CPU。等epoll监听到相应的事件之后,在恢复协程,进行真正的IO读写。
以下是libco的IO Hooking中的recv函数,在文件co_hooks_sys_call.cpp文件中

ssize_t recv( int socket, void *buffer, size_t length, int flags )
{
    //宏展开之后,就是把系统的recv函数的赋值给函数指针g_sys_recv_func
    HOOK_SYS_FUNC( recv );
    // 判断该协程是否允许IO hooking
    if( !co_is_enable_sys_hook() )
    {
        return g_sys_recv_func( socket,buffer,length,flags );
    }
     // 从一个全局的数组中以fd为index得到一个rpchook_t
     // rpchook_t记录这个fd的一些信息,如超时等
    rpchook_t *lp = get_by_fd( socket );

    if( !lp || ( O_NONBLOCK & lp->user_flag ) ) 
    {
        return g_sys_recv_func( socket,buffer,length,flags );
    }
    int timeout = ( lp->read_timeout.tv_sec * 1000 ) 
                + ( lp->read_timeout.tv_usec / 1000 );

    struct pollfd pf = { 0 };
    pf.fd = socket;
    pf.events = ( POLLIN | POLLERR | POLLHUP );
    // !!调用poll,注册EventLoop事件,然后让出CPU
    int pollret = poll( &pf,1,timeout );
    // 已经被唤醒,继续读取
    ssize_t readret = g_sys_recv_func( socket,buffer,length,flags );
    return readret;
}

通过IO Hooking实现协程在IO的自动切换最大好处在于能把目前大部分以同步方式写的代码,以最小的代价改成异步操作。

libco源码解读

libco工作流程

在实际使用中,libco工作流程如下

  1. mainloop主循环负责监听连接请求,有请求则建立一个worker协程处理。如果timeout时间内没有请求,则处理就绪协程(即io操作已经返回)
  2. worker协程,如果遇到io操作则挂起,对fd添加监听操作,同时让出CPU。

libco提供的协程接口:

  • co_create: 创建协程
  • co_yield:协程主动让出CPU
  • co_resume: 恢复协程

数据结构篇

协程上下文环境参数

struct coctx_param_t
{
    coctx_pfn_t f;//函数指针
    coctx_pfn_t f_link;//函数指针
    const void *s1;
    const void *s2;
}

协程上下文环境
主要是用来保存协程的栈位置和寄存器内容

struct coctx_t
{
    void *regs[5];//用于保存寄存器的值。
    coctx_param_t *param; //函数参数
    coctx_pfn_t routine; //这个函数是stCoRoutine_t中的pfn统一封装,在pfn函数运行完成之后,主动让出CPU
    const void *s1;//rontine
    const void *s2;//routine的参数
    size_t ss_size;//栈的大小,一般等于stCoRoutine_t的sRunStac大小,即128K
    char *ss_sp;//栈指针,指向stRoutine_t的sRunStack
}

coctx_t相关函数:

coctx_swap( coctx_t *, coctx_t * ) //实现协程切换的关键函数,通过汇编实现
coctx_init( coctx_t *ctx) //初始化ctx(将ctx置0)
coctx_make( coctx_t *ctx, coctx_pfn_t pfn, const void *s, const void *s1) //把pfn函数指针赋值给routine
coctx_swap( coctx_t *cur, coctx *ctx) //把当前协程运行环境保存到cur中,然后切换到ctx所指的协程

协程线程结构体

struct stCoRoutine_t
{
    stCoRoutineEnv_t *env; //协程所属线程环境
    pfn_co_routine_t pfn; //协程绑定的函数
    void *arg;         //函数的参数
    coctx_t ctx;       //上下文环境
    char cStart;       //该协程是否已经开始运行
    char cEnd;         //该协程是否已经运行结束
    stCoSpec_t aSpec[1024]; //协程的本地变量数组
    char cIsMain;      //是否是线程本身,libco将线程本身也看作一个协程
    char cEnableSysHook;//是否开启hook系统调用
    char sRunStack[1024 * 128];//协程运行栈大小为128K
}

协程线程环境结构体
用于记录当前线程中里

struct stCoRoutineEnv_t
{
    stCoRoutine_t *pCallStack[128]; //协程调用栈
    int iCallStackSize;             //栈的大小,指的是栈顶位置
    stEpoll_t *pEpoll;      
}

线程epoll结构体
每个线程都会有一个独立epoll fd来监听事件

struct stCoEpoll_t
{
    int iEpollFd;
    static const int _EPOLL_SIZE = 1024 * 10;
    struct stTimeout_t *pTimeout;        //超时处理
    struct stTimeoutItemLink_t *pstTimeoutList;
    struct stTimeoutItemLink_t *pstActiveList;
};

目前还没搞明白libco的超时机制,这部分以后有机会再补上

libco多线程

libco本身是支持多线程。libco有一个全局数组保存着每个线程的环境,这个全局数据是由线程的id来作为索引.
```c
static stCoRoutineEnv_t* g_arrCoEnvPerThread[ 102400 ]
````
同一个线程内的线程读写线程的变量不需要加锁,但是读写线程外的公共变量需要加锁