CherieLi Student

解析命令行参数

2020-11-15
CherieLi

前言

在程序中一般都会用到命令行选项, 我们可以使用getopt 和getopt_long函数来解析命令行参数

getopt

getopt主要用来处理短命令行选项, 例如./test -v-v就是一个短选项. 使用该函数需要引入头文件<unistd.h>, 下面是该函数的定义

int getopt(int argc, char * const argv[], const char * optstring);

其中 argc 和 argv 是main函数中的传递的参数个数和内容, optstring用来指定可以处理哪些选项, 下面是optstring的一个示例:

"a:bc"

该示例表明程序可以接受3个选项: -a -b -c, 其中 a 后面的 :表示该选项后面要跟一个参数, 即如 -a text的形式, 选项后面跟的参数会被保存到 optarg 变量中. 下面是一个使用示例:

#include <stdio.h>
#include <unistd.h>

int main(int argc, char **argv) {
    int ch;
    while((ch = getopt(argc, argv, "a:b")) != -1) {
        switch(ch) {
            case 'a':
                printf("option a: %s\n", optarg);
                break;
            case 'b':
                printf("option b \n");
                break;
            case '?': // 输入未定义的选项, 都会将该选项的值变为 ?
                printf("unknown option \n");
                break;
            default:
                printf("default \n");
        }
    }
}

执行 ./test -a aa -b -c 输出结果如下:

option a: aa
option b 
unknown option

getopt_long

getopt_long支持长选项的命令行解析, 所为长选项就是诸如--help的形式, 使用该函数, 需要引入<getopt.h>下面是函数原型:

#include <getopt.h>

int getopt_long(int argc, 
                char * const argv[],
                const char *optstring,
                const struct option *longopts,
                int *longindex);

int getopt_long_only(int argc,
                    char * const argv[],
                    const char *optstring,
                    const struct option *longopts,
                    int *longindex);

其中 argc , argv , optstringgetopt中的含义一样, 下面解释一下longoptslongindex

longopts

longopts 指向一个struct option 的数组, 下面是option的定义:

struct option {
    const char *name;
    int         has_arg;
    int        *flag;
    int         val;
};

下面是各字段的含义

  • name - 长选项的名称, 例如 help
  • has_arg - 是否带参数, 0 不带参数, 1 必须带参数, 2 参数可选
  • flag - 指定长选项如何返回结果, 如果flag为NULL, getopt_long() 会返回val. 如果flag不为NULL, getopt_long会返回0, 并且将val的值存储到flag中
  • val - 将要被getopt_long返回或者存储到flag指向的变量中的值

下面是longopts的一个示例

struct option opts[] = {
       {"version", 0, NULL, 'v'},
       {"name", 1, NULL, 'n'},
       {"help", 0, NULL, 'h'}
   };

我们来看{"version", 0, NULL, 'v'}, version 即为长选项的名称, 即按如下形式--version, 0 表示该选项后面不带参数, NULL 表示直接将v返回(字符v在ascii码中对应的数值), 即在使用getopt_long遍历到该条选项时, getopt_long 返回值为字符v对应的ascii码值.

longindex

longindex表示长选项在longopts中的位置, 例如在上面的示例中, version 对应的 longindex 为0, name 对应的 longindex 为1, help对应的 longindex 为2, 该项主要用于调试, 一般设为 NULL 即可.

下面是一个使用示例:

void use_getpot_long(int argc, char *argv[]) {
    const char *optstring = "vn:h";
    int c;
    struct option opts[] = {
        {"version", 0, NULL, 'v'},
        {"name", 1, NULL, 'n'},
        {"help", 0, NULL, 'h'},
        {NULL,0,NULL,0}
    };

    while((c = getopt_long(argc, argv, optstring, opts, NULL)) != -1) {
        switch(c) {
            case 'n':
                printf("username is %s\n", optarg);
                break;
            case 'v':
                printf("version is 0.0.1\n");
                break;
            case 'h':
                printf("this is help\n");
                break;
            case '?':
                printf("unknown option\n");
                break;
            case 0 :
                printf("the return val is 0\n");
                break;
            default:
                printf("------\n");

        }
    }
}

然后我们运行程序 ./test --name lzy --version --help --haha, 下面是运行结果:

username is lzy
version is 0.0.1
this is help
unknown option

当然我们也可以使用短选项 ./test -n lzy -v -h 下面我们对程序做一下修改, 这一次将 struct option 中的 flaglongindex 设为具体的值

void use_getpot_long2(int argc, char *argv[]) {
    const char *optstring = "vn:h";
    int c;

    int f_v = -1, f_n = -1, f_h = -1, opt_index = -1; 
    struct option opts[] = {
        {"version", 0, &f_v, 'v'},
        {"name", 1, &f_n, 'n'},
        {"help", 0, &f_h, 'h'},
        {NULL,0,NULL,0}
    };

    while((c = getopt_long(argc, argv, optstring, opts, &opt_index)) != -1) {
        switch(c) {
            case 'n':
                printf("username is %s\n", optarg);
                break;
            case 'v':
                printf("version is 0.0.1\n");
                break;
            case 'h':
                printf("this is help\n");
                break;
            case '?':
                printf("unknown option\n");
                break;
            case 0 :
                printf("f_v is %d \n", f_v);
                printf("f_n is %d \n", f_n);
                printf("f_h is %d \n", f_h);
                break;
            default:
                printf("------\n");
        }
        printf("opt_index is %d\n\n", opt_index);
    }
}

运行程序: ./test --name lzy --version --help , 下面是运行结果:

f_v is -1 
f_n is 110 
f_h is -1 
opt_index is 1

f_v is 118 
f_n is 110 
f_h is -1 
opt_index is 0

f_v is 118 
f_n is 110 
f_h is 104 
opt_index is 2

我们可以看到当给 flag 指定具体的指针之后, getopt_long 会返回0, 因此会去执行case 0, 并且 val 的值赋给了 flag 指向的变量. 下面我们用短选项执行一下程序 ./test -n lzy -v -h, 下面是运行结果

username is lzy
opt_index is -1

version is 0.0.1
opt_index is -1

this is help
opt_index is -1

我们看到使用短选项的时候 getopt_long 就相当于 getopt , flaglongindex都不起作用了.

getopt_long 和 getopt_long_only

下面解释一下 getopt_longgetopt_long_only的区别, 首先用下列选项运行一下 use_getopt_long ./test -name lzy -version -help , 下面是输出结果:

username is ame
opt_index is -1

version is 0.0.1
opt_index is -1

./test2: invalid option -- 'e'
unknown option
opt_index is -1

./test2: invalid option -- 'r'
unknown option
opt_index is -1

./test2: invalid option -- 's'
unknown option
opt_index is -1

./test2: invalid option -- 'i'
unknown option
opt_index is -1

./test2: invalid option -- 'o'
unknown option
opt_index is -1

username is -help
opt_index is -1

我们看到使用短选项标识符 - 指向长选项时, 程序还是会按短选项来处理, 即一个字符一个字符的解析. 下面我们将 use_getopt_long 做一下更改, 即将 getopt_long 改为 getopt_long_only , 如下所示:

void use_getpot_long3(int argc, char *argv[]) {
    const char *optstring = "vn:h";
    int c;
    struct option opts[] = {
        {"version", 0, NULL, 'v'},
        {"name", 1, NULL, 'n'},
        {"help", 0, NULL, 'h'},
        {NULL, 0, NULL, 0}
    };

    while((c = getopt_long_only(argc, argv, optstring, opts, NULL)) != -1) {
        switch(c) {
            case 'n':
                printf("username is %s\n", optarg);
                break;
            case 'v':
                printf("version is 0.0.1\n");
                break;
            case 'h':
                printf("this is help\n");
                break;
            case '?':
                printf("unknown option\n");
                break;
            case 0 :
                printf("the return val is 0\n");
                break;
            default:
                printf("------\n");

        }
    }
}

下面再运行程序 ./test -name lzy -version -help , 下面是运行结果:

username is lzy
version is 0.0.1
this is help

即使用 getopt_long_only 时, ---都可以作用于长选项, 而使用 getopt_only 时, 只有 --可以作用于长选项.

参考文档

http://blog.zhangjikai.com/2016/03/05/%E3%80%90C%E3%80%91%E8%A7%A3%E6%9E%90%E5%91%BD%E4%BB%A4%E8%A1%8C%E5%8F%82%E6%95%B0–getopt%E5%92%8Cgetopt_long/


上一篇 pwndbg

下一篇 安全编译选项

Comments

Content