edsionte's TechBlog

No Pains, No Gains

Archive for 2010 年 7 月

实现cp命令–从主函数开始

25 7 月, 2010

今天陈老师对我们以后Linux的学习做了些指导，一针见血的指出我们学习中经常会遇到的问题。我大概记了一下：

1.从有需求做起，不要盲目看书。

2.有计划，有步骤的学习。

3.主动学习，学会分享。

暂不说其他，我觉得第1条在我们学习过程中很值得注意。前段时间做了my_ls.c和my_shell.c。虽然都调试成功，但还是极大的参考了《linuxC编程实战》这本书。因为文件系统在linux中占据着重要地位，所以还是得多通过实践来理解这部分的内容，不妨大家和我一起做my_cp，练习一下文件操作这部分的系统调用函数。

既然我们要实现cp命令，必须得了解cp命令的基本使用方法。这方面的资料网上很多，并且可以参考man手册自己试试，在此我不再详细说明。my_cp将要实现以下基本的功能：

1.将一个文件拷贝到指定路径。（目的文件可存在也可不存在）。这是my_cp中最基本的功能，事实上2，3，4功能最终都会被分解成此功能。

2.将一个目录拷贝到指定目录下，此时必须加-R或-r选项。

3.将多个目录拷贝到指定目录下，此时必须加-R或-r选项。

4.将多个文件拷贝到指定目录下。这里的源文件即包含目录文件也包含普通文件。

个人建议，最好多在终端试试以上各种情况，重点看一看cp命令是如何处理非法命令的，这对我们下面的编程有帮助。

请注意，原文件中如果存在目录文件，并且输入的命令行参数未加-r或-R选项，则会自动忽略此源目录文件，而其他文件的拷贝不受影响。如：

gues@huangwei-desktop:~/code/shell_command$ ls
ls  ls1  my_cp  my_cp1  my_cp.c  my_ls.c  my_shell.c  newls.c  t.c  tdir  test  tfile.c  ttfile.c
gues@huangwei-desktop:~/code/shell_command$ cp my_shell.c tdir/ test/
cp: 略过目录"tdir/"
gues@huangwei-desktop:~/code/shell_command$ ls test/
my_shell.c

如果你完成了my_ls或者my_shell，你一定会知道，这类实现系统命令的程序在main函数中首先会对命令行参数进行解析，判断其合法性，然后再根据用户的输入（是否包含某选项或者参数个数等）来“引导”程序进入其他子函数，以便完成相应功能。想想my_ls程序，难道不是这样吗？

好了，我们开始吧！

首先进入主函数。由于本程序只支持-r或者-R选项，因此如果用户输入选项，我们来判断是否合法。如果合法让其标志param_r为真。由于-r或-R选项位置不一定限制在cp命令之后（事实上放在命令行参数末尾也可以），所以用index_r来保存其下标。实现代码如下：（因为插件原因，下面的代码在出现<或>符号的后面均加入了 \ ）

	char dest_path[PATH_MAX+1];
	char src_path[256][PATH_MAX+1];
	int i,k,num,src_num,index_r;
	struct stat buf;

	//check the legality of the options,only -r or -R
	for(i=1;i<\argc;i++)
	{
		if(argv[i][0]=='-')
		{
			if((!strcmp(argv[i],"-r")||!strcmp(argv[i],"-R")))
			{
				param_r=1;
				index_r=i;
			}
			else
			{
				printf("my_cp:invalid options: %s\n",argv[i]);
				exit(1);
			}
		}
	}

接下来计算命令行参数中参数的个数num以及源文件的个数src_num，这两个变量备用。如果num小于2，肯定不合法。上述要求都合法后，提取目标文件的路径，上面已经说过因为R和r选项后可以出现在参数末尾，因此得多加一次判断，并不能直接认为argv[argc-1]就是目标文件路径。

if(param_r)
	{
		num=argc-1-1;
		src_num=num-1;
	}
	else
	{
		num=argc-1;
		src_num=num-1;
	}
	if(num<\2)
	{
		printf("my_cp: [option] (source) (dest)\n");
		exit(1);
	}
	//extract the dest path
	if(index_r!=argc-1)
	{
		strcpy(dest_path,argv[argc-1]);
	}
	else
	{
		strcpy(dest_path,argv[argc-2]);
	}

接下来提取源文件的路径，由于源文件可以有多个，因此我们用一个字符串数组来存储源文件路径。

	//extract the src path
	k=0;
	for(i=1;i<\argc-1;i++)
	{
		if(i==index_r&&param_r)
			continue;
		else
		{
			strcpy(src_path[k++],argv[i]);
		}
	}

以上工作都做好后，我们可以”分流“了，即根据不同要求进入不同的子函数。我的“分流”原则是根据源文件数src_num。当其大于1时，说明源文件是多个。首先判断此目的文件是否存在，如果存在那么接着判断它是否为一个目录文件，因为多个源文件不可能拷贝到一个非目录文件当中。
确定了目的文件是一个目录后，我们要将这个目录下的所有文件依次调用子函数进行“分流”。
这里有两个重要的子函数，cp_single函数针对这样的情况：将单个文件拷贝到另一文件。（功能1）。cp_directory函数针对这样的情况：将单个文件夹拷贝到指定目录（功能2）。进入这两个子函数的依据就是，如果源文件是一个文件进入前者，源文件是目录进入后者。而我们用for循环将上述两函数有效的结合起来，就可以实现上述功能的3，4。

	if(src_num>\1)
	{
		if(stat(dest_path,&buf)==-1)
		{
			printf("my_cp: \"%s\" is not a directory.\n",dest_path);
			exit(1);
		}
		//the dest path is valid
		if(S_ISDIR(buf.st_mode))
		{
			strcpy(temp_dest_path,dest_path);
			//the dest path is directory
			for(i=0;i<\src_num;i++)
			{
				if(stat(src_path[i],&buf)==-1)
				{
					printf("my_cp: can't get file status of \"%s\" : no this file or directory.\n",src_path[i]);
					continue;
				}
				//the src_path exist
				if(!S_ISDIR(buf.st_mode))
				{
					cp_single(src_path[i],dest_path);
				}
				else if(param_r)
				{
					cp_directory(src_path[i],dest_path);

				}
				else
				{
					printf("my_cp: skip the directory: \"%s\".\n",src_path[i]);
				}
				strcpy(dest_path,temp_dest_path);

			}

		}
		else
		{
			printf("my_cp: \"%s\" is not a directory.\n",dest_path);
			exit(1);
		}
	}
	else
	{
		//The code here be omited
	}

我们接下来主要来看源文件数目为1的情况。其实这属于cp命令最基本的功能，cp_directory函数也会调用这个函数。
源文件存在的时候，如果源文件是一个目录并且有r或R选项，那么进入cp_directory函数（至于目标文件是否为目录，进入此函数可以判断）。如果源文件不是目录文件，那么进入cp_single函数即可。

	if(src_num>\1)
	{
		//The code here be omited
	}
	else
	{
		//only one src path
		if(stat(src_path[0],&buf)==-1)
		{
			printf("my_cp: can't get file status of \"%s\" : no this file or directory.\n",src_path[0]);
			exit(1);
		}
		if(S_ISDIR(buf.st_mode))
		{
			if(param_r)
			{
				cp_directory(src_path[0],dest_path);
				exit(0);
			}
			else
			{
				printf("my_cp: skip the directory: \"%s\".\n",src_path[0]);
				exit(1);
			}
		}
		else
                {
			cp_single(src_path[0],dest_path);
		}
	}

好了，主函数部分基本就是这样，这里主要说明整个主函数的整个流程。另外我们也应该不走寻常路，去尝试一些错误情况，这有利于我们编程。

无评论 »

Posted in Linux下C编程

Tags: 命令文件操作

字节对齐

23 7 月, 2010

今天在看结构体和共用体部分的时候，遇到了一个新名词“内存对齐”。先引入问题吧。如下：

struct student
{
	char name[20];
	int age;
	char sex;
	char phone[15];
};
struct student p1;

sizeof(p1)=？
这个很简单得出答案，即20+4+1+15=40Byte。如果将phone[15]改为phone[16]，结果是44。难道不是41吗？

这里便要引入内存对齐的概念。内存为了提高访问效率，便规定以结构体中最大的基本单位长度为对齐标准。即实际分配的内存大小是对齐标准的整数倍（必要条件）。在上面的结构体中，最大的基本类型是int。因此以4Byte为对其标准。所以实际内存大小应该为4的整数倍，即为44Byte.

也许你有疑惑：name[20]不是要20Byte吗，为什么以4Byte为对齐标准？请注意这里的基本类型。name[20]是一个字符串数组，数组属于复合的数据类型。复合的数据类型还有结构体，共用体。基本的数据类型是整型，字符型，浮点型。如果你还有不解，那么看下题：

struct score
{
	float english;
	float math;
	float computer；
};
struct student
{
	char name[10];
	int age;
	char sex;
	struct score st_score;
};

在student结构体中含有数据类型为struct score这样的变量。struct score的大小为12Byte，也是struct student结构体中最大的数据类型，但是我们的对齐标准是4Byte，就如我们刚说的那样，内存的对齐标准是取结构体中最大的基本数据类型，这里我们取sizeof(int)。

再看下面的问题：

union data1
{
	int i;
	char c;
	char str[9];
};
struct data2
{
	int i;
	char c;
	char str[9];
};

sizeof(struct data1)=? sizeof(struct data2)=?
对于前者，由于共用体的存储大小由最大的成员来决定，因此上题中共用体的存储大小为9Byte，考虑到内存对齐，它以sizeof(int)=4Byte来对齐，因此实际内存分配大小是12Byte。对于后者，存储大小是4+1+9=14Byte，这个结构体以4对齐，因此实际分配大小为16Byte。

现在你应该对于共用体和结构体的内存对齐有所了解了。那么再接着往下看：

struct data
{
	char c;
	double d;
	char ch;
}

sizeof(struct data)=?
有了上面的理解，10肯定不会是答案，那么会是16吧。也错。正确答案是24。你可能会感到莫名其妙：按照上面所说的方法，以8为对齐标准，那么10不是8的倍数，那就是16呀。为什么呢？请你耐心看下面。

首先我们知道结构体变量是分配的连续内存空间。d毫无疑问是分配8Byte，对于d“前面”的c，按照对齐标准我们应该分配8Byte,而d后面的ch，按照对齐标准也应该分配8Byte。因此结果是24。

如果这样：

struct data
{
	double d;
	char c;
	char ch;
}

sizeof(struct data)=16。

因为内存没必要分别为c和ch分配8Byte来进行对齐，将它们放在一个8byte里就可以实现内存对齐。上面在引入内存对齐概念的时候，我用括号特别注释必要条件便是说明此处内容。

5 comments »

Posted in C语言的那些事儿

Tags: C编程共用体内存对齐结构体

gdb调试器快速入门

21 7 月, 2010

一直不会使用gdb调试器，主要原因是它不像windows下那些编译环境有良好的图形界面，所以一再的排斥gdb调试器。遇到问题也是盲目寻找。下午花了些时间专门看了gdb调试器的相关资料，其实上手一点都不困难。本文通过FQA的方式让你快速入门gdb调试器。

1.如何启动gdb调试器呢？

在终端输入 gdb 程序文件名 即可。注意gdb调试的是可执行文件，而不是源代码。因此此处的文件名应该是可执行程序文件名。成功进入gdb后会显示一大段文字说明，然后是gdb提示符：(gdb) 。

请注意在进入gdb之前应该按照如下方式编译源程序：

gcc -g test_gdb.c -o test_gdb

只有加入选项-g才能被gdb调试。

2.除了上述方法，还有其他方法进入gdb吗？

直接在终端输入：gdb，成功进入后，使用file命令装入要调试的程序。输入： file 程序文件名 即可。

3.我成功进入了gdb，如何退出呢？

使用quit命令，输入： quit 即可。

4.进入gdb后，我要查看源代码必须退出才能查看吗？

当然不用。下面的命令可以帮助你快速查看源码。

list：显示10源代码，再次输入该命令显示接下来的10行。

list 1,10:显示从第一行到第10行的代码。

list 函数名：显示此函数名周围的代码。

5.gdb可以设置断点吗？如何设置？

在gdb中最简单的设置方式是：break 行号 在这一行设置断点。比如break 9 会在代码的第9行设置断点。当程序执行到第9行会自动暂停，此时，第9行代码还未执行。

你也可以使用：break 函数名 的方式在某个函数处设置断点，程序运行到这个函数内的第一条语句处会自动暂停。

你也可以这样设置断点：break 行号或函数名 if 条件 。它很好理解，当满足if条件语句时才会在指定的行号或者函数名处断点。

6.我发现我把断点设置错了，如何消除断点？

使用命令：clear 行号 即可删除。

7.我已经成功设置了断点，可是我如何运行程序以便让它在断点处暂停？

输入：run 即可。程序自动停止在第一个断点处。

8.我的程序运行的时候需要加参数，我还能继续使用run命令运行程序吗？

当然可以，只不过你要在run后加上你的参数，参数间用空格隔开。如：run 参数1 参数2 …..

9.有时候我并不确定程序具体哪一句有问题，我如何一步一步的查看语句？

两种命令：next和step。两者均可以一句一句的查看语句。但不同的是，next命令将函数调用看作一条语句，而step则会进入函数，一步步的执行函数内的代码。

10.如何让暂停的代码继续运行？

输入命令：continue。它可以让程序继续运行，直到程序运行完毕或者遇到下一个断点为止。

11.当程序在断点处暂停执行时，如何查看当前变量的值？

使用print命令。具体如下：

print 命令或者表达式：显示变量或表达式的值。

print 变量=值：为变量赋值。

以上命令属于基本的调试命令，更多的命令可以参考这本书。

熟悉以上命令便可以快速入门gdb，要熟练的使用调试器，当代码遇到问题时，多调试即可。

1 comment »

Posted in Linux下C编程

Tags: gdb 调试

线程ID的输出格式

20 7 月, 2010

Last Update:8/15

在获取线程ID的时候，常用到pthread_self()函数获取当前线程的ID，它返回的ID是pthread_t类型的。如果要打印出线程ID，用什么输出格式呢？

在此书中例题8_1中使用的是%u，即unsigned int,但是编译时候有一个warning:

format ‘%u’ expects type ‘unsigned int’, but argument 2 has type ‘pthread_t’。

其实线程ID的格式应该是unsigned long，所以输出格式为:%lu。再次编译就对了。linux中还有一些ID类的数据类型，比如常见的pid，它的输出格式为%d；

再比如文件状态结构体struct stat *buf中的st_ino字段，它的类型为ino_t，而输出格式为%lu。在内核的inode结构体（include/linux/fs.h）中可以找到这个字段的最终面目：unsigned long i_ino;它便是索引结点号。

无评论 »

Posted in C语言的那些事儿, Linux下C编程

Tags: 线程线程控制错误

my_shell.c代码分析

16 7 月, 2010

大三的时候，那时候因为课程需要，我们调试过my_shell.c程序。当时只是对整个程序的结构了解，在涉及linux系统调用函数的时候就不是很清楚”为什么会这样做？”。my_shell.c程序核心函数便是do_cmd函数，此函数是整个程序的核心，负责对用户输入的命令进行执行。

本文便是分析do_cmd函数，以达到对my_shell.c程序有深入的理解。此函数会涉及文件操作中的相关系统调用函数，如果你和我一样调试并分析过前面所说的my_ls.c程序，那么接下来所述的内容对你来说并不困难。

我们按照如下方式定义do_cmd函数：

void do_cmd(int argcount, char arglist[100][256]);

其中，argcount是统计用户输入命令中选项的个数，arglist数组存储每个选项。比如输入：ls -l /那么此时argcount=3,而arglist[0],arglist[1],arglist[2]中分别存储的是：ls,-l,/。

首先此函数会检查用户输入的命令行参数中是否存在后台运行符。利用for循环，对arglist数组中的每个参数与”&”进行比较。由于arglist中的元素是字符串，那么应该选用strcmp函数，而不是利用==来判断。此外即便找到了后台运行符，还应该检查是否”&”位于参数末尾。如果i==argcount-1为假，那么便出错。实现代码如下:

//check if the command include character of running in the background
	for(i=0;i<\argcount;i++)
	{
		if(strncmp(arg[i],"&",1)==0)
		{
			if(i==argcount-1)
			{
				background=1;
				arg[argcount-1]=NULL;
				break;
			}
			else
			{
				printf("wrong command\n");
				return;
			}
		}
	}//for

接下来，检测命令行参数是否含有>,<,|符号，检测方法与上出代码原理类似。由于本程序要求用户输入的命令行参数只能包含上述符号其中之一，所以当flag大于一时，错误。参数中符号合法，接下来提取文件名，存于字符串file中。程序中分别有三个if语句依次针对出现>,<,|时的情况。我们只要分析出现管道符号的情况。

在分析之前首先弄起出管道符号的作用。比如下面命令：

edsionte@edsionte-laptop:~$ ls -l / | wc -c
1513

管道符号前后分别是两个shell命令，前命令的输出作为后命令的输入。

如果检测出命令行中含有管道符号，即how=have_pipe。然后将命令行中两个shell命令分离出来，前命令依然存于arg数组中，而后命令存于argnext数组中。实现命令如下：

if(how==have_pipe)
	{
		for(i=0;arg[i]!=NULL;i++)
		{
			if(strncmp(arg[i],"|",1)==0)
			{
				arg[i]=NULL;
				int j;
				for(j=i+1;arg[j]!=NULL;j++)
				{
					argnext[j-(i+1)]=arg[j];
				}
				argnext[j-(i+1)]=arg[j];
				break;
			}
		}
	}

接下来就要用到进程控制的内容了。我们fork一个新的进程，让它去执行命令行参数中的命令。当命令行中不包含管道符号时，只需fork一个进程，比如ls -l / > a;我们只需fork一个新进程，让其（if(pid==0)）执行ls命令即可；否则，我们必须fork两个信进程，前一个进程执行|前的命令，另外一个进程执行|后的命令。至于另个进程如何”通信”，如何让前一个命令的输出称为后者的输入？不着急，后面会详细说明。

1.如果所输命令中不包含<,>,|，how==normal(0);那么调用exe族函数即可让子进程去执行所输的命令。如下：

			if(pid==0)
			{
				if(!(find_command(arg[0])))
				{
					printf("%s: command not found\n",arg[0]);
					exit(0);
				}
				execvp(arg[0],arg);
				exit(0);
			}

find_command函数是在指定目录下去查找命令arg[0]对应的可执行程序。

2.如果命令行中包括输出重定向符号>，how==out_redirect(1);那么需在上述代码中exe函数前添加下面的代码：

				fd=open(file,O_RDWR|O_CREAT|O_TRUNC,0644);
				dup2(fd,1);//make the file as a standard output stream
				execvp(arg[0],arg);//execute the command

前面我们已经提到file中存储的是输出重定向（或输入重定向）的文件名，因此首先应以可读可写方式打开一个文件，并且档要打开的文件存在时，会清空源文件数据，这些我们在前面的博文中都有解释。我们知道标准输出输入的文件描述符为：1，0，利用dup2函数就可以将fd，1同时指向file文件，实现将标准输出重定向到我们刚已打开的文件。

3.如果命令行中包含输入重定向符号<，how==out_redirect(2);那么添加如下代码：

				fd=open(file,O_RDONLY);
				dup2(fd,0);//make the file as a standard output stream
				execvp(arg[0],arg);//execute the command

这里只涉及到读取文件，因此以只读方式打开文件。

4.如果命令行中包含管道符号，how==have_pipe(3);如同我们在上面所述的，子进程还需再fork一个进程（暂且叫它子子进程，child_child_process）。首先让子子进程去执行管道符号前面的shell命令，并将输出结果暂存于tempfile文件中；让子进程去执行管道符号后面的shell命令，并读取tempfile文件，将其作为第二个命令的输入。这样，子进程和子子进程实现了管道”通信”。具体代码实现其实是上述2和3的结合，具体如下：

			if(pid==0)//child_process
			{
				int pid2;
				int status2;
				int fd2;

				if((pid2=fork())<\0)
				{
					printf("fork2 error\n");
					return;
				}
				else if(pid2==0)//child_child_process
				{
					if(!(find_command(arg[0])))
					{
						printf("%s: command not found\n",arg[0]);
						exit(0);
					}
					fd2=open("/tmp/tempfile",O_WRONLY|O_CREAT|O_TRUNC,0644);
					dup2(fd2,1);
					execvp(arg[0],arg);
					exit(0);
				}

				if(waitpid(pid2,&status2,0)==-1)//waiting for child_child_process
				{
					printf("wait for child_child process error\n");
				}

				if(!(find_command(argnext[0])))
				{
					printf("%s:command not found\n",argnext[0]);
					exit(0);
				}

				fd2=open("/tmp/tempfile",O_RDONLY);
				dup2(fd2,0);
				execvp(argnext[0],argnext);

				if(remove("/tmp/tempfile"))
				{
					printf("remove error\n");
				}
				exit(0);
			}

上出1～4处代码需要一个switch语句来组织，根据how参数来选择相应代码，进行执行。另外，由于上述代码中设计两次fork进程，因此要弄清楚父子进程的关系，其次还需了解代码4中waitpid函数的作用。由于子子进程和子进程同组，因此子进程等待子子进程结束。

同样，父进程需要等待子进程执行完毕。但是如果命令行中包含后台运行父&，那么附近成可直接返回，不用等待子进程。这些功能的实现代码如下：

	if(background==1)
	{
		printf("process id %d\n",pid);
	}

	if(waitpid(pid,&status,0)==-1)
	{
		printf("wait for child process error\n");
	}

至此，我们分析完了do_cmd函数的功能，完整代码可以参考这里。

edsionte's TechBlog

Archive for 2010 年 7 月

实现cp命令–从主函数开始

字节对齐

gdb调试器快速入门

线程ID的输出格式

my_shell.c代码分析

本博客中的所有文字、图片及代码均可任意转载，但是请在转载时以超链接形式标明文章原始出处和作者信息。

windows 7 ultimate product key

winrar download free

winzip registration code

winzip free download

winzip activation code

windows 7 key generator

winzip freeware

winzip free download full version

free winrar download

free winrar

windows 7 crack

windows xp product key

windows 7 activation crack

free winzip

winrar free download

winrar free

download winrar free

windows 7 product key