edsionte's TechBlog

No Pains, No Gains

Ubuntu下编译3.0.4内核

8 9 月, 2011 by edsionte 15 comments »

Linux内核3.0版本发布已有一段时间了，不知道这个版本号大跃进的内核是否好用。目前各个发行版的linux还仍未采用3.0的内核，因此可以自己动手编译内核来感受一下！趁着这次编译内核的机会可以再熟悉一下编译内核的步骤。

1.下载并解压内核到任意目录

从源码官网下载最新的内核源码3.0.4，可以解压至任意目录，我放在主目录下：

~$ tar xjvf linux-3.0.4.tar.bz2

2.配置内核

对内核进行配置是为了得到内核配置文件.config。通过对内核进行配置，可以使未来编译成功的内核增加或减少对一些内核特性的支持。对内核进行配置有多种方法，有基于文本的配置方式也有基于图形的用户界面。下面采用使用比较广泛的make menuconfig方式：

~/linux-3.0.4$sudo apt-get install libncurses5-dev
~/linux-3.0.4$sudo make menuconfig

由于该配置方式基于ncurses库，所以在启动配置界面前要先安装ncurses库。启动配置界面前，必须进入源码根目录，配置界面启动成功后如下图：

我们这里对内核按照默认的配置方式进行编译，因此当配置菜单启动后直接退出并保存即可。此时就在内核源码根目录下生成了.config文件。

3.编译

编译内核包含两部分的工作，其一是编译内核，即编译配置选项中标记为Y的那部分，这部分内核最终形成bzIamge镜像文件；其二是编译内核模块，即编译配置选项中标记为M的那部分内核，这部分形成以.ko结尾的内核模块目标文件。

上述两部分编译工作可以依次通过make bzImage和make modules完成，也可以通过一条make命令直接完成。编译内核的整个过程比较漫长，因此可以对make加-j参数来提高编译的效率。在make时使用该选项会为编译过程分配n个并发任务，这样可以缩短编译时间。n的取值为cpu个数的二倍。

~/linux-3.0.4$sudo make -j4

4.安装

安装过程分为两部分，首先对内核模块进行安装，这个过程会将刚刚编译内核模块时生成的内核模块复制到/lib/modules/3.0.4/目录下，其中3.0.4为对应的内核版本。使用的命令如下：

~/linux-3.0.4$sudo make modules_install

接着使用下述命令安装编译好的内核：

~/linux-3.0.4$sudo make install

安装内核的过程主要完成了以下的工作：

1.将编译内核时生成的内核镜像bzImage拷贝到/boot目录下，并将这个镜像命名为vmlinuz-3.0.4。如果使用x86的cpu，则该镜像位于arch/x86/boot/目录下（处于正在编译的内核源码下）。

2.将~/linux-3.0.4/目录下的System.map拷贝到/boot/目录下，重新命名为System.map-3.0.4。该文件中存放了内核的符号表。

3.将~/linux-3.0.4/目录下的.config拷贝到/boot/目录下，重新命名为config-3.0.4。

5.创建initrd.img文件

initrd.img即为初始化的ramdisk文件，它是一个镜像文件，将一些最基本的驱动程序和命令工具打包到镜像文件里。该镜像文件的作用是在系统还没有挂载根分区前，系统需要执行一些操作，比如挂载scsi驱动，此时将initrd文件释放到内存中，作为一个虚拟的根分区，然后执行相关脚本，运行insmod命令加载需要的模块。

具体的创建方法如下：

~/linux-3.0.4$sudo mkinitramfs 3.0.4 -o /boot/initrd.img-3.0.4

6.更新grub

最后一步则是更新grub启动菜单，使用下面的命令则可以自动更新启动菜单：

sudo update-grub2

这样会将刚才编译好的内核放在启动菜单的首位，如果需要修改启动菜单中默认系统的启动顺序，则修改/boot/grub/grub.cfg文件中的set default=的值即可。

OK，内核编译完毕。

15 comments »

Posted in 开发技术

Tags: linux 内核编译内核

在/etc/passwd中得到普通用户列表

7 9 月, 2011 by edsionte 11 comments »

/etc/passwd文件用来保存系统中当前所有的用户信息，该文件对所有用户都可见。在该文件中，每行信息代表一个用户。每个用户的信息由7部分组成：

用户名：加密后的用户密码：用户ID（UID）：用户所在组ID（GID）：用户全名以及用户信息：用户主目录：该用户登录时所用的命令解释器

在该文件中，有些用户并不是用户建立的，而是系统帐号。比如在上述passwd文件中，sys、bin等用户就是系统所保留的用户。

edsionte@edsionte-desktop:~$ cat /etc/passwd
root:x:0:0:root:/root:/bin/bash
daemon:x:1:1:daemon:/usr/sbin:/bin/sh
bin:x:2:2:bin:/bin:/bin/sh
sys:x:3:3:sys:/dev:/bin/sh
sync:x:4:65534:sync:/bin:/bin/sync
games:x:5:60:games:/usr/games:/bin/sh
…………
guest:x:1001:1001:guest,,,,:/home/guest:/bin/bash
lc:x:1002:1002:lc,,,,:/home/lc:/bin/bash

现在有一个项目需求，即从/etc/passwd文件中将普通用户的用户名解析出来。要完成这个要求，关键是找出系统用户和普通用户之间的差别。在useradd命令的man手册中关于-u选项有这样的描述：

-u uid 使用者的 ID 值。必须为唯一的 ID 值，除非用 -o 选项。数字不可为负值。预设为最小不得小于 999 而逐次增加。 0~ 999 传统上是保留给系统帐号使用。

因此，可以通过UID来区分普通用户和系统用户，即UID大于999的为普通用户，否则为系统用户。

后记：本文发出后，有几个朋友指出这个办法只适合ubuntu系统，因此希望大家注意使用范围。

11 comments »

Posted in 技术杂谈

Tags: linux 技术

线程那些事儿(2)-实践

5 9 月, 2011 by edsionte 无评论 »

在多线程程序中，一个新的线程通常由一个进程调用phtread_create()函数而诞生的。新线程创建后，通常将这个进程称为主线程。你也许会有所迷惑：一个进程怎么会编程线程？此刻有几个线程，几个进程？

其实通过上文对线程、轻量级进程以及线程组之间关系的理解后，这个问题似乎也不难回答。我们可以将所有的进程都看作一个线程组，只不过普通进程的线程组只包含它自己一个线程，它不能与其他线程共享资源，只能独享自己的资源（而成为进程）。

对于多线程程序来说，一旦在进程内创建了一个线程，那么该进程也就摇身变成了一个线程。主线程和子线程共享“以前”那个进程所独享的资源。主线程和子线程之间是并列关系，不存在类似fork()函数那样的父子进程关系，这也就是不将创建线程的进程称为父线程的原因。

如果你还对上述的描述有所疑惑，那么通过下面的实验结果可以理解的更加深刻。下述的程序就是一个普通的线程创建，只不过主线程和子线程增加了延时以方便我们查看实验结果。

int *thread(void* arg)
{
	pthread_t newthid;
	newthid = pthread_self();//get the current thread's id
	printf("this a new thread and thread ID is=%lu\n", newthid);
	sleep(500);
	return NULL;
}

int main()
{
	pthread_t thid;

	printf("main thread,ID is %lu\n", pthread_self());//get the main thread's id
	if (pthread_create(&thid, NULL, (void *)thread, NULL) != 0) {
		printf("thread creation failed\n");
		exit(1);
	}

	printf("my Id is %lu, new thread ID is %lu\n", pthread_self(), thid);
	sleep(1000);
	return 0;
}

我们带开一个终端（称为终端1）运行上述程序，再另一个终端（称为终端2）里使用ps -eLf命令查看系统当前的线程信息。

UID        PID  PPID   LWP  C NLWP STIME TTY          TIME CMD
edsionte  2210  2208  2210  0    1 09:10 pts/0    00:00:00 bash
edsionte  2429  2210  2429  0    2 09:52 pts/0    00:00:00 ./createthread
edsionte  2429  2210  2430  0    2 09:52 pts/0    00:00:00 ./createthread
edsionte  2431  2208  2431  5    1 09:52 pts/1    00:00:00 bash
edsionte  2449  2431  2449  0    1 09:52 pts/1    00:00:00 ps -eLf

请注意上述信息中三类ID信息：PID，PPID和LWP。LWP是轻量级进程的pid，NLWP为线程组中线程的个数。下面对上述的实验结果作以解释。

1.运行实验程序的终端对应的pid为2210；

2.我们的实验程序产生了两个线程，其pid都是2429。这说明这两个线程是并列关系，它们属于同一个线程组，该线程组的pid为2429。

3.实验程序产生的两个线程的PPID均为2210，再次说明这两个线程之间没有父子关系，他们的父亲均为终端1对应的进程。

4.每个线程都与一个轻量级进程关联，因此两个线程的LWP不同，分别为2429和2430。

5.这两个线程形成一个线程组，因此他们对应的NLWP为2。

6.通过pid，ppid和LWP的分配情况可以看到，内核对于进程和轻量级进程的id分配是统一管理的，这源于他们使用相同的数据结构task_struct。

上述分析基本上用实验结果诠释了进程、线程和轻量级进程之间的关系。

无评论 »

Posted in POSIX线程技术

Tags: POSIX线程线程轻量级进程

进程在Linux内核中的角色扮演

2 9 月, 2011 by edsionte 1 comment »

在Linux内核中，内核将进程、线程和内核线程一视同仁，即内核使用唯一的数据结构task_struct来分别表示他们；内核使用相同的调度算法对这三者进行调度；并且内核也使用同一个函数do_fork()来分别创建这三种执行线程（thread of execution）。执行线程通常是指任何正在执行的代码实例，比如一个内核线程，一个中断处理程序或一个进入内核的进程。

这样处理无疑是简洁方便的，并且内核在统一处理这三者之余并没有失去他们本身所具有的特性。本文将结合进程、线程和内核线程的特性浅谈进程在内核中的角色扮演问题。

1.进程描述符task_struct的多角色扮演

上述三种执行线程在内核中都使用统一的数据结构task_struct来表示。task_struct结构即所谓的进程描述符，它包含了与一个进程相关的所有信息。进程描述符中不仅包含了许多描述进程属性的字段，而且还有一系列指向其他数据结构的指针。下面将简单介绍进程描述符中几个比较特殊的字段，它们分别指向代表进程所拥有的资源的数据结构。

mm字段：指向mm_struct结构的指针，该类型用来描述进程整个的虚拟地址空间。

fs字段：指向fs_struct结构的指针，该类型用来描述进程所在文件系统的根目录和当前进程所在的目录信息。

files字段：指向files_struct结构的指针，该类型用来描述当前进程所打开文件的信息。

signal字段：指向signal_struct结构（信号描述符）的指针，该类型用来描述进程所能处理的信号。

对于普通进程来说，上述字段分别指向具体的数据结构以表示该进程所拥有的资源。

对应每个线程而言，内核通过轻量级进程与其进行关联。轻量级进程之所轻量，是因为它与其他进程共享上述所提及的进程资源。比如进程A创建了线程B，则B线程会在内核中对应一个轻量级进程。这个轻量级进程很自然的对应一个进程描述符，只不过B线程的进程描述符中的某些代表资源指针会和A进程中对应的字段指向同一个数据结构，这样就实现了多线程之间的资源共享。

由于内核线程只运行在内核态，并且只能由其他内核线程创建，所以内核线程并不需要和普通进程那样的独立地址空间。因此内核线程的进程描述符中的mm指针即为NULL。内核线程是否共享父内核线程的某些资源，则通过向内核线程创建函数kernel_thread()传递参数来决定。

通过上面的分析可以发现，内核中使用统一的进程描述符来表示进程、线程和内核线程，根据他们不同的特性，其进程描述符中某些代表资源的字段的指向会有所不同，以实现扮演不同角色。

2. do_fork()的多角色扮演

进程、线程以及内核线程都有对应的创建函数，不过这三者所对应的创建函数最终在内核都是由do_fork()进行创建的，具体的调用关系图如下：

从图中可以看出，内核中创建进程的核心函数即为看do_fork()，该函数的原型如下：

long do_fork(unsigned long clone_flags,
               unsigned long stack_start,
               struct pt_regs *regs,
               unsigned long stack_size,
               int __user *parent_tidptr,
               int __user *child_tidptr)

该函数的参数个数是固定的，每个参数的功能如下：

clone_flags：代表进程各种特性的标志。低字节指定子进程结束时发送给父进程的信号代码，一般为SIGCHLD信号，剩余三个字节是若干个标志或运算的结果。

stack_start：子进程用户态堆栈的指针，该参数会被赋值给子进程的esp寄存器。

regs：指向通用寄存器值的指针，当进程从用户态切换到内核态时通用寄存器中的值会被保存到内核态堆栈中。

stack_size：未被使用，默认值为0。

parent_tidptr：该子进程的父进程用户态变量的地址，仅当CLONE_PARENT_SETTID被设置时有效。

child_tidptr：该子进程用户态变量的地址，仅当CLONE_CHILD_SETTID被设置时有效。

既然进程、线程和内核线程在内核中都是通过do_fork()完成创建的，那么do_fork()是如何体现其功能的多样性？其实，clone_flags参数在这里起到了关键作用，通过选取不同的标志，从而保证了do_fork()函数实现多角色——创建进程、线程和内核线程——功能的实现。clone_flags参数可取的标志很多，下面只介绍几个与本文相关的标志。

CLONE_VIM：子进程共享父进程内存描述符和所有的页表。

CLONE_FS：子进程共享父进程所在文件系统的根目录和当前工作目录。

CLONE_FILES：子进程共享父进程打开的文件。

CLONE_SIGHAND：子进程共享父进程的信号处理程序、阻塞信号和挂起的信号。使用该标志必须同时设置CLONE_VM标志。

如果创建子进程时设置了上述标志，那么子进程会共享这些标志所代表的父进程资源。

2.1 进程的创建

在用户态程序中，可以通过fork()、vfork()和clone()三个接口函数创建进程，这三个函数在库中分别对应同名的系统调用。系统调用函数通过128号软中断进入内核后，会调用相应的系统调用服务例程。这三个函数对应的服务历程分别是sys_fork()、sys_vfork()和sys_clone()。

 int sys_fork(struct pt_regs *regs)
 {
         return do_fork(SIGCHLD, regs->sp, regs, 0, NULL, NULL);
 }

 int sys_vfork(struct pt_regs *regs)
 {
         return do_fork(CLONE_VFORK | CLONE_VM | SIGCHLD, regs->sp, regs, 0,
                        NULL, NULL);
 }

 long
 sys_clone(unsigned long clone_flags, unsigned long newsp,
           void __user *parent_tid, void __user *child_tid, struct pt_regs *regs)
 {
         if (!newsp)
                 newsp = regs->sp;
         return do_fork(clone_flags, newsp, regs, 0, parent_tid, child_tid);
 }

通过上述系统调用服务例程的源码可以发现，三个服务历程内部都调用了do_fork()，只不过差别在于第一个参数所传的值不同。这也正好导致由这三个进程创建函数所创建的进程有不同的特性。下面对每种进程作以简单说明。

fork()：由于do_fork()中clone_flags参数除了子进程结束时返回给父进程的SIGCHLD信号外并无其他特性标志，因此由fork()创建的进程不会共享父进程的任何资源。子进程会完全复制父进程的资源，也就是说父子进程相对独立。不过由于写时复制技术（Copy On Write，COW）的引入，子进程可以只读父进程的物理页，只有当两者之一去写某个物理页时，内核此时才会将这个页的内容拷贝到一个新的物理页，并把这个新的物理页分配给正在写的进程。

vfork()：do_fork()中的clone_flags使用了CLONE_VFORK和CLONE_VM两个标志。CLONE_VFORK标志使得子进程先于父进程执行，父进程会阻塞到子进程结束或执行新的程序。CLONE_VM标志使得子进程共享父进程的内存地址空间（父进程的页表项除外）。在COW技术引入之前，vfork()适用子进程形成后立马执行execv()的情形。因此，vfork()现如今已经没有特别的使用之处，因为写实复制技术完全可以取代它创建进程时所带来的高效性。

clone()：clone通常用于创建轻量级进程。通过传递不同的标志可以对父子进程之间数据的共享和复制作精确的控制，一般flags的取值为CLONE_VM|CLONE_FS|CLONE_FILES|CLONE_SIGHAND。由上述标志可以看到，轻量级进程通常共享父进程的内存地址空间、父进程所在文件系统的根目录以及工作目录信息、父进程当前打开的文件以及父进程所拥有的信号处理函数。

2.2 线程的创建

每个线程在内核中对应一个轻量级进程，两者的关联是通过线程库完成的。因此通过pthread_create()创建的线程最终在内核中是通过clone()完成创建的，而clone()最终调用do_fork()。

2.3 内核线程的创建

一个新内核线程的创建是通过在现有的内核线程中使用kernel_thread()而创建的，其本质也是向do_fork()提供特定的flags标志而创建的。

 int kernel_thread(int (*fn)(void *), void *arg, unsigned long flags)
 {
        /*some register operations*/
         return do_fork(flags | CLONE_VM | CLONE_UNTRACED, 0, &regs, 0, NULL, NULL);
 }

从上面的组合的flag可以看出，新的内核线程至少会共享父内核线程的内存地址空间。这样做其实是为了避免赋值调用线程的页表，因为内核线程无论如何都不会访问用户地址空间。CLONE_UNTRACED标志保证内核线程不会被任何进程所跟踪，

3. 进程的调度

由于进程、线程和内核线程使用统一数据结构来表示，因此内核对这三者并不作区分，也不会为其中某一个设立单独的调度算法。内核将这三者一视同仁，进行统一的调度。

参考资料：

1. 深入理解Linux内核

2. Linux内核设计与实现

1 comment »

Posted in Linux下C编程

Tags: task_struct 内核线程线程进程进程描述符

线程的那些事儿

28 8 月, 2011 by edsionte 10 comments »

1.线程

通过操作系统原理课，我们知道进程是系统资源分配的基本单位，线程是程序独立运行的基本单位。线程有时候也被称作小型进程，首先，这是因为多个线程之间是可以共享资源的；其次，多个线程之间的切换所花费的代价远远比进程低。

在用户态下，使用最广泛的线程操作接口即为POSIX线程接口，即pthread。通过这组接口可以进行线程的创建以及多线程之间的并发控制等。

2.轻量级进程

如果内核要对线程进行调度，那么线程必须像进程那样在内核中对应一个数据结构。进程在内核中有相应的进程描述符，即task_struct结构。事实上，从Linux内核的角度而言，并不存在线程这个概念。内核对线程并没有设立特别的数据结构，而是与进程一样使用task_struct结构进行描述。也就是说线程在内核中也是以一个进程而存在的，只不过它比较特殊，它和同类的进程共享某些资源，比如进程地址空间，进程的信号，打开的文件等。我们将这类特殊的进程称之为轻量级进程（Light Weight Process）。

按照这种线程机制的理解，每个用户态的线程都和内核中的一个轻量级进程相对应。多个轻量级进程之间共享资源，从而体现了多线程之间资源共享的特性。同时这些轻量级进程跟普通进程一样由内核进行独立调度，从而实现了多个进程之间的并发执行。

3.POSIX线程库的实现

用户线程和内核中轻量级进程的关联通常实在符合POSIX线程标准的线程库中完成的。支持轻量级进程的线程库有三个：LinuxThreads、NGPT（Next-Generation POSIX Threads）和NPTL（Native POSIX Thread Library）。由于LinuxThreads并不能完全兼容POSIX标准以及NGPT的放弃，目前Linux中所采用的线程库即为NPTL。

4.线程组

POSIX标准规定在一个多线程的应用程序中，所有线程都必须具有相同的PID。从线程在内核中的实现可得知，每个线程其实都有自己的pid。为此，Linux引入了线程组的概念。在一个多线程的程序中，所有线程形成一个线程组。每一个线程通常是由主线程创建的，主线程即为调用pthread_create()的线程。因此该线程组中所有线程的pid即为主线程的pid。

对于线程组中的线程来说，其task_struct结构中的tpid字段保存该线程组中主线程的pid，而pid字段则保存每个轻量级进程的本身的pid。对于普通的进程而言，tgid和pid是相同的。事实上，getpid()系统调用中返回的是进程的tgid而不是pid。

5.内核线程

上面所描述的都是用户态下的线程，而在内核中还有一种特殊的线程，称之为内核线程（Kernel Thread）。由于在内核中进程和线程不做区分，因此也可以将其称为内核进程。毫无疑问，内核线程在内核中也是通过task_struct结构来表示的。

内核线程和普通进程一样也是内核调度的实体，只不过他们有以下不同：

1).内核线程永远都运行在内核态，而不同进程既可以运行在用户态也可以运行在内核态。从另一个角度讲，内核线程只能之用大于PAGE_OFFSET（即3GB）的地址空间，而普通进程则可以使用整个4GB的地址空间。

2).内核线程只能调用内核函数，而普通进程必须通过系统调用才能使用内核函数。

edsionte's TechBlog

Ubuntu下编译3.0.4内核

1.下载并解压内核到任意目录

2.配置内核

3.编译

4.安装

5.创建initrd.img文件

6.更新grub

在/etc/passwd中得到普通用户列表

线程那些事儿(2)-实践

进程在Linux内核中的角色扮演

1.进程描述符task_struct的多角色扮演

2. do_fork()的多角色扮演

2.1 进程的创建

2.2 线程的创建

2.3 内核线程的创建

3. 进程的调度

线程的那些事儿

1.线程

2.轻量级进程

3.POSIX线程库的实现

4.线程组

5.内核线程

本博客中的所有文字、图片及代码均可任意转载，但是请在转载时以超链接形式标明文章原始出处和作者信息。

windows 7 ultimate product key

winrar download free

winzip registration code

winzip free download

winzip activation code

windows 7 key generator

winzip freeware

winzip free download full version

free winrar download

free winrar

windows 7 crack

windows xp product key

windows 7 activation crack

free winzip

winrar free download

winrar free

download winrar free

windows 7 product key