edsionte's TechBlog

No Pains, No Gains

Archive for the ‘文件系统’ category

open()在Linux内核的实现(6)-打开操作分析

19 4 月, 2015

1.基本说明

当link_path_walk()进行完毕之后，也就意味着文件路径的查找位于最后一个目录项中，这个目录项是否存在目前还不明确，因为还需要配合用户使用open()时所传递的参数，有可能是打开已存在文件，有可能是创建新文件。

2.函数分析

2.1.do_last()

在path_openat()中，经过link_path_walk()对open路径的查找，将进入do_last()对路径中最后一个目录项做处理。最后一个目录项可能是各种类型，比如“.”或者“..”，也可能是符号链接文件或者是“/”，在此将对普通目录项（LAST_NORM）所进行的处理进行说明。

对于open系统调用来说，flags参数通过取不同的值可以进行不同的操作，下面将针对open最常用的两种操作进行说明，即打开文件和创建文件。

2.1.1.打开文件

如果使用open系统调用的作用仅仅是打开文件，那么flags中必然不会存在O_CREAT标志，基本步骤如下：

1.通过walk_component()对最后一个目录项进行查找。walk_component()首先在rcu模式下对目录项进行查找，如果查找失败则进行ref模式下的目录项查找。如果两种方式均查找失败，则返回值小于0；如果当前目录项为符号链接文件，则返回1，该函数将直接返回到path_openat()中，进而通过follow_link()进行处理；如果查找成功，则跳至ok标号处；

2.完成最后一个目录项的查找工作，即将进行真正的打开操作。不过，在这之前还需要通过may_open()对当前inode的权限和标志位进行检查；

3.如果一切顺利，则通过nameidata_to_filp()执行打开操作；

4.返回file结构。

2.1.2.创建文件

如果创建一个文件，那么flags必然设置标志O_CREAT。基本步骤如下：

1.首先会检查最后一个目录项是否以“/”结尾，如果是，则直接错误返回。否则，继续进行；

2.通过lookup_hash()对最后一个目录项进行查找，这个查找函数将返回一个dentry。如果最后一个目录项确实存在，那么dentry->d_inode不为空，那么说明要创建的这个文件事先是存在的。此时先进行标志位的判断，比如如果用户设置了O_EXCL标志，那么此时就不必继续进行直接错误返回。如果标志检查一切成功，则进行步骤4；否则，dentry->d_inode将为空，继续进行；

3.当最后一个目录项inode为空时，那么需要通过vfs_create()调用具体文件系统的create钩子函数创建这个文件；

4.通过may_open()检查inode标志位和权限的合法性；

5.通过nameidate_to_flip()调用具体文件系统的open钩子函数进行文件的打开工作；

6.返回file。

3.总结

通过前面的系列文章，说明了open()在Linux内核实现。事实上，这仅仅反映的是它在在虚拟文件系统的实现过程，主要涉及的内容为对路径的查找。最终，文件的打开操作必须经过具体文件系统的实现，虽然每个文件系统具体实现不同，但是他们的输入输出都将受到虚拟文件系统的限制保持一致。

参考资料：

1.Linux源码3.2.69；

2.Linux系统调用open七日游：http://blog.chinaunix.net/uid-20522771-id-4419666.html

3.深入理解Linux内核：http://book.douban.com/subject/2287506/；

4.深入Linux内核架构：http://book.douban.com/subject/4843567/；

5.Linux内核探秘：http://book.douban.com/subject/25817503/；

无评论 »

Posted in Linux内核源码分析, 文件系统

open()在Linux内核的实现(5)-符号链接目录项的处理

20 3 月, 2015

1.基本说明

在open()的路径查找过程中，walk_component()的作用就是对具体的目录项进行处理。它通过handle_dots()处理LAST_DOT和LAST_DOTDOT类型的目录项，通过do_lookup()处理非LAST_DOT和LAST_DOTDOT类型的目录项。当经过了do_lookup的处理后，还需要通过should_follow_link()检查当前的目录项是否是符号链接。

如果当前的目录项具备符号链接特性，那么内核将试图通过unlazy_walk()将当前的rcu-walk切换到ref-walk。因为处理处理符号链接文件会使用实体文件系统的钩子函数follow_link()，这个函数可能会引起阻塞，因此必须切换到允许阻塞的ref-walk模式。如果切换失败，则返回-ECHILD，即返回值do_filp_open()处，将重新以ref-walk方式执行打开操作；否则，walk_component()将返回1，那么调用它的link_path_walk()将通过nested_symlink()处理符号链接文件。

2.函数分析

2.1.nested_symlink()

该函数声明如下：

static inline int nested_symlink(struct path *path, struct nameidata *nd);

符号链接的处理过程并不复杂，但需要清楚link_count和total_link_count两个关键的变量的含义。这两个变量均来自当前进程描述符current中，前者表示当前符号链接连续嵌套的次数，后者表示一个路径中符号链接的总数。这两个计数均有最大限制，link_count最大不能超过MAX_NESTED_LINKS（默认为8）,total_link_count最大不能超过40。

该函数的主要处理流程如下：

1.首先检查link_count是否超过了限制，如果超过限制则向上返回ELOOP错误；

2.如果一切正常，则nd和current同时更新嵌套计数器；

3.为了对符号链接文件嵌套情况的处理，接下来将进入循环处理过程。每次处理过程都首先通过follow_link()获取当前目录项所指文件，返回最后该文件路径的最后一个目录项；并且通过walk_component()更新nd；特殊情况下，当前目录项（即当前正在处理的符号链接文件的最后一个目录项）所指的文件仍然是个符号链接文件，因此walk_componet()将返回1，因此继续执行循环体，直至遇到非符号链接文件；

4.当本次的符号链接文件获取到最终的目标时，对nd和current的嵌套计数进行减一操作；

5.结束；

2.2.follow_link()

该函数声明如下：

static __always_inline int
follow_link(struct path *link, struct nameidata *nd, void **p);

该函数的作用是对这个符号链接文件所指的目标文件进行“一探究竟”，通过对目标文件进行查找操作进而更新nd。主要操作包含以下内容：

1.首先判断total_link_count是否超过了最大限制；

2.通过cond_resched()进行一次进程调度。通过walk_component()中的解释可知，只要某个目录项为符号链接文件，那么当前的walk模式肯定为ref，由于当前进程一开始处于rcu模式下，可能导致某些进程抢占失败，因此这里有必要进行一次进程调度；

3.对current进行total_link_count加一操作；

4.通过nd_set_link()对当前nd中saved_names[nd->depth]字段进行置空操作；

5.设置当前目录项的类型为LAST_BIND；

6.通过当前目录项中follow_link钩子函数进行符号链接文件的跟随操作，即将这个符号链接文件所指的目标文件路径返回至saved_names[nd->depth]中；

7.如果获取目标文件路径成功，则通过__vfs_follow_link()对这个目标文件路径进行全新的查找；

2.3.__vfs_follow_link()

该函数是对link_path_walk()的再次封装，其声明如下：

static int __vfs_follow_link(struct nameidata *nd, const char *link);

这种封装其实是合理的，因为既然对目标文件路径进行一个全新的查找工作，那可以使用前面的link_path_walk()函数，因为这个函数本身就是对路径的查找。

这里举个简单的例子（示例1）说明这种函数的调用情况。比如存在路径“/home/edsionte/files/abc/”，简称路径A，其中files目录是一个符号链接文件，其指向”/home/wang/test/exe/”目录（简称路径B，exe和test为普通目录）。如果要open路径A，那么简单的处理步骤是：

1.通过link_path_walk对路径A进行查找;

2.当walk_component()进行到files目录项时，发现其为符号链接文件，那么将通过nested_symlink()对这个目录项进行处理;

3.nested_symlink()中的follow_link()发现files指向的文件路径为路径B。为了检查路径B的合法性以及更新nd等信息，将通过__vfs_follow_link()对路径B进行查找工作；

4.调用link_path_walk()对路径B进行遍历，最终获取路径B的最后一个目录项exe；

5.nested_symlink()将执行walk_component()，并确定路径B最后的目录项test不是符号连接文件，因此退出nested_symlink()；返回路径A的link_path_walk()；

6.关于路径A的查找工作完毕；

特殊情况下（示例2），如果上述示例1中的路径B中，test目录同样为符号链接文件，并且指向名为C的路径“/home/tian/bin/”，其中，bin为普通目录；那么open路径A这个操作将会多一轮的处理流程。基于上述的处理流程步骤如下：

1.通过link_path_walk对路径A进行查找;

2.当walk_component()进行到files目录项时，发现其为符号链接文件，那么将通过nested_symlink()对这个目录项进行处理;

3.follow_link()发现files指向的文件路径为路径B。为了检查路径B的合法性以及更新nd等信息，将通过__vfs_follow_link()对路径B进行查找工作；

4.调用link_path_walk()对路径B进行遍历，当walk_component()进行至B中的test目录项时，由于其为符号链接文件，因此将调用nested_symlink()；

5.nested_symlink()处理目录项test，由于test指向的路径C中所有目录项都是非符号链接文件，因此循环体执行一次，最终返回C的最后一个目录项bin至路径B的link_path_walk()中；

6.路径B的link_path_walk()继续进行，直至遍历到最后一个目录项exe；它将返回到3中的follow_link()中，接着执行walk_component()发现exe为普通目录项，则nested_symlink()结束；

7.路径A的link_path_walk()继续对路径A的下一个目录项abc进行walk_component();

通过上述示例可以看出，符号链接文件的嵌套数并不是指link_path_walk()的嵌套调用数目，而是指nested_symlink()的调用数。只有当符号链接文件（路径A）所指的文件（路径B）中依旧存在符号链接（指向路径C）时，才会出现nested_symlink()的嵌套。

3.总结

符号链接文件的处理方式比较特殊，但是本质的实现还是基于link_path_walk()，该函数是整个路径查找框架中的基础实现。对于一个路径来说，经过link_path_walk()的处理，nd将保存最后一个目录项的信息，但是最后一个目录项代表的文件（或目录）是否存在并不知晓，需要通过调用link_path_walk()的path_openat()做最后的处理。

参考资料：

1.Linux源码3.2.69；

2.Linux系统调用open七日游：http://blog.chinaunix.net/uid-20522771-id-4419666.html

3.深入理解Linux内核：http://book.douban.com/subject/2287506/；

4.深入Linux内核架构：http://book.douban.com/subject/4843567/；

5.Linux内核探秘：http://book.douban.com/subject/25817503/；

无评论 »

Posted in Linux内核源码分析, 文件系统

Tags: nested_symlink 符号连接文件路径查找

open()在Linux内核的实现(4)-普通目录项的处理

3 3 月, 2015

1.基本说明

在open()的路径查找过程中，walk_component()将对路径中的每个目录项进行遍历，当目录项为普通目录项时，将通过do_lookup()对其进行查找。在路径查找过程中，普通目录项算是比较常见的，因此更应该采取高效的方法节省查找时间。

为了提高查找效率，内核通过rcu-walk方式避免ref-walk由于锁机制而引入的阻塞问题；其次，内核通过dentry缓存的方式将目录项以哈希表的方式组织起来，以便提高查找效率。这两种方式在一定程度上可以提高路径查找的效率，不过它们并不是适合所有情况。比如，rcu-walk方式不能使用可能会引起阻塞的函数，有时候要查找的目录项并不位于缓存当中而只能从磁盘上获取信息。

由于上述提高查找效率的方式可能会查找失败，因此内核一般会经过多次目录项的查找。也就是说，内核会先进行高效的查找方式，如果在这种模式下查找失败，那么再进行传统的查找方式，保证查找工作的正常进行。具体的，内核会先进行rcu-walk方式，如果查找失败，则进行ref-walk方式；内核会优先在目录项缓存中进行快速的查找，如果查找失败，则通过访问磁盘进行慢速的查找。

2.函数实现

2.1.do_lookup()

内核通过do_lookup()进行普通目录项的查找工作。该函数声明如下：

tatic int do_lookup(struct nameidata *nd, struct qstr *name,
	struct path *path, struct inode **inode);

这个函数主要通过区分不同的情景来选择对应的查找方式。总体来说，先以rcu-walk方式在目录项缓存中查找，如果成功，则查找结束返回；否则，将rcu-walk切换到ref-walk模式；ref-walk模式下会先进行目录项缓存的查找，如果查找成功，则返回；否则，进行ref-walk下的磁盘查找；如果成功，则返回，否则，查找失败并返回错误码ENOENT；该错误码对应到用户态即为“No such file or directory”。

如果以rcu-walk模式进入该函数，则主要的查找步骤如下：

1.如果当前是rcu-walk模式（设置了LOOKUP_RCU），则先通过__d_lookup_rcu在目录项缓存中查找；

2.如果查找失败，则跳入unlazy标号处；如果查找成功，则继续；

3.通过follow_mount_rcu()判断当前的目录项是否为挂载点，如果是，则跨越挂载点；否则继续；

4.如果rcu-walk方式下查找缓存成功，则返回0；否则，进入unlazy标号；

5.unlazy标号是将当前的rcu-walk切换成ref-walk模式；如果切换成功，则继续；否则，返回ECHILD。即返回到do_filp_open()处，重新进行ref模式的查找；

6.当前查找模式为ref-walk，并且此时在缓存中并未找到对应的目录项；那么接下来必须试图在磁盘上进行查找了。不过在进行磁盘查找之前，还是会再次调用d_lookup()进行一次内存查找，因为retry标号下的代码有互斥锁，很可能该函数再此处会阻塞，而在阻塞阶段就目标目录项就有可能被载入内存，这样就可以省去在磁盘上查找目录项的工作；

7.如果d_lookup()查找成功，则继续；否则，通过d_alloc_and_lookup()分配并在磁盘上查找dentry；具体的，调用当前文件系统的lookup钩子函数；如果磁盘查找失败，则错误返回；否则，继续；

8.此时，已获取到要查找的目录项；则再通过follow_managed()对当前目录项进行检查，比如，检查当前目录项是否为挂载点；

9.获取当前目录项对应的inode信息；

10.返回；

如果以ref-walk模式进入该函数，则首先会通过__d_lookup()在目录项缓存中查找；如果查找成功，则接下来的步骤与rcu-walk步骤8-10相同；如果查找失败，则接下来的步骤与rcu-walk步骤6-10相同。

3.总结

普通目录项的查找工作其实并不复杂，无非是在内存中查找或在磁盘中查找。只不过，内核为了提高路径查找效率同时引入了rcu-walk方式，从而增加了代码分析的复杂度。如果当前目录项为符号链接文件，则内核的处理方式又是另一种方式，具体的实现过程可参见本系列的下一篇文章。

参考资料：

1.Linux源码3.2.69；

2.Linux系统调用open七日游：http://blog.chinaunix.net/uid-20522771-id-4419666.html

3.深入理解Linux内核：http://book.douban.com/subject/2287506/；

4.深入Linux内核架构：http://book.douban.com/subject/4843567/；

5.Linux内核探秘：http://book.douban.com/subject/25817503/；

1 comment »

Posted in Linux内核源码分析, 文件系统

Tags: do_lookup 文件系统路径查找

open()在Linux内核的实现(3)-“.”和“..”的处理

17 2 月, 2015

1.基本说明

open()在内核的实现过程中，有一大部分工作都是路径查找。路径查找即对用户态传入的文件路径以目录项为单位进行依次遍历。目录项包含五种类型，当目录项为”.”（LAST_DOT）或者“..”(LAST_DOTDOT)，那么walk_component()将通过handle_dots()对其进行处理。

实际上，如果当前目录项为“.”，那么该函数什么也不做直接返回（返回到link_path_walk中）即可。也就是说，如果当前目录项为”.”，那么walk_component()此时的作用就是“越过”这些当前目录，而nd信息不做改变，因为所有“.”之前的普通目录项已经更新了nd。比如/home/edsionte/./././doc，目录项edsionte之后的“.”对应的nd与edsionte目录项相同，因此walk_component()在遇到“.”时直接越过他们，进而处理doc目录项。

如果当前目录项为“..”，即当前要walk的目录项为上一次已经walk的目录项的父目录，也就是需要向上获取当前目录的父目录。

2.函数实现

2.1.handle_dots()

该函数的实现比较简单，内部根据当前的walk类型做了函数分发。

static inline int handle_dots(struct nameidata *nd, int type);

如果当前搜索路径的模式位rcu，则进入follow_dotdot_rcu()的流程；否则进入follow_dotdot()的流程。

2.2.follow_dotdot_rcu()

该函数的声明如下：

static int follow_dotdot_rcu(struct nameidata *nd);

该函数是在rcu模式下获取父目录项信息，如果搜索成功，则返回0；否则，返回ECHILD，也就是说需要切换到ref-walk方式下进行搜索路径。该函数的主要处理过程如下：

1.如果有需要的话，首先通过set_root_rcu()设置当前路径的根目录信息。可以在path_init()中获知，只有搜索路径是绝对路径，nd中的root才会在一开始就被设置；否则，比如是相对路径，那么这里就必须对根目录进行设置了。因为此处是向上搜索，可能会一直找到根目录处。

2.进入循环体，向上获取当前目录项的父目录项。通过情况下，这个循环体只会被执行一次即退出，只有当父目录项为一个挂载点时才有可能不断进行循环。

3.如果退出循环体，至此已经获取到了当前目录项的上一级目录项（即“..”所代表的父目录项）。

4.如果这个父目录项是一个挂载点，那么还需做一些特殊检查。因为在特殊情况下，当前这个父目录项又被挂载了其他的文件系统，那么返回上级目录这个操作获取的应该是最新文件系统的内容而不是之前那个文件系统的内容。通过__lookup_mnt()检查父目录下挂载的文件系统是否为最新的文件系统，如果是则检查结束；否则，将继续检查；

5.更新nd中的inode，并返回；

在循环体中，可能会出现三种情况：

a.如果当前目录项恰好为根目录目录项，则直接跳出循环；比如在根目录下执行“cd ../../../”;

b.如果当前目录项既不是根目录，也不是一个挂载点，则属于最普通的情况，即直接获取当前目录项的父目录项。方法很简单，直接用当前目录项的parent（nd->path.dentry->d_parent）覆盖当前的nd结构中的path.dentry即可；

c.如果当前目录项代表的是当前文件系统的根目录，则不能通过简单的获取当前目录项parent这种方法，因为获取的parent为“/”（当然指的是当前文件系统的根目录）。此时需要通过follow_up_rcu()对nd->path进行填充。如果follow_up_rcu()返回1，则循环继续；返回0，则结束循环；

2.3.follow_up_rcu()

如果“..”所代表的目录项正好是一个挂载点时，那么需要将当前的遍历从当前的文件系统向上（follow up）切换到父文件系统。该函数的声明如下：

static int follow_up_rcu(struct path *path);

既然是向上跨越到父文件系统，那么首先将父文件系统的挂载点对应的dentry（nd->path->mnt->mnt_mountpoint）赋值给当前nd中对应的dentry（nd->path->dentry）。因为这个挂载点也就是“..”对应的目录项，挂载点本质也就是个目录。

其次，将父文件系统的vfsmount结构（nd->path->mnt->mnt_parent）复制给当前nd中对应的mnt项（nd->path->mnt）。

通过以上两个步骤，即将当前的walk位置向上移动到父文件系统中的一个目录上。

下面通过举例说明上述过程。假设存在路径/home/edsionte/work，其中fs1文件系统下有目录/home/edsionte/work，文件系统fs2挂载在work目录下，即fs2的挂载点为work。假设work下有文件w1和file，在/home/edsionte/work/file目录下，用户访问的路径为“../w1”，则“..”对应的dentry即为fs2文件系统根目录，则需要跨越到fs1文件系统中。“跨越”操作首先是将当前dentry指向work，也就是下次将要在work目录下寻找w1文件；其次，需要改变当前文件系统状态，即通过替换vfsmount来体现。

完成以上操作，将返回1。也就是说，必须再进行一次follow_dotdot_rcu()中的循环过程，因为follow_up_rcu()完成的只是文件系统的跨越，跨越完毕后必须进行follow_dotdot_rcu()中的循环体工作。

更特殊的是，跨越文件系统之后的这个目录项很可能又是一个挂载点，那么又必须进入follow_up_rcu()中执行上述操作。只有当当前文件系统的挂载点就是自己的时候，即跨越到根文件系统的时候，该函数返回0，那么返回到上级函数follow_dotdot_rcu()中的循环体时，也将结束整个循环过程。

下面再通过举例说明follow_dotdot_rcu()中循环体反复执行的例子。假设fs1文件系统存在路径/home/edsionte/work，首先将fs2文件系统挂载于work下，再将fs3挂载在work下，那么此时fs3对应的父vfsmount为fs2对应的结构；再将fs4文件系统挂载在wrok下，那么fs4指向fs3。此刻，/home/edsionte/work可以访问fs4的内容，而其他之前挂载在这里的文件系统将被隐藏。假设用户在wrok目录下执行“cd ../”，用户想得到的结果是fs1文件系统下edsionte/下的内容。而此刻work位于fs4中，那么他必须向上逐步跨越文件系统，即fs4通过follow_up_rcu()跨越到父文件系统fs3，fs3再跨越到fs2，fs2再跨越到fs1。

2.4.follow_dotdot()

follow_dotdot()和follow_dotdot_rcu()的实现方式几乎一致，只不过该函数在内部实现上使用了读写锁。具体的，主要体现在follow_up()和follow_mount()两个函数的内部，它们的实现过程中均使用了读写锁，这在rcu-walk中是不允许的。

3.总结

本文针对open()在内核中的路径查找过程进行简单说明，并集中关注了“..”这个特殊的目录项。LAST_DOTDOT类型的目录项之所以特殊是由于它向上（follow up）的查找过程与当前所位于的路径查找过程（向下，follow down）相反，同时还会涉及到文件系统挂载点。如果您想了解其他类型目录项的查找过程，可以阅读本系列其他文章。

参考资料：

1.Linux源码3.2.69；

2.Linux系统调用open七日游：http://blog.chinaunix.net/uid-20522771-id-4419666.html

3.深入理解Linux内核：http://book.douban.com/subject/2287506/；

4.深入Linux内核架构：http://book.douban.com/subject/4843567/；

5.Linux内核探秘：http://book.douban.com/subject/25817503/；

无评论 »

Posted in Linux内核源码分析, 文件系统

Tags: open实现相对路径路径查找

open()在Linux内核的实现(2)-路径查找

10 2 月, 2015

1.基本说明

文件的打开操作在内核中的实现思路很简单：即通过用户态传递的路径逐项查找文件；如果该文件存在，那么内核将为该文件创建file结构；同时将该file结构与files数组关联，最终返回数组的索引作为用户态的文件描述符。

路径查找是对给定的文件路径以目录项为单位进行逐级解析。主要包括以下几项内容：

1.确定路径查找的起始位置。比如，起始位置可能是current->fs->cwd或current->fs->root；

2.当前进程是否有对目录项关联的inode进行访问的权限；

3.根据当前的目录项，对下一级目录项进行查找；这里的查找可能是向下查找子文件，也可能是向上反查父目录（比如下一级目录项为“..”）；

4.处理挂载点问题；当前目录项如果是挂载点，那么必须处理不同文件系统之间的跨越；

5.处理符号链接文件；如果当前目录项为一个符号链接文件，那么必须追随（follow）该文件所指向的真实文件；

6.查找并创建文件路径中所缺失的部分；比如，通过open()创建一个新文件时，那么所传递的路径中可能有部分目录项当前是不存在的；

其中，第1项是路径查找的首要工作；2~6项是在路径查找过程中，针对每个目录项进行检查确认的。

负责open系统调用基本实现的是do_sys_open()，其内部所调用的do_filp_open函数承担了大部分open的实现过程，其中就包括路径查找。

2.函数分析

2.1.do_filp_open

open操作的核心函数为do_filp_open，它解析文件路径并新建file结构。该函数内部创建nd变量，传入并调用了path_openat()。nameidata类型的nd在整个路径查找过程中充当中间变量，它既可以为当前查找输入数据，又可以保存本次查找的结果。

struct file *do_filp_open(int dfd, const char *pathname,
		const struct open_flags *op, int flags)
{
	struct nameidata nd;
	struct file *filp;

	filp = path_openat(dfd, pathname, &nd, op, flags | LOOKUP_RCU);
	if (unlikely(filp == ERR_PTR(-ECHILD)))
		filp = path_openat(dfd, pathname, &nd, op, flags);
	if (unlikely(filp == ERR_PTR(-ESTALE)))
		filp = path_openat(dfd, pathname, &nd, op, flags | LOOKUP_REVAL);
	return filp;
}

在这个函数中，path_openat有可能会被调用三次。通常内核为了提高效率，会首先在RCU模式（rcu-walk）下进行文件打开操作；如果在此方式下打开失败，则进入普通模式（ref-walk）。第三次调用比较少用，目前只有在nfs文件系统才有可能会被使用。接下来将主要说明前两种调用方式。

2.2.path_openat

path_openat()其函数声明如下：

static struct file *path_openat(int dfd, const char *pathname,
		struct nameidata *nd, const struct open_flags *op, int flags);

该函数描述了整个路径查找过程的基本步骤，这里做简单说明。每个具体步骤的实现过程，将在本文以及后续文章中做详析说明。

1.首先通过get_empty_flip()分配一个新的file结构，分配前会对当前进程的权限和文件最大数进行判断；

2.path_init()对接下来的路径遍历做一些准备工作，主要用于判断路径遍历的起始位置，即通过根目录/，或当前路径（pwd），或指定路径（openat系统调用可以指定）；

3.将当前进程的total_link_count置为0；

3.link_path_walk()对所打开文件路径进行逐一解析，每个目录项的解析结果都存在nd参数中；

4.根据最后一个目录项的结果，do_last()将填充filp所指向的file结构；

5.如果上一步中的filp所指为空，将说明当前文件为符号链接文件；

6.如果设置了LOOKUP_FOLLOW标志，则通过follow_link()进入符号链接文件所指文件，填充file；否则，直接返回当前符号链接文件的filp；

7.最终返回file结构；

2.3.path_init

path_init()用于设置路径搜寻的起始位置，主要体现在设置nd变量。其函数声明如下：

static struct file *path_openat(int dfd, const char *pathname,
		struct nameidata *nd, const struct open_flags *op, int flags);

如果flags设置了LOOKUP_ROOT标志，则表示该函数被open_by_handle_at函数调用，该函数将指定一个路径作为根；这属于特殊情况，这里暂不分析；接下来path_init主要分三种情况设置nd。

1.如果路径名name以/为起始，则表示当前路径是一个绝对路径，通过set_root设置nd；否则，表示路径name是一个相对路径；

2.如果dfd为AT_FDCWD，那么表示这个相对路径是以当前路径pwd作为起始的，因此通过pwd设置nd；

3.如果dfd不是AT_FDCWD，表示这个相对路径是用户设置的，需要通过dfd获取具体相对路径信息，进而设置nd；

上述步骤2和3都表示要打开的文件路径是以相对路径为起始的，但是两者稍有不同。步骤2为我们通常默认的open操作，而步骤3具体指的是openat系统调用，这一点体现在不同打开系统调用向do_sys_open中dfd参数所传递的值。

不管上述哪一种打开情况，均要设置nd变量，它是一个nameidata类型。在path_init中，nd的last_type都被默认设置成了LAST_ROOT。

在path_init中，如果为上述步骤1，则通过当前进程的fs->root字段更新nd的root字段，并且nd的path字段也指向root字段；如果为步骤2，则通当前进程fs->pwd更新nd的path字段；如果为步骤3，则先通过文件描述符dfd获取用户指定的工作目录file结构，然后通过file的f_path字段更新nd的path字段。需要注意的，步骤2和步骤3均未设置root字段。最终，nd中的inode字段均由path.dentry->d_inode更新。

2.4.link_path_walk

link_path_walk()主要用于对各目录项逐级遍历。其函数声明如下：

static int link_path_walk(const char *name, struct nameidata *nd);

该函数核心部分是通过一个循环完成的。在进入这个循环之前，如果路径name是一个绝对路径，那么该函数还对路径进行了一些处理，即过滤掉绝对路径/前多余的符号/。

在循环中，所要做的工作包含如下：

1.next为path类型的变量，指向下一个目录项；name指向被搜索的路径；this为qstr类型变量，表示当前搜索路径所处目录项的哈希值，用type指明当前目录项类型；

2.如果有必要，为当前目录项更新哈希值，并保存在this中；

3.如果当前目录项为“.”，则type为LAST_DOT；如果目录项为“..”，则type为LAST_DOTDOT；否则，type默认为LAST_NORM；

4.如果当前目录项紧邻的分隔符/有多个（比如/home///edsionte），则将其过滤，即使name指向最后一个/；

5.通过walk_component()处理当前目录项，更新nd和next；如果当前目录项为符号链接文件，则只更新next；

6.如果当前目录项为符号链接文件，则通过nested_symlink()进行处理，更新nd；

7.如果name中的目录项遍历完毕，则结束；否则进行下一轮循环；

通过上述循环，将用户所指定的路径name从头至尾进行了搜索，至此nd保存了最后一个目录项的信息，但是内核并没有确定最后一个目录项是否真的存在，这些工作将在do_last()中进行。

2.5.walk_component

walk_component()位于link_path_walk函数之中。该函数声明如下：

static inline int walk_component(struct nameidata *nd, struct path *path,
		struct qstr *name, int type, int follow)

在每次循环中，它将获取当前目录项的dentry结构以及inode结构等信息，即更新nd。如果当前目录项对应的inode不存在，那么将向用户态返回ENOENT；在该函数中，定义了变量inode，它将保存当前目录项对应的索引节点。

根据当前目录项类型的不同，对目录项的处理流程也不同。该函数的具体流程如下：

1.如果type为LAST_DOT和LAST_DOTDOT，将进入handle_dots()对当前目录项进行“walk”；

2.如果当前目录项为普通目录项，则通过do_lookup()对其进行处理；

3.如果should_follow_link()获知当前目录项为符号链接文件，则退出当前函数。具体的，如果当前walk模式为rcu，则直接返回-ECHILD，否则返回1。返回-ECHILD时候，将直接返回到do_filp_open()，进行ref-walk模式重新查找；如果返回1，则返回至上层函数link_path_walk()，进入netsted_symlink()进行符号链接目录项的处理；

也就是说，一旦当前目录项为符号链接文件，则需要通过ref-walk进行处理。这是因为处理符号链接文件需要通过具体文件的处理函数进行实现，这个过程可能会导致阻塞，这与rcu方式是违背的，因此需要先转换到ref-walk；

4.至此，如果当前目录项查找成功，则通过path_to_nameidata()更新nd；

3.总结

本文重点说明了open实现过程中的路径查找过程。open中的路径查找是针对用户所传递路径，按照目录项逐级进行遍历查找；对于路径中的每个目录项，不同类型的目录项有不同的处理方法。如果需要了解对“.”、“..”以及符号连接文件的处理方法，可以阅读本系列后续文章。

参考资料：

1.Linux源码3.2.69；

2.Linux系统调用open七日游：http://blog.chinaunix.net/uid-20522771-id-4419666.html

3.深入理解Linux内核：http://book.douban.com/subject/2287506/；

4.深入Linux内核架构：http://book.douban.com/subject/4843567/；

5.Linux内核探秘：http://book.douban.com/subject/25817503/；

无评论 »

Posted in Linux内核源码分析, 文件系统

Tags: path_walk 源码分析路径查找

Back to Top

Valid XHTML 1.0 Transitional | Valid CSS 3

edsionte's TechBlog

Archive for the ‘文件系统’ category

open()在Linux内核的实现(6)-打开操作分析

1.基本说明

2.函数分析

2.1.do_last()

3.总结

open()在Linux内核的实现(5)-符号链接目录项的处理

1.基本说明

2.函数分析

2.1.nested_symlink()

2.2.follow_link()

2.3.__vfs_follow_link()

3.总结

open()在Linux内核的实现(4)-普通目录项的处理

1.基本说明

2.函数实现

2.1.do_lookup()

3.总结

open()在Linux内核的实现(3)-“.”和“..”的处理

1.基本说明

2.函数实现

2.1.handle_dots()

2.2.follow_dotdot_rcu()

2.3.follow_up_rcu()

2.4.follow_dotdot()

3.总结

open()在Linux内核的实现(2)-路径查找

1.基本说明

2.函数分析

2.1.do_filp_open

2.2.path_openat

2.3.path_init

2.4.link_path_walk

2.5.walk_component

3.总结

本博客中的所有文字、图片及代码均可任意转载，但是请在转载时以超链接形式标明文章原始出处和作者信息。

windows 7 ultimate product key

winrar download free

winzip registration code

winzip free download

winzip activation code

windows 7 key generator

winzip freeware

winzip free download full version

free winrar download

free winrar

windows 7 crack

windows xp product key

windows 7 activation crack

free winzip

winrar free download

winrar free

download winrar free

windows 7 product key