1.基本说明
在open()的路径查找过程中,walk_component()的作用就是对具体的目录项进行处理。它通过handle_dots()处理LAST_DOT和LAST_DOTDOT类型的目录项,通过do_lookup()处理非LAST_DOT和LAST_DOTDOT类型的目录项。当经过了do_lookup的处理后,还需要通过should_follow_link()检查当前的目录项是否是符号链接。
如果当前的目录项具备符号链接特性,那么内核将试图通过unlazy_walk()将当前的rcu-walk切换到ref-walk。因为处理处理符号链接文件会使用实体文件系统的钩子函数follow_link(),这个函数可能会引起阻塞,因此必须切换到允许阻塞的ref-walk模式。如果切换失败,则返回-ECHILD,即返回值do_filp_open()处,将重新以ref-walk方式执行打开操作;否则,walk_component()将返回1,那么调用它的link_path_walk()将通过nested_symlink()处理符号链接文件。
2.函数分析
2.1.nested_symlink()
该函数声明如下:
static inline int nested_symlink(struct path *path, struct nameidata *nd);
符号链接的处理过程并不复杂,但需要清楚link_count和total_link_count两个关键的变量的含义。这两个变量均来自当前进程描述符current中,前者表示当前符号链接连续嵌套的次数,后者表示一个路径中符号链接的总数。这两个计数均有最大限制,link_count最大不能超过MAX_NESTED_LINKS(默认为8),total_link_count最大不能超过40。
该函数的主要处理流程如下:
1.首先检查link_count是否超过了限制,如果超过限制则向上返回ELOOP错误;
2.如果一切正常,则nd和current同时更新嵌套计数器;
3.为了对符号链接文件嵌套情况的处理,接下来将进入循环处理过程。每次处理过程都首先通过follow_link()获取当前目录项所指文件,返回最后该文件路径的最后一个目录项;并且通过walk_component()更新nd;特殊情况下,当前目录项(即当前正在处理的符号链接文件的最后一个目录项)所指的文件仍然是个符号链接文件,因此walk_componet()将返回1,因此继续执行循环体,直至遇到非符号链接文件;
4.当本次的符号链接文件获取到最终的目标时,对nd和current的嵌套计数进行减一操作;
5.结束;
2.2.follow_link()
该函数声明如下:
static __always_inline int follow_link(struct path *link, struct nameidata *nd, void **p);
该函数的作用是对这个符号链接文件所指的目标文件进行“一探究竟”,通过对目标文件进行查找操作进而更新nd。主要操作包含以下内容:
1.首先判断total_link_count是否超过了最大限制;
2.通过cond_resched()进行一次进程调度。通过walk_component()中的解释可知,只要某个目录项为符号链接文件,那么当前的walk模式肯定为ref,由于当前进程一开始处于rcu模式下,可能导致某些进程抢占失败,因此这里有必要进行一次进程调度;
3.对current进行total_link_count加一操作;
4.通过nd_set_link()对当前nd中saved_names[nd->depth]字段进行置空操作;
5.设置当前目录项的类型为LAST_BIND;
6.通过当前目录项中follow_link钩子函数进行符号链接文件的跟随操作,即将这个符号链接文件所指的目标文件路径返回至saved_names[nd->depth]中;
7.如果获取目标文件路径成功,则通过__vfs_follow_link()对这个目标文件路径进行全新的查找;
2.3.__vfs_follow_link()
该函数是对link_path_walk()的再次封装,其声明如下:
static int __vfs_follow_link(struct nameidata *nd, const char *link);
这种封装其实是合理的,因为既然对目标文件路径进行一个全新的查找工作,那可以使用前面的link_path_walk()函数,因为这个函数本身就是对路径的查找。
这里举个简单的例子(示例1)说明这种函数的调用情况。比如存在路径“/home/edsionte/files/abc/”,简称路径A,其中files目录是一个符号链接文件,其指向”/home/wang/test/exe/”目录(简称路径B,exe和test为普通目录)。如果要open路径A,那么简单的处理步骤是:
1.通过link_path_walk对路径A进行查找;
2.当walk_component()进行到files目录项时,发现其为符号链接文件,那么将通过nested_symlink()对这个目录项进行处理;
3.nested_symlink()中的follow_link()发现files指向的文件路径为路径B。为了检查路径B的合法性以及更新nd等信息,将通过__vfs_follow_link()对路径B进行查找工作;
4.调用link_path_walk()对路径B进行遍历,最终获取路径B的最后一个目录项exe;
5.nested_symlink()将执行walk_component(),并确定路径B最后的目录项test不是符号连接文件,因此退出nested_symlink();返回路径A的link_path_walk();
6.关于路径A的查找工作完毕;
特殊情况下(示例2),如果上述示例1中的路径B中,test目录同样为符号链接文件,并且指向名为C的路径“/home/tian/bin/”,其中,bin为普通目录;那么open路径A这个操作将会多一轮的处理流程。基于上述的处理流程步骤如下:
1.通过link_path_walk对路径A进行查找;
2.当walk_component()进行到files目录项时,发现其为符号链接文件,那么将通过nested_symlink()对这个目录项进行处理;
3.follow_link()发现files指向的文件路径为路径B。为了检查路径B的合法性以及更新nd等信息,将通过__vfs_follow_link()对路径B进行查找工作;
4.调用link_path_walk()对路径B进行遍历,当walk_component()进行至B中的test目录项时,由于其为符号链接文件,因此将调用nested_symlink();
5.nested_symlink()处理目录项test,由于test指向的路径C中所有目录项都是非符号链接文件,因此循环体执行一次,最终返回C的最后一个目录项bin至路径B的link_path_walk()中;
6.路径B的link_path_walk()继续进行,直至遍历到最后一个目录项exe;它将返回到3中的follow_link()中,接着执行walk_component()发现exe为普通目录项,则nested_symlink()结束;
7.路径A的link_path_walk()继续对路径A的下一个目录项abc进行walk_component();
通过上述示例可以看出,符号链接文件的嵌套数并不是指link_path_walk()的嵌套调用数目,而是指nested_symlink()的调用数。只有当符号链接文件(路径A)所指的文件(路径B)中依旧存在符号链接(指向路径C)时,才会出现nested_symlink()的嵌套。
3.总结
符号链接文件的处理方式比较特殊,但是本质的实现还是基于link_path_walk(),该函数是整个路径查找框架中的基础实现。对于一个路径来说,经过link_path_walk()的处理,nd将保存最后一个目录项的信息,但是最后一个目录项代表的文件(或目录)是否存在并不知晓,需要通过调用link_path_walk()的path_openat()做最后的处理。
参考资料:
1.Linux源码3.2.69;
2.Linux系统调用open七日游:http://blog.chinaunix.net/uid-20522771-id-4419666.html
3.深入理解Linux内核:http://book.douban.com/subject/2287506/;
4.深入Linux内核架构:http://book.douban.com/subject/4843567/;
5.Linux内核探秘:http://book.douban.com/subject/25817503/;