Linux hung task 机制-myfaxmail-ChinaUnix博客

学而不思则罔，思而不学则贻shawn.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

myfaxmail

博客访问： 1463400
博文数量： 267
博客积分： 3010
博客等级：少校
技术积分： 3089
用户组：普通用户
注册时间： 2011-06-05 17:09

个人简介

尊天命，尽人事

文章分类

全部博文（267）

Linux内核（61）
Internet（8）
嵌入式（158）
未分配的博文（40）

文章存档

2017年（6）

2015年（4）

2014年（27）

2013年（52）

2012年（59）

2011年（120）

我的朋友

相关博文

Linux hung task 机制

分类： LINUX

2017-03-18 16:38:59

一、相关知识
长期以来，处于D状态(TASK_UNINTERRUPTIBLE状态)的进程都是让人比较烦恼的问题，处于D状态的进程不能接收信号，kill不掉。在一些场景下，常见到进程长期处于D状态，用户对此无能为力，也不知道原因，只能重启恢复。
其实进程长期处于D状态肯定是不正常的，内核中设计D状态的目的是为了让进程等待IO完成，正常情况下IO应该会顺利完成，然后唤醒相应的D状态进程，即使在异常情况下(比如磁盘离或损坏、磁阵链路断开等)，IO处理也是有超时机制的，原理上不会存在永久处于D状态的进程。但是就是因为内核代码流程中可能存在一些bug，或者用户内核模块中的相关机制不合理，可能导致进程长期处于D状态，无法唤醒，类似于死锁状态。
针对这种情况，内核中提供了hung task机制用于检测系统中是否存在处于D状态超过120s(时长可以设置)的进程，如果存在，则打印相关警告和进程堆栈。如果配置了hung_task_panic（proc或内核启动参数），则直接发起panic，结合kdump可以搜集到vmcore。从内核的角度看，如果有进程处于D状态的时间超过了120s，那肯定已经出现异常了，以此机制来收集相关的异常信息，用于分析定位问题。

二、基本原理
hung task机制的实现很简单，其基本原理为：
创建一个内核线程(khungtaskd)，定期(120)唤醒后，遍历系统中的所有进程，检查是否存在处于D状态超过120s(时长可以设置)的进程，如果存在，则打印相关警告和进程堆栈。如果配置了hung_task_panic（proc或内核启动参数），则直接发起panic。

阅读(998) | 评论(0) | 转发(0) |

上一篇：使用 kexec 快速重启 Linux

下一篇：linux tcp GSO和TSO实现

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6