进程在用户空间运行时,被称为进程的用户态,而陷入内核空间的时候,被称为进程的内核态。从用户态到内核态的转变,需要通过系统调用来完成。
系统调用过程一直是同一个进程运行,上下文切换只改变了CPU寄存器的值,用于指向指令地址,并不会涉及到虚拟内存等进程用户态的资源的切换
进程上下文切换内容:
进程是由内核来管理和调度的,进程的切换只能发生在内核态。
进程的上下文不仅包括了虚拟内存、栈、全局变量等用户空间的资源,还包括了内核堆栈、CPU寄存器等内核空间的状态。
因此,进程的上下文切换就比系统调用时多了一步:在保存当前进程的内核状态和 CPU 寄存器之前,需要先把该进程的虚拟内存、用户栈等保存下来;而加载了下一进程的内核态后,还需要刷新进程的虚拟内存和用户栈。
进程上下文切换的影响:
进程切换时机:
Linux 为每个 CPU 都维护了一个就绪队列,将活跃进程(即正在运行和正在等待 CPU 的进程)按照优先级和等待 CPU 的时间排序,然后选择最需要 CPU 的进程,也就是优先级最高和等待 CPU 时间最长的进程来运行。
同一进程的不同线程切换时只改变了线程的私有数据,内核堆栈和CPU寄存器的值
跟进程上下文不同,中断上下文切换并不涉及到进程的用户态。
所以,即便中断过程打断了一个正处在用户态的进程,也不需要保存和恢复这个进程的虚拟内存、全局变量等用户态资源。
中断上下文,其实只包括内核态中断服务程序执行所必需的状态,包括 CPU 寄存器、内核堆栈、硬件中断参数等。
# 进程上下文切换情况
cat /proc/<pid>/status | grep ctxt
# 每5秒输出线程上下文切换情况
pidstat -wt 5
上下文切换在数百到一万次每秒以内是正常情况,但如果超过一万,则说明出现了性能问题:
方法:通过最简单的系统调用 gettid
来计算进程上下文的切换时间。
结果:失败,系统调用并不是一次完整的进程上下文切换,运行期间,vmstat
所显示的上下文切换次数并没有明显的增长。
方法:通过 futex
来进行进程之间的切换。具体做法是父子进程轮流 wait 并 wake up 对方。
结果: 上下文切换时间中包含 futex
系统调用的时间,并且因为其搅乱了CPU Caches(L1,L2,L3,TLB)所以结果会比较大。
代码:timectxsw.c
参考:
https://blog.tsunanet.net/2010/11/how-long-does-it-take-to-make-context.html