分析Memory使用状况
内存是影响服务器性能的一个主要因素, 当进程已经驻留内存或者系能够分配给进程足够的内存给它, CPU能顺利自如的运行. 如果发生内存不足, 服务器使用I/O channel获取数据, 由于访问I/O channel速度大约比访问内存满1000倍, 这会给服务器带了性能问题.
Page大小
操作系统以内存页管理内存, 页大小会对系统系统性能有影响. 在i386系统中, 页大小默认为4KB, 对于系统经常处理大量小文件, 这是没有问题的. 但是如果系统经常处理大文件, 页大小为4KB会使服务器性能低效, 这种情况下页大小为2M更好. 当系统使用完内存后, 这是系统会使用swap memory, 由于swap memory是一种模拟memory的硬盘, 而不是真正的内存, 所以当系统使用swap memory时, 系统会非常慢. 所以当系统速度很慢时, 首先查看swap memory使用状况, swap memory的使用情况可以通过free -m查看.
[root@rdhl ~]# free -m total used free shared buffers cachedMem: 3832 2715 1116 0 43 37-/+ buffers/cache: 2635 1197Swap: 3967 0 3967
如果发现系统在使用swap, 接下来做的就是需要通过vmstat -s查看使用swap的具体情况, 如果使用swap很多, 那么系统速度会很慢, 因此需要考虑增加内存或者移除使用内存很多的进程.
Active和Inactive内存
在Linux内核决定哪些内存页需要交换(swap)时, 系统根据Active memory和Inactive memory来判断. 所谓Active memory就是最近被使用的内存, Inactive memory是已经有一段时间没有被使用的内存. 当内核需要从RMA到swap移动内存块时, 内核会确保只有Inactive memory的内存块会被移到. 系统的Active memory和Inactive memory可以通过vmstat -s查看.
[root@rdhl ~]# vmstat -s 3924700 total memory 2781632 used memory 39228 active memory 63784 inactive memory 1143068 free memory 44644 buffer memory 38348 swap cache 4063224 total swap 0 used swap 4063224 free swap 9091 non-nice user cpu ticks 76 nice user cpu ticks 1849895 system cpu ticks 23999960 idle cpu ticks 110671 IO-wait cpu ticks 0 IRQ cpu ticks 228 softirq cpu ticks 0 stolen cpu ticks 84027541 pages paged in 358313 pages paged out 0 pages swapped in 0 pages swapped out 21388189 interrupts 2499501 CPU context switches 1395818922 boot time 7884 forks
从上面可以看出Active memory相对Inactive memory要小.
内核内存
当分析内存使用状况时, 内核本身使用的内存也需要考虑, 这种内存叫做slab memory, 可以通过/pro/meminfo来查看.
[root@rdhl ~]# cat /proc/meminfoMemTotal: 3924700 kBMemFree: 1142084 kBBuffers: 45476 kBCached: 38372 kBSwapCached: 0 kBActive: 39284 kBInactive: 64612 kBActive(anon): 10336 kBInactive(anon): 9880 kBActive(file): 28948 kBInactive(file): 54732 kBUnevictable: 0 kBMlocked: 0 kBSwapTotal: 4063224 kBSwapFree: 4063224 kBDirty: 4 kBWriteback: 0 kBAnonPages: 20048 kBMapped: 8748 kBShmem: 168 kBSlab: 78396 kBSReclaimable: 24932 kBSUnreclaim: 53464 kBKernelStack: 920 kBPageTables: 3176 kBNFS_Unstable: 0 kBBounce: 0 kBWritebackTmp: 0 kBCommitLimit: 6025572 kBCommitted_AS: 118392 kBVmallocTotal: 34359738367 kBVmallocUsed: 281896 kBVmallocChunk: 34359454008 kBHardwareCorrupted: 0 kBAnonHugePages: 2048 kBHugePages_Total: 0HugePages_Free: 0HugePages_Rsvd: 0HugePages_Surp: 0Hugepagesize: 2048 kBDirectMap4k: 10240 kBDirectMap2M: 4184064 kB
从上可以看到内核使用slab memory的大小, 如果需要查看更加详细的内核使用内存信息, 可以使用slabtop命令.
[root@rdhl ~]# slabtop Active / Total Objects (% used) : 1037851 / 1042500 (99.6%) Active / Total Slabs (% used) : 16568 / 16568 (100.0%) Active / Total Caches (% used) : 99 / 185 (53.5%) Active / Total Size (% used) : 66243.50K / 66845.72K (99.1%) Minimum / Average / Maximum Object : 0.02K / 0.06K / 4096.00K OBJS ACTIVE USE OBJ SIZE SLABS OBJ/SLAB CACHE SIZE NAME550224 550216 99% 0.02K 3821 144 15284K avtab_node353696 353524 99% 0.03K 3158 112 12632K size-32 25360 25266 99% 0.19K 1268 20 5072K dentry 20617 20498 99% 0.07K 389 53 1556K selinux_inode_security 17228 16974 98% 0.06K 292 59 1168K size-64 13528 13525 99% 0.99K 3382 4 13528K ext4_inode_cache 12469 12455 99% 0.10K 337 37 1348K buffer_head 9477 9453 99% 0.14K 351 27 1404K sysfs_dir_cache 5778 5772 99% 0.58K 963 6 3852K inode_cache 4028 3977 98% 0.07K 76 53 304K Acpi-Operand 3960 3948 99% 0.12K 132 30 528K size-128 2852 2808 98% 0.04K 31 92 124K Acpi-Namespace 2489 2451 98% 0.20K 131 19 524K vm_area_struct 2233 1931 86% 0.05K 29 77 116K anon_vma_chain 2160 2115 97% 0.19K 108 20 432K size-192 1656 1408 85% 0.04K 18 92 72K anon_vma 1357 511 37% 0.06K 23 59 92K avc_node 1302 1288 98% 0.55K 186 7 744K radix_tree_node 940 806 85% 0.19K 47 20 188K filp 920 772 83% 0.04K 10 92 40K dm_io 915 854 93% 0.25K 61 15 244K size-256 864 772 89% 0.02K 6 144 24K dm_target_io 784 768 97% 0.50K 98 8 392K size-512 752 734 97% 1.00K 188 4 752K size-1024 744 743 99% 2.00K 372 2 1488K size-2048 645 577 89% 0.25K 43 15 172K skbuff_head_cache 640 636 99% 0.77K 128 5 512K shmem_inode_cache 384 384 100% 0.64K 64 6 256K proc_inode_cache 380 236 62% 0.19K 19 20 76K cred_jar 280 273 97% 0.53K 40 7 160K idr_layer_cache 235 235 100% 4.00K 235 1 940K size-4096 202 6 2% 0.02K 1 202 4K jbd2_revoke_table 184 184 100% 32.12K 184 1 11776K kmem_cache
对于内存性能分析, 系统管理员最感兴趣的是slab使用内存大小和NAME和SIZE, 如果slab使用的内存很高, 也许这个模块发生了什么错误, 也可能需要更新内核信息.
使用ps分析内存
使用ps来调整内存使用情况的优势是ps给出服务器上所有进程的内存使用大小. 通常使用ps aux来查看内存使用情况, 其中特别需要关注VSZ和RSS, VSZ(Virtual Size)是指virtual memory使用情况, 这是进程申请的总的内存大小, RSS(Resident Size)是指进程实际使用的内存大小.
[root@rdhl ~]# ps aux | moreUSER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMANDroot 1 0.0 0.0 19356 1432 ? Ss Mar26 0:01 /sbin/initroot 2 0.0 0.0 0 0 ? S Mar26 0:00 [kthreadd]root 3 0.0 0.0 0 0 ? S Mar26 0:00 [migration/0]root 4 0.0 0.0 0 0 ? S Mar26 0:00 [ksoftirqd/0]root 5 0.0 0.0 0 0 ? S Mar26 0:00 [migration/0]root 6 0.0 0.0 0 0 ? S Mar26 0:00 [watchdog/0]root 7 0.0 0.0 0 0 ? S Mar26 0:00 [migration/1]root 8 0.0 0.0 0 0 ? S Mar26 0:00 [migration/1]root 9 0.0 0.0 0 0 ? S Mar26 0:00 [ksoftirqd/1]root 10 0.0 0.0 0 0 ? S Mar26 0:00 [watchdog/1]root 11 0.0 0.0 0 0 ? S Mar26 0:07 [events/0]root 12 0.0 0.0 0 0 ? S Mar26 0:08 [events/1]root 13 0.0 0.0 0 0 ? S Mar26 0:00 [cgroup]root 14 0.0 0.0 0 0 ? S Mar26 0:00 [khelper]root 15 0.0 0.0 0 0 ? S Mar26 0:00 [netns]root 16 0.0 0.0 0 0 ? S Mar26 0:00 [async/mgr]root 17 0.0 0.0 0 0 ? S Mar26 0:00 [pm]root 18 0.0 0.0 0 0 ? S Mar26 0:00 [sync_supers]root 19 0.0 0.0 0 0 ? S Mar26 0:00 [bdi-default]
从上面的输出可以发现有些进程用[]括起来, 而另外一些没有, 用[]括起来的进程是内核的一部分, 其他的是正常的进程.
有两种方法可以详细了解一个进程到底在做什么, 其中一种是到/proc下找到指定进程ID, 进入该目录找到maps文件, 该文件给出了内存怎么映射到这个进程, 比如进程使用的内存地址, 子程序和库.
7f990a7bc000-7f990a7c8000 r-xp 00000000 fd:00 2359326 /lib64/libnss_files-2.12.so7f990a7c8000-7f990a9c8000 ---p 0000c000 fd:00 2359326 /lib64/libnss_files-2.12.so7f990a9c8000-7f990a9c9000 r--p 0000c000 fd:00 2359326 /lib64/libnss_files-2.12.so7f990a9c9000-7f990a9ca000 rw-p 0000d000 fd:00 2359326 /lib64/libnss_files-2.12.so7f990a9ca000-7f990a9d1000 r-xp 00000000 fd:00 2359722 /lib64/librt-2.12.so7f990a9d1000-7f990abd0000 ---p 00007000 fd:00 2359722 /lib64/librt-2.12.so7f990abd0000-7f990abd1000 r--p 00006000 fd:00 2359722 /lib64/librt-2.12.so7f990abd1000-7f990abd2000 rw-p 00007000 fd:00 2359722 /lib64/librt-2.12.so7f990abd2000-7f990ac0b000 r-xp 00000000 fd:00 2359738 /lib64/libnspr4.so7f990ac0b000-7f990ae0a000 ---p 00039000 fd:00 2359738 /lib64/libnspr4.so7f990ae0a000-7f990ae0b000 r--p 00038000 fd:00 2359738 /lib64/libnspr4.so7f990ae0b000-7f990ae0d000 rw-p 00039000 fd:00 2359738 /lib64/libnspr4.so7f990ae0d000-7f990ae0f000 rw-p 00000000 00:00 07f990ae0f000-7f990ae12000 r-xp 00000000 fd:00 2359740 /lib64/libplds4.so7f990ae12000-7f990b011000 ---p 00003000 fd:00 2359740 /lib64/libplds4.so7f990b011000-7f990b012000 r--p 00002000 fd:00 2359740 /lib64/libplds4.so7f990b012000-7f990b013000 rw-p 00003000 fd:00 2359740 /lib64/libplds4.so
另一种方法是使用pmap -d PID, 如:
[root@rdhl proc]# pmap -d 82908290: dd if=/dev/urandom of=/dev/nullAddress Kbytes Mode Offset Device Mapping0000000000400000 48 r-x-- 0000000000000000 0fd:00000 dd000000000060b000 8 rw--- 000000000000b000 0fd:00000 dd0000000001aa4000 132 rw--- 0000000000000000 000:00000 [ anon ]000000305a600000 128 r-x-- 0000000000000000 0fd:00000 ld-2.12.so000000305a81f000 4 r---- 000000000001f000 0fd:00000 ld-2.12.so000000305a820000 4 rw--- 0000000000020000 0fd:00000 ld-2.12.so000000305a821000 4 rw--- 0000000000000000 000:00000 [ anon ]000000305ae00000 1576 r-x-- 0000000000000000 0fd:00000 libc-2.12.so000000305af8a000 2048 ----- 000000000018a000 0fd:00000 libc-2.12.so000000305b18a000 16 r---- 000000000018a000 0fd:00000 libc-2.12.so000000305b18e000 4 rw--- 000000000018e000 0fd:00000 libc-2.12.so000000305b18f000 20 rw--- 0000000000000000 000:00000 [ anon ]000000305b200000 92 r-x-- 0000000000000000 0fd:00000 libpthread-2.12.so000000305b217000 2048 ----- 0000000000017000 0fd:00000 libpthread-2.12.so000000305b417000 4 r---- 0000000000017000 0fd:00000 libpthread-2.12.so000000305b418000 4 rw--- 0000000000018000 0fd:00000 libpthread-2.12.so000000305b419000 16 rw--- 0000000000000000 000:00000 [ anon ]000000305b600000 28 r-x-- 0000000000000000 0fd:00000 librt-2.12.so000000305b607000 2044 ----- 0000000000007000 0fd:00000 librt-2.12.so000000305b806000 4 r---- 0000000000006000 0fd:00000 librt-2.12.so000000305b807000 4 rw--- 0000000000007000 0fd:00000 librt-2.12.so00007fd95653b000 96836 r---- 0000000000000000 0fd:00000 locale-archive00007fd95c3cc000 12 rw--- 0000000000000000 000:00000 [ anon ]00007fd95c3d9000 4 rw--- 0000000000000000 000:00000 [ anon ]00007ffffe83e000 84 rw--- 0000000000000000 000:00000 [ stack ]00007ffffe988000 4 r-x-- 0000000000000000 000:00000 [ anon ]ffffffffff600000 4 r-x-- 0000000000000000 000:00000 [ anon ]mapped: 105180K writeable/private: 296K shared: 0K
使用pmap的优势是pmap给出一个进程工作时详细顺序信息, 通过这个命令能看到进程调用外部库和以[anon]结束表示通过malloc进行内存分配请求.