分析Memory使用状况

内存是影响服务器性能的一个主要因素, 当进程已经驻留内存或者系能够分配给进程足够的内存给它, CPU能顺利自如的运行. 如果发生内存不足, 服务器使用I/O channel获取数据, 由于访问I/O channel速度大约比访问内存满1000倍, 这会给服务器带了性能问题.

Page大小

操作系统以内存页管理内存, 页大小会对系统系统性能有影响. 在i386系统中, 页大小默认为4KB, 对于系统经常处理大量小文件, 这是没有问题的. 但是如果系统经常处理大文件, 页大小为4KB会使服务器性能低效, 这种情况下页大小为2M更好. 当系统使用完内存后, 这是系统会使用swap memory, 由于swap memory是一种模拟memory的硬盘, 而不是真正的内存, 所以当系统使用swap memory时, 系统会非常慢. 所以当系统速度很慢时, 首先查看swap memory使用状况, swap memory的使用情况可以通过free -m查看.

[root@rdhl ~]# free -m             total       used       free     shared    buffers     cachedMem:          3832       2715       1116          0         43         37-/+ buffers/cache:       2635       1197Swap:         3967          0       3967

如果发现系统在使用swap, 接下来做的就是需要通过vmstat -s查看使用swap的具体情况, 如果使用swap很多, 那么系统速度会很慢, 因此需要考虑增加内存或者移除使用内存很多的进程.

Active和Inactive内存

在Linux内核决定哪些内存页需要交换(swap)时, 系统根据Active memoryInactive memory来判断. 所谓Active memory就是最近被使用的内存, Inactive memory是已经有一段时间没有被使用的内存. 当内核需要从RMA到swap移动内存块时, 内核会确保只有Inactive memory的内存块会被移到. 系统的Active memoryInactive memory可以通过vmstat -s查看.

[root@rdhl ~]# vmstat -s      3924700  total memory      2781632  used memory        39228  active memory        63784  inactive memory      1143068  free memory        44644  buffer memory        38348  swap cache      4063224  total swap            0  used swap      4063224  free swap         9091 non-nice user cpu ticks           76 nice user cpu ticks      1849895 system cpu ticks     23999960 idle cpu ticks       110671 IO-wait cpu ticks            0 IRQ cpu ticks          228 softirq cpu ticks            0 stolen cpu ticks     84027541 pages paged in       358313 pages paged out            0 pages swapped in            0 pages swapped out     21388189 interrupts      2499501 CPU context switches   1395818922 boot time         7884 forks

从上面可以看出Active memory相对Inactive memory要小.

内核内存

当分析内存使用状况时, 内核本身使用的内存也需要考虑, 这种内存叫做slab memory, 可以通过/pro/meminfo来查看.

[root@rdhl ~]# cat /proc/meminfoMemTotal:        3924700 kBMemFree:         1142084 kBBuffers:           45476 kBCached:            38372 kBSwapCached:            0 kBActive:            39284 kBInactive:          64612 kBActive(anon):      10336 kBInactive(anon):     9880 kBActive(file):      28948 kBInactive(file):    54732 kBUnevictable:           0 kBMlocked:               0 kBSwapTotal:       4063224 kBSwapFree:        4063224 kBDirty:                 4 kBWriteback:             0 kBAnonPages:         20048 kBMapped:             8748 kBShmem:               168 kBSlab:              78396 kBSReclaimable:      24932 kBSUnreclaim:        53464 kBKernelStack:         920 kBPageTables:         3176 kBNFS_Unstable:          0 kBBounce:                0 kBWritebackTmp:          0 kBCommitLimit:     6025572 kBCommitted_AS:     118392 kBVmallocTotal:   34359738367 kBVmallocUsed:      281896 kBVmallocChunk:   34359454008 kBHardwareCorrupted:     0 kBAnonHugePages:      2048 kBHugePages_Total:       0HugePages_Free:        0HugePages_Rsvd:        0HugePages_Surp:        0Hugepagesize:       2048 kBDirectMap4k:       10240 kBDirectMap2M:     4184064 kB

从上可以看到内核使用slab memory的大小, 如果需要查看更加详细的内核使用内存信息, 可以使用slabtop命令.

[root@rdhl ~]# slabtop Active / Total Objects (% used)    : 1037851 / 1042500 (99.6%) Active / Total Slabs (% used)      : 16568 / 16568 (100.0%) Active / Total Caches (% used)     : 99 / 185 (53.5%) Active / Total Size (% used)       : 66243.50K / 66845.72K (99.1%) Minimum / Average / Maximum Object : 0.02K / 0.06K / 4096.00K  OBJS ACTIVE  USE OBJ SIZE  SLABS OBJ/SLAB CACHE SIZE NAME550224 550216  99%    0.02K   3821      144     15284K avtab_node353696 353524  99%    0.03K   3158      112     12632K size-32 25360  25266  99%    0.19K   1268       20      5072K dentry 20617  20498  99%    0.07K    389       53      1556K selinux_inode_security 17228  16974  98%    0.06K    292       59      1168K size-64 13528  13525  99%    0.99K   3382        4     13528K ext4_inode_cache 12469  12455  99%    0.10K    337       37      1348K buffer_head  9477   9453  99%    0.14K    351       27      1404K sysfs_dir_cache  5778   5772  99%    0.58K    963        6      3852K inode_cache  4028   3977  98%    0.07K     76       53       304K Acpi-Operand  3960   3948  99%    0.12K    132       30       528K size-128  2852   2808  98%    0.04K     31       92       124K Acpi-Namespace  2489   2451  98%    0.20K    131       19       524K vm_area_struct  2233   1931  86%    0.05K     29       77       116K anon_vma_chain  2160   2115  97%    0.19K    108       20       432K size-192  1656   1408  85%    0.04K     18       92        72K anon_vma  1357    511  37%    0.06K     23       59        92K avc_node  1302   1288  98%    0.55K    186        7       744K radix_tree_node   940    806  85%    0.19K     47       20       188K filp   920    772  83%    0.04K     10       92        40K dm_io   915    854  93%    0.25K     61       15       244K size-256   864    772  89%    0.02K      6      144        24K dm_target_io   784    768  97%    0.50K     98        8       392K size-512   752    734  97%    1.00K    188        4       752K size-1024   744    743  99%    2.00K    372        2      1488K size-2048   645    577  89%    0.25K     43       15       172K skbuff_head_cache   640    636  99%    0.77K    128        5       512K shmem_inode_cache   384    384 100%    0.64K     64        6       256K proc_inode_cache   380    236  62%    0.19K     19       20        76K cred_jar   280    273  97%    0.53K     40        7       160K idr_layer_cache   235    235 100%    4.00K    235        1       940K size-4096   202      6   2%    0.02K      1      202         4K jbd2_revoke_table   184    184 100%   32.12K    184        1     11776K kmem_cache

对于内存性能分析, 系统管理员最感兴趣的是slab使用内存大小和NAME和SIZE, 如果slab使用的内存很高, 也许这个模块发生了什么错误, 也可能需要更新内核信息.

使用ps分析内存

使用ps来调整内存使用情况的优势是ps给出服务器上所有进程的内存使用大小. 通常使用ps aux来查看内存使用情况, 其中特别需要关注VSZ和RSS, VSZ(Virtual Size)是指virtual memory使用情况, 这是进程申请的总的内存大小, RSS(Resident Size)是指进程实际使用的内存大小.

[root@rdhl ~]# ps aux | moreUSER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMANDroot         1  0.0  0.0  19356  1432 ?        Ss   Mar26   0:01 /sbin/initroot         2  0.0  0.0      0     0 ?        S    Mar26   0:00 [kthreadd]root         3  0.0  0.0      0     0 ?        S    Mar26   0:00 [migration/0]root         4  0.0  0.0      0     0 ?        S    Mar26   0:00 [ksoftirqd/0]root         5  0.0  0.0      0     0 ?        S    Mar26   0:00 [migration/0]root         6  0.0  0.0      0     0 ?        S    Mar26   0:00 [watchdog/0]root         7  0.0  0.0      0     0 ?        S    Mar26   0:00 [migration/1]root         8  0.0  0.0      0     0 ?        S    Mar26   0:00 [migration/1]root         9  0.0  0.0      0     0 ?        S    Mar26   0:00 [ksoftirqd/1]root        10  0.0  0.0      0     0 ?        S    Mar26   0:00 [watchdog/1]root        11  0.0  0.0      0     0 ?        S    Mar26   0:07 [events/0]root        12  0.0  0.0      0     0 ?        S    Mar26   0:08 [events/1]root        13  0.0  0.0      0     0 ?        S    Mar26   0:00 [cgroup]root        14  0.0  0.0      0     0 ?        S    Mar26   0:00 [khelper]root        15  0.0  0.0      0     0 ?        S    Mar26   0:00 [netns]root        16  0.0  0.0      0     0 ?        S    Mar26   0:00 [async/mgr]root        17  0.0  0.0      0     0 ?        S    Mar26   0:00 [pm]root        18  0.0  0.0      0     0 ?        S    Mar26   0:00 [sync_supers]root        19  0.0  0.0      0     0 ?        S    Mar26   0:00 [bdi-default]

从上面的输出可以发现有些进程用[]括起来, 而另外一些没有, 用[]括起来的进程是内核的一部分, 其他的是正常的进程.

有两种方法可以详细了解一个进程到底在做什么, 其中一种是到/proc下找到指定进程ID, 进入该目录找到maps文件, 该文件给出了内存怎么映射到这个进程, 比如进程使用的内存地址, 子程序和库.

7f990a7bc000-7f990a7c8000 r-xp 00000000 fd:00 2359326                    /lib64/libnss_files-2.12.so7f990a7c8000-7f990a9c8000 ---p 0000c000 fd:00 2359326                    /lib64/libnss_files-2.12.so7f990a9c8000-7f990a9c9000 r--p 0000c000 fd:00 2359326                    /lib64/libnss_files-2.12.so7f990a9c9000-7f990a9ca000 rw-p 0000d000 fd:00 2359326                    /lib64/libnss_files-2.12.so7f990a9ca000-7f990a9d1000 r-xp 00000000 fd:00 2359722                    /lib64/librt-2.12.so7f990a9d1000-7f990abd0000 ---p 00007000 fd:00 2359722                    /lib64/librt-2.12.so7f990abd0000-7f990abd1000 r--p 00006000 fd:00 2359722                    /lib64/librt-2.12.so7f990abd1000-7f990abd2000 rw-p 00007000 fd:00 2359722                    /lib64/librt-2.12.so7f990abd2000-7f990ac0b000 r-xp 00000000 fd:00 2359738                    /lib64/libnspr4.so7f990ac0b000-7f990ae0a000 ---p 00039000 fd:00 2359738                    /lib64/libnspr4.so7f990ae0a000-7f990ae0b000 r--p 00038000 fd:00 2359738                    /lib64/libnspr4.so7f990ae0b000-7f990ae0d000 rw-p 00039000 fd:00 2359738                    /lib64/libnspr4.so7f990ae0d000-7f990ae0f000 rw-p 00000000 00:00 07f990ae0f000-7f990ae12000 r-xp 00000000 fd:00 2359740                    /lib64/libplds4.so7f990ae12000-7f990b011000 ---p 00003000 fd:00 2359740                    /lib64/libplds4.so7f990b011000-7f990b012000 r--p 00002000 fd:00 2359740                    /lib64/libplds4.so7f990b012000-7f990b013000 rw-p 00003000 fd:00 2359740                    /lib64/libplds4.so

另一种方法是使用pmap -d PID, 如:

[root@rdhl proc]# pmap -d 82908290:   dd if=/dev/urandom of=/dev/nullAddress           Kbytes Mode  Offset           Device    Mapping0000000000400000      48 r-x-- 0000000000000000 0fd:00000 dd000000000060b000       8 rw--- 000000000000b000 0fd:00000 dd0000000001aa4000     132 rw--- 0000000000000000 000:00000   [ anon ]000000305a600000     128 r-x-- 0000000000000000 0fd:00000 ld-2.12.so000000305a81f000       4 r---- 000000000001f000 0fd:00000 ld-2.12.so000000305a820000       4 rw--- 0000000000020000 0fd:00000 ld-2.12.so000000305a821000       4 rw--- 0000000000000000 000:00000   [ anon ]000000305ae00000    1576 r-x-- 0000000000000000 0fd:00000 libc-2.12.so000000305af8a000    2048 ----- 000000000018a000 0fd:00000 libc-2.12.so000000305b18a000      16 r---- 000000000018a000 0fd:00000 libc-2.12.so000000305b18e000       4 rw--- 000000000018e000 0fd:00000 libc-2.12.so000000305b18f000      20 rw--- 0000000000000000 000:00000   [ anon ]000000305b200000      92 r-x-- 0000000000000000 0fd:00000 libpthread-2.12.so000000305b217000    2048 ----- 0000000000017000 0fd:00000 libpthread-2.12.so000000305b417000       4 r---- 0000000000017000 0fd:00000 libpthread-2.12.so000000305b418000       4 rw--- 0000000000018000 0fd:00000 libpthread-2.12.so000000305b419000      16 rw--- 0000000000000000 000:00000   [ anon ]000000305b600000      28 r-x-- 0000000000000000 0fd:00000 librt-2.12.so000000305b607000    2044 ----- 0000000000007000 0fd:00000 librt-2.12.so000000305b806000       4 r---- 0000000000006000 0fd:00000 librt-2.12.so000000305b807000       4 rw--- 0000000000007000 0fd:00000 librt-2.12.so00007fd95653b000   96836 r---- 0000000000000000 0fd:00000 locale-archive00007fd95c3cc000      12 rw--- 0000000000000000 000:00000   [ anon ]00007fd95c3d9000       4 rw--- 0000000000000000 000:00000   [ anon ]00007ffffe83e000      84 rw--- 0000000000000000 000:00000   [ stack ]00007ffffe988000       4 r-x-- 0000000000000000 000:00000   [ anon ]ffffffffff600000       4 r-x-- 0000000000000000 000:00000   [ anon ]mapped: 105180K    writeable/private: 296K    shared: 0K

使用pmap的优势是pmap给出一个进程工作时详细顺序信息, 通过这个命令能看到进程调用外部库和以[anon]结束表示通过malloc进行内存分配请求.