Name	Name	Last commit message	Last commit date
parent directory ..
Malloc_tutorial.pdf	Malloc_tutorial.pdf
README.md	README.md
alloc.c	alloc.c
alloc.h	alloc.h
test.c	test.c

堆内存

堆内存是连续的，但是有三个界限，一个是起始点，另一个则是映射区域的终点称为break点，最后一个则是整个堆区域的最大点。通过在头文件sys/ressource.h中的getrlimit方法和setrlimit方法，可以用来或许堆的最大点。通过brk可以得到break点

brk and sbrk

brk 可以设置break为指定地址,如果该区域没有映射将会自动映射 sbrk则是移动break点，不能直接指定地址移动到指定位置，而是提供移动距离。当sbrk指定的参数是0的时候，返回当前的break地址内存映射总是按照页来映射的，但是break点可以不在页边界上，这就导致了从break点到页边界这段内存是可用的，但是建议使用

mmap

mmap用于直接将文件映射到内存中，但是mmap有一种匿名映射，可以用来实现malloc,此时分配的内存不属于堆内存，OpenBsd的malloc 实现就是利用了mmap来做的。

dummy malloc

直接使用sbrk来移动break点，这就是最简单的一种,malloc的实现,很显然，这个malloc是dummy的，无法使用的，因为当多次malloc 后，已经无法去free之前分配的内存了，因为没有记录每次分配的时候的大小,不知道要回收多少内存

如何去实现

为了记录每次分配的大小，需要给每次分配的内存添加一些元数据信息，比如该块内存是否分配，分配了多大，为了方便内存的合并还需要知道下一段分配的内存位置，因此需要有个指针指向下段内存的起始位置，这样方便在回收的时候可以对一系列的段进行合并。所有每段分配的内存都需要有一个元数据区域，下面是这个元数据区域的C表示:

typedef struct s_block *t_block;
struct s_block {
    size_t  size;
    t_block next;
    int     free;
};

地址对齐

为了让分配的内存对齐，需要调整分配的大小是系统位数的整数倍 32位系统中，32bits是4字节，因此分配的内存应该是4的整数倍。假设分配的大小为x那么算法如下:

x = 4*p + q ( 0 <= q <=3),如果x是4的整数倍那么q就是0
x - 1 = 4*(p-1) + 3,因此(x-1)/4*4+4 = 4*p = x 如果q!=0的化，
x - 1 = 4*p + q-1(0<= q-1 <=2)因此 (x-1)/4*4+4 = 4*p+4 = x/4*4 + 4

最终(x-1)/4*4+4 总是最接近4的整数倍，用C语言实现如下:
#define align4(x) (((((x) - 1)>>2)<<2 )+4)

First fit算法

当malloc运行一段时间后，会维护了一段段的内存块，散落在堆区域内，无法进行合并，当下次再分配的时候，如何从这些零碎的区域中选择一个进行分配呢，这里使用了first fit算法，算法代码如下:

t_block find_block(t_block *last,size_t size) {
    t_block b = base;
    while(b && !(b->free && b->size >= size)) {
        *last = b;
        b = b->next;
    }
    return (b);
}

遍历所有分配的内存块，找到第一个大小大于请求的大小,然后返回这块内存的起始地址即可

扩展堆

当没有可用的内存块的时候，该如何分配内存呢，只需要移动break就可以完成。代码如下:

#define BLOCK_SIZE sizeof(struct s_block)
t_block extend_heap(t_block last,size_t s) {
    t_block b;
    b = sbrk(0);
    if(sbrk(BLOCK_SIZE + s) == (void*)-1)
        return (NULL);
    b->size = s;
    b->next = NULL;
    if(last)
        last->next = b;
    b->free = 0;
    return (b);
}

使用sbrk移动break指定大小，然后初始化一个元数据结构体，然后再使用last指针把新分配的区域链接起来

分割内存块

但请求的内存大小通过first fit算法找到了合适的块后，因为请求的大小和找到的块大小不是完全一样的，因此需要切割这个块切割的时候需要考虑一些问题，比如切割后应该保证剩下的内容大小至少是BLOCK_SIZE+4.为了方便计算剩余空间的其实位置，可以使用一个小技巧，就是给元数据区域增加一个长度为0的的数组，(可变数组，C中因为不能使用0长度，因此这里使用1)，这个数组的地址就是数据区域的起始地址。有个这个起始地址就方便计算下段区域的地址了，因此修改元数据的结构体如下:

struct s_block {
    size_t  size;
    t_block next;
    int     free;
    char    data[1];
};

上面的这个data是不占用空间的.

void split_block(t_block b,size_t s) {
    t_block new;
    new = b->data + s; //数据区域的其实地址加上这段内存块的数据大小，就是剩余空间的起始地址了
    new->size = b->size -s -BLOCK_SIZE;
    new->next = b->next;
    new->free = 1;
    b->size = s;
    b->next = new;
}

使用new指向剩余空间的起始位置，然后初始化new，并链接，在调用这个函数的时候，应该事先判断下剩余的空间是否满足最小大小

malloc实现

malloc主要是组合上面提到的一些函数，初始化base，也就是第一块被分配的内存块。是个全局的变量，在first fit算法中用到了，因为需要从第一个被分配的内存块开始搜索未分配的内存块。malloc算法实现

void *base = NULL;
void *malloc(size_t size) {
    t_block b,last;
    size_t  s;
    //字节对齐
    s = align4(size);
    //是否是第一次分配
    if(base) {
        last = base;
        //first fit算法查找可用内存块
        b = find_block(&last,s);
        //是否查找到,查找到后进行分割，否则扩展现有的内存
        if(b) {
            if((b->size -s ) >= (BLOCK_SIZE + 4))   
                split_block(b,s);
            b->free = 0;
        } else {
            b = extend_heap(last,s);
            if(!b)
                return (NULL);
        }
    } else {
        b = extend_heap(NULL,s);
        if(!b)
            return (NULL);
        base = b;
    }
    return (b->data);
}

calloc实现

calloc的实现比较简单，先使用malloc来得到正确的大小后，然后初始化这段内存为0即可，实现如下:

void *calloc(size_t number,size_t size) {
    size_t *new;
    size_t s4,i;
    new = malloc(number*size);
    if(new) {
        //因为是4字节对齐，因此，每次初始化4字节，如果分配60字节只需要初始化15次
        //因此右移2位，相当于除以4。
        s4 = align4(number * size) >> 2;
        for(i = 0;i < s4;++i) {
            new[i] = 0;    
        }
    }
    return (new);
}

free的实现

free如果不考虑合并的话，还是非常简单的，得到内存块的元数据指针，设置free标记，就完成了。但是这样会导致大量的内存碎片为此在free的时候需要考虑合并相邻的内存块，但是如何和内存块的前后进行合并呢，因为使用的是单链表链接所有的内存块的，无法 o(1)找到前一块内存，为此必须从头寻找到前一块内存块，然后合并。为此可以考虑使用双向循环链表。因此元数据区域更改为如下:

struct s_block {
    size_t  size;
    struct s_block  *next;
    struct s_block  *prev;
    int             free;
    char            data[1];
};
typedef struct s_block *t_block;

有了双向循环链表作为支撑，这下内存块的合并就方便了，其代码如下:

t_block fusion(t_block b) {
    if(b->next && b->next->free) {
        b->size += BLOCK_SIZE + b->next->size;
        b->next = b->next->next;
        if(b->next)
            b->next->prev = b;
    }
    return (b);
}

到此为此内存碎片的这个问题，有所优化了，但是还存在另外一个问题就是，如何判断用户传入的指针是指向数据区域的开始位置，如果不是开始位置那么获取到的元数据就是错误的，会导致错误的free，(因为元数据的地址是根据数据起始地址减去元数据大小得到的)，为此需要有个手段来判断传入的指针是否是有效的，因此需要在元数据区域添加一个指针指向数据结构的起始地址，然后拿这个地址和用户传入的地址进行比较就可以判断是否有效，因此元数据被修改为如下形式:

struct s_block {
    size_t  size;
    struct s_block  *next;
    struct s_block  *prev;
    void            *ptr;
    int             free;
    char            data[1];
};

下面是判断传入的指针是否有效的代码实现:

//返回元数据指针
t_block get_block(void *p)
{
    char *tmp;
    tmp = p;
    return (p = tmp -=BLOCK_SIZE);
}

int valid_addr(void *p)
{
    if(base)
    {
        if(p > base && p<sbrk(0))
        {
            return (p == (get_block(p))->ptr);   
        }
    }
    return 0;
}

下面是free函数的代码实现:

void free(void *p)
{
    t_block b;
    if(valid_addr(p))
    {
        b = get_block(p);
        b->free = 1;
        //判断前面的内存块是否free，如果free就合并
        if(b->prev && b->prev->free)
            b = fusion(b->prev); 
            //和后面的内存合并
            if(b->next)
                fusion(b);
            else { //b是最后一段内存快
                if(b->prev)  
                    b->prev->next = NULL;
                else //如果只有b，那么就直接brk回收掉b,然后设置base = NULL
                    base = NULL;
                brk(b);
            }
    }
}

realloc的实现

realloc的实现主要分为下面几步:

使用malloc分配指定大小的一个新的内存块
从原有区域拷贝数据到新的内存块
free掉原有的内存块
返回新的指针

但是在实现过程中还是需要考虑一些细节上的问题，比如:

如果realloc的大小没有改变，那么什么也不做
如果realloc是减小内存块大小，那么只需要分割就可以了
如果下一个block是可用的，并且提供了足够的空间，那么只要合并，然后分割即可

其实现代码如下:


void copy_block(t_block src,t_block dst)
{
    int *sdata,*ddata;
    size_t  i;
    sdata = src->ptr;
    ddata = dst->ptr;
    for(i = 0;i*4 < src->size && i *4<dst->size;++i)
        ddata[i] = sdata[i];
}

void *realloc(void *p,size_t size)
{
    size_t  s;
    t_block b,new;
    void *newp;
    if(!p)  //为空就直接分配
        return (malloc(size));
    if(valid_addr(p)) //是否是合法的地址
    {
        s = align4(size);
        b = get_block(p);
        if(b->size >= s) { //realloc的大小是小于目前的内存块大小，隐私split即可
            if(b->size -s >= (BLOCK_SIZE + 4)) 
                split_block(b,s);
        } else {
            //进行合并策略,判断是否可以合并，和合并后的大小是否符合要求
            if(b->next && b->next->free
               && (b->size + BLOCK_SIZE + b->next->size) >=s) {
                fusion(b);
                //可以合并，合并后，进行split即可
                if(b->size -s >= (BLOCK_SIZE + 4))
                    split_block(b,s);
                    //都不满足的情况直接分配一块新的内存块，然后拷贝数据
            } else {
                newp = malloc(s);
                if(!newp)
                    return (NULL);
                new = get_block(b,new);
                copy_block(b,new);
                free(p);
                return newp;
            }
        }
        return p;
    }
    return NULL;
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

c-malloc

c-malloc

README.md

堆内存

brk and sbrk

mmap

dummy malloc

如何去实现

地址对齐

First fit算法

扩展堆

分割内存块

malloc实现

calloc实现

free的实现

realloc的实现

总结

Files

c-malloc

Directory actions

More options

Directory actions

More options

Latest commit

History

c-malloc

Folders and files

parent directory

README.md

堆内存

brk and sbrk

mmap

dummy malloc

如何去实现

地址对齐

First fit算法

扩展堆

分割内存块

malloc实现

calloc实现

free的实现

realloc的实现

总结