背景
随着性能优化逐步进入深水区,我们发现很多大厂的方案,其实都建立在对正常虚拟机运行过程中Hook的基础上,建立自己的优化方案。因此,只有了解了art虚拟机的运行机制,才能真正去实施一些特殊的“魔改”方案。因为art代码非常庞大,我们会从很多的方面去了解他。本片是Heap 模型的第一篇。
内存分配
当我们在java层 new 一个对象的时候,由于有虚拟机的存在,我们开发者不用了解任何相关的内存分配细节,就能够完成一次内存的分配。那么,art虚拟机究竟是怎么帮助我们进行内存分配的,其实得益于art虚拟机抽象的以下分配类
我们从上图可以看到,art把内存分配相关的模型策略,分为了6层
第一层
分为了Space与AllocSpace两个类,他们都是一个虚类,即需要子类去实现virtual修饰的方法,比如我们看到Space类定义
class Space {
public:
// Dump space. Also key method for C++ vtables.
virtual void Dump(std::ostream& os) const;
Space代表一块内存空间,AllocSpace代表一块可用于内存分配的空间,AllocSpace则提供了内存分配与释放相关的虚函数,Alloc,Free,由特定的子类去实现对应的策略。
class AllocSpace {
public:
virtual mirror::Object* Alloc(Thread* self, size_t num_bytes, size_t* bytes_allocated,
size_t* usable_size, size_t* bytes_tl_bulk_allocated) = 0;
virtual size_t Free(Thread* self, mirror::Object* ptr) = 0;
再回过头我们看到上面的类图,我们就会发现子类中的ImageSpace是没有继承于AllocSpace,这就意味着,它其实是没有实现对应的Alloc与Free相关的函数,因此,我们常说的GC机制,其实是不会作用在这块内存空间上面的!非常有趣!我们下文会继续讲到,这跟art划分的内存模型有很大关系
第二层
第二层是ContinuousSpace与DiscontinuousSpace两个类,这两个类的职责非常简单,前者就是代表了该内存空间是连续的,后者是非连续。
划分为连续与非连续,其实更大的作用是在GC过程中相关的内存整理,非连续的空间有更简单的分配方式
第三层
MemMapSpace 与 LargeObjectSpace是第三层,在这里,已经开始根据外部所需要的空间的大小,进行了不同的空间划分。比如当分配的内存属于java对象String或者是基础类型的数组,且内存超过3个内存页(Heap 构造时我们会讲到,一般是12kb)的时候,就会把资源分配到LargeObject内存空间里面,其他的就分配在MemMapSpace
第四层
到了第四层,我们出现了第一个非常重要的内存分配空间,ImageSpcace,ImageSpace用于.art文件的加载,我们知道应用可以在预编译的时候,生成.art文件,还有就是一些系统类,比如boot.art,这些art文件在内存中的表现,其实就放在了ImageSpace中。同时我们也讲到,ImageSpace没有继承AllocSpace,这也就意味着,它不会对外提供分配与释放策略,因此该内存中,也不会被GC所影响!(可以把部分启动类放在这里,达到GC抑制的效果)而另外的ContinuousMemMapAllocSpace,将由它的子类去实现常见的内存分配策略。
第五、六层
五六层就是具体的art内存分配策略了,包括了BumpPointerSpace,ZygoteSpace,RegionSpace,RosAllocSpace,DlMallocSpace,它们都有自己特有的内存分配策略,这些策略被应用在不同的各个地方(主要由GC策略选择不同的内存分配策略)。下面我们按装顺序介绍一下这几种内存分配策略
内存分配策略
BumpPointerSpace
BumpPointerSpace其实分配思想很简单,就是顺序分配,比如我第一次分配分配10kb内存,下一次再分配xxkb
BumpPointerSpace::BumpPointerSpace(const std::string& name, uint8_t* begin, uint8_t* limit)
: ContinuousMemMapAllocSpace(name,
MemMap::Invalid(),
begin,
begin,
limit,
kGcRetentionPolicyAlwaysCollect),
growth_end_(limit), 资源的尾部,
objects_allocated_(0), 当前有多少个mirrorobject
bytes_allocated_(0), 分配的内存大小
block_lock_("Block lock"),
main_block_size_(0) {
// This constructor gets called only from Heap::PreZygoteFork(), which
// doesn't require a mark_bitmap.
}
因为是顺序分配,因此我们只需记录一个尾部end地址(已分配的最后一个地址尾部),就能在下次分配直接找到分配的开始地址,非常简单,这里就不详细说分配过程,可以参考分配源码
ZygoteSpace
ZygoteSpace本身没有创建相关的内存资源,而是通过外部传入的MemMap对象,作为内存资源,自身只是起到了一个管理作用
ZygoteSpace* ZygoteSpace::Create(const std::string& name,
MemMap&& mem_map,
accounting::ContinuousSpaceBitmap&& live_bitmap,
accounting::ContinuousSpaceBitmap&& mark_bitmap) {
DCHECK(live_bitmap.IsValid());
DCHECK(mark_bitmap.IsValid());
size_t objects_allocated = 0;
CountObjectsAllocated visitor(&objects_allocated);
ReaderMutexLock mu(Thread::Current(), *Locks::heap_bitmap_lock_);
live_bitmap.VisitMarkedRange(reinterpret_cast<uintptr_t>(mem_map.Begin()),
reinterpret_cast<uintptr_t>(mem_map.End()), visitor);
ZygoteSpace* zygote_space = new ZygoteSpace(name, std::move(mem_map), objects_allocated);
zygote_space->live_bitmap_ = std::move(live_bitmap);
zygote_space->mark_bitmap_ = std::move(mark_bitmap);
return zygote_space;
}
ZygoteSpace在art有特殊的含义,就是该内存空间是继承自Zygote进程的资源存放地,虽然它继承自AllocSpace,但是它的分配实现Alloc/Free,是不起作用的
mirror::Object* ZygoteSpace::Alloc(Thread*, size_t, size_t*, size_t*, size_t*) {
UNIMPLEMENTED(FATAL);
UNREACHABLE();
}
它作为一块带有“含义”的内存资源而存在,同时它不同于ImageSpace,ImageSpace存放的是系统资源内存,不会发生GC操作。而ZygoteSpace会在FullGC的时候,进行GC的操作。因为来自Zygote进程的内存,还是有回收的空间
RegionSpace
RegionSpace,其实是把内存资源通过划分的思想,把内存划分成一个个固定大小的Region而得名,相当于内存空间被划分多个内存块,进行内存分配时,在内存块分配即可。
RegionSpace::RegionSpace(const std::string& name, MemMap&& mem_map, bool use_generational_cc)
: ContinuousMemMapAllocSpace(name,
std::move(mem_map),
mem_map.Begin(),
mem_map.End(),
mem_map.End(),
kGcRetentionPolicyAlwaysCollect),
region_lock_("Region lock", kRegionSpaceRegionLock),
use_generational_cc_(use_generational_cc),
time_(1U),
num_regions_(mem_map_.Size() / kRegionSize),
madvise_time_(0U),
num_non_free_regions_(0U),
num_evac_regions_(0U),
max_peak_num_non_free_regions_(0U),
non_free_region_index_limit_(0U),
current_region_(&full_region_),
evac_region_(nullptr),
cyclic_alloc_region_index_(0U) {
CHECK_ALIGNED(mem_map_.Size(), kRegionSize);
CHECK_ALIGNED(mem_map_.Begin(), kRegionSize);
DCHECK_GT(num_regions_, 0U);
num_regions_ 个Region空间
regions_.reset(new Region[num_regions_]);
uint8_t* region_addr = mem_map_.Begin();
for (size_t i = 0; i < num_regions_; ++i, region_addr += kRegionSize) {
regions_[i].Init(i, region_addr, region_addr + kRegionSize);
}
mark_bitmap_ =
accounting::ContinuousSpaceBitmap::Create("region space live bitmap", Begin(), Capacity());
if (kIsDebugBuild) {
CHECK_EQ(regions_[0].Begin(), Begin());
for (size_t i = 0; i < num_regions_; ++i) {
CHECK(regions_[i].IsFree());
CHECK_EQ(static_cast<size_t>(regions_[i].End() - regions_[i].Begin()), kRegionSize);
if (i + 1 < num_regions_) {
CHECK_EQ(regions_[i].End(), regions_[i + 1].Begin());
}
}
CHECK_EQ(regions_[num_regions_ - 1].End(), Limit());
}
DCHECK(!full_region_.IsFree());
DCHECK(full_region_.IsAllocated());
size_t ignored;
DCHECK(full_region_.Alloc(kAlignment, &ignored, nullptr, &ignored) == nullptr);
// Protect the whole region space from the start.
Protect();
}
其中分配会采取内存对其,由属性kRegionSize决定(每个Region默认1m)
因为抽象出来一个个Region,我们能够随心的去分配想要的内存,不局限内存本身是否是连续的,同时因为每个内存块当前的状态不同(比如,有的已经分配了,有的没有),因此每个Region本身还对应一个状态RegionState
enum class RegionState : uint8_t {
kRegionStateFree, 该Region没有内存分配
kRegionStateAllocated, 内存块已分配
kRegionStateLarge, 大对象Region,比如4m的大对象(那么就需要4个Region),其中第一块Region状态为kRegionStateLarge,其他就是kRegionStateLargeTail
kRegionStateLargeTail, 如上
};
RegionSpace本身还定义着很多toSpace,fromSpace的操作,其实它就是Copying Collection(拷贝垃圾回收机制)的内存分配模型。然后android7包括7默认的垃圾回收机制,前台是CMS,后台是HSC,因此,RegionSpace能被发挥作用的地方其实还算是有点局限,除非你指定了Copying Collection垃圾回收机制,android8后,CC转正了,因此RegionSpace有了更多的发挥空间
DlmallocSpace 与 RosAllocSpace
我们从上文的类图可以看到DlmallocSpace与RosAllocSpace ,都是MallocSpace的子类,而我们的Heap里面,其实只有MallocSpace对象,具体选择实现的子类是DlmallocSpace还是RosAllocSpace,其实由kUseRosAlloc决定,默认是使用RosAllocSpace。
space::MallocSpace* Heap::CreateMallocSpaceFromMemMap(MemMap&& mem_map,
size_t initial_size,
size_t growth_limit,
size_t capacity,
const char* name,
bool can_move_objects) {
space::MallocSpace* malloc_space = nullptr;
if (kUseRosAlloc) {
// Create rosalloc space.
malloc_space = space::RosAllocSpace::CreateFromMemMap(std::move(mem_map),
name,
kDefaultStartingSize,
initial_size,
growth_limit,
capacity,
low_memory_mode_,
can_move_objects);
} else {
malloc_space = space::DlMallocSpace::CreateFromMemMap(std::move(mem_map),
name,
kDefaultStartingSize,
initial_size,
growth_limit,
capacity,
can_move_objects);
}
if (collector::SemiSpace::kUseRememberedSet) {
accounting::RememberedSet* rem_set =
new accounting::RememberedSet(std::string(name) + " remembered set", this, malloc_space);
CHECK(rem_set != nullptr) << "Failed to create main space remembered set";
AddRememberedSet(rem_set);
}
CHECK(malloc_space != nullptr) << "Failed to create " << name;
malloc_space->SetFootprintLimit(malloc_space->Capacity());
return malloc_space;
}
DlmallocSpace与RosAllocSpace两者不同点就在于,实现的机制不一样,DlmallocSpace采用的是dlmalloc内存分配管理模型,它是一个开源库,也是c语音malloc调用的具体实现。dlmalloc内存机制如下(其实就是malloc的机制)
而RosAllocSpace,采用的是谷歌自己的内存分配rosalloc完成,具体实现机制如下
rosalloc是一种动态分配内存算法,专门为了art虚拟机做了适配,其实它是一种多粒度内存分配算法,ros的意思就是run of slot,可以理解为一个run是RosAllocSpace中内存分配的单元,每个Run有自己的内存分配粒度(slot)
比如Run1 中代表可分配10kb为单位的内存,Run2则代表可分配1M为单位的内存,具体的内存由slot决定。
更加具体的分配细节,可以在这里看到,我们就不深入细节,有个概念就好。
LargeObjectSpace
它的创建过程很简单,就是初始化num_bytes_allocated_等分配的参数
LargeObjectSpace::LargeObjectSpace(const std::string& name, uint8_t* begin, uint8_t* end,
const char* lock_name)
: DiscontinuousSpace(name, kGcRetentionPolicyAlwaysCollect),
lock_(lock_name, kAllocSpaceLock),
num_bytes_allocated_(0), num_objects_allocated_(0), total_bytes_allocated_(0),
total_objects_allocated_(0), begin_(begin), end_(end) {
}
不知道大家有没有发现,LargeObjectSpace跟其他Space不一样,它继承于DiscontinuousSpace,意味着它的分配是不连续的,我们看一下它的分配过程就理解了
mirror::Object* LargeObjectMapSpace::Alloc(Thread* self, size_t num_bytes,
size_t* bytes_allocated, size_t* usable_size,
size_t* bytes_tl_bulk_allocated) {
std::string error_msg;
每次都调用MapAnonymous,其实它最终调用的就是mmap
MemMap mem_map = MemMap::MapAnonymous("large object space allocation",
num_bytes,
PROT_READ | PROT_WRITE,
/*low_4gb=*/ true,
&error_msg);
if (UNLIKELY(!mem_map.IsValid())) {
LOG(WARNING) << "Large object allocation failed: " << error_msg;
return nullptr;
}
mirror::Object* const obj = reinterpret_cast<mirror::Object*>(mem_map.Begin());
const size_t allocation_size = mem_map.BaseSize();
MutexLock mu(self, lock_);
large_objects_.Put(obj, LargeObject {std::move(mem_map), false /* not zygote */});
DCHECK(bytes_allocated != nullptr);
if (begin_ == nullptr || begin_ > reinterpret_cast<uint8_t*>(obj)) {
begin_ = reinterpret_cast<uint8_t*>(obj);
}
end_ = std::max(end_, reinterpret_cast<uint8_t*>(obj) + allocation_size);
*bytes_allocated = allocation_size;
if (usable_size != nullptr) {
*usable_size = allocation_size;
}
DCHECK(bytes_tl_bulk_allocated != nullptr);
*bytes_tl_bulk_allocated = allocation_size;
num_bytes_allocated_ += allocation_size;
total_bytes_allocated_ += allocation_size;
++num_objects_allocated_;
++total_objects_allocated_;
return obj;
}
可以看到,分配的时候,其实每次都是采用mmap去分配内存空间,而LargeObjectMapSpace就是将mmap返回的空间进行了一次管理,所以它才是不连续的,很好理解,这也意味指这块内存的增长,不会影响属于连续内存分配的其他Space(这里能做很多黑科技)。
那么我们分配的内存什么时候会被划分进入LargeObjectSpace呢?其实我们直接看Heap分配条件即可,被定义为大对象要满足以下条件
inline bool Heap::ShouldAllocLargeObject(ObjPtr<mirror::Class> c, size_t byte_count) const {
return byte_count >= large_object_threshold_ && (c->IsPrimitiveArray() || c->IsStringClass());
}
large_object_threshold_默认为12kb
总结
我们通过本文,初步了解了art内存分配的几个模型,为什么要写这个系列呢,其实就是因为最近大厂很多针对内存优化的方案,都离不开对虚拟机内存分配的知识的了解!希望能够通过这一系列的文章,能够对自己有帮助!
本文正在参加「金石计划」