一,OC对象本质,用clang编译main.m
OC对象结构都是通过基础的C/C++结构体实现的,我们通过创建OC文件及对象,将OC对象转化为C++文件来探寻OC对象的本质。
代码:
@interface HTPerson : NSObject
@property(nonatomic,strong)NSString *name;
@end
@implementation HTPerson
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
HTPerson *person = [[HTPerson alloc]init];
NSLog(@"Hello, World!");
}
return 0;
}
通过命令行将OC的main文件转化为C++文件
我们通过命令行将OC的mian.m文件转化为c++文件。
复制代码clang -rewrite-objc main.m -o main.cpp // 这种方式没有指定架构例如arm64架构 其中cpp代表(c plus plus)
生成 main.cpp
我们可以指定架构模式的命令行,使用xcode工具 xcrun
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
生成 main-arm64.cpp
#ifndef _REWRITER_typedef_HTPerson
#define _REWRITER_typedef_HTPerson
typedef struct objc_object HTPerson;
typedef struct {} _objc_exc_HTPerson;
#endif
extern "C" unsigned long OBJC_IVAR_$_HTPerson$_name;
struct HTPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
// @property (nonatomic, strong) NSString* name;
/* @end */
// @implementation HTPerson
static NSString * _I_HTPerson_name(HTPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_HTPerson$_name)); }
static void _I_HTPerson_setName_(HTPerson * self, SEL _cmd, NSString *name) { (*(NSString **)((char *)self + OBJC_IVAR_$_HTPerson$_name)) = name; }
// @end
int main(int argc, const char * argv[]) {
/* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;
HTPerson* person = ((HTPerson *(*)(id, SEL))(void *)objc_msgSend)((id)((HTPerson *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("HTPerson"), sel_registerName("alloc")), sel_registerName("init"));
}
return 0;
}
可以观察到HTPerson
类的本质就是结构体(struct)
struct HTPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
struct NSObject_IMPL NSObject_IVARS
是继承于父类NSObject的实例变量。这种方法模拟了类继承的行为,确保HTPerson对象不仅拥有自己的实例变量_name,还继承了NSOBject的所有实例变量。
typedef struct objc_class *Class;
struct NSObject_IMPL {
Class isa;
};
我们发现class
其实就是一个指针,isa是一个指向类对象的指针,每个OC对象都有一个isa指针,指向它的类。
extern "C" unsigned long OBJC_IVAR_$_HTPerson$_name;
这声明了一个全局变量用于_name
实例变量在HTPerson
对象中的偏移量。编译器使用这个变量来访问对象的实例变量。
下面是HTPerson属性的set,get
方法的底层实现
static NSString * _I_HTPerson_name(HTPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_HTPerson$_name)); }
static void _I_HTPerson_setName_(HTPerson * self, SEL _cmd, NSString *name) { (*(NSString **)((char *)self + OBJC_IVAR_$_HTPerson$_name)) = name; }
在set、get方法的底层实现中 OBJC_IVAR_$_SMPerson$_name
就是属性对应的内存地址的偏移量, 系统通过每个属性的偏移量,来实现对其赋值和取值。
typedef struct objc_object HTPerson;
将objc_object
结构体类型定义为HTPerson
类型
- objc_object:包含一个指向类的指针isa的结构体,所有OC对象都继承自它。
typedef struct objc_class *Class;
struct objc_object {
Class _Nonnull isa __attribute__((deprecated));
};
- HTPerson:这行代码定义了一个新的类型名
HTPerson
,它是struct objc_object
类型的别名。
二,OC对象在内存中的布局
以NSObject为例,点击NSObject进入发现NSObject的内部实现
@interface NSObject <NSObject> {
#pragma clang diagnostic push
#pragma clang diagnostic ignored "-Wobjc-interface-ivars"
Class isa OBJC_ISA_AVAILABILITY;
#pragma clang diagnostic pop
}
@end
转化为c语言函数就是一个结构体
struct NSObject_IMPL {
Class isa;
};
这个结构体只有一个成员isa指针,而指针在64位架构中占8个字节,也就是说一个NSObject
对象所暂用的内存是8
个字节。对于OC对象还有一些方法,这些方法也是占用内存的,但这些方法所占用的空间并不在NSObject对象中。
探寻NSObject对象在内存中如何体现的
NSObject *objc = [[NSObject alloc] init];
上述一段代码中系统为NSObject对象分配8个字节的内存空间,用来存放一个成员isa指针。那么isa指针这个变量的地址就是结构体的起始地址,也就是NSObjcet对象的地址。
假设isa的地址为0x100400110,那么上述代码分配存储空间给NSObject对象,然后将存储空间的地址赋值给objc指针。objc存储的就是isa的地址。objc指向内存中NSObject对象地址,即指向内存中的结构体,也就是isa的位置。
自定义类的内部实现
#import <Foundation/Foundation.h>
#import <objc/runtime.h>
@interface HTPerson : NSObject
@property (nonatomic, strong) NSString* name;
@property (nonatomic) int number;
@property (nonatomic, strong) NSString* phone;
@end
@implementation HTPerson
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
HTPerson* person = [[HTPerson alloc] init];
person.name = @"name";
person.number = 1;
person.phone = @"123";
NSLog(@"%zd", class_getInstanceSize([HTPerson class]));
}
return 0;
}
struct HTPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
int _number;
NSString *_name;
NSString *_phone;
};
NSObject_IMPL内部其实就是Class isa 那么我们假设 struct NSObject_IMPL NSObject_IVARS; 等价于 Class isa;
所以可以转化为
struct HTPerson_IMPL {
Class *isa;
int _number;
NSString *_name;
NSString *_phone;
};
因此此结构体占用多少存储空间,对象就占用多少存储空间。输出结果为32.
现在我们来计算总的内存大小,考虑内存对齐:
- NSObject_IVARS(假设它包含一个指针):8字节
- _number:4字节
对齐填充:4字节(因为接下来是指针,按8字节对齐) - _name:8字节
- _phone:8字节
所以OC对象的内存布局也遵守结构体的内存对齐规则。
- 前面的地址必须是后面的地址正数倍,不是就补齐。
- 整个Struct的地址必须是最大字节的整数倍。
复杂的继承关系
/* Person */
@interface Person : NSObject
{
int _age;
}
@end
@implementation Person
@end
/* Student */
@interface Student : Person
{
int _no;
}
@end
@implementation Student
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
NSLog(@"%zd %zd",
class_getInstanceSize([Person class]),
class_getInstanceSize([Student class])
);
}
return 0;
}
画出内存图例
我们发现只要继承自NSObject
的对象,那么底层结构体内一定有一个isa
指针。
上面的输出结果为16,16。
person对象只使用了12个字节,但是因为内存对齐的原因,使person对象也占用16个字节。对于student对象,包含了person对象的结构体实现,和一个int类型的_no成员变量,同样isa指针8个字节,_age成员变量4个字节,_no成员变量4个字节,根据内存对齐原则student对象占据的内存空间也是16个字节。
类的本质
OC的类信息存放在哪里? OC对象主要可以分为三种
- instance对象(实例对象)
- class对象(类对象)
- meta-class对象(元类对象)
instance对象就是通过类alloc出来的对象,每次调用alloc都会产生新的instance对象。
NSObjcet *object1 = [[NSObjcet alloc] init];
NSObjcet *object2 = [[NSObjcet alloc] init];
object1
和object2
都是NSObject
的instace
对象(实例对象),但他们是不同的两个对象,并且分别占据着两块不同的内存。 instance对象在内存中存储的信息包括isa指针和其他成员变量
class对象 我们通过class方法或runtime方法得到一个class对象。class对象也就是类对象
Class objectClass1 = [object1 class];//获取类对象
Class objectClass2 = [NSObject class];//获取元类
// runtime
Class objectClass4 = object_getClass(object1);
每一个类在内存中有且只有一个对象。
class对象在内存中存储的信息主要包括
- isa指针
- superclass指针
- 类的属性信息(@property),类的成员变量信息(ivar)
- 类的对象方法信息(instance method),类的协议信息(protocol)
instance对象中的成员变量是具体对象的属性,每个实例都有自己的一份副本,是成员变量具体的值。创建实例对象的时候要为成员变量赋值。而类对象中的类的成员变量信息与类本身关联,而不是与类的每个实例关联。
meta_class对象 每个类在内存中有且只有一个meta-class对象。在内存中存储的信息主要包括
- isa指针
- superclass指针
- 类的类方法的信息(class method)
meta-class对象
和class对象
的内存结构是一样的,所以meta-class中也有类的属性信息,类的对象方法信息等成员变量,但是其中的值可能是空的。
对象的isa指针的指向
- 当对象调用实例方法的时候,实例方法信息是存储在class类对象中的,instance的isa指向class,通过instance的isa找到
class
,最后找到对象方法的实现进行调用。 - 当类对象调用类方法的时候,类方法是存储在meta-class元类对象中的。class类对象的isa指针就指向元类对象,通过class的isa找到
meta-class
,最后找到类方法的实现进行调用
- 当对象调用其父类对象方法的时候,此时就需要使用到class类对象superclass指针。当Student的instance对象要调用Person的对象方法时,会先通过
isa
找到Student的class
,然后通过superclass
找到Person的class
,最后找到对象方法的实现进行调用。 - 当类对象调用父类的类方法时,当Student的class要调用Person的类方法时,会先通过isa找到Student的meta-class,然后通过
superclass
找到Person的meta-class
,最后找到类方法的实现进行调用
不管是类对象还是元类对象,类型都是Class
,class
和mete-class
的底层都是objc_class结构体的指针,内存中就是结构体
struct objc_class : objc_object {
...省略无关代码
// Class ISA; //ISA(从objc_object继承过来的)指向元类
Class superclass; //指向其父类
cache_t cache; //缓存
class_data_bits_t bits; //类的数据
class_rw_t *data() const {
return bits.data();
}
void setData(class_rw_t *newData) {
bits.setData(newData);
}
...省略无关代码
}
这个结构体继承 objc_object
并且结构体内有一些函数,因为这是c++结构体,在c上做了扩展,因此结构体中可以包含函数。
前面讲到bjc_object中有一个isa指针,那么objc_class
继承objc_objec
t,也就同样拥有一个isa
指针。
类中存储的类的成员变量信息,实例方法,属性名等这些信息在哪里呢。
class_data_bits_t bits; //类的数据
class_rw_t *data() const {
return bits.data();
}
void setData(class_rw_t *newData) {
bits.setData(newData);
}
obj_class中有class_rw_t
类型的bits.data
的读写
我们来到class_rw_t
中,class_rw_t 结构体是 Objective-C 运行时中用于描述类的可读写数据的结构体。它包含了类的动态数据,可以在运行时修改。这些数据包括标志、方法列表、属性列表、协议列表等。
struct class_rw_t {
// Be warned that Symbolication knows the layout of this structure.
uint32_t flags;
uint16_t witness;
#if SUPPORT_INDEXED_ISA
uint16_t index;
#endif
explicit_atomic<uintptr_t> ro_or_rw_ext;
Class firstSubclass;
Class nextSiblingClass;
private:
using ro_or_rw_ext_t = objc::PointerUnion<const class_ro_t, class_rw_ext_t, PTRAUTH_STR("class_ro_t"), PTRAUTH_STR("class_rw_ext_t")>;
const ro_or_rw_ext_t get_ro_or_rwe() const {
return ro_or_rw_ext_t{ro_or_rw_ext};
}
void set_ro_or_rwe(const class_ro_t *ro) {
ro_or_rw_ext_t{ro, &ro_or_rw_ext}.storeAt(ro_or_rw_ext, memory_order_relaxed);
}
void set_ro_or_rwe(class_rw_ext_t *rwe, const class_ro_t *ro) {
// the release barrier is so that the class_rw_ext_t::ro initialization
// is visible to lockless readers
rwe->ro = ro;
ro_or_rw_ext_t{rwe, &ro_or_rw_ext}.storeAt(ro_or_rw_ext, memory_order_release);
}
class_rw_ext_t *extAlloc(const class_ro_t *ro, bool deep = false);
public:
void setFlags(uint32_t set)
{
__c11_atomic_fetch_or((_Atomic(uint32_t) *)&flags, set, __ATOMIC_RELAXED);
}
void clearFlags(uint32_t clear)
{
__c11_atomic_fetch_and((_Atomic(uint32_t) *)&flags, ~clear, __ATOMIC_RELAXED);
}
// set and clear must not overlap
void changeFlags(uint32_t set, uint32_t clear)
{
ASSERT((set & clear) == 0);
uint32_t oldf, newf;
do {
oldf = flags;
newf = (oldf | set) & ~clear;
} while (!CompareAndSwap(oldf, newf, &flags));
}
class_rw_ext_t *ext() const {
return get_ro_or_rwe().dyn_cast<class_rw_ext_t *>(&ro_or_rw_ext);
}
class_rw_ext_t *extAllocIfNeeded() {
auto v = get_ro_or_rwe();
if (fastpath(v.is<class_rw_ext_t *>())) {
return v.get<class_rw_ext_t *>(&ro_or_rw_ext);
} else {
return extAlloc(v.get<const class_ro_t *>(&ro_or_rw_ext));
}
}
class_rw_ext_t *deepCopy(const class_ro_t *ro) {
return extAlloc(ro, true);
}
const class_ro_t *ro() const {
auto v = get_ro_or_rwe();
if (slowpath(v.is<class_rw_ext_t *>())) {
return v.get<class_rw_ext_t *>(&ro_or_rw_ext)->ro;
}
return v.get<const class_ro_t *>(&ro_or_rw_ext);
}
void set_ro(const class_ro_t *ro) {
auto v = get_ro_or_rwe();
if (v.is<class_rw_ext_t *>()) {
v.get<class_rw_ext_t *>(&ro_or_rw_ext)->ro = ro;
} else {
set_ro_or_rwe(ro);
}
}
const method_array_t methods() const {
auto v = get_ro_or_rwe();
if (v.is<class_rw_ext_t *>()) {
return v.get<class_rw_ext_t *>(&ro_or_rw_ext)->methods;
} else {
return method_array_t{v.get<const class_ro_t *>(&ro_or_rw_ext)->baseMethods};
}
}//方法列表
const property_array_t properties() const {
auto v = get_ro_or_rwe();
if (v.is<class_rw_ext_t *>()) {
return v.get<class_rw_ext_t *>(&ro_or_rw_ext)->properties;
} else {
return property_array_t{v.get<const class_ro_t *>(&ro_or_rw_ext)->baseProperties};
}
}//属性列表
const protocol_array_t protocols() const {
auto v = get_ro_or_rwe();
if (v.is<class_rw_ext_t *>()) {
return v.get<class_rw_ext_t *>(&ro_or_rw_ext)->protocols;
} else {
return protocol_array_t{v.get<const class_ro_t *>(&ro_or_rw_ext)->baseProtocols};
}
}//协议列表
}
而成员变量信息则是存储在class_ro_t
内部中的,我们来到class_ro_t内查看。
class_ro_t 结构体是 Objective-C 运行时中用于描述类的只读数据的重要部分,包含了类的方法列表、属性列表、协议列表等信息。通过 ro_or_rw_ext 成员,class_rw_t 可以指向只读数据(class_ro_t
)或读写扩展数据(class_rw_ext_t
),并通过成员函数来访问和修改这些数据。
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;//实例对象大小
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name;//类名
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;//成员变量
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
// This field exists only when RO_HAS_SWIFT_INITIALIZER is set.
_objc_swiftMetadataInitializer __ptrauth_objc_method_list_imp _swiftMetadataInitializer_NEVER_USE[0];
_objc_swiftMetadataInitializer swiftMetadataInitializer() const {
if (flags & RO_HAS_SWIFT_INITIALIZER) {
return _swiftMetadataInitializer_NEVER_USE[0];
} else {
return nil;
}
}
method_list_t *baseMethods() const {
return baseMethodList;
}
class_ro_t *duplicate() const {
if (flags & RO_HAS_SWIFT_INITIALIZER) {
size_t size = sizeof(*this) + sizeof(_swiftMetadataInitializer_NEVER_USE[0]);
class_ro_t *ro = (class_ro_t *)memdup(this, size);
ro->_swiftMetadataInitializer_NEVER_USE[0] = this->_swiftMetadataInitializer_NEVER_USE[0];
return ro;
} else {
size_t size = sizeof(*this);
class_ro_t *ro = (class_ro_t *)memdup(this, size);
return ro;
}
}
};
总结如图: