本文只作概念性講解,不作詳解,只是希望把我理解的原理簡單地描述出來,不深入探究。
JVM
JVM是什么?
我的理解簡單來說是:一個能把Class字節碼翻譯成本機cpu能夠識別的指令的程序。
流程
Java源碼(.java文件) => 編譯器 => Class文件 => JVM => 可執行的指令
不一定只有Java,例如Scala,Groovy等基于JVM的語言,只要能編譯成標準Class的都可以。
Class文件
class文件結構介紹:
根據java虛擬機規范的規定,class文件格式采用一種類似c語言結構體的偽結構來存儲,這種偽結構中只有兩種數據類型:無符號數和表。
無符號數:無符號數屬于基本的數據類型,以u1,u2,u4,u8來分別代表1個字節,2個字節,4個字節和8個字節的無符號數,無符號數可以用來描述數字、索引引用、數量值,或者按照utf-8編碼構成字符串值。
表:表是由多個無符號數或者其他表作為數據項構成的復合數據類型,所有表都習慣性地以“_info“結尾。表用于描述有層次關系的復合結構的數據,整個class文件本質上就是一張表,它由下列數據項構成:
ClassFile {
u4 magic;//魔數(0xCAFEBABE),每個class文件的前4個字節稱為魔數,值為0xCAFEBABE。作用在于輕松的辨別class文件與非class文件。
//下面兩個是版本號,隨著Java技術的發展,class文件的格式會發生變化。版本號的作用在于使得虛擬機能夠認識當前加載class的文件格式。從而準確的提取class文件信息
u2 minor_version;//次版本號
u2 major_version;//主版本號
u2 constant_pool_count;//常量池容量計數值
cp_info constant_pool[constant_pool_count-1];//常量池,具體見對照表
u2 access_flags;//訪問標志,用來表明該class文件中定義的是類還是接口,訪問修飾符是public還是缺省。類或接口是否是抽象的。類是否是final的。
u2 this_class;//類索引
u2 super_class;//父類索引
u2 interfaces_count;//接口計數器
u2 interfaces[interfaces_count];//接口索引集合
u2 fields_count;//字段計數器
field_info fields[fields_count];//字段表
u2 methods_count;//方法計數器
method_info methods[methods_count];//方法表
u2 attributes_count;//屬性表計數器
attribute_info attributes[attributes_count];//屬性表集合
}
常量對照表
常量表類型 | 標志值(占1 byte) | 描述 |
---|---|---|
CONSTANT_Utf8 | 1 | UTF-8編碼的Unicode字符串 |
CONSTANT_Integer | 3 | int類型的字面值 |
CONSTANT_Float | 4 | float類型的字面值 |
CONSTANT_Long | 5 | long類型的字面值 |
CONSTANT_Double | 6 | double類型的字面值 |
CONSTANT_Class | 7 | 對一個類或接口的符號引用 |
CONSTANT_String | 8 | String類型字面值的引用 |
CONSTANT_Fieldref | 9 | 對一個字段的符號引用 |
CONSTANT_Methodref | 10 | 對一個類中方法的符號引用 |
CONSTANT_InterfaceMethodref | 11 | 對一個接口中方法的符號引用 |
CONSTANT_NameAndType | 12 | 對一個字段或方法的部分符號引用 |
如上面表格所示,每個類型都會有對應的tag值,還有方法權限標志表,描述符表之類的(省略了,想深入了解請看《深入理解Java虛擬機》)。根據這些tag值來表示,例如常量為01 00 12 4C 6A 61 76 61 2F 6C 61 6E 67 2F 53 74 72 69 6E 67 3B
,是int類型呢還是float呢,是public還是private?根據這些對照表來查出對應tag所表示的意義可以看出:
01——tag值為1,類型為CONSTANT_Utf8_info;
00 12——這個UTF-8編碼的常量字符串長度為18;
4C 6A 61 76 61 2F 6C 61 6E 67 2F 53 74 72 69 6E 67 3B——18個字節的字符串,對應:
Ljava/lang/String
(描述符,L 代表是引用類型);
反編譯原理
Class按照上面說的tag值和表對照,就能分析出Class對應的Java文件結構,那么即遵循這樣的規范反編譯成Java文件,當然反編譯出來的并非是原本一模一樣的Java源碼,而是根據分析重新生成的Java代碼。