聲明:本文摘抄自《深入理解Java虛擬機》一書,本文完全為自我學習,請感興趣的同學購買正版,支持原創
Java虛擬機不和包括Java語言在內的任何語言綁定,它只與“Class文件”這種特定的二進制文件所關聯。Class文件中包含了Java虛擬機指令集和符號表以及若干輔助信息。
Class文件結構
Class文件是以8位字節為基礎單位的二進制流,各項數據項目嚴格按照順序緊湊的排列在Class文件之中,中間沒有添加任何分割符,這使的整個Class文件中存儲的內容幾乎全部是程序運行所必須的數據,沒有空隙存在。當遇到需要占用8字節以上空間的數據項時,則會按照高位在前的方式分割成若干個8為字節進行存儲。
根據Java虛擬機規范,Class文件格式采用類似與C語言結構體的偽結構來存儲數據,這種結構只有兩種數據類型:無符號數和表。對Class文件解析都是基于這兩種數據類型進行的。
無符號數屬于基本數據類型,以u1,u2,u4,u8來分別表示1個字節,2個字節,4個字節和8個字節的無符號數,無符號數可以用來描述數字,索引引用,數量值或者按照UTF-8編碼構成的字符串值。
表是由多個無符號數或其他表為數據項構成的復合數據類型,所有表都習慣性以“_info”結尾。表用于描述有層次關系的復合結構的數據。
無論是無符號數還是表,當需要描述同一類型但數量不定的多個數據時,經常會使用一個前置的容量計數器加若干個連續的數據項的形式,這時稱這一連續的某一類型的數據為某一類型的集合。
魔數與Class文件的版本
每個Class文件的頭4個字節稱為魔數(Magic Number),它的唯一作用就是確定這個文件是否為一個能被虛擬機接受的Class文件。很多文件存儲標準中都使用魔數來進行身份識別,譬如圖片格式,如gif或者jpeg等在文件頭中都存在魔數。Class文件的魔數為“0xCAFEBABE”。
緊接著魔數后4個字節存儲的是Class文件的版本號:第5和第6個字節是次版本號(Minor Version),第7和第8字節是主版本號(Major Version)。高版本的JDK能向下兼容以前版本的Class文件,但不能運行以后版本的Class文件,即使文件格式并未發生任何變化,虛擬機也拒絕執行超過其版本號的Class文件。
常量池
緊接著主版本號之后就是常量池入口。常量池是Class文件結構中與其他項目關聯最多的數據類型,也是占用Class文件空間最大的數據之一。由于常量池中常量個數是不固定的,所以在常量池的入口需要一項u2類型的數據,來代表常量池中常量個數(constant_pool_count)。與Java中語言習慣不一樣的是,這個容量計數是從1而不是0開始的(第0項常量空出來有特殊考慮)。Class文件結構中只有常量池的容量計數是從1開始,對于其他集合類型,包括接口索引集合,字段表集合,方法集合等容量計數都與一般習慣相同,是從0開始的。
常量池中主要存放兩大類常量:字面量(Literal)和符號引用(Symbolic Refereces)。
字面量比較接近與Java語言層面的常量概念,如文本字符串,聲明為final類型的常量值等。
符號引用則屬于編譯原理方面的概念,包括了下面三類常量:
- 類和接口的全限定名(Fully Qualified Name)
- 字段的名稱和描述符(Descriptor)
- 方法的名稱和描述符
常量池目前共有14種結構,常量池是最繁瑣的數據,因為這14種常量類型各自均有自己的結構。
Java 相關規范:http://docs.oracle.com/javase/specs/index.html
Java虛擬機規范《The Java Virtual Machine Specification》
[JDK7]:http://docs.oracle.com/javase/specs/jvms/se7/html/index.html
[JDK8]:http://docs.oracle.com/javase/specs/jvms/se8/html/index.html