Java內(nèi)存分配與管理是Java的核心技術(shù)之一,一般Java在內(nèi)存分配時(shí)會涉及到以下區(qū)域:
- 寄存器:我們在程序中無法控制
- 棧:存放基本類型的數(shù)據(jù)和對象的引用,但對象本身不存放在棧中,而是存放在堆中
- 堆:存放用new產(chǎn)生的數(shù)據(jù)
- 靜態(tài)域:存放在對象中用static定義的靜態(tài)成員
- 常量池:存放常量
- 非RAM存儲:硬盤等永久存儲空間
Java內(nèi)存分配中的棧
在函數(shù)中定義的一些基本類型的變量數(shù)據(jù)和對象的引用變量都在函數(shù)的棧內(nèi)存中分配。當(dāng)在一段代碼塊定義一個(gè)變量時(shí),Java就在棧中為這個(gè)變量分配內(nèi)存空間,當(dāng)該變量退出該作用域后,Java會自動釋放掉為該變量所分配的內(nèi)存空間,該內(nèi)存空間可以立即被另作他用。
Java內(nèi)存分配中的堆
堆內(nèi)存用來存放由new創(chuàng)建的對象和數(shù)組。 在堆中分配的內(nèi)存,由Java虛擬機(jī)的自動垃圾回收器來管理。
在堆中產(chǎn)生了一個(gè)數(shù)組或?qū)ο蠛螅€可以在棧中定義一個(gè)特殊的變量,讓棧中這個(gè)變量的取值等于數(shù)組或?qū)ο笤诙褍?nèi)存中的首地址,棧中的這個(gè)變量就成了數(shù)組或?qū)ο蟮囊米兞俊?/p>
引用變量是普通的變量,定義時(shí)在棧中分配,引用變量在程序運(yùn)行到其作用域之外后被釋放。而數(shù)組和對象本身在堆中分配,即使程序運(yùn)行到使用 new 產(chǎn)生數(shù)組或者對象的語句所在的代碼塊之外,數(shù)組和對象本身占據(jù)的內(nèi)存不會被釋放,數(shù)組和對象在沒有引用變量指向它的時(shí)候,才變?yōu)槔荒茉俦皇褂茫匀徽紦?jù)內(nèi)存空間不放,在隨后的一個(gè)不確定的時(shí)間被垃圾回收器收走(釋放掉)。這也是Java 比較占內(nèi)存的原因。
常量池 (constant pool)
常量池指的是在編譯期被確定,并被保存在已編譯的.class文件中的一些數(shù)據(jù)。除了包含代碼中所定義的各種基本類型(如int、long等等)和對象型(如String及數(shù)組)的常量值(final)還包含一些以文本形式出現(xiàn)的符號引用,比如:
- 類和接口的全限定名
- 字段的名稱和描述符
- 方法和名稱和描述符
虛擬機(jī)必須為每個(gè)被裝載的類型維護(hù)一個(gè)常量池。常量池就是該類型所用到常量的一個(gè)有序集和,包括直接常量(string、integer和 floating point常量)和對其他類型、字段和方法的符號引用。
對于String常量,它的值是在常量池中的。而JVM中的常量池在內(nèi)存當(dāng)中是以表的形式存在的。對于String類型,有一張固定長度的CONSTANT_String_info表用來存儲文字字符串值,注意:該表只存儲文字字符串值,不存儲符號引用。說到這里,對常量池中的字符串值的存儲位置應(yīng)該有一個(gè)比較明了的理解了。在程序執(zhí)行的時(shí)候,常量池會儲存在Method Area,而不是堆中。
堆與棧
Java的堆是一個(gè)運(yùn)行時(shí)數(shù)據(jù)區(qū),類的對象從中分配空間。這些對象通過new、newarray、 anewarray和multianewarray等指令建立。它們不需要程序代碼來顯式的釋放。堆是由垃圾回收來負(fù)責(zé)的,堆的優(yōu)勢是可以動態(tài)地分配內(nèi)存大小,生存期也不必事先告訴編譯器,因?yàn)樗窃谶\(yùn)行時(shí)動態(tài)分配內(nèi)存的,Java的垃圾收集器會自動收走這些不再使用的數(shù)據(jù)。但缺點(diǎn)是,由于要在運(yùn)行時(shí)動態(tài)分配內(nèi)存,存取速度較慢。
棧的優(yōu)勢是,存取速度比堆要快,僅次于寄存器,棧數(shù)據(jù)可以共享。但缺點(diǎn)是,存在棧中的數(shù)據(jù)大小與生存期必須是確定的,缺乏靈活性。棧中主要存放一些基本類型的變量數(shù)據(jù)(int, short, long, byte, float, double, boolean, char)和對象句柄(引用)。
棧有一個(gè)很重要的特殊性,就是存在棧中的數(shù)據(jù)可以共享。假設(shè)我們同時(shí)定義:
int a = 3;
int b = 3;
編譯器先處理int a = 3;首先它會在棧中創(chuàng)建一個(gè)變量為a的引用,然后查找棧中是否有3這個(gè)值,如果沒找到,就將3存放進(jìn)來,然后將a指向3。接著處理int b = 3;在創(chuàng)建完b的引用變量后,因?yàn)樵跅V幸呀?jīng)有3這個(gè)值,便將b直接指向3。這樣,就出現(xiàn)了a與b同時(shí)均指向3的情況。
這時(shí),如果再令 a = 4;那么編譯器會重新搜索棧中是否有4值,如果沒有,則將4存放進(jìn)來,并令a指向4;如果已經(jīng)有了,則直接將a指向這個(gè)地址。因此a值的改變不會影響到b的值。
要注意這種數(shù)據(jù)的共享與兩個(gè)對象的引用同時(shí)指向一個(gè)對象的這種共享是不同的,因?yàn)檫@種情況a的修改并不會影響到b, 它是由編譯器完成的,它有利于節(jié)省空間。而一個(gè)對象引用變量修改了這個(gè)對象的內(nèi)部狀態(tài),會影響到另一個(gè)對象引用變量。
String
String是一個(gè)特殊的包裝類數(shù)據(jù),可以用:
String str = new String("abc");
String str = "abc";
兩種形式來創(chuàng)建,第一種是用new()來新建對象的,它會存放于堆中。每調(diào)用一次就會創(chuàng)建一個(gè)新的對象。而第二種是先在棧中創(chuàng)建一個(gè)對String類的對象引用變量str,然后通過符號引用去字符串常量池里找有沒有"abc"。如果沒有,則將"abc"存放進(jìn)字符串常量池 ,并令str指向”abc”;如果已經(jīng)有”abc” 則直接令str指向“abc”。
比較類里面的數(shù)值是否相等時(shí),用equals()方法;當(dāng)測試兩個(gè)包裝類的引用是否指向同一個(gè)對象時(shí),用==,下面用例子說明上面的理論。
String str1 = "abc";
String str2 = "abc";
System.out.println(str1==str2); //true
可以看出str1和str2是指向同一個(gè)對象的。
String str1 = new String ("abc");
String str2 = new String ("abc");
System.out.println(str1==str2); // false
用new的方式是生成不同的對象。每一次生成一個(gè)。
因此用第一種方式創(chuàng)建多個(gè)”abc”字符串,在內(nèi)存中其實(shí)只存在一個(gè)對象而已. 這種寫法有利于節(jié)省內(nèi)存空間。同時(shí)它可以在一定程度上提高程序的運(yùn)行速度,因?yàn)镴VM會自動根據(jù)棧中數(shù)據(jù)的實(shí)際情況來決定是否有必要創(chuàng)建新對象。而對于String str = new String("abc");的代碼,則一概在堆中創(chuàng)建新對象,而不管其字符串值是否相等,是否有必要創(chuàng)建新對象,從而加重了程序的負(fù)擔(dān)。
另一方面, 要注意: 我們在使用諸如String str = "abc";的格式定義類時(shí),總是想當(dāng)然地認(rèn)為,創(chuàng)建了String類的對象str。擔(dān)心陷阱!對象可能并沒有被創(chuàng)建!而可能只是指向一個(gè)先前已經(jīng)創(chuàng)建的對象。只有通過new()方法才能保證每次都創(chuàng)建一個(gè)新的對象。
由于String類的immutable性質(zhì),當(dāng)String變量需要經(jīng)常變換其值時(shí),應(yīng)該考慮使用StringBuffer類,以提高程序效率。
- 首先String不屬于8種基本數(shù)據(jù)類型,String是一個(gè)對象。因?yàn)閷ο蟮哪J(rèn)值是null,所以String的默認(rèn)值也是null;但它又是一種特殊的對象,有其它對象沒有的一些特性。
- new String()和new String("")都是聲明一個(gè)新的空字符串,是空串不是null;
- String str="kvill";String str=new String ("kvill")的區(qū)別
示例:
String s0 = "kvill";
String s1 = "kvill";
String s2 = "kv" + "ill";
System.out.println( s0 == s1 );
System.out.println( s0 == s2 );
結(jié)果為:
true
true
首先,我們要知道Java會確保一個(gè)字符串常量只有一個(gè)拷貝。
因?yàn)槔又械膕0和s1中的"kvill"都是字符串常量,它們在編譯期就被確定了,所以s0==s1為true;而"kv"和"ill"也都是字符串常量,當(dāng)一個(gè)字符串由多個(gè)字符串常量連接而成時(shí),它自己肯定也是字符串常量,所以s2也同樣在編譯期就被解析為一個(gè)字符串常量,所以s2也是常量池中"kvill"的一個(gè)引用。所以我們得出s0==s1==s2;用new String() 創(chuàng)建的字符串不是常量,不能在編譯期就確定,所以new String()創(chuàng)建的字符串不放入常量池中,它們有自己的地址空間。
示例:
String s0 = "kvill";
String s1 = new String("kvill");
String s2 = "kv" + new String("ill");
System.out.println( s0 == s1 );
System.out.println( s0 == s2 );
System.out.println( s1 == s2 );
結(jié)果為:
false
false
false
例2中s0還是常量池 中"kvill”的應(yīng)用,s1因?yàn)闊o法在編譯期確定,所以是運(yùn)行時(shí)創(chuàng)建的新對象”kvill”的引用,s2因?yàn)橛泻蟀氩糠?new String(”ill”)所以也無法在編譯期確定,所以也是一個(gè)新創(chuàng)建對象”kvill”的引用;明白了這些也就知道為何得出此結(jié)果了。
- String.intern():
再補(bǔ)充介紹一點(diǎn):存在于.class文件中的常量池,在運(yùn)行期被JVM裝載,并且可以擴(kuò)充。String的 intern()方法就是擴(kuò)充常量池的一個(gè)方法;當(dāng)一個(gè)String實(shí)例str調(diào)用intern()方法時(shí),Java查找常量池中是否有相同Unicode的字符串常量,如果有,則返回其的引用,如果沒有,則在常量池中增加一個(gè)Unicode等于str的字符串并返回它的引用;看示例就清楚了
示例:
String s0 = "kvill";
String s1 = new String("kvill");
String s2 = new String("kvill");
System.out.println( s0==s1 );
System.out.println( "**********" );
s1.intern();
s2 = s2.intern(); //把常量池中"kvill"的引用賦給s2
System.out.println( s0==s1);
System.out.println( s0==s1.intern() );
System.out.println( s0==s2 );
結(jié)果為:
false
false //雖然執(zhí)行了s1.intern(),但它的返回值沒有賦給s1
true //說明s1.intern()返回的是常量池中"kvill"的引用
true
最后我再破除一個(gè)錯(cuò)誤的理解。有人說,“使用String.intern()方法則可以將一個(gè)String類保存到一個(gè)全局String表中。如果具有相同值的Unicode字符串已經(jīng)在這個(gè)表中,那么該方法返回表中已有字符串的地址。如果在表中沒有相同值的字符串,則將自己的地址注冊到表中”。如果我把他說的這個(gè)全局的String表理解為常量池的話,他的最后一句話,“如果在表中沒有相同值的字符串,則將自己的地址注冊到表中”是錯(cuò)的。
示例:
String s1 = new String("kvill");
String s2 = s1.intern();
System.out.println( s1 == s1.intern() );
System.out.println( s1 + " " + s2 );
System.out.println( s2 == s1.intern() );
結(jié)果:
false
kvill kvill
true
在這個(gè)類中我們沒有聲名一個(gè)”kvill”常量,所以常量池中一開始是沒有”kvill”的,當(dāng)我們調(diào)用s1.intern()后就在常量池中新添加了一 個(gè)”kvill”常量,原來的不在常量池中的”kvill”仍然存在,也就不是“將自己的地址注冊到常量池中”了。
s1==s1.intern() 為false說明原來的”kvill”仍然存在;s2現(xiàn)在為常量池中”kvill”的地址,所以有s2==s1.intern()為true。
- 關(guān)于equals()和==:
equals()對于String簡單來說就是比較兩字符串的Unicode序列是否相當(dāng),如果相等返回true;而==是比較兩字符串的地址是否相同,也就是是否是同一個(gè)字符串的引用。
- 關(guān)于String是不可變的
這一說又要說很多,大家只要知道String的實(shí)例一旦生成就不會再改變了,比如說:
String str = "kv"+"ill"+" "+"ans";
就是有4個(gè)字符串常量,首先"kv"和"ill"生成了"kvill"存在內(nèi)存中,然后"kvill"又和" " 生成 "kvill "存在內(nèi)存中,最后又和"ans"生成了"kvill ans,并把這個(gè)字符串的地址賦給了str。就是因?yàn)镾tring的”不可變”產(chǎn)生了很多臨時(shí)變量,這也就是為什么建議用StringBuffer的原因了,因?yàn)镾tringBuffer是可改變的。
下面是一些String相關(guān)的常見問題:
String中的final用法和理解
final StringBuffer a = new StringBuffer("111");
final StringBuffer b = new StringBuffer("222");
a=b;//此句編譯不通過
final StringBuffer a = new StringBuffer("111");
a.append("222");// 編譯通過
可見,final只對引用的"值"(即內(nèi)存地址)有效,它迫使引用只能指向初始指向的那個(gè)對象,改變它的指向會導(dǎo)致編譯錯(cuò)誤。至于它所指向的對象的變化,final是不負(fù)責(zé)的。
String常量池問題的幾個(gè)例子
下面是幾個(gè)常見例子的比較分析和理解:
String a = "a1";
String b = "a" + 1;
System.out.println((a == b)); //result = true
String a = "atrue";
String b = "a" + "true";
System.out.println((a == b)); //result = true
String a = "a3.4";
String b = "a" + 3.4;
System.out.println((a == b)); //result = true
分析:JVM對于字符串常量的"+"號連接,將程序編譯期,JVM就將常量字符串的"+"連接優(yōu)化為連接后的值,拿"a" + 1來說,經(jīng)編譯器優(yōu)化后在class中就已經(jīng)是a1。在編譯期其字符串常量的值就確定下來,故上面程序最終的結(jié)果都為true。
String a = "ab";
String bb = "b";
String b = "a" + bb;
System.out.println((a == b)); //result = false
分析:JVM對于字符串引用,由于在字符串的"+"連接中,有字符串引用存在,而引用的值在程序編譯期是無法確定的,即"a" + bb無法被編譯器優(yōu)化,只有在程序運(yùn)行期來動態(tài)分配并將連接后的新地址賦給b。所以上面程序的結(jié)果也就為false。
String a = "ab";
final String bb = "b";
String b = "a" + bb;
System.out.println((a == b)); //result = true
分析:和[3]中唯一不同的是bb字符串加了final修飾,對于final修飾的變量,它在編譯時(shí)被解析為常量值的一個(gè)本地拷貝存儲到自己的常量池中或嵌入到它的字節(jié)碼流中。所以此時(shí)的"a" + bb和"a" + "b"效果是一樣的。故上面程序的結(jié)果為true。
String a = "ab";
final String bb = getBB();
String b = "a" + bb;
System.out.println((a == b)); //result = false
private static String getBB() {
return "b";
}
分析:JVM對于字符串引用bb,它的值在編譯期無法確定,只有在程序運(yùn)行期調(diào)用方法后,將方法的返回值和"a"來動態(tài)連接并分配地址為b,故上面程序的結(jié)果為false。
通過上面4個(gè)例子可以得出得知:
String s = "a" + "b" + "c";
就等價(jià)于String s = "abc";
String a = "a";
String b = "b";
String c = "c";
String s = a + b + c;
這個(gè)就不一樣了,最終結(jié)果等于:
StringBuffer temp = new StringBuffer();
temp.append(a).append(b).append(c);
String s = temp.toString();
由上面的分析結(jié)果,可就不難推斷出String采用連接運(yùn)算符(+)效率低下原因分析,形如這樣的代碼:
public class Test {
public static void main(String args[]) {
String s = null;
for(int i = 0; i < 100; i++) {
s += "a";
}
}
}
每做一次 + 就產(chǎn)生個(gè)StringBuilder對象,然后append后就扔掉。下次循環(huán)再到達(dá)時(shí)重新產(chǎn)生個(gè)StringBuilder對象,然后 append 字符串,如此循環(huán)直至結(jié)束。如果我們直接采用 StringBuilder 對象進(jìn)行 append 的話,我們可以節(jié)省 N - 1 次創(chuàng)建和銷毀對象的時(shí)間。所以對于在循環(huán)中要進(jìn)行字符串連接的應(yīng)用,一般都是用StringBuffer或StringBulider對象來進(jìn)行append操作。
String對象的intern方法理解和分析:
public class Test4 {
private static String a = "ab";
public static void main(String[] args){
String s1 = "a";
String s2 = "b";
String s = s1 + s2;
System.out.println(s == a);//false
System.out.println(s.intern() == a);//true
}
}
這里用到Java里面是一個(gè)常量池的問題。對于s1 + s2操作,其實(shí)是在堆里面重新創(chuàng)建了一個(gè)新的對象,s保存的是這個(gè)新對象在堆空間的的內(nèi)容,所以s與a的值是不相等的。而當(dāng)調(diào)用s.intern()方法,卻可以返回s在常量池中的地址值,因?yàn)閍的值存儲在常量池中,故s.intern和a的值相等。
總結(jié)
棧中用來存放一些原始數(shù)據(jù)類型的局部變量數(shù)據(jù)和對象的引用(String,數(shù)組,對象等等),但不存放對象內(nèi)容。
堆中存放使用new關(guān)鍵字創(chuàng)建的對象。
字符串是一個(gè)特殊包裝類,其引用是存放在棧里的,而對象內(nèi)容必須根據(jù)創(chuàng)建方式不同定(常量池和堆)。有的是編譯期就已經(jīng)創(chuàng)建好,存放在字符串常量池中,而有的是運(yùn)行時(shí)才被創(chuàng)建。使用new關(guān)鍵字,存放在堆中。