前言
字符串(character string)是一個(gè)或多個(gè)字符的序列,很多高級(jí)語(yǔ)言像 java、C#、Kotlin 都有字符串類(lèi)型,但是 C 語(yǔ)言并沒(méi)有提供符串?dāng)?shù)據(jù)類(lèi)型,而是使用 char 類(lèi)型的數(shù)組元素來(lái)存儲(chǔ)字符串。
在 C 語(yǔ)言中定義字符串有下列幾種形式:
- 字符串常量;
- char 數(shù)組;
- char 指針。
一、字符串常量
字符串常量的例子非常常見(jiàn),它是放在一對(duì)雙括號(hào)中的一串字符或符號(hào)。一對(duì)雙括號(hào)之間的任何內(nèi)容都會(huì)被編譯器視為字符串,包括特殊字符和嵌入的空格。當(dāng)使用 printf() 顯示信息時(shí),就將該信息定義為字符串常量了,看以下示例:
printf("This is a string.");
printf("This is on\ntwo lines.");
printf("Foor \" you write \\\".");
執(zhí)行結(jié)果如下:
This is a string.
This is on
two lines.
For " you write \".
使用特殊字符時(shí)要注意轉(zhuǎn)義字符“\”的用法。下面來(lái)看字符串常量在內(nèi)存中的存儲(chǔ)形式,如下圖所示:
每個(gè)字符串的末尾都自動(dòng)添加了代碼值為 0 的特殊字符,這個(gè)字符稱(chēng)為空字符,寫(xiě)為 \0。C 中的字符串總是由 \0 字符結(jié)束,因此字符串的長(zhǎng)度要比字符串中的字符數(shù)多 1。
要注意的是,在 printf() 函數(shù)遇到第一個(gè)空字符 \0 時(shí)就會(huì)停止輸出。
二、存儲(chǔ)字符串的變量
C 語(yǔ)言對(duì)變量存儲(chǔ)字符串的語(yǔ)法沒(méi)有特殊的規(guī)定,而且 C 中根本就沒(méi)有 字符串變量,也沒(méi)有處理字符串的特殊運(yùn)算符,但是標(biāo)準(zhǔn)庫(kù)中提供了很多函數(shù)來(lái)處理字符串。
2.1 char 數(shù)組
可以使用 char 數(shù)組來(lái)保存字符串,這也是字符串變量的最簡(jiǎn)單的形式,char 數(shù)組的聲明如下:
char exp[32];
該變量可以存儲(chǔ)一個(gè)最多包含 31 個(gè)字符的字符串,因?yàn)橐A(yù)留一個(gè)數(shù)組元素給終止符“\0”。
注意:如果使用這個(gè)數(shù)組來(lái)存儲(chǔ) 32 個(gè)字符(數(shù)組末位不是終止符),那么以上的 char 數(shù)組就不是表示一個(gè)字符串了,僅僅是一個(gè) char 數(shù)組而已。
看另一種聲明方式,這里使用以下聲明初始化字符串變量:
char exp[] = "This is a string.";
這里并沒(méi)有指定數(shù)組大小,編譯器會(huì)指定一個(gè)足以容納這個(gè)初始化字符串常量的數(shù)值。在上例中數(shù)組大小為 18,其中前 17 個(gè)元素用來(lái)存儲(chǔ)字符,最后一個(gè)用來(lái)存儲(chǔ)終止符“\0”。
要引用存儲(chǔ)在數(shù)組中的字符串,只需要使用數(shù)組名即可,例如使用 printf 函數(shù)輸出存儲(chǔ)在數(shù)組中的字符串,%s 用于輸出一個(gè)用空字符中止的字符串:
printf("the content of the array is %s\n", standard);
三、字符指針
可以通過(guò)指針來(lái)表示字符串,一般形式如下:
char* string = "This is a string.";
這里有一點(diǎn)要注意:可以對(duì)上面的 string 整體賦值,但是不能修改字符串中的任一字符,否則會(huì)提示訪(fǎng)問(wèn)沖突。例如:
string++; string = 'y';
string[1] = 'e';
在這段代碼中,string 本質(zhì)上是一個(gè)字符指針,占 4 字節(jié);"This is a string." 分配在代碼段,占 18 個(gè)字節(jié);實(shí)際上總共耗費(fèi)了 22 個(gè)字節(jié),這 22 個(gè)字節(jié)中:4 字節(jié)的指針 string 叫做字符串指針(用來(lái)指向字符串的,但是它本身不是字符串),17 字節(jié)的用來(lái)存 "This is a string" 這 17 個(gè)字符的內(nèi)存才是真正的字符串,最后一個(gè)用來(lái)存 '\0' 的內(nèi)存是字符串結(jié)尾標(biāo)志(本質(zhì)上也不屬于字符串)。
四、字符串常用的方法
請(qǐng)參考 C 在線(xiàn)手冊(cè):http://www.kuqin.com/clib/
五、總結(jié)
C 語(yǔ)言中字符串的本質(zhì):指針指向頭、固定尾部的地址相連的一段內(nèi)存。
字符串就是一串字符。字符反映在現(xiàn)實(shí)中就是文字、符號(hào)、數(shù)字等人用來(lái)表達(dá)的字符,反映在編程中字符就是字符類(lèi)型的變量。C 語(yǔ)言中使用 ASCII 編碼對(duì)字符進(jìn)行編程,編碼后可以用 char 型變量來(lái)表示一個(gè)字符。字符串就是多個(gè)字符打包在一起共同組成的;
字符串在內(nèi)存中其實(shí)就是多個(gè)字節(jié)連續(xù)分布構(gòu)成的(類(lèi)似于數(shù)組,字符串和字符數(shù)組非常像);
C 語(yǔ)言中字符串有 3 個(gè)核心要點(diǎn):
- 第一是用一個(gè)指針指向字符串頭;
- 第二是固定尾部(字符串總是以'\0'來(lái)結(jié)尾);
- 第三是組成字符串的各字符彼此地址相連。
'\0' 是一個(gè) ASCII 字符,其實(shí)就是編碼為 0 的那個(gè)字符(真正的 0,和數(shù)字 0 是不同的,數(shù)字 0 有它自己的 ASCII編碼)。要注意區(qū)分 '\0' 和 '0' 和 0;
'\0' 作為一個(gè)特殊的數(shù)字被字符串定義為結(jié)尾標(biāo)志。產(chǎn)生的副作用就是:字符串中無(wú)法包含 '\0' 這個(gè)字符。