裁剪 libiconv 1.16

libiconv用于將任意編碼方式的字符轉(zhuǎn)換為另一編碼方式,由于libiconv庫中存在大量我們用不上的字庫,因此可以對其進(jìn)行裁剪。
在libiconv源碼下的lib/encodings.def對其支持的所有編碼方式進(jìn)行了定義,此外還有其他幾個(gè)def后綴的文件,如encodings_extra.defencodings_dos.def等,這些默認(rèn)是沒有啟用的,在裁剪的時(shí)候一般無需理會,只需修改encodings.def即可。

你可以直接刪除encodings.def中定義的DEFENCODING,或者用條件編譯、注釋等方法將其屏蔽。
以下patch適用于libiconv-1.16,刪除了日文、韓文、big5以及ISO8859-2后的所有字庫,保留了gb2312/gbk/gb18030字庫:

--- a/lib/encodings.def
+++ b/lib/encodings.def
@@ -168,6 +168,8 @@ DEFENCODING(( "UCS-4-SWAPPED",          /* libiconv */
             ucs4swapped,
             { ucs4swapped_mbtowc, NULL }, { ucs4swapped_wctomb, NULL })
 
+# if 0
+
 DEFENCODING(( "C99",
             ),
             c99,
@@ -178,6 +180,8 @@ DEFENCODING(( "JAVA",
             java,
             { java_mbtowc, NULL },        { java_wctomb, NULL })
 
+#endif //if 0
+
 /* Standard 8-bit encodings */
 
 DEFENCODING(( "ISO-8859-1",             /* IANA */
@@ -218,6 +222,8 @@ DEFALIAS(     "ISO88592",               /* HP-UX */
             iso8859_2)
 #endif
 
+#if 0
+
 DEFENCODING(( "ISO-8859-3",             /* IANA */
               "ISO_8859-3",             /* IANA */
               "ISO_8859-3:1988",        /* IANA */
@@ -429,6 +435,8 @@ DEFENCODING(( "KOI8-RU",
             koi8_ru,
             { koi8_ru_mbtowc, NULL },     { koi8_ru_wctomb, NULL })
 
+#endif //if 0
+
 /* Windows 8-bit encodings */
 
 DEFENCODING(( "CP1250",                 /* JDK 1.1 */
@@ -460,6 +468,8 @@ DEFALIAS(     "IBM-1252",               /* AIX */
             cp1252)
 #endif
 
+#if 0
+
 DEFENCODING(( "CP1253",                 /* JDK 1.1 */
               "WINDOWS-1253",           /* IANA */
               "MS-GREEK",
@@ -501,6 +511,8 @@ DEFENCODING(( "CP1258",                 /* JDK 1.1 */
             cp1258,
             { cp1258_mbtowc, cp1258_flushwc }, { cp1258_wctomb, NULL })
 
+#endif //if 0
+
 /* DOS 8-bit encodings */
 
 DEFENCODING(( "CP850",                  /* IANA, JDK 1.1 */
@@ -515,6 +527,8 @@ DEFALIAS(     "IBM-850",                /* AIX */
             cp850)
 #endif
 
+#if 0
+
 DEFENCODING(( "CP862",                  /* IANA, JDK 1.1 */
               "IBM862",                 /* IANA */
               "862",                    /* IANA */
@@ -523,6 +537,8 @@ DEFENCODING(( "CP862",                  /* IANA, JDK 1.1 */
             cp862,
             { cp862_mbtowc, NULL },       { cp862_wctomb, NULL })
 
+#endif //if 0
+
 DEFENCODING(( "CP866",                  /* IANA, JDK 1.1 */
               "IBM866",                 /* IANA */
               "866",                    /* IANA */
@@ -531,6 +547,8 @@ DEFENCODING(( "CP866",                  /* IANA, JDK 1.1 */
             cp866,
             { cp866_mbtowc, NULL },       { cp866_wctomb, NULL })
 
+#if 0
+
 DEFENCODING(( "CP1131",                 /* FreeBSD, MacOS X */
             ),
             cp1131,
@@ -772,6 +790,8 @@ DEFENCODING(( "JIS_X0212",
             jisx0212,
             { jisx0212_mbtowc, NULL },    { jisx0212_wctomb, NULL })
 
+#endif //if 0
+
 DEFENCODING(( "GB_1988-80",             /* IANA */
               "ISO646-CN",              /* IANA */
               "ISO-IR-57",              /* IANA */
@@ -790,6 +810,8 @@ DEFENCODING(( "GB_2312-80",             /* IANA */
             gb2312,
             { gb2312_mbtowc, NULL },      { gb2312_wctomb, NULL })
 
+#if 0
+
 DEFENCODING(( "ISO-IR-165",
               "CN-GB-ISOIR165",         /* RFC 1922 */
             ),
@@ -810,6 +832,7 @@ DEFENCODING(( "KSC_5601",               /* IANA */
 
 /* CJK encodings */
 
+
 DEFENCODING(( "EUC-JP",                 /* IANA */
               "EUCJP",                  /* glibc, HP-UX, IRIX, OSF/1, Solaris */
               "Extended_UNIX_Code_Packed_Format_for_Japanese", /* IANA */
@@ -875,6 +898,8 @@ DEFENCODING(( "ISO-2022-JP-MS",
             iso2022_jpms,
             { iso2022_jpms_mbtowc, NULL }, { iso2022_jpms_wctomb, iso2022_jpms_reset })
 
+#endif //if 0
+
 DEFENCODING(( "EUC-CN",                 /* glibc */
               "EUCCN",                  /* glibc, IRIX */
               "GB2312",                 /* IANA */
@@ -916,6 +941,8 @@ DEFENCODING(( "GB18030",                /* IANA, glibc */
             gb18030,
             { gb18030_mbtowc, NULL },     { gb18030_wctomb, NULL })
 
+#if 0
+
 DEFENCODING(( "ISO-2022-CN",            /* IANA, RFC 1922 */
               "csISO2022CN",
             /*"ISO2022CN",                 JDK 1.1 */
@@ -1038,3 +1065,4 @@ DEFENCODING(( "ISO-2022-KR",            /* IANA, RFC 1557 */
             iso2022_kr,
             { iso2022_kr_mbtowc, NULL },  { iso2022_kr_wctomb, iso2022_kr_reset })
 
+#endif //if 0

修改好encodings.def后,借助libiconv自帶的Makefile重新生成aliases.hflags.h
以下操作需要gperf,如果是Debian系的Linux可以用apt install gperf安裝gperf

make -B -f Makefile.devel lib/aliases.h lib/flags.h

如果你修改了encodings_dos.def或其他def文件,那么還需要重新生成aliases_dos.h

make -B -f Makefile.devel lib/aliases_dos.h

上述操作如果沒有報(bào)錯的話,就可以重新configure并編譯了:

./configure
make clean
make -j4

最后脫去不需要的調(diào)試符號,并對比裁剪之前的體積:

strip -g --strip-unneeded libiconv.so.2.6.1 -o strip-libiconv.so.2.6.1
庫名稱 未裁剪 僅刪除日文與韓文 刪除日文、韓文與big5等
strip-libiconv.so.2.6.1 916k 752k 254k
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。