文檔對比處理必備之人間神器--匹配助手



“匹配助手”,又名“Matching_Helper”。是無需安裝綠色的免費軟件,簡單高效處理文檔。

版本號:8.0.0.0

官網(wǎng):http://www.perlbot.net/chinese.html

功能:

將A與B兩文件相同的內(nèi)容提取出來生成C

將A與B兩文件不相同的內(nèi)容提取出來生成C

將A有,B沒有的內(nèi)容提取出來生成C

將A與B合并成C

將A清空重復(fù)內(nèi)容生成C

將A重復(fù)內(nèi)容生成C

將A每行內(nèi)容前加上前綴生成C

將A每行內(nèi)容后加上后綴生成C

按A順序排列B生成C

將A從最后一行反向生成C

將A從小到大排列生成C

將A從大到小排列生成C

將A中包含B的內(nèi)容生成C

將A中不包含B的內(nèi)容生成C

自定義對比,如 A1:B2=A1B1A2B3

正則匹配,如 A=~s/(\d)/$1*2/ge

使用方法:

1、打開需要匹配的文件。

2、設(shè)置匹配選項。

3、點擊轉(zhuǎn)換即可。

支持讀取“.txt”、“.xls”、“.xlsx”文件,也支持生成“.txt”、“.xls”、“.xlsx”文件。

默認為英語界面,中國地區(qū)默認為中文界面,您可以自己修改界面內(nèi)容為自己的國家語言,界面排版也可以自定義。

16種功能:

1-14講解例子都使用下面的兩個文件內(nèi)容:

A文件:

111

111

111

222

222

333

B文件:

123

AAA

333

AAA

222

________________________________________________________________________________

1、將A與B兩文件相同的內(nèi)容提取出來生成C文件

也就是把同時存在于A與B兩個不同的文件里的相同內(nèi)容提取出來,單獨提取出來重新生成一個新文件C。

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

333

333

222

222

222

因為選擇了“重復(fù)保留”,表示如果結(jié)果里相同內(nèi)容存在多個,則多個內(nèi)容同時保留在C文件里。

注意看,A和B有兩個相同的內(nèi)容是“222”和“333”,A文件有兩個“222”和一個“333”,B文件有一個“222”和一個“333”,所以就成了兩個“333”和和三個“222”。

那么如果不選擇“重復(fù)保留”呢?C文件的內(nèi)容為:

333

222

因為不保留結(jié)果里的重復(fù)內(nèi)容了,所以“333”和“222”都只有一個了。

________________________________________________________________________________

2、將A與B兩文件不相同的內(nèi)容提取出來生成C

是指將沒有同時存在A文件與B文件里的內(nèi)容提取出來生成C文件

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

111

111

111

123

AAA

AAA

A文件里有內(nèi)容“111”(三個111)不存在于B文件,而B文件有內(nèi)容“123”(一個123)、“AAA”(兩個AAA)不存在于A文件,所以生成的C文件內(nèi)容就有了一個“123”,兩個“AAA”,三個“111”。

不選擇“重復(fù)保留”呢?C文件的內(nèi)容為:

111

123

AAA

也就是只保留一個結(jié)果。

________________________________________________________________________________

3、將A有,B沒有的內(nèi)容提取出來生成C

很好理解,A文件有的內(nèi)容,而B文件沒有,就把它提取出來生成文件C

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

111

111

111

因為只有“111”是B文件沒有的,“222”與“333”在B文件都可以找得到,同時選擇了“重復(fù)保留”所以生成的C文件會有三個“111”

不選擇“重復(fù)保留”,那么C文件只會有一個“111”,您想必也猜得到。

有個家伙問我怎么將B文件有,而A文件沒有的內(nèi)容提取出來生成C,我不會告訴他用“A文件瀏覽”選擇B文件,用“B文件瀏覽”選擇A文件:)

________________________________________________________________________________

4、將A與B合并成C

A文件內(nèi)容在前,B文件內(nèi)容在后,合并成新的C文件

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

111

111

111

222

222

333

123

AAA

333

AAA

222

A文件與B文件內(nèi)容全部保留,數(shù)一下不^_^

不選擇了“重復(fù)保留”則C文件內(nèi)容為:

111

222

333

123

AAA

每一個內(nèi)容就保留了一次,再數(shù)一次。。。

________________________________________________________________________________

5、將A清空重復(fù)內(nèi)容生成C

特別注意?。。∵@里的清空重復(fù)內(nèi)容是指將有重復(fù)內(nèi)容出現(xiàn)的一個不留,比如出現(xiàn)兩個“111”,那么就刪除兩個“111”,而不是只刪除一個“111”,生成的文件不會產(chǎn)生“111”了?。≈貜?fù)內(nèi)容想保留一個的功能后面會講解到,但不是在這個5號功能里。

既然重復(fù)內(nèi)容都全部刪了,那個“重復(fù)保留”選項在這里就無所謂了。

C文件內(nèi)容為:

333

因為A文件有三個“111”和兩個“222”都被刪除了。

________________________________________________________________________________

6、將A重復(fù)內(nèi)容生成C

這個跟上面的功能相反,只有重復(fù)的才保留內(nèi)容。

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

111

111

111

222

222

因為“333”只有一個,所以被刪除了。

不選擇了“重復(fù)保留”則C文件內(nèi)容為:

111

222

雖然“111”有三個,“222”有兩個,但都只保留了一個。

________________________________________________________________________________

7、將A每行內(nèi)容前加上前綴生成C

您想試著在每一行前面連接上指定的內(nèi)容,用它就對了。比如內(nèi)容為“RuiWang Li”(作者的姓名),您想在前面添加上招呼“hi ”,使其成為“hi RuiWang Li”,怎么做?選擇完A文件后,在右下角有看到一行文本框,把“hi ”填上去運行即可。

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

hi 111

hi 111

hi 111

hi 222

hi 222

hi 333

不選擇“重復(fù)保留”則C文件內(nèi)容為:

hi 111

hi 222

hi 333

________________________________________________________________________________

8、將A每行內(nèi)容后加上后綴生成C

跟上面7功能是相反的,比如內(nèi)容為“RuiWang Li”(這是誰?),您想在后面添加上招呼“,hi”,使其成為“RuiWang Li,hi”,怎么做?選擇完A文件后,在右下角有看到一行文本框,把“,hi”填上去運行即可。

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

111,hi

111,hi

111,hi

222,hi

222,hi

333,hi

不選擇了“重復(fù)保留”則C文件內(nèi)容為:

111,hi

222,hi

333,hi

________________________________________________________________________________

9、按A順序排列B生成C

有一個排序混亂的B文件,您希望按照A文件的順序來重新排列B文件,選這個功能就對啦。

222

333

123

AAA

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

222

333

123

AAA

AAA

首先是B文件的內(nèi)容“222”被發(fā)現(xiàn)出現(xiàn)在A文件中,接下來發(fā)現(xiàn)了“333”,另外還有“123”與“AAA”

________________________________________________________________________________

10、將A從最后一行反向生成C

用于從文件的最后一行反向讀取并生成C文件,最后一行成了第一行,第一行成了最后一行。

333

222

111

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

333

222

222

111

111

111

________________________________________________________________________________

11、將A從小到大排列生成C

對比不同行內(nèi)容并從小到大排列成新文件C

111

222

333

第一行111,第二行222,第三行333,是不是從小到大了喲

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

111

111

111

222

222

333

和上面是一樣的,只是保留了重復(fù)內(nèi)容,文件是完整的。

________________________________________________________________________________

12、將A從大到小排列生成C

對比不同行內(nèi)容并從大到小排列成新文件C

333

222

111

第一行333,第二行222,第三行111,是不是從小到大了喲

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

333

222

222

111

111

111

和上面是一樣的,只是保留了重復(fù)內(nèi)容,文件是完整的。

________________________________________________________________________________

13、將A中包含B的內(nèi)容生成C

注意,這里是指包含,不是指等于,打個比方說,如“A123B”包含“123”,只要是包含就行。

222

333

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

222

222

333

另外,包含時不區(qū)分大小寫,也就是說“A123B”包含“a12”或包含“23b”等。

________________________________________________________________________________

14、將A中不包含B的內(nèi)容生成C

注意,這里是指不包含,不是指不等于。

111

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

111

111

111

另外,不包含時是不區(qū)分大小寫的。同13。

________________________________________________________________________________

15、自定義對比,如 A1:B2=A1B1A2B3

這是個靈活的表達式,使“匹配助手”增色不少。

A文件:

000 222 de2 333 444 555 666 777

001 223 qs3 334 445 556 667 778

002 224 Aa4 335 446 557 668 779

B文件:

AAA BBB 223 DDD EE1 FFF GGG HH1 1 10444444 1 1 1 1

AAA BBB 224 DDD EE2 FFF GGG HH2 a a1333330 a a a a

AAA BBB 221 DDD EE3 FFF GGG HH3 b b1222203 b b b b

AAA BBB 222 DDD EE4 FFF GGG HH4 c 101111cc c c c c

AAA BBB 223 DDD EE5 FFF GGG HH5 d dd11234560 d d d d

以表達式為例:

A2:B3=A1B5A4B11

“A2”指A文件的第2列,也可以寫成“a2”

“:”指對比的意思,是等于的意思,不是包含,匹分大小寫。

“B3”指B文件的第3列,也可以寫成“b3”

“=”指生成結(jié)果

“A1B5A4B11”,也可以寫成“a1b5a4b11”,指如果A文件的第2列等于B文件的第3列,那么結(jié)果就是:A文件的第1列、B文件的第5列、A文件的第4列、B文件的第11列,各要素中間是用“ ”(一個Tab鍵)分隔開。結(jié)果如下:

000 EE4 333 c

001 EE1 334 1

002 EE2 335 a

如果選擇了“重復(fù)保留”則C文件內(nèi)容為:

000 EE4 333 c

001 EE1 334 1

001 EE5 334 d

002 EE2 335 a

您可以嘗試下,挺好用的。

________________________________________________________________________________

16、正則匹配,如 A=~s/(\d)/$1*2/ge

另外,在15功能的輸入欄里,還有個功能,可以寫A=A或B=B(a=a或b=b)

這個需要配合正則匹配使用(下面舉幾個例子,加深下印象)

注意:正則匹配同樣適用于1-14的功能!

正則匹配可謂人間神器,有興趣可以多研究下Perl的正則。

比如A=A

那您得在正則匹配寫上表達式。

如表達式a=~m/a{5}/i

a=代表A文件,也可以A=。如果是b=或B=則為B文件。

~m意指匹配,符合條件的意思。

/a{5}/i指5個a或5個A,a{5}指5個a,最后的i指不區(qū)分大小寫,那就是5個a或5個A。

那么,這個A=A,正則表達式a=~m/a{5}/i,就是A文件里,每一行內(nèi)容,存在5個a或5個A,則輸出到C文件里。

例子2:

a=~m/^XYZ\d{7,11}/

^XYZ指每行以XYZ開頭,\d{7,11}指7至11位的數(shù)字(\d指數(shù)字)

例子3:

ab=~m/a.+c/

ab=代表A和B兩文件都需要匹配,.+指1次或多次的任何字符,所以這個能匹配abc,axxc,aT9sW"Sc等等,A和B每一行內(nèi)容符合這些條件的都輸出到C文件。

例子4:

a=~s/a/Z/ig

~s指替換模式,最后的i前面講過,指不區(qū)分大小寫,g指所有的匹配。

比如一行內(nèi)容為1axazAa0,那么,替換后變成什么樣?1ZxZzZZ0,有多少a或A就全替換成Z(共4個a或A)。

里面的小寫z并不替換成大寫Z,因為我們表達式并沒有小寫z替換大寫Z,替換的是a或A。

最終把替換后的內(nèi)容輸出到C文件。

例子5:

a=~s/(\d+)/$1*2/ge

比如一行內(nèi)容為a1b2c3,(\d+)能匹配1和2和3,$1*2表示匹配到的第一個括號條件乘2,最后的e表示執(zhí)行條件。

那么,最終結(jié)果為a2b4c6

例子6:

a=~y/a/A/

~y為轉(zhuǎn)換模式,比如一行內(nèi)容為abcxyzaaa,結(jié)果為AbcxyzAAA。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

多使用,多交流,發(fā)現(xiàn)越多的美,您會越發(fā)的喜歡“匹配助手”!y6cmE祝您使用愉快!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容

  • 最近在寫個性化推薦的論文,經(jīng)常用到Python來處理數(shù)據(jù),被pandas和numpy中的數(shù)據(jù)選取和索引問題繞的比較...
    shuhanrainbow閱讀 4,595評論 6 19
  • 寫在前面 現(xiàn)如今飯可以少吃一餐,WIFI不可以斷一天……據(jù)觀察家族微信群隊伍逐漸龐大,姨媽、舅舅、爺爺輩的家人成為...
    飛翔的餅閱讀 342評論 0 0
  • 世上沒有一件工作不辛苦,沒有一處人事不復(fù)雜。 從今天起,每天微笑吧, 世上除了生死,都是小事。 不管遇到了什么煩心...
    Levan_li閱讀 422評論 1 1
  • 北國佳人情向楚, 神游太姥比湖居。 詩詞大賦同歌詠, 入畫河山共簡書。 注:北國佳人,出處,《漢書·外戚列傳》“北...
    西山有晴雪閱讀 657評論 17 54