文章首發微信公眾號:九九和她的炫妻狂魔
還有不到一周就要過年了,粽九很快也要踏上回老家的旅程,現在這里恭祝大家新春快樂,闔家安康!
就在昨天,我們的神經病國王憂國憂民,親自教大家怎樣制作精致的Mini 小春聯,請看 “超簡單MINI春聯制作法” 。
春聯的形式有了,接下來就是內容了。
不過以我的文學造旨?詣,讓我自己寫對聯是萬萬不可能的,這輩子都不可能的。加上 “自己動手” 這事兒說出去有點不geek,于是我們很顯然的想借助網絡的力量幫我們生成對聯。
首先看看全球最大的搜索平臺:某度?谷歌。
第一條搜索結果居然把我介紹到了隔壁微軟。
網址:https://duilian.msra.cn/,網頁介紹的功能如下:
候選下聯:能夠給出若干候選給用戶選擇。
下聯定字:可以在下聯任意位置輸入想要的字詞,系統將自動補全空缺處字詞并生成完整的下聯候選。
我覺得微軟在開車,但是我沒有證據……
用字推敲:可以限定下聯中必須要出現的字。
機巧對聯:支持拆字聯和同音異字聯。比如,“煙掩檐上燕”。
嵌名對聯:系統還能識別人名。但目前看來和小愛同學是一個級別……
圖片裝裱:對完之后可以自動生成圖案。
接著我們再來看看全球最大同性交友平臺:B站?Github。
有個項目提供【深度學習對對聯】,此項目已經獲得幾千個Star,算是比較有名了,我們借此機會調戲?測試一下。
項目名稱:seq2seq_couplet
網址:https://ai.binwang.me/couplet/
目前除了對下聯,還支持使用符號來斷句。
接下來我們對這兩個系統進行調戲?調試。
測試集(一):教科書般的上聯
上聯1.1:迎喜迎春迎富貴
微軟:
Git:
上聯1.2:華夏金龍天外飛
微軟:
Git:
接論:深度學習能夠接上下聯,但是在對聯的出詞模式和平仄上相對欠缺。微軟的相比之下就更好,但是有的候選詞比較容易出搞笑的結果。
測試集(二):文藝上聯
上聯2.1:春花秋月,李樹繁盛日復日
微軟先是崩了:
然后發現只能接受最多9個漢字:
Git:
“時復雜” 改成 “時復時” 也更好一點啊……
上聯2.2:進德修業
微軟:
Git:
結論:到這里就明顯能感覺到機器并不明白整句話的含義,暫時只能做到詞和詞之間的匹配,比如“春華” - “冬雪”, “進” - “出”。
測試集(三):二次元上聯
作為一個自身肥宅,我必須要祭出我的二次元來挑戰一下機器學習的權威!撒,一狗!
上聯3.1:玄不救非
微軟:
Git:
上聯3.2:鳥幽花香,希音傳正果
微軟:
Git:
結論:應該是有人工干預了機器學習的結果,使得下聯都是文縐縐的,可能是之前給的訓練集都是出自各種詩句、對聯,和古文的結果。
測試集(四):搞怪上聯
上聯4.1:蔡徐坤雞你太美
微軟:
???微軟開始智障
Git:
感到了濃濃的求生欲……
上聯4.2:百個功能愿你一氣呵成
微軟:
碼農,客戶,和產品經理的愛恨情仇?
Git:
有些Bug真的看也看不穿……【捂臉】
結論:微軟的整詞提取能力更強,比如 “百個功能” 雖然不是一句成語,但是微軟可以成功的識別為一個詞,進而匹配出 “三權分立” 這樣的成語。然而Git 上面有網友的在線調試和及時反饋,會很大程度上避免 “詞不成句” 的現象。
綜上所述,大家如果有一些個性化或者需要定制化的對聯,可以到這兩個平臺上試一試,說不定會有驚喜哦!最后再次祝大家新年快樂,我們明年再賤?見!
相關閱讀
其他跟程序有關的小玩意兒