輸入法是我們在數字時代,與電腦交互最重要的工具,就像我們的嘴巴。
先來聊聊人機交互的歷史
在最初的時候,我們怎么與電腦進行交互呢?
通過敲代碼,輸入各種命令直接得到結果。輸入的這些字符,都是在鍵盤上一個鍵,一個鍵代表一個字母非常的直觀。當然也存在著一個鍵,能代表2個符號,那么有一個shift鍵來幫助你選擇是這個鍵上面的那個符號,還有一些F1F2類的鍵來實現各種特殊的功能。
最開始我們與電腦進行交,主要是通過物理按鍵的方式。后來我們又多了另外一樣,人機交互的利器——鼠標。鼠標只有兩個按鍵,但是它有滑動的功能。
這開啟了圖形化的交互界面。鼠標就是我們在電腦的圖形界面中的手。再后來觸摸屏的實現,讓我們可以直接在屏幕上,用手進行操作,這種情況下就多了多點觸控,滑動,長按等操作方式。
但這些方式,都不能夠使我們的意思傳達給電腦,我們只能夠選擇電腦已具備的選項。這樣反而不如我們敲代碼,來的高效快捷。所以直接告訴計算機我們想要什么,然后他就能幫我們實現嗎?
這是人工智能想要達到的交互方式。但要實現如此自然的交互,目前還有些距離。
我們首要要實現的還不是讓計算機直接理解我們的語言,而是讓計算機能顯示出我們的語言。且我們能像輸入代碼一樣,將我們的語言順利地輸入到計算機當中。
這樣我們就可以通過,計算機上的應用,把語言傳達給它人。
漢字的輸入難題
我們看以字母為代表的英語,直接在鍵盤上敲擊的26個字母就夠了。26個字母,通過各種組合形成詞語。
但關于漢字,我們就比較為難了。給每一個漢字設置一個鍵,那要上千個按鍵。
我們必須用更少的鍵組成更的多字。那只有找找組成漢字的基本元素了,如果電腦是中國人發明出來的,不知道會怎么設計鍵盤。
但是,沒有但是,我們就得用這26個字母的鍵盤。
看到這些字母,自然而然便想到了拼音。我們可以通過輸入拼音字母,來輸入漢字。
我們以“da"為例
就有四個音調,共56個字。同一個音調最多也有33個字。當然這個音常用的字沒幾個,其它音就不好說了。但這的確是可行可用的辦法。
還可以怎么辦呢?
直接把漢字拆成,基礎的元素如何?把鍵盤變成這個樣子
不對!上面那個是注音符號,還是用聲音來輸入漢字。這個看上去很像日語片假名的東西,是我們民國時期用的漢語拼音,現在我們用的都是拉丁字母為基礎的注音符號,臺灣還是用的這套注音符號。注音輸入法,韻母不需要敲那么鍵,可以輸入聲調,這無疑減少了候選詞。
但這不是拆字啊,怎么拆字呢?
通常不會讀的字,查字典的時候,我們用查部首的方式。漢字那么多,部首可以沒那么多,把鍵盤上換成部首不就行了。
嗯,數了一下,偏旁部首還有相關字可有76個。雖然鍵盤上有不止76個鍵,全放部首會不會。。
不知你聽說過沒
查字典還有一種超快的辦法——四角號碼檢字法
用最多5個阿拉伯數字來對漢字進行歸類。取漢字左上角、右上角、左下角、右下角四個角的筆畫,一個漢字用四個數字表示。
這個用來查字典還好,用來輸入的話,重碼和拼音有的比,而且速度也快不了多少……想了解可以去百度折騰一下。
字型輸入法的大招來了!
拆四個角不管用,就拆得更徹底些吧!拆成一個個筆畫,先寫哪個筆畫,再寫哪個筆畫我都表示出來,這回一定準了吧。對,這就是傳說打字飛快的五筆輸入法!
五筆輸入法,把這26個鍵,根據基本的筆畫橫(一)、豎(丨)、撇(丿)、捺/點(丶)折(乙)劃成五個區。每個區,五個鍵代表這個筆畫在字的第幾順。
只有筆畫肯定不夠,又加了常用的字還有部首(字根)在相應的區位。背好五筆字根口訣、拆字口訣、識別碼口訣、末筆口訣、字型口訣等,你會可以飛一般地打字了。
麻煩?想要快總要些代價嘛。強烈建議學漢字的小朋友大朋友使用,玩會這個,媽媽再也不用擔心你不認字啦!
26個字母在上面,卻要我把他們當筆畫,這不是為難人嘛!
莫慌,又想認音,又想輸入筆畫,還真有辦法。那就是雙拼輸入法。
拼音輸入的話,韻母就那么幾個,但是要多敲好幾次字母。干脆設置一些鍵,也代表一些韻母好了。這樣,你兩個鍵就可以選出一個音。
雖然比輸入全拼快了很多。但,這不還是拼音嗎?
別急,還有形碼部分。與五筆的筆畫布局不同,雙拼的字根是按讀音和形狀,放到對應的按鍵的。
橫(a)、豎(l)、撇(p)、捺(n)、點(d)、折(V)
下面是部分,感受一下:
形碼部分的拆字規則也簡單,首和尾,長得像的選出來就行了。比如:“樹” 取“木”M,和最后那一點D。感興趣的話,具體規則大家可以自行去折騰。
不過雙拼的音型方案有很多,你甚至可以音碼用一家的,輔助碼(形碼)用另外一家的方案。或者只用音碼,反正你電腦里也只不過記憶了“UU”代表“shu",或者是“uumd"代表“樹”。
最好用的輸入法是什么?
此問題一出,雙拼的小伙伴激動地揮舞雙手,五筆的小伙伴冷笑了一聲,全拼的小伙伴深藏功與名。
關于答案,每個人都可能不同,而且每個人都可能會變化。
在沒有這些智能設備以前,書面表達是通過手寫來完成。
會寫字,才被稱作有文化。不識字,則是文盲。
當我們面對在電腦上輸入漢字的問題時,寫出這些漢字,可能是更自然的想法。
早些年的手寫板現在已經銷聲匿跡了吧。
如果做不到,那至少也應該出可以用筆畫的方式,找到那字。所以在當初,拼音和五筆字型都是常見的輸入法。五筆甚至是更優選擇。
但是后來搜狗百度谷歌等輸入法廠商,使用超大規模的語料庫、模糊音、整句輸入、搜索熱詞更新、自動糾錯、詞頻變化、筆畫拆分、云詞庫……等方式,讓全拼輸入變得更加有效率。有許多方便輸入的功能,也只能夠在全拼狀態下使用。并不是其它輸入法不優秀,只是沒有形成生態。
我們寫字,得一個字一個字的寫。但是說話則是連詞成句的,語音的方式無疑更加自然。我們的需求并不是像查字典一樣,快速的找到一個又一個的字。五筆等輸入法,提高了選擇單字的數量,卻降低了成整句的效果。
拼音碼有個最大的優勢,就是聲母加韻母的讀音規則,韻母結束后出現一個新的聲母(或者零聲母)就可以判斷是一個新語音,在整句輸入法中這個規則可以方便的數出句子包含的音節數量。
但其他輸入法用大量的聲母當做輔助碼,或者根本就沒有聲母這樣的字詞起始標志,很難在整句中正確劃分單字或者詞組,連一個句子有多少個字都無法判斷,那要想順利找到對應漢字就更難了 ,還不如字詞方式輸入效率高。許多的五筆用戶只用單字輸入法,就是因為增加了詞組以后反而會增加重碼率。單字到詞組尚且如此,再到句子的重碼率更是不可想象。自然碼做過一段時間的整句輸入,其中也包括五筆模塊,但最后發現效果不理想。
曾經為在手機上九個數字鍵上輸入漢字,我們發明了九宮格輸入法,這是我們見過最普及的,編碼方法來輸入文字吧。
很有一部分人在玩手機隨時隨地輸入文字前,可能拼音都不怎么樣,只有一個模糊的印象。拼音輸入法絕對提高大家使用拼音的姿勢。
即便是手機如此普及的今天,仍然有很多人輸入文字都是困難的。人機之間不可逾越的障礙,就是我們重新設定一套規則,才可以與計算機溝通。
最好用的輸入法,是你最熟悉的那套規則,也許是輸入法廠商提供的完善的全拼輸入方案,也許是你自己定制的按鍵分布,音型規則。
人即輸入法
智能移動終端普及后,我們日常主要的溝通方式,語音也搬進了數字世界中。你不僅僅可以把語音直接發給你的好友,語音識別技術甚至可以幫你轉換成文字,使你直接用文字指令與設備溝通。
但目前來看,語音真的是一個很雞肋的功能。每次看到別人扔過來的大段的語音,一段一段的語音;每次看到語音輸入法轉化的,充滿錯別字的片段;每次聽到有人大聲得,讓手機給他講個笑話……
是的,感覺它很新奇,也有效果,但總差些什么。
語音是比較隨意的,不像文字那么有調理和簡潔,轉化成文字他不好讀。現成條件下,機器與語音的搭配總感覺很奇怪,大段的語音,我們需要像打開水龍頭接水一樣。而與機器的對話,總是不那么如意,仿佛我們倆都很傻。
有個朋友發語音給我,我不方便聽。隨便搜了一篇發語音不方便的文章給他。他卻用語音,一句一句回復我:我知道。你知道為什么我要發語音嗎?工作中啊,說錯了什么方式不對,就有人截圖取證。發語音,他取證就麻煩很多了。
聽完真是漲見識了。但是我覺得,這只是目前語音呢還不方便分享,要是有一天語音,可以像語音文字那樣在社交平臺上傳播。語音證據,恐怕比文字更繪聲繪色。
但在我們生活交流中,語音從來不單獨存在,有一個聲音信號,必有有一個聲源圖像。如果哪天我們可以用語音暢快交流,也許就是虛擬現實。
文字是我們表達的工具,輸入法是我們輸出文字的工具。
表達我們的意思,除了語音和文字之外還有別人方法嗎?表情包算是一個吧?視頻就更算是了。
記得微軟曾說,要做智能輸入法,知道你下一步想要說什么?
目前,輸入法在地名、人名、溫度單位、表情聯想、位置和音樂方面的創新,都算是往智能化的前進。
人工智能更是進一步理解人類的思維方式。假設有一天,你還沒說,人工智能就知道你想說什么,那還需要你做什么?他復制了你,而且可以無障礙與其它人工智能溝通信息。使人類成為一個思維整體。
正如圖形化界面剛出現,大家覺得那東西太占內存,且與代碼相比,效率低下;
正如觸摸屏在手機上出現,大家覺得大屏耗電大,識別不精準,耗流量多,沒有按鍵的手感和盲打;
下一個可能,是否也在被我們嫌棄中?