“生活是怎么阻礙我們的?”系列,是關于在生活中遇到的各種問題與不適應性。曾讀過的一句話,意思是說“當身邊的大多數人還在享受科技的便利,而你卻覺得不能大展身手,有被阻礙的感覺時,你把那些不便利變成便利的行為就是在開拓未來”,深以為然。這個系列的文章表達了對當下生活的一些不滿與改進愿望。
內容提要:
1.輸入法發展越來越智能化
2.輸入法智能性體現為:豐富且快速更新的詞庫,對用戶操作習慣的解析,內容與場景識別。
3.共享經濟思維下的輸入法,用戶不僅提供輸入內容和輸入操作,還會優化其他用戶體驗。
4.云計算與機器學習應用于輸入法會會帶來新變革。
5.微場景的內容識別和輸入操作的模式識別是新階段輸入法的兩大核心技術。
智能輸入法的發展
中文輸入里,PC輸入法是一個重要的交互入口和流量入口。輸入法,其實就是最典型的用戶體驗型產品代表。
在最早期,人們都還是用全拼、雙拼,后來有了好用的智能ABC,紫光拼音,他們相對于現在來說,都是偽智能。也就是2006年,互聯網開始迅猛發展的時候,人們對輸入法的需求放量增長,促使了新一批的智能輸入法的誕生,最有名的就是搜狗輸入法和谷歌輸入法,其中搜狗輸入法從那時期就賺足了人氣。在2010年前后,智能手機大爆發的時代,手機輸入法和電腦輸入法一起深入了用戶的生活,幾乎,每個中國人要與外界聯系,都離不開輸入法了。(偷偷插一段,微信語音的普及,又進一步簡化了人們產生聯系的成本,把聯系的交互成本降到了更低。當然因為語音的隱私性因素,語音不能成為主導性信息輸入方式)百度、必應、QQ都先后加入了輸入法的陣營,這時候的他們只能說太晚了,搜狗已經在輸入法這片土壤上耕耘了5年,積累了太多人氣與技術。不過BAT的霸權還是在的,利用自身的優勢,百度和QQ還是都占據了自己的那一部分市場。百度在移動端的發力,也讓它有了一片新的開拓領域。
智能性
說了這么多的發展,時間回到2016,各家的發展都已經積累了一段時間,輸入法的版本已經都進入了穩定更新的狀態,這時候的智能輸入法能夠配得上“智能”的稱號嗎?筆者簡單地以搜狗輸入法、百度輸入法、QQ輸入法和windows自帶的微軟輸入法為例,說明輸入這個交互體驗的過程的智能性,不評價各個輸入法的附加特色功能,如皮膚、截屏工具等。
輸入法的智能性基本體現在以下幾個方面:
第一,詞庫豐富且更新快,屬于運營的范疇。現在的輸入法基本上都能獲取到網絡權限,不斷更新完善的詞庫可以很大程度避免用戶輸入詞匯很難找到的尷尬。這是輸入法智能的最基本表現,用戶能快速找到想要錄入的詞匯。
第二,對用戶基本操作習慣的解析,這是產品設計和用戶體驗的反映。一個是基本錯誤,由于用戶對正確拼音的掌握不佳導致的本質性輸入錯誤,各家輸入法都有模糊輸入來解決這個問題。一個是用戶在快速打字時,容易出現的錯誤有字母順序錯誤、錯按旁邊字母、單字母重復輸入等,這些是隨機性的誤操作是需要輸入法理解用戶的輸入意圖,正確地顯示用戶想要的內容,由于這些操作具有一定復雜的規律性,仍然是可以模糊預判的,這個就和各家輸入法的算法和詞條檢索依據相關了,用戶的體驗就會做出很大差別,這屬于智能輸入法用戶滿意程度最大的評判依據,是用戶的期待需求。這里搜狗是做得最好的,但仍有提高的空間;微軟是最差的,成長空間當然很巨大了(調侃)。
第三,內容識別與更專業的詞匯關聯。這個功能最大的目的是能夠通過用戶近段時間的輸入操作和輸入內容,為用戶智能的推薦更符合用戶輸入內容領域的詞匯語句。具體場景更多是在處理專業的文本輸入時(如學生寫論文、作家寫書稿、記者寫新聞等),專業的詞匯和句式的判斷與篩選,輔助輸入法評定詞匯的優先級。詞匯關聯每個輸入法都在做,用于優化選詞結果的匹配性和命中率,但是現在的輸入法基本都是基于當前詞條的輸入內容與歷史記錄,更多的是高頻詞匯再次選定、長句語境判讀結果秒對,而對于輸入內容上下文的理解,文章內容領域的判定還不是做得很好(這里很可能是因為存在用戶隱私的問題)。這個功能對用戶來說更多是一種驚喜、出乎預料性質的一種體驗,猶豫沒有詳細研究過所述四個輸入法的技術,所以不清楚是否存在相關的技術應用,但是從用戶體驗上來說,搜狗做的最近接,體驗也最好。
猜想與展望
基于對現有產品的體驗,但是由于技術了解很少,這里只能對只能輸入進行猜測與展望。
1.共享經濟的啟發。
想到共享經濟要素里提到的“過剩的產能資源”、“低成本化的分享”與“用戶參與的平臺”,讓我覺得輸入法也是一個可以共享的“經濟”。像Waze利用人們對地圖的使用而讓地圖越來越準確,越用越滿意的情況,輸入法也是一樣的道理。用戶會源源不斷的產生內容,擁有風格各異的操作習慣,平臺或者工具要做的就是找到類似的用戶,將他們的習慣、內容匹配在一起。
形象來說,John是一個互聯網產品從事人員,他的輸入內容很多與互聯網相關,詞匯、用句甚至句法等都有明顯的風格;Alex也是一名互聯網從事人員,當他開始使用輸入法時,他完全可以借用John產生的用戶語言群,對自己的輸入進行優化。如果和John、Alex一樣的人足夠多,他們的語言群就會成為一個具有很大相似性的詞庫,如果一個新用戶可以很快被識別為和他們一樣的人群,那么輸入法就可以更高效智能的為這個新用戶服務。
同樣的道理,輸入操作習慣也是用戶生成的一種龐大資源。用戶在輸入某些詞匯的時候,總會慣性的輸錯某兩個字母的順序(把搜索sou'suo輸入成suo'suo)、用戶在輸入某個詞匯(例如兩個liang'ge)的時候總是會少按某個相同字母(g)等,用戶的錯誤變成為一種資源,用來優化所有具有相同習慣人的輸入的資源。同時,用戶本身正確的輸入操作習慣,也變成一種資源,用于優化相同操作的用戶詞匯。甚至, 當輸入操作習慣間產生了不可思議的聯系時,這個由于操作習慣帶來的資源又可以提取出更多的資源,比如常有A操作習慣的用戶,也伴隨著B操作,輸入法平臺實現了對數據的二次挖掘。
2.機器學習與云計算
如果說現在的智能輸入法都算是一種本地化的機器學習,它學習用戶的輸入內容與習慣并給與本地用戶更好的體驗,那為什么我們的機器學習不能處于云端呢?它不僅僅學習一個用戶的輸入內容和輸入習慣,還能學習所有用戶的輸入內容和輸入習慣,智能地分析不同用戶之間的關聯性與差異性,并且對新用戶進行實時、快速地分發已學習到的、適合該用戶的輸入內容與輸入習慣。
如果說共享經濟種的平臺是為了實現更高的資源調配與優化,那傳統的共享平臺也可以從人為設定規則的層次,升級到機器學習結果最優化的層次。平臺的工作不僅僅是收集資源,更深入的是精準高效地派發分配資源。
由于用戶使用的PC性能已經相當卓越,并且輸入具有間斷性特定,云計算可以采用分布式計算與服務器組合的形式,那么版本的迭代與更新變為應用程序的優化更新與服務器的算法優化更新。
3.基于微場景的內容識別
要完成用戶輸入內容的識別,就需要輸入法“讀懂”用戶的內容,當然獲取用戶的輸入內容本身是一種剽竊隱私的做法,但是當用戶選擇某個智能輸入法的時候,就明白如果希望輸入法能更好用更智能,那么輸入法就會對用戶的輸入產生一定的記錄,正如人們使用谷歌翻譯的時候就明白想要獲得的翻譯質量更好,內容自然會被谷歌獲取到以匹配更優選的翻譯方式和詞匯。
輸入法讀懂用戶內容是存在條件的,即基于微場景的讀取。輸入法不能太復雜,而且用戶輸入習慣具有間斷性,在一個集中的時段,用戶會集中于一個或者少量的幾個主題產生內容,這也要求輸入法的內容的識別是微場景的,而不是長時間連續性的。形象來說,當用戶在網購有關蛋糕烘焙的寶貝時,我們要求輸入法能夠根據輸入場景(比如打開的網頁和使用的應用程序)快速地識別場景的轉換和主題,從網址輸入、電商搜索欄輸入到與賣家溝通、朋友間分享咨詢,輸入法能夠理解到用戶開始了一個關于蛋糕烘焙的話題,并且開始提供適用于網購、蛋糕烘焙甚至是某個網頁或者應用特有的常用詞匯,直到切換到下一個場景。
4.用戶輸入操作模式識別
用戶輸入操作的資源更多是模式識別的范疇,這里主要是對個體用戶的習慣性操作進行抽象,提煉用戶操作特征與分類。這里暫時能想到的就是基于神經網絡的聚類分析。
最后
從輸入法的智能性,分析了智能輸入法在智能領域可能的發展,但是都沒有基于實際調查的整體用戶需求,也沒有深入了解實際輸入法產品中應用的技術,并不符合產品從需求到功能的思維。只是從日常生活中的一些現象,推想到可能的未來發展,希望輸入法在未來可以有更智能、更人性化的用戶體驗。
限于本人的認知,上面的內容都還沒有經過精準論證的看法,如果有錯誤的地方,還請大家指出討論。