前一陣從淼哥那里知道了訊飛聽見,就是上傳一段音頻,選擇機器轉錄,可以很快時間內轉錄成文字,準確率可達95%。人工轉錄的準確率大概在98%,也就是說機器轉錄只比人工差一點點,但是速度快了好多倍,成本也低了好多倍。
因為我做過好多年字幕,曾經接過一個商業活就是為中文講座配字幕,但是文字都要自己去聽打。一個不到兩小時的講座,作為一個打字還算快,打軸也算熟練的人,我滿負荷狀態做了兩天才做完。(我就不說給多少錢了,年輕的時候對時間真是沒概念哎。)
而放到現在,可以直接丟去訊飛平臺轉錄,不到半小時可以下載字幕,然后做一點校對,據我估計可以在3小時之內完成工作。科技對行業的影響就是這么大。
而就在前幾天,我知道原來在遙遠的美利堅也有類似的平臺——AcousDoc,似乎是來自Standford的華人學生做的,可以理解為英語版的訊飛聽見。
那么這個有什么用呢?作為一個做了多年美劇字幕的人,知道字幕組要翻譯一個劇,有一樣東西是必不可少的,那就是英文字幕。英文字幕一般都是從美國電視臺錄下來的。如果一個劇沒有英文字幕,那么聽譯難度會成倍上升,除非有一幫狂熱的人特別想做,否則一般不會去翻譯。
而這個東西的出現,意味著可以靠機器生成一個片子的字幕,并且準確率很高,這就直接解決了一個極大的痛點。之前有個NASA的聽譯任務,因為沒有字幕,幾乎沒有人報名。用這個平臺生成了字幕之后,總群里面一發,翻譯當晚報滿。
科技改變生活。
一陣激動之余,在知乎搜了一下相關內容,發現這樣一篇回答(為什么 Deep Learning 最先在語音識別和圖像處理領域取得突破? ),大概是說30年前學者就建立了深度學習的模型,但是直到近年來機器處理速度大幅提升,互聯網資訊大量增長,讓機器能夠足夠快的學習足夠多的材料,才使得語音識別準確率取得突破。
看完對學者致以崇高的敬意。一個研究成果可以在30年后時機成熟的時候釋放巨大的能量。在我的人生觀當中,來世界一遭,也應該留下這樣的成果。我還記得曾經看過霍金講宇宙的紀錄片,其中提到地球在幾十億年后是會毀滅的,所以人類需要一直探索外太空。但是可能出現合適的居住地的地方,不是人類壽命的時間能到達的。那么就有兩個可能,一是生物技術的發展,使得人類能夠活到到達能夠移居的星球。另一個是通過人工智能的發展,讓機器人代替人類探索宇宙。
從這方面來看,人工智能將是數十億年后人類文明得以延續的關鍵。
大學時候雖然讀的是數學系,但是并沒有學好數學。在我第一個100天計劃中,就包含了微積分的學習,要把落下的東西補回來。之前并沒有想過為什么要補數學,只是覺得有必要。今天這么一看更明確了,如果以后要做人工智能方面的研究,那么數學的底子是必不可少的。
嗯,就是這樣。