這幾天買了一個藍牙耳機,好在跟小妹說話的時候可以不用被線綁在電腦前面。有了耳機,就想來試用一下語音辨識。
先前有用過viavoice 來玩,感覺不甚好用,所以丟了它。剛要下載它找半天找不到,還發現ibm 在 2006 年已經賣了它。找呀找的,突然想起來,windows vista 不就內建了語音辨識了嗎? 於是來試試看。
語音辨識有教學課程,辨識率好像還滿高的。但結束教學開始使用之後,完全不是那麼一回事。光是要用語音命令,就常會辨識錯。而且許多非 microsoft 的程式其實在 accessibility 方面根本沒有考慮,相容性也很差。
等到要輸入文字時,問題就更大了。它的詞庫似乎和我的口語不太相同,總是辨識出一些很奇怪的詞,像是很笨的新注音。而當要辨識的詞和語音命令相同時,還會打架。比如「選取全部文字」,在文字裡有"全部文字"這個詞時,動作會不一樣。它或許是想用自動辨識的方式,猜測使用者是在輸入文字還是想要下指令,減少使用者自行切換的需要。
有時連人聽人說話,都不一定聽得懂,或是會會錯意,要電腦聽得懂人話,似乎還有一段路要走。難怪簡立峰先生要說,現在還沒到實用的程度。連研究了幾十年的人都這麼說...
沒有留言:
張貼留言