語音相關背景而想嘗試創業的人 - 創業

Table of Contents


大家好, 第一次來逛創業板, 剛好看到這個熱門話題, 跟大家聊一下我的心得好了.

※ 引述《jerk2 (...)》之銘言:
: Q2: 現在有的資源就是一個中文語音辨認雛形系統,能玩多久?
: 語音應用一定要從封閉式的應用開始
: 而不同封閉式的應用需要不同的語意分析及回應機制
: 這不是給你一個API隨你設計就能達成的
: 除非這個設計者只利用辨認結果的文字部分丟進自己研發的語意分析模組
: 另外中文語音對他們來說會是一個不小的門檻。我想至少兩年或更久。

你如果有在看hacker news, 年初應該有注意到這篇
http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/

google speech 雖然沒有公布API, 但是chrome source code 藏不著秘密...
(PS. 這篇步驟我驗證過, 不只英文可行, 中文也可)

有個印度仔動作蠻快的, 直接用上面公布的技巧, 整合出
一套電腦語音輔助系統叫 Iris, 各位可以看一下短片簡介, 概念是不是蠻像Siri的?
(當時 Siri 還沒發表).

http://youtu.be/CzPopePEAEE

(底下開始講道理)
"語音應用一定要從封閉式的應用開始", 原po這句真的有點到重點,
電腦對自然語言語音辨識效果很差, 但針對有限字詞的辨識率卻還蠻高的,

只要好好限制字彙數量, 電腦其實可以準確聽懂人類語音指令, 大家可以多開始想想,
有哪些領域有需要語音協助, 但該領域會出現的字詞彙並不會太多.

我隨便舉個例, 如果能念頻道名稱或節目名稱, 電視就自動轉到那一台, 是不是比
用遙控器慢慢轉方便? 請問同一時間上映的的節目名稱會有多少筆, 我算過了,
了不起兩百筆. 這樣級別的語音辨識, 事實上是可以很輕易做到又快又準的.

我認為現在, 基本單字音辨識引擎其實不難取得, 未來一兩年的方向應該是善用這些
引擎, 針對某些特定領域過濾語音, 整合出新的應用.


--

All Comments

Elvira avatarElvira2011-10-19
Olivia avatarOlivia2011-10-22
Taxi裡的Ninja
Todd Johnson avatarTodd Johnson2011-10-24