語音相關背景而想嘗試創業的人 - 創業

Table of Contents

各位好,初來這個版發現這裡臥虎藏龍
所以想來這裡分享一些發展語音辨識/語音合成相關產業的想法


目前IPhone、Google、Vlingo已經有算成熟的語音協助軟體
除了Vlingo有支援簡體中文外,其餘服務還沒有中文版
另外,這些軟體的服務還是以個人化應用為主(語音查詢、語音簡訊、行事曆)
並沒有以商家為主的應用(如發展客制化的語音客服系統)
我想,將語音嵌入各種個人化應用以外的服務以目前來看是很好的機會
且目前中文語音辨認在這三家公司的發展上還算非常薄弱
地域性的中文語音服務功能在目前來看也許是一個很好的切入時機


之所以會有以中文語音切入市場的想法
主要是因為英文等其他語言的語音市場看起來即將被那幾個大廠獨佔了
只有中文這一塊看起來還有一些發展的空間
另外,文化和語言的區隔讓一些客制化服務變得較有發展的可能

當然有人可能會覺得,以過去一些語音詢問系統失敗的例子
(如x華電信之前推出的語音客服系統)
不禁會懷疑語音服務真的發展得起來嗎?使用者不會為那些笨拙的機器回答感到厭煩嗎?

但我想目前是發展語音服務較好的切入時間點
理由有以下幾點:

1. 智慧型手機/平版電腦/3G網路的崛起
以往那種只能靠打電話到客服中心的時代過去了
當語音查詢發生在網頁介面時,那些討人厭的「等候語音回報」的過程消失了
就算有再多的資訊要回報給使用者,不用像以往必須用破爛的語音合成逐字念稿
尤其是那些不重要的資訊(重聽請按一,確認請按二,轉接客服請按九)
在當初是徹底毀滅了語音應用的可能性
以目前平版、智慧型手機行動上網的普及度來說
語音查詢變得可以隨時隨地,且不需要老是用很多步驟尋找商家網頁
並在五花八門的網頁裡找尋那個隱藏在莫名其妙地方的按鈕
(譬如有時想找個營業時間還不見得找得到)


2. 語音辨認技術/語意擷取技術逐漸成熟
這裡說的「成熟」並不是指已經成熟到能達到「機械公敵」那樣的境界
而是指在「資訊查詢」這個角度上,以現在的技術一定可以做得到
而且並不如想像中的困難
(除了詢問商品種類、規格、商家資訊、服務據點、服務時間及內容、人才招募外
一般人還會想對一個企業問些什麼?)
如果能讓商家擁有自己的語音查詢系統
並依企業型態及需求設計出各種語音查詢環境及回應方式
我想語音查詢服務可以是一個企業入口網站的好用介面


3. 提供客制化服務
對一個企業/政府網站來說,網站所提供的每一項資訊都很重要
(不重要就不會擺上網頁了)
也因此造成各個企業網站通常摻雜了太多的連結、動畫及隱藏在眾連結下的資訊
但是對於使用者來說,除了使用者想知道的資訊外,其他資訊都不重要
譬如我們想找某分店的營業時間、訂位資訊
通常會先上官網、點選「門市資訊」、找到分店地址(有些時候還真不知道地址)
幸運的話在地址上方就有門市電話,然後打到門市詢問
用語音的話,直接在語音應用程式介面說
「想查新竹陶x屋訂位資訊」,然後介面呈現的是新竹各分店訂位狀況
似乎比起在網頁上逐一點選有效率許多

如果有一個語音服務系統能夠集結各類店家資訊
並且針對不同店家的語音服務需求,設計各種語境上的語音、網頁等回應
模擬線上客服系統,又不需打字或點選各種按鈕、各種連結
語音服務似乎會是另一個不錯的選擇

能否客制化是一個重點,以apple/google等語音搜尋方式所找到的資訊
這些終究是由網頁搜尋而來的,不一定是最重要或最即時的資訊
商家就算想提供使用者更多資訊也沒有辦法,除非商家與google直接簽合約
但客制化語音查詢系統可以做到的,就是提供一些可供企業調整的互動模式
在某些規格化的互動語境下提供客制化的回應
(譬如同樣問有無職缺,不同公司可以選擇以不同方式呈現)
免去客戶老是必須找電話、打電話詢問的過程


我想語音服務應該可以成為將來產業服務的另一種趨勢
雖然有人會說,以上各種服務都可以用網頁搭配搜尋做到
但一般網頁為了把商家各種資訊擺上,通常都被設計成很多層的選單模式
使用語音之後,那些複雜的多層次選單,可以只靠簡單的語音指令直接略過
直接得到所需的資訊

有人會說,其實把每個網頁都外掛站內搜尋引擎就好
但對於使用手持裝置的人來說,與其在點選搜尋引擎、想關鍵字上花費力氣
不如直接點選那些選單來得方便(雖然有時需要一點運氣)
如果能在語音服務上提供規格化+客制化的互動模式
那所有查詢就變得直覺多了




第一次發文又是大半夜的,如果有不周全或者太過妄想的成分
還請各位多包涵
也希望大家能為這個想法提供一些改進的建議
至於中文語音辨認技術上的問題、語意擷取的問題
我想以現階段的中文語音辨認及文件分析技術大約能解決七成問題
剩下的就是投入更多專業能力和時間的問題了

謝謝大家!


--

All Comments

Andrew avatarAndrew2011-10-13
如果您有這方面的技術 我倒是有東西想委託開發說~ ^^
Selena avatarSelena2011-10-18
我只有這個技術的雛形,有基本的單字、短句辨認能力
Kelly avatarKelly2011-10-23
我的程式能力不像各位程式高手那樣強,對於網頁開發、平台等
Kelly avatarKelly2011-10-27
是不太行的,但對語音所需要的數學基礎和演算法多少瞭解一些
Oliver avatarOliver2011-10-31
我認為要成熟還有一段不短的距離..
Carolina Franco avatarCarolina Franco2011-11-04
我手上有個已經商品化的電路.不用os的
Valerie avatarValerie2011-11-07
TTS的價值可能比較大。單單輸入控制用的辨識已有太多了
Kristin avatarKristin2011-11-09
這個應用已經不只是控制,而是後端的服務
Liam avatarLiam2011-11-13
目前辨識電路能做的差不多就是關鍵字,頂多簡單的文法
Tracy avatarTracy2011-11-15
且電路很難依據客戶需求隨時調整,難道要為每個企業單獨設計
一套辨識流程嗎?
Candice avatarCandice2011-11-16
有些事不是光控制就能解決的,語意解析和人性化回應也很重要
Rae avatarRae2011-11-20
所以就是TTS不是嗎。
Connor avatarConnor2011-11-23
Do Information Audible需要的技術突破更大價值也更大。
Margaret avatarMargaret2011-11-24
Use Case: Information use in hands-busy ~ eyes-busy
的狀況。 因為資訊都得read。靠的是眼睛。
Zenobia avatarZenobia2011-11-28
Voice Recognition / Voice Synthesis / Text-to-speech
Xanthe avatarXanthe2011-12-02
我說的是recognition的進入障礙比較多。技術可得性比較
Andrew avatarAndrew2011-12-05
高的問題。如果只是電話語音系統的雲端化。得看看成本
效益比是否比現有的建置方法便宜。價格更具競爭力。
Frederica avatarFrederica2011-12-09
Big O會是問題。當雲端化後、你需要的計算能力跟request
幾乎成平方比。
Genevieve avatarGenevieve2011-12-14
人性化回應不見得一定要用TTS,初期甚至只要能跳出正確的
Jake avatarJake2011-12-19
除非到達一個breaking point。有了網路外部性的特質。
你需要的不只是有能力coding的partner。還得有可以設計
Ophelia avatarOphelia2011-12-22
文字或網頁頁面就好。語音辨識雲端化是必須做的事情,初期
Eden avatarEden2011-12-25
可以只辨認關鍵字,運算量會小非常多。它取代的不是鍵盤
取代的也不是觸控,而是省略繁瑣點選步驟的過程
Daniel avatarDaniel2011-12-28
計算架構的人。當然實作語音辨識相關軟體的人也需要。
加上machine learning。以及UX design。
Carolina Franco avatarCarolina Franco2011-12-28
所有的產業背後當然都有困難的進入門檻,太容易就大家都能做
Lily avatarLily2012-01-01
我是實做語音辨認的人,目前辨認有多少能耐我大概有個譜
至於機器學習,於特定領域的機器學習一直比不特定領域好很多
Elvira avatarElvira2012-01-05
我舉個例子好了。語音辨識尤其用來輸入指令控制已經很久
Hazel avatarHazel2012-01-09
你要解決的問題是就算好久以前行動電話就有此功能、但使
用者接受度不大的問題是?絕對不是辨識度技術以往落後的
Elizabeth avatarElizabeth2012-01-10
我想我的重點可能不在「控制」,只做控制沒什麼市場
Rachel avatarRachel2012-01-13
的問題。也不是輸入太煩瑣的問題。試問我對著話筒念一個
名字需要多久的功夫。因此一定有其它問題導致它一直被
Hazel avatarHazel2012-01-18
閒置在手機中沒有被廣泛採用。
就電話服務語音系統而言某種程度我會使用。但也不是語音
輸入。除了查號。
Zanna avatarZanna2012-01-21
以往手機受限於計算能力的不足,在您所說的應用上有他的侷限
Ethan avatarEthan2012-01-22
電話語音服務系統最大的問題是等待時間,等TTS把那些蠢問題
Skylar Davis avatarSkylar Davis2012-01-26
講完。以往的語音應用著重在控制,沒什麼搞頭,頂多做做玩具
Anonymous avatarAnonymous2012-01-27
http://www.inside.com.tw/2011/10/12/iphone-4s-siri
我想做的不是控制,而是和siri市場區隔的服務應用
Poppy avatarPoppy2012-01-28
siri定位在個人秘書,我想定位在企業服務上
Faithe avatarFaithe2012-01-30
恕直言
這聽起來像是新科技的研發,還不到具體產品,離創業還有相當
Lily avatarLily2012-01-30
距離。還是要想一想,把 "技術研發"、"發明"、"創業" 這三個
概念做清楚區別
Kama avatarKama2012-02-01
這不是新科技...
Ursula avatarUrsula2012-02-05
語音辨認早就等在那裡待命,語意分析在特定領域上沒那麼複雜
Damian avatarDamian2012-02-07
一個人對於星巴客客服人員能問的東西有多少?
有沒有折扣/優惠、目前有沒有座位、有職缺嗎、開到幾點...
Annie avatarAnnie2012-02-12
只是要取代這些本來要上官網/104/打電話/親臨店家的動作
Christine avatarChristine2012-02-16
關鍵字辨認率很早就達到九成五以上(pc環境)
Ula avatarUla2012-02-20
手機環境下,以往為了克服計算能力,都把浮點運算換成整數
辨認效果當然又差又慢。加上傳統手機減噪的設計很差
Isabella avatarIsabella2012-02-24
辨識最怕的聲音品質問題一直克服不了
Linda avatarLinda2012-02-26
現在智慧型手機在硬體上改善不少,噪音銳減..
Bethany avatarBethany2012-03-01
是"新科技"也沒關係呀,只是聽起來,除了技術還是技術,連稍
Sierra Rose avatarSierra Rose2012-03-02
微具體的產品(雛形)還有距離,不是來吐槽,只是提供想法
詳細請見下篇
Jake avatarJake2012-03-06
會一直談技術是因為一直被問到技術怎麼克服的問題
讓我不得不一直回答技術
Dora avatarDora2012-03-10
我推文內有說已經有辨認雛形系統,我不可能一個人完成系統
Anonymous avatarAnonymous2012-03-15
正是如此,所以寫了下面這篇,換個話題,不聊技術
Candice avatarCandice2012-03-16
雛形系統聽起來是技術的雛形,並不是能夠拿出去銷售的產品雛
形。總是要有東西可以銷售,才有得玩呀
Zanna avatarZanna2012-03-16
您對我的期待未免太高了
Joseph avatarJoseph2012-03-19
如果只是幫忙做的話 沒加入這個的創業打算 有多少錢
Zanna avatarZanna2012-03-23
$0
目前都還沒起頭呢