0
| 本文作者: 呂倩 | 2017-08-09 18:00 |

搜狗推出了一款真正落地的語音技術(shù)產(chǎn)品。
8月8日,搜狗針對文字工作者,推出語音實時轉(zhuǎn)文字的速記工具“搜狗聽寫”。適用于寫文章、采訪錄音、會議記錄、筆記整理 、日常記事等場景,幫助用戶實現(xiàn)語音記錄和信息輸入。針對不同場景和需求,搜狗聽寫可以支持“聽寫”和“轉(zhuǎn)寫”兩種模式。在“聽寫”模式下,錄音的同時即可實時給出識別結(jié)果;而“轉(zhuǎn)寫”模式下則可以離線錄音,錄音完成后一次性獲取文字結(jié)果。
為了提高文字整理效率,搜狗聽寫還加入了邊聽邊改、無線標(biāo)重點(藍牙打點)、多端同步、信息分享等人性化功能,與搜狗輸入法個人詞庫打通。此外,搜狗公司語音交互技術(shù)中心總經(jīng)理王硯峰宣稱,搜狗聽寫還提供耳語識別技術(shù),在說話音量低至30分貝時,依然可以準(zhǔn)確識別。
早在2012年,搜狗即開始研發(fā)智能語音技術(shù),并同步開啟相關(guān)產(chǎn)品落地的布局。去年8月3日,搜狗舉行知音引擎的發(fā)布會,取得機器翻譯的突破。跟進當(dāng)時世界上最領(lǐng)先的機器翻譯的深度學(xué)習(xí)的框架,基于attion的端到端的框架,再加上以前在語音識別上的累積,用3個月的時間搭建起機器翻譯引擎,并且應(yīng)用到了去年的烏鎮(zhèn)大會上。
去年11月份,搜狗推出了機器同傳,率先商用化。今年1月份,推出行業(yè)首個跨引擎搜索引擎,也是基于機器翻譯核心引擎推出。5月份,搜狗語音核心技術(shù)在應(yīng)用方面取得突破等。
實際上,目前市場上已有一些同類的產(chǎn)品,例如早期推出的訊飛聽見等,相比之下,搜狗是否存在優(yōu)勢呢?搜狗語音交互中心負責(zé)人王硯峰對雷鋒網(wǎng)表示:
第一,訊飛對應(yīng)的產(chǎn)品,如訊飛聽見、訊飛錄音寶等,是不能支持長時間錄音、并且免費轉(zhuǎn)寫的。而搜狗是首次做了長時錄音設(shè)置,并且支持免費轉(zhuǎn)寫。
第二,搜狗的產(chǎn)品是面向垂直場景,包括記者采訪的場景、作家寫作的場景等等。這些功能雖小,但它體現(xiàn)在具體場景下,怎么絞盡腦汁的想盡辦法,幫朋友解決問題。
第三,功能上,訊飛手機端沒有”聽見“。且搜狗聽寫有語音實時轉(zhuǎn)文字、邊聽邊改、標(biāo)重點、快速查找、多端同步、不限時長錄音等功能。
除此之外,依托搜狗產(chǎn)品日均超過2.6億次的語音請求,提供海量的真實語料數(shù)據(jù),可以使得機器不斷學(xué)習(xí)并提升語音識別準(zhǔn)確率。

但對于搜狗轉(zhuǎn)寫免費會持續(xù)多長時間這個問題,王硯峰表示,目前肯定是免費的,至于之后會不會收費,并不完全確定。至少按照現(xiàn)有的產(chǎn)品形態(tài),肯定是在相當(dāng)長的時間內(nèi)不考慮使用這個產(chǎn)品來賺錢。作為一家互聯(lián)網(wǎng)公司,通過技術(shù)來收取技術(shù)服務(wù)費不是搜狗的商業(yè)邏輯。至少到現(xiàn)在為止,搜狗還不想通過產(chǎn)品收費的方式來進行商業(yè)的變現(xiàn)。
為什么選擇這個時間點來發(fā)布產(chǎn)品?
王硯峰對雷鋒網(wǎng)表示,一方面,是與去年發(fā)布的知音引擎更好地呼應(yīng),另一方面,搜狗下半年將會集中發(fā)布一批人工智能落地產(chǎn)品。王硯峰坦言,客觀來講,搜狗作為一家人工智能業(yè)界公司,在AI落地方面做得遠遠不夠。也正因此,下半年將在硬件、軟件等場景集中一波攻勢,包括智能副駕、智能聽寫等。
基于搜狗的語音能力和自然交互能力,在非巨頭壟斷的行業(yè),搜狗將嘗試做更多硬件產(chǎn)品的自研、試水、投資,可能自己研發(fā),也可能投資一些公司,以合作的方式把這些產(chǎn)品做出來。
在王硯峰看來,不論是車載市場、家庭場景,還是可穿戴市場,雖然玩家很多,但離市場成熟期還早得很,在這個過程中,王硯峰認為搜狗完全有信心拿出更多爆款產(chǎn)品或有量產(chǎn)品,來搶占市場份額,例如在中國可穿戴設(shè)備硬件中排名前五名的糖貓兒童手表,目前出貨量已突破100萬。
而已如今大火的Amazon Echo為例,王硯峰認為,亞馬遜并非單獨將這個平臺推起來的,而是因為有了巨大的用戶量、進而帶動了平臺的使用量,這才有了更多的開發(fā)者加入進來。
在Amazon Echo上,雖然有很多的開發(fā)者,但其主功能的比例,絕大部分還是在定位在鬧鐘、天氣,以及音樂上。目前的中小開發(fā)者對于智能語音入口的產(chǎn)業(yè)格局尚且不成有力威脅,牌還是在巨頭的手上。
王硯峰對雷鋒網(wǎng)表示,如果智能語音入口級硬件可以自己做,像Amazon Echo那樣做出爆款產(chǎn)品,推出自己的硬件,進而搶奪市場入口,這當(dāng)然是首選。但在手機和電視領(lǐng)域,搜狗暫不會做這樣的硬件,也不可能把硬件戰(zhàn)線拉得過長。對于搜狗來講,做十幾款硬件也是存在問題的。更適合的做法是——瞄準(zhǔn)幾款最有用戶痛點、最適合自己風(fēng)格的硬件產(chǎn)品來做。這兩個之間并不存在非此即彼的關(guān)系,更多的是互補的關(guān)系。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。