本站電腦知識提供應用軟件知識,計算機網(wǎng)絡軟件知識,計算機系統(tǒng)工具知識,電腦配置知識,電腦故障排除和電腦常識大全,幫助您更好的學習電腦!不為別的,只因有共同的愛好,為軟件和互聯(lián)網(wǎng)發(fā)展出一分力! AI音頻轉(zhuǎn)錄工具SwiftScribe使用教程: 百度美國推出了轉(zhuǎn)錄工具SwiftScribe,一個利用人工智能,讓用戶能快速將音頻快速轉(zhuǎn)成文字的免費網(wǎng)頁工具。 百度在近年一直在持續(xù)改善其新一代深度語音識別系統(tǒng)DeepSpeech2。DeepSpeech2系統(tǒng)由百度硅谷人工智能實驗室(SVAIL)研發(fā),并在去年被麻省理工科技評論評為2016年十大突破技術。 “百度在語音技術領域不斷進步,語音接口更為實用和有效。用戶可以愈加便利地與身邊的設備進行互動。百度的深度語音識別系統(tǒng)(DeepSpeech2)包含了一個非常龐大的神經(jīng)網(wǎng)絡,引入了數(shù)以百萬計的轉(zhuǎn)錄語音。有時它在識別漢語語音片段方面,要比人為識別更加準確。”麻省理工科技評論寫道。 百度在去年也推出了應用DeepSpeech2的安卓輸入法應用TalkType,讓用戶能夠快速語音輸入文字。國際科技巨頭如微軟、亞馬遜、蘋果以及谷歌同樣在語音識別領域投入大量精力,但在長段語音識別轉(zhuǎn)錄上仍不及百度。 SwiftScribe支持上傳轉(zhuǎn)錄wav和mp3格式的音頻文件。一段30秒左右的音頻轉(zhuǎn)錄成文本時間大概為10秒,而一段1分鐘左右的文件大致需要30秒的轉(zhuǎn)錄時間。SwiftScribe最大支持用戶上傳1小時長的音頻文件,1小時的音頻則需要20分鐘左右的處理時間,百度的項目管理人武田介紹道。 但SwiftScribe的功能目前還沒有很完善,在轉(zhuǎn)錄成功后,用戶還需自行對文本進行編輯。SwiftScribe轉(zhuǎn)錄出來的文本是不帶標點符號的,用戶需要自行斷句、并對可能出現(xiàn)的錯誤進行更正、以及編輯英文單詞大小寫等。不過SwiftScribe同樣提供變速閱讀工具,讓用戶在校對編輯時可以調(diào)慢播放速度。 SwiftScribe的開發(fā)靈感源于武田在加州大學圣芭芭拉分校讀研期間的采訪經(jīng)歷。 “我的母語不是英語,要整理一段1小時錄音對我來說要花上10個小時。而對于專業(yè)人士來說,時間也不短,大概要6小時,” 武田說道。 武田和同事Nina Wei在跟幾個速記員交流過后也為開發(fā)SwiftScribe找到了不少靈感。武田的團隊認為SwiftScribe能給速記員帶來1.67倍的效率提升,能縮短40%的工作時間,這也意味著他們能花同樣的時間賺到更多的錢。 顯而易見,SwiftScribe并不只是單單面向于速記員,它基于網(wǎng)頁,并免費為用戶提供服務,對于其他如記者等需要經(jīng)常整理音頻文件的職業(yè),SwiftScribe可謂是提高效率的神器。 “我們希望在未來能夠?qū)⑵渖虡I(yè)化,” 武田說道,透露在技術成熟后增加收費服務的打算。 武田的團隊計劃未來給SwiftScribe加入音頻自動轉(zhuǎn)錄文字、為視頻上字幕等功能,以及增加支持文件格式,并加入自動添加標點符號的功能。 學習教程快速掌握從入門到精通的電腦知識 |
溫馨提示:喜歡本站的話,請收藏一下本站!