您的位置: 首頁>>速記知識交流>>正在閱讀

語音識別不會取代電腦速記技術

  來源: 北京    作者:  黑匣子速記    類型: 其他    發表: 2018/7/2    瀏覽:   


    我既是一名速記技術的受益者,也是一名速記技術的實踐者和速記教育工作者,談談我對語音識別的體會。 前一段時間曾經有一種說法:“速記員(或電腦速記技術)會隨著先進語音辨識技術的出現而消失”。我覺得這是對速記技術的不了解而產生的:語音識別不會取代電腦速記技術。 語音識別是讓機器通過識別和理解語音信號轉化為相應的文本或命令的高技術。讓機器識別語音的困難在某種程度上就象一個外語不好的人,聽外國人講話一樣,它和不同的說話人、不同的說話速度、不同的說話內容,以及不同的環境條件有關。語音信號本身的特點造成了語音識別的困難。這些特點包括多變性、動態性、瞬時性和連續性。 我曾經多次在中關村賣語音識別軟件的公司進行過語音識別測試,結果遠遠不象廠家宣傳得那樣神,那樣智能,甚至可以完全替代人腦的勞動:不就是對著麥克風“呱呱、呱呱”一說,字不就出來了嗎?當然,這是人最向往的,但實際上實現起來遠遠不象人們想象得那么簡單。 語音識別和電腦速記都是把稍縱即逝的語言信息變成文字,但二者在記錄語言信息時是不同的: 1、語音識別只能識別有聲信息,對無聲信息則做不到。人在表達語音信息時,往往還伴隨著體態語(手勢、眼神等),比如說“他想了想說”、“遲疑了一下,回答道”、“她含情脈脈地看著我說”等等這些信息,在工作中有時都是需要記錄下來的,你讓語音技術怎么去識別我的眼神是脈脈含情呢?還是暗送秋波呢? 2、記錄語音信息都會遇到同音字、詞處理的問題。電腦速記是這樣,語音識別也是這樣。如“亂了綱!本秃芸赡軙霈F“亂了肛腸”;以“同等xueli考研”是這個“學歷”還是這個“學力”;“秘書人員要正確領會領導shouyi”是這個“授意”還是這個“受意”等。就是語音識別能夠完全記錄下語音識別,而且能夠達到百分之百的準確率,仍然是和錄音機一樣(關于錄音機與速記的關系,早有定論,這里不再贅述)同樣需要人們的后期加工整理,這樣花費的時間會比人在當時記錄的時間要多得多。因為人在講話時,往往是口語,從口語到書面語的轉化,并不是單純的落成了文字。 3、人們在表達語言時有時候會說半句話,剩下的半句話往往會出現吞音的現象或干脆就不說了,聽者可以借助當時的語境就理解了。但是,語音識別記錄下的這前半句話一落到文字上,就是病句。電腦速記則可以由速記人員根據當時的語境及時把后半句話補完整,使之通順了,不然,別人就看不懂。速記是通過記音來達到記意的目的。速記在記錄語音信息時,如果發現遺漏了可以根據當時的語境回想起來而補充進去,但是你讓語音識別去想?它怎么想?想都想不起來。電腦速記員一般有一個體會:在會議現場做速記記錄要比聽錄音帶記錄,信息來源要豐富得多,記錄起來也會輕松得多,記錄的效果也會比較好。不但能夠聽得到,而且看得到發言人的講話時情景,這樣可以幫助速記員去理解語音信息而記錄下來。當發言人聲音比較小時,速記員可以看著發言人的口形去記錄,語音識別怎么看口形去理解啊。聽錄音帶整理信息非常麻煩,如果是錄音不是很清楚,再有一些嘈雜聲時,人辨別起來都很費勁,你放一段錄音,讓麥克風去識別成規范文字?累死它。 4、電腦速記在記錄語音信息時,是需要對語音信息進行同步過濾和整理的,是由人腦來把握語音信息記錄的主動權的,抓重點,控詳略,進行實時記錄,把一些口頭禪都過濾掉。語音識別只能是機械記錄,是被動的。 5、語音識別不能理識和別交互式有聲信息。比如說兩個人在談話、辯論時,是放一個麥克風還是放兩個麥克風?你讓麥克風聽誰的?總不可能讓這個麥克風只能識別這個人的聲音,另外一個人的聲音給擋住,不讓它進來吧。語音識別怎么能夠知道這個是甲的聲音,那個是乙的聲音?電腦速記員在記錄談話時,不但可以記錄下人的講話,而且可以記錄下當時的場景,如辯論人的神態、狀況等,這樣的信息就會很豐富、很生動。 6、目前的語音識別軟件都需要人們說標準的普通話,如果有口音、方言、土語,那識別起來就更難了。由于我國南北地域的不同,帶來了語系的差異,“北、吳、湘、贛、客、閩、粵”等八大方言區,語音差異太大了,有的地方因為“b”和“P”、“n”和“l”不分,而出現的方言笑話太多了。但是,速記人員如果能夠聽得懂,一般都是能夠記錄下來的。這也給速記人員提出了一個更高要求——必須具有廣闊的知識面,聽得多了,記錄的信息就準確多了,這就是為什么速記員會比一般人辨別、采集語音信息能力強的原因,這個我們的專業特點,這個就好象是一個老鐵路工人,只要聽火車路過兩截鐵軌的聲音間隔,就可以判定路況一樣。有時候方言特別重的人講話,人都聽不懂,機器也聽不懂。從這個方面也說明推廣普通話的重要性。 7、人們在理解語言時,可以根據語音之間的停頓、語調、語氣來記錄語言,并把聲音信息變成文字,而且在記錄時,實時加相應的標點符號。 語音識別在理解語言時還需要說標點符號的形狀,因為機器在理解語言時,是需要靠斷句來理解的:“王處長冒號你從哪兒來問號另起一自然段空兩格咱們今天學習前書名號鄧小平理論后書名號”,事實上人說話時是不說標點符號具體形狀的,這樣說會很別扭。 語音識別理解語言時,會遇到字符串正確切分和對句子結構理解的問題。比如說“美國會考慮戰略導彈防御系統”是“美國/會/考慮/戰略導彈防御系統”還是“美/國會/考慮/戰略導彈防御系統”呢?“他yihuier/jiulai/”本來是“他一會兒就來”往往會理解成“他一揮而就/來”;“要及時把握……”語音識別在切分時,就很可能會切分成“藥劑師把握……”。 電腦速記是由速記人員實時對語音信息進行切分,加標點符號、分段的。 8、語音識別只能識別單一漢語語音信息,對于其他的聲音,它都會認為是雜音而影響其識別的準確率。要記錄正在播放歌曲的歌詞或詩朗誦的朗誦詞,從背景音樂里提取有用信息變成文字,你讓麥克風怎么識別?速記人員則可以做到。 9、速記記錄語言信息的一次性,是記錄最前沿話題的。新生事物的出現,隨時會產生新詞語,人們可以根據對語言信息的理解,選定具體是哪個字或詞,如“他剪了一個酷頭”語音識別就會很可能識別成“他揀了一個褲頭”。速記記錄的一次性是指速記人員在記錄語言時,當時就把同音字(詞)確定下來是具體的哪一個字(詞),以保證準確率在95%以上,一個優秀的速記師可以保持一次性的準確率在99%以上,這個也是為什么電腦速記能夠得到人們認可的原因,也是速記高效率的具體體現。 為了提高語音識別的準確性,對人名、地名等專有名詞,需要事先對詞語進行限定,把新詞語做進去,但是實際操作起來不現實。比如說,要用語音識別記錄明天的會議內容,往往不可能讓所有的代表都來,每人今天事先對麥克風說一遍,適應一下口音,把一些詞語事先錄入進去,這樣的話,就變成了今天是開會了,明天再說就是重復會議了。比如說明天在上海召開APEC會議,誰能夠要求國家領導人今天晚上事先對著麥克風說一遍明天的發言?這個恐怕不可以。 10、隨著信息社會的發展,現在越來越多地出現了一種新的說話方式:中英文信息混和現象。比如說“請王秘書把客戶的合同fai ke si(FAX)過來”,速記員在記錄時只要能夠聽得懂英文單詞,就可以把它即時翻譯記錄成“請王秘書把客戶的合同傳真過來”;另外,由于語言有一些外來詞語,當傳入我國時,因為是前沿話題,一時半時人們還找不到一個合適的中文詞語和造出一個新詞語來代替,同樣會出現中文信息和外文信息夾雜的情況,讓麥克風去識別成全中文信息呢?還是中外文信息混合呢?準確率能夠達到多少?這也給速記員提出了新的挑戰,成長為一個優秀的速記員是不是容易的,僅僅有很高的記錄速度是遠遠不夠的。 11、電腦速記技術是語文現代化和中文信息處理的一個組成部分。無論是手寫速記,還是電腦速記,都是以漢語拼音為基礎的,深深植根于漢民族語言的技術,只要說漢語就有速記存在的地方,除非不說漢語,而說別的語言,又變成是別的語種的速記了。 信息社會越發展,越需要處理信息的高效率。中文電腦速記正是這樣一個處理信息高效手段,它的出現與被應用,正是信息社會發展的必然產物和人們處理信息高效率的的必然趨勢。 總之,語音識別和速記技術工作方式方法不一樣,一個是機芯在工作,一個是人腦在工作。語音識別再智能,還是沒有人腦智能,還是不能象人在理解語言那樣;人腦在理解語言時,都會遇到同音詞問題,何況是機器呢?如果語音識別能夠完全代替人腦的勞動那就好辦了,以后把人腦都割掉,肩膀上都安裝一個機器腦子,那我們的社會將是怎樣?這就好象是有了汽車、火車、飛機,作為最基本的代步工具自行車依然沒有被取代一樣。 所以我覺得語音識別也好,錄音機也好,速記技術也好,都是記錄語言信息的工具,他們之間的關系是相得益彰,相輔相成的,誰也取代不了誰。 正是因為語音識別和電腦速記技術這樣的不同點。國外一些發達國家都有自己語種的電腦速記技術。目前全國人民法院系統的書記員普遍采用了電腦速記記錄庭審的方式,實現了庭審計算機化,我國電腦速記技術的出現,推動了我國司法制度的改革人民法院和人民檢察院書記員單獨序列。 僅僅是管窺之見。今天就到這兒,下次再聊。

 
相關主題 推薦閱讀
·為什么重要會議需要速記
·為什么重要會議需要速記
黑匣子速記成立于2003年11月,是國內領先的中文速錄服務機構。專業、高效、優質,成為政府部門、國企及媒體公關公司首選的速錄服務機構。專業提供北京速錄服務、錄音整理文字、翻譯、北京速記員服務。

掃碼添加微信,咨詢速記服務等業務
服務范圍
·找速記聽打員,就來黑匣子速記
·翻譯服務:筆譯/同傳/交傳
·錄音整理:演講/會議/深訪
·會議速記:論壇/講座/專訪
特別推薦

Copyright © 2003-2018  深圳市黑匣子速記有限公司 All Rights Reserved.
免責聲明:本網站內容均采集自公開渠道,若對您或您的公司有負面影響,請與我們聯系刪除相關文字。免費推廣請聯系我們。
電話:0755-83016025 聯系人:曾經理 13543280061 Email:[email protected]  


快乐双彩开奖结果027期 十一运前三直走势图 炒股交易平台 基金配资比例 河北彩票快三开奖结果 福彩20选8玩法中奖规则 幸运28预测大白 黑龙江6+1中奖号码 能日常搬砖挣钱的网游 上证指数吧东方财富网手机版 广西快乐十分开奖数据