您的當前位置:天津公務員考試網 >> 申論資料 >> 熱點時評

2020年天津公務員考試申論熱點:AI語音技術

發布:2019-06-17 16:46:31    來源:天津公務員考試網 字號: | | 我要提問我要提問
      本期為各位考生帶來了2020年天津公務員考試申論熱點:AI語音技術。要想申論成績好,關注熱點不可少。天津公務員考試中,申論是最能拉開考生成績的一門科目,積累對于申論而言,是非常重要的天津公務員考試網溫馨提示考生閱讀下文,相信能給考生帶來一定的幫助。
   更多2020年天津公務員考試復習技巧詳見2020年天津公務員提前復習用書點擊訂購)。  
/
 
  AI語音技術是AI的一個分支,隨著AI技術的發展,AI語音技術也在突飛猛進換代升級。現在,科大訊飛、搜狗等科技公司相繼發布了語音合成技術的應用。通過AI手段,用戶可以一秒變聲為社會名人或者其他想要模仿的聲音。

  AI的這種音色遷移技術可稱為變聲技術,可以將任何人的聲音轉換成特定人的聲音(Any-to-One)。與國內的IT公司比較起來,搜狗公司的AI變聲功能已經達到實用的階段。搜狗CEO王小川在一場大會上進行了展示。通過手機軟件,王小川用AI變聲模擬了高曉松和東北妹子的聲音,引得現場連連發笑。

  比起AI之前的語音服務,如導航、智能音箱、問題解讀等,變聲技術是AI語音技術的重要升級,如果說之前的AI語音服務還在追求以什么樣的語音,以及如何使AI的語音更像人的聲調和音色為用戶和公眾提供更好的服務,那么現在的AI變聲技術則進一步擴大了AI的應用范圍,既有可能讓AI語音更好為公眾服務,也有可能讓AI語音步入歧途,成為詐騙的工具。前者是向善和行善,后者是從惡和行惡。

  AI的變聲技術是一種逼真的語音合成技術,它的基礎是神經網絡和機器學習。神經網絡模擬電信號在人腦神經元之間的傳遞過程,對輸入數據進行處理,從大量樣本數據中總結出共同特征,再通過機器學習模擬特定人的聲音,達到以假亂真的效果。顯然,這樣的變音技術有很多用武之地,凡是可以采用語音或有聲服務的地方,都可能獲得這類服務和應用,如語音交互、有聲讀物、新媒體、智能客服、大眾娛樂等。不過,AI變聲技術的短板也是顯著的,如果有人利用這種技術向任何特定的人打電話以扮演其親人、朋友、同事、上級的聲音,就會讓人難以辨別真假。

  不過,與AI變聲技術相似的另一種AI語音技術似乎向善的成分大一些,這就是“講話到面孔”技術,也可稱為“聞聲識人”技術。研究人員設計了一種智能軟件,把網上搜集的數百萬段教學和音像視頻中的每個人的面部特征與其講話的聲音特點匹配和相聯,形成一種可供計算機學習的大數據,通過深度學習,這種智能軟件僅僅通過聽一個人的聲音就可以畫出(顯示)其相貌,而且八九不離十,但是,現在這種軟件還不成熟。

  “講話到面孔”的AI語音技術完全可以應用到刑事鑒識中,可以與較早的模擬畫像技術一道成為刑事鑒識的補充技術。模擬畫像技術是基于找不到嫌疑人的影視資料、聲音和照片,或者是嫌疑人的圖像很模糊,只能通過受害人或目擊者的口述,由刑偵人員畫出嫌疑人的相貌。2017年6月9日,克里斯滕森殺害中國訪問學者章瑩穎,在案件偵查之初,美國聯邦調查局(FBI)就向擅長模擬畫像的中國警官林宇輝發出邀請,請他協助畫出嫌犯的畫像,而當時能提供的嫌犯圖片就來自街邊監控攝像頭上的模糊截圖。

  無論是AI變聲技術,還是“講話到面孔”的AI語音(聞聲識人)技術,都是AI語音技術的升級。技術是中立的,關鍵在于如何使用這類技術。在這類技術應用于社會生活和工作之前,制定對其嚴格管理的措施極為緊迫和必須。

  2019年4月,全國人大常委會審議的《民法典人格權編(草案)》里加了一條規定:任何組織和個人不得以利用信息技術手段偽造的方式侵害他人的肖像權。同樣,如果AI語音技術發展了,也應當加上不得以信息技術手段偽造的方式侵害他人的聲音權,同時要單獨在人工智能立法中涉及AI合成不得侵犯他人的肖像權、聲音權等。任何未經授權的合成肖像、合成音頻均屬于侵權違法行為。

  盡管如此,還是需要有一部明確的法律來規范包括語音、肖像等在內的AI新產品和應用,使其只能向善行善,而非向惡行惡。

點擊分享此信息:
沒有了   |   下一篇 »
RSS Tags
返回網頁頂部
CopyRight 2019 http://www.jvoyac.tw/ All Rights Reserved 皖B2-20110080-11
(任何引用或轉載本站內容及樣式須注明版權)XML
六合图库最新下载