国产bbaaaaa片,成年美女黄网站色视频免费,成年黄大片,а天堂中文最新一区二区三区,成人精品视频一区二区三区尤物

您現(xiàn)在的位置: 首頁> 研究主題> 智能語音

智能語音

智能語音的相關(guān)文獻(xiàn)在1993年到2023年內(nèi)共計3166篇,主要集中在無線電電子學(xué)、電信技術(shù)、自動化技術(shù)、計算機(jī)技術(shù)、信息與知識傳播 等領(lǐng)域,其中期刊論文363篇、會議論文6篇、專利文獻(xiàn)798654篇;相關(guān)期刊256種,包括數(shù)據(jù)、中國廣播、安徽科技等; 相關(guān)會議6種,包括第十三屆海峽兩岸智能運(yùn)輸系統(tǒng)學(xué)術(shù)研討會、2011年全國電力企業(yè)信息化大會、中國自動化學(xué)會第19屆青年學(xué)術(shù)會議等;智能語音的相關(guān)文獻(xiàn)由5902位作者貢獻(xiàn),包括劉兵、虞焰興、不公告發(fā)明人等。

智能語音—發(fā)文量

期刊論文>

論文:363 占比:0.05%

會議論文>

論文:6 占比:0.00%

專利文獻(xiàn)>

論文:798654 占比:99.95%

總計:799023篇

智能語音—發(fā)文趨勢圖

智能語音

-研究學(xué)者

  • 劉兵
  • 虞焰興
  • 不公告發(fā)明人
  • 高君效
  • 何云鵬
  • 余杰
  • 馮海洪
  • 李本松
  • 劉偉
  • 張高見
  • 期刊論文
  • 會議論文
  • 專利文獻(xiàn)

搜索

排序:

年份

    • 劉銀娣; 楊楊
    • 摘要: 智能技術(shù)在有聲書生產(chǎn)中的應(yīng)用成為了有聲書產(chǎn)業(yè)發(fā)展的新方向。從媒介本體論的視角看,口述故事和聲覺空間構(gòu)成了有聲故事書的內(nèi)核和外衣,其智能化生產(chǎn)也要緊扣其實質(zhì),圍繞著故事生產(chǎn)與聲音生產(chǎn)開展。盡管當(dāng)前有聲故事書的智能化生產(chǎn)還處于初級階段,在故事生產(chǎn)和聲音生產(chǎn)環(huán)節(jié)面臨著許多問題,但是可以預(yù)見,智能化技術(shù)應(yīng)用必將成為有聲故事書生產(chǎn)發(fā)展的趨勢。從故事生產(chǎn)的角度,未來有聲書智能化生產(chǎn)要打破文本內(nèi)容線性思維束縛,實現(xiàn)從“讀故事”到“講故事”的轉(zhuǎn)換,方便用戶在有聲書的非線性互動敘事中創(chuàng)建自己的故事。從聲音生產(chǎn)的角度,則需要發(fā)展和應(yīng)用文本情緒分析技術(shù),促進(jìn)智能語音的情緒傳達(dá),并從當(dāng)前的重視單一聲質(zhì)發(fā)展到營造立體聲域。
    • 王海軍; 于佳文
    • 摘要: 研究提出運(yùn)用客觀數(shù)據(jù)和系統(tǒng)的方法來識別顛覆性技術(shù)并提高識別精準(zhǔn)度的方法?;陬嵏残约夹g(shù)理論,重新修正顛覆性技術(shù)特征,從創(chuàng)新性、擴(kuò)散性和轉(zhuǎn)軌性三方面構(gòu)建一種采用搜索路徑統(tǒng)計數(shù)(SPC)算法、專利吸收率和專利擴(kuò)散率測度的新方法對顛覆性技術(shù)進(jìn)行識別和判斷;并利用1970—2020年間1985件專利的數(shù)據(jù)對智能語音領(lǐng)域進(jìn)行實證分析,分析識別出強(qiáng)化學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)是該領(lǐng)域的顛覆性技術(shù),而端到端的神經(jīng)網(wǎng)絡(luò)算法是該領(lǐng)域未來發(fā)展的方向。
    • 張超; 錢爾赫
    • 摘要: 2020年3月4日,中央廣播電視總臺音頻客戶端“云聽”上線,一年后客戶端閱覽量即達(dá)到10.73億次,成為總臺閱覽量10億量級四大客戶端之一。傳統(tǒng)媒體開始尋求蛻變與創(chuàng)新之路,國家隊“云聽”的進(jìn)場,為音頻新媒體產(chǎn)業(yè)帶來了新的契機(jī)。
    • 唐玉璟
    • 摘要: 本文對新聞移動客戶端的智能語音功能進(jìn)行研究,分析其智能語音發(fā)展的特點(diǎn),發(fā)現(xiàn)新聞移動客戶端存在智能生態(tài)不完善、場景不夠貼合用戶需求、語義模糊和缺乏"溫度"的問題,進(jìn)而提出當(dāng)前新聞移動客戶端智能語音功能完善措施,以期對新聞移動客戶端智能語音的優(yōu)化和完善提供借鑒,促進(jìn)媒體融合。
    • 袁靜; 王子杰; 澤仁志瑪; 王志國; 豐繼林; 申旭輝; 吳鵬; 王橋; 楊德賀; 王統(tǒng)領(lǐng); 周樂
    • 摘要: 閃電哨聲波是一種重要的電磁波動,了解其傳播特征及傳播過程有助于揭開圈層電磁耦合機(jī)理.從衛(wèi)星觀測資料識別閃電哨聲波通常需要將原始電磁波形進(jìn)行濾波處理再轉(zhuǎn)化為時頻圖像,最后采用目視方法識別圖像中的色散狀形態(tài),整個過程消耗大量人機(jī)時間和內(nèi)存資源,不能滿足張衡一號(ZH-1)衛(wèi)星觀測的海量電磁場數(shù)據(jù)處理的需求.針對該問題,鑒于閃電哨聲波原始波形數(shù)據(jù)能夠通過播放器產(chǎn)生降調(diào)的聲音,本文打破以視覺分析為主的閃電哨聲波研究慣例,首次采用語音智能技術(shù)研究其自動識別算法.首先,以張衡一號衛(wèi)星感應(yīng)磁力儀(SCM)的VLF波段的波形數(shù)據(jù)為研究對象,截取時間窗口為0.16 s的波形數(shù)據(jù)作為音頻片段;然后對該片段進(jìn)行去趨勢處理;基于梅爾頻率倒譜系數(shù)(MFCCs)能夠刻畫人耳的聽覺機(jī)理,提取閃電哨聲波的MFCCs特征;其次,構(gòu)建長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)并輸入波形數(shù)據(jù)的MFCCs特征訓(xùn)練分類模型;最后利用MFCCs特征和訓(xùn)練得到的LSTM分類模型實現(xiàn)閃電哨聲波自動識別.通過對10200數(shù)據(jù)集(5100段包含閃電哨聲波,5100段無閃電哨聲波)上開展實驗發(fā)現(xiàn):該方法的準(zhǔn)確率為96.7%,召回率為84.2%,調(diào)和平均得分(F1-score)為90.0%,AUC(Area under Curve)評分為90.1%,而且消耗的時間成本是2.28 s,消耗內(nèi)存資源是82.89 MB;當(dāng)前最優(yōu)的基于時頻圖的閃電哨聲波識別算法在本數(shù)據(jù)集上的準(zhǔn)確率為97.3%,內(nèi)存消耗為233 MB,在CPU上處理0.16 s的片段數(shù)據(jù)所消耗的時間是6.71 s,內(nèi)存消耗和時間消耗比較嚴(yán)重.相比而言,基于智能語音的閃電哨聲波識別算法準(zhǔn)確率略低0.6%,但能夠節(jié)約66%的時間成本以及65%的內(nèi)存資源.這表明該算法不僅僅適合從衛(wèi)星觀測的海量數(shù)據(jù)中快速準(zhǔn)確識別出閃電哨聲波,且更適合應(yīng)用于星載識別.
    • 黃晶晶
    • 摘要: 未來幾年,合肥市人工智能產(chǎn)業(yè)將持續(xù)向縱深推進(jìn),在智能語音、智能視覺、認(rèn)知智能、類腦智能等領(lǐng)域?qū)崿F(xiàn)重點(diǎn)突破,在人才集聚、應(yīng)用創(chuàng)新等環(huán)節(jié)取得重大進(jìn)展,進(jìn)一步完善新一代人工智能產(chǎn)業(yè)生態(tài)圈。新一代人工智能正在全球范圍內(nèi)蓬勃興起,為經(jīng)濟(jì)社會發(fā)展注入了新動能,正在深刻改變?nèi)藗兊纳a(chǎn)生活方式。近年來,合肥市緊抓人工智能發(fā)展的重大戰(zhàn)略機(jī)遇,搶灘布局新一代人工智能產(chǎn)業(yè)。目前,合肥市人工智能產(chǎn)業(yè)整體發(fā)展態(tài)勢強(qiáng)勁.
    • 魏智; 王琳玲; 黃昊; 戰(zhàn)坤
    • 摘要: 介紹智慧病房設(shè)計,包括整體架構(gòu)、具體實現(xiàn)路徑、實施方法、功能模塊及應(yīng)用效果,指出智慧病房結(jié)合人工智能技術(shù)有助于提升醫(yī)院病房綜合服務(wù)水平及患者就醫(yī)體驗。
    • 趙東明; 王敏輝; 田雷
    • 摘要: 為了解決運(yùn)營商服務(wù)熱線情感挖掘能力不足的問題,本文對中國移動服務(wù)數(shù)據(jù)(10086語音投訴工單、在線服務(wù)記錄、服務(wù)標(biāo)簽等)進(jìn)行研究,構(gòu)建了一種智能語音認(rèn)知分析系統(tǒng),以多模態(tài)情感分類技術(shù)輸出結(jié)構(gòu)化情感標(biāo)簽,并通過數(shù)據(jù)可視化運(yùn)營分析界面方式進(jìn)行展示,以期為相關(guān)人員提供參考。
    • 李蓀; 曹峰
    • 摘要: 端到端(End-to-End)框架是一種基于深度神經(jīng)網(wǎng)絡(luò)可直接預(yù)測語音信號和目標(biāo)語言字符的概率模型,從原始的數(shù)據(jù)輸入到結(jié)果輸出,中間的處理過程和神經(jīng)網(wǎng)絡(luò)成一體化,可脫離人類主觀偏見,直接提取特征,從而充分挖掘數(shù)據(jù)信息,簡化任務(wù)處理步驟。近幾年,注意力機(jī)制的引入,輔助端到端架構(gòu)實現(xiàn)了多模態(tài)間的相互映射,進(jìn)一步提高了技術(shù)的整體性能。通過對近幾年端到端技術(shù)在智能語音領(lǐng)域技術(shù)和應(yīng)用的調(diào)研,端到端架構(gòu)為語音模型算法提供了新的思想和方法,但也存在混合框架無法有效地平衡和兼顧單一技術(shù)特點(diǎn),模型內(nèi)部邏輯復(fù)雜使得人工介入調(diào)試?yán)щy、定制可擴(kuò)展性減弱等問題。未來端到端一體化模型在語音領(lǐng)域應(yīng)用方面還將有進(jìn)一步的發(fā)展,一方面是前端到后端的模塊端到端,忽略前端語音增強(qiáng)和后端語音識別中涉及多項輸入的假設(shè),將語音增強(qiáng)和聲學(xué)建模一體化,另一方面是交互信息載體的端到端,聚焦于語音信號數(shù)據(jù)本身的信息提取和處理,使得人機(jī)交互更貼近真實人類語言的溝通方式。
    • 白華
    • 摘要: 人工智能是中國為數(shù)不多的與世界同步發(fā)展的技術(shù)領(lǐng)域,經(jīng)過數(shù)十年國內(nèi)無數(shù)優(yōu)秀科學(xué)家、學(xué)者,以及眾多企業(yè)研發(fā)工程師的不懈努力,我國部分領(lǐng)域核心關(guān)鍵技術(shù)實現(xiàn)重要突破,語音識別、視覺識別技術(shù)世界領(lǐng)先。這一次產(chǎn)業(yè)界和學(xué)術(shù)界深度融合,發(fā)揮了更廣泛的作用,在捷通華聲等專注核心技術(shù)研發(fā)和產(chǎn)業(yè)化應(yīng)用的企業(yè)共同努力下,守住了智能語音核心技術(shù)在國際競爭中的主動權(quán),中國語音合成產(chǎn)業(yè)市場牢牢掌握在我們的民族企業(yè)手上。
  • 查看更多

客服郵箱:kefu@zhangqiaokeyan.com

京公網(wǎng)安備:11010802029741號 ICP備案號:京ICP備15016152號-6 六維聯(lián)合信息科技 (北京) 有限公司?版權(quán)所有
  • 客服微信

  • 服務(wù)號