中文信息處理
中文信息處理的相關(guān)文獻在1982年到2022年內(nèi)共計1628篇,主要集中在自動化技術(shù)、計算機技術(shù)、漢語、語言學(xué)
等領(lǐng)域,其中期刊論文1463篇、會議論文160篇、專利文獻1331059篇;相關(guān)期刊380種,包括現(xiàn)代圖書情報技術(shù)、計算機工程、計算機工程與設(shè)計等;
相關(guān)會議70種,包括第五屆全國青年計算語言學(xué)研討會(YWCL 2010)、中國中文信息學(xué)會成立二十七周年學(xué)術(shù)會議(CIPS2008)、第九屆全國計算語言學(xué)學(xué)術(shù)會議等;中文信息處理的相關(guān)文獻由2167位作者貢獻,包括劉挺、吳健、徐波等。
中文信息處理—發(fā)文量
專利文獻>
論文:1331059 篇
占比:99.88%
總計:1332682篇
中文信息處理
-研究學(xué)者
劉挺
吳健
徐波
孫茂松
俞士汶
鄭家恒
馬少平
孫樂
孫玉芳
張敏
朱巧明
李生
林鴻飛
王仁華
王斌
程學(xué)旗
陳小荷
劉匯丹
許嘉璐
黃萱菁
周國棟
周強
李培峰
許洪波
劉奕群
吳立德
張宇
張普
李斌
王永成
黃德根
何婷婷
劉群
朱靖波
蔡東風(fēng)
趙軍
車萬翔
錢培德
陳群秀
于浩
馮志偉
吳云芳
由麗萍
胡郁
袁毓林
(Missing)
亢世勇
馮元勇
吾守爾·斯拉木
施水才
排序:
按相關(guān)性
按時間降序
按時間升序
摘要:
為調(diào)動我國從事中文信息處理 技術(shù)研究的專家和學(xué)者的積極性,推動信息產(chǎn)業(yè)的發(fā)展,根據(jù)《錢偉長中文信息處理 科學(xué)技術(shù)獎獎勵條例》,現(xiàn)開展2022年度“錢偉長中文信息處理 科學(xué)技術(shù)獎”(以下簡稱學(xué)會科學(xué)技術(shù)獎)評審獎勵工作。
林青霞
摘要:
根據(jù)菲律賓華裔青少年的特點,研究中文信息處理 的內(nèi)容,設(shè)計相應(yīng)的《中文信息處理 》課程。通過教學(xué)內(nèi)容的創(chuàng)新和教學(xué)模式的改革,結(jié)合學(xué)校的實驗環(huán)境,對其實驗課程進行了一系列教學(xué)改革和實踐探索,取得較好的教學(xué)質(zhì)量提升。
金彥亮;
謝晉飛;
吳迪嘉
摘要:
中文命名實體識別在中文信息處理 中扮演著重要的角色.在中文信息文本中,許多命名實體內(nèi)部包含著嵌套實體.然而,已有研究大多聚焦在非嵌套實體識別,無法充分捕獲嵌套實體之間的邊界信息.采用分層標(biāo)注方式進行嵌套命名實體識別(nested named entity recognition,NNER),將每層的實體識別解析為一個單獨的任務(wù),并通過Gate過濾機制來促進層級之間的信息交換.利用公開的1998年《人民日報》NNER語料進行了多組實驗,驗證了模型的有效性.實驗結(jié)果表明,在不使用外部資源詞典信息的情況下,該方法在《人民日報》數(shù)據(jù)集上的F1值達到了91.41%,有效提高了中文嵌套命名實體識別的效果.
吳珍梅
摘要:
漢字是一種文字,更是一門靈動的藝術(shù)。它是中國文明的核心釋放和中華文化的獨特符號。漢字之美,不僅能夠使人耳目一新而獲得精神愉悅,更可以給人以美的熏陶而催發(fā)其蓬勃向上。因此,正確書寫規(guī)范漢字,不僅對日常書寫、中文信息處理 有著至關(guān)重要的作用,而且對中華文化的精準(zhǔn)傳承將產(chǎn)生極其深遠(yuǎn)的影響。
陸儉明
摘要:
人工智能可以分為兩大類:一類跟自然語言無關(guān),如電腦下圍棋、飛機無人駕駛等;另一類跟語言有關(guān),突出的如機器翻譯,還有如“聊天機器人”。以漢語為處理對象的自然語言處理即“中文信息處理 ”,無疑應(yīng)為后一類人工智能所需要。我們從事語言研究的人更癡心地以為語言學(xué)會在人工智能研究中派上用場。然而,當(dāng)今基于人工神經(jīng)網(wǎng)絡(luò)的“機器深度學(xué)習(xí)”的人工智能研究,與語言學(xué)不是結(jié)合得更加緊密,而是越來越疏遠(yuǎn)了。
姚睿琦;
張輝;
姚云洪
摘要:
[目的/意義]探討運用社會網(wǎng)絡(luò)分析方法研究小說中的人物影響力和關(guān)系變化特征,分析小說的寫作意圖與寫作特點.[方法/過程]以金庸小說《射雕英雄傳》和《神雕俠侶》為研究對象,基于中文信息處理 與社會網(wǎng)絡(luò)分析法,抽取小說中的人物關(guān)系網(wǎng)絡(luò),通過社區(qū)探測、k-核分解、中心性分析研究小說人物的重要程度,通過時間演化和人物關(guān)系網(wǎng)絡(luò)結(jié)構(gòu)測度分析人物影響力的演變.[結(jié)果/結(jié)論]人物關(guān)系網(wǎng)絡(luò)具有"小世界效應(yīng)",人物影響力與親密關(guān)系的變化規(guī)律顯著,能夠揭示作者的寫作風(fēng)格.
無;
劉奕群;
王小川;
張敏;
陳煒鵬;
馬少平;
許靜芳;
毛佳昕;
王蟒;
馬為
摘要:
隨著互聯(lián)網(wǎng)信息爆炸增長,搜索引擎已成為最重要的互聯(lián)網(wǎng)應(yīng)用之一,關(guān)系到社會信息處理水平與利用效率;當(dāng)前絕大部分國家的搜索服務(wù)被跨國巨頭壟斷,擁有自主可控的搜索技術(shù)對國家信息安全意義重大。2006年至今,清華大學(xué)與搜狗公司通過緊密的校企合作建設(shè)了搜狗搜索引擎,致力于提供性能突出、自主可控、內(nèi)容可信的搜索服務(wù)。
王曉明
《第七屆全國語言文字應(yīng)用學(xué)術(shù)研討會》
| 2011年
摘要:
語言文字是信息的主要載體和處理對象,而漢字是中文信息的主要載體和處理對象.為了迎接信息時代的到來,我國臺灣地區(qū)也開始思考語言文字工作的新思路.為迎接信息時代的到來,迎合信息時代的新特點,臺灣打破了部門界限,對整個信息化工作做了全面的統(tǒng)籌規(guī)劃,形成了產(chǎn)、學(xué)、研、政一體化的新的運作模式。由于組織結(jié)構(gòu)完善,分工明確,避免了工作上的相互交叉、推誘及重復(fù)性勞動造成的浪費,從而確保了資金的合理運用,提高了工作效率,臺灣在文字的搜集與整理,乃至整個中文信息處理 工作上都取得了豐厚的成果。更重要的是:確保了各項成果的協(xié)調(diào)一致性,避免造成不必要的混亂。
YU Jiang-de;
于江德;
HU Shun-yi;
胡順義;
YU Zheng-tao;
余正濤
《中國中文信息學(xué)會2015學(xué)術(shù)年會(CIPS2015)暨第十四屆全國計算語言學(xué)學(xué)術(shù)會議(CCL2015)、第三屆基于自然標(biāo)注大數(shù)據(jù)的自然語言處理國際學(xué)術(shù)研討會(NLP-NABD2015)》
| 2015年
摘要:
針對漢語詞法分析中分詞、詞性標(biāo)注、命名實體識別三項子任務(wù)分步處理時多類信息難以整合利用,且錯誤向上傳遞放大的不足,提出一種三位一體字標(biāo)注的漢語詞法分析方法,該方法將漢語詞法分析過程看作字序列的標(biāo)注過程,將每個字的詞位、詞性、命名實體三類信息融合到該字的標(biāo)記中,采用最大熵模型經(jīng)過一次標(biāo)注實現(xiàn)漢語詞法分析的三項任務(wù).并在Bakeoff2007的PKU語料上進行了封閉測試,通過對該方法和傳統(tǒng)分步處理的分詞、詞性標(biāo)注、命名實體識別的性能進行大量對比實驗,結(jié)果表明,三位一體字標(biāo)注方法的分詞、詞性標(biāo)注、命名實體識別的性能都有不同程度的提升,漢語分詞的F值達到了96.4%,詞性標(biāo)注的標(biāo)注精度達到了95.3%,命名實體識別的F值達到了90.3%,這說明三位一體字標(biāo)注的漢語詞法分析性能更優(yōu).
YU Jiang-de;
于江德;
HU Shun-yi;
胡順義;
YU Zheng-tao;
余正濤
《中國中文信息學(xué)會2015學(xué)術(shù)年會(CIPS2015)暨第十四屆全國計算語言學(xué)學(xué)術(shù)會議(CCL2015)、第三屆基于自然標(biāo)注大數(shù)據(jù)的自然語言處理國際學(xué)術(shù)研討會(NLP-NABD2015)》
| 2015年
摘要:
針對漢語詞法分析中分詞、詞性標(biāo)注、命名實體識別三項子任務(wù)分步處理時多類信息難以整合利用,且錯誤向上傳遞放大的不足,提出一種三位一體字標(biāo)注的漢語詞法分析方法,該方法將漢語詞法分析過程看作字序列的標(biāo)注過程,將每個字的詞位、詞性、命名實體三類信息融合到該字的標(biāo)記中,采用最大熵模型經(jīng)過一次標(biāo)注實現(xiàn)漢語詞法分析的三項任務(wù).并在Bakeoff2007的PKU語料上進行了封閉測試,通過對該方法和傳統(tǒng)分步處理的分詞、詞性標(biāo)注、命名實體識別的性能進行大量對比實驗,結(jié)果表明,三位一體字標(biāo)注方法的分詞、詞性標(biāo)注、命名實體識別的性能都有不同程度的提升,漢語分詞的F值達到了96.4%,詞性標(biāo)注的標(biāo)注精度達到了95.3%,命名實體識別的F值達到了90.3%,這說明三位一體字標(biāo)注的漢語詞法分析性能更優(yōu).
YU Jiang-de;
于江德;
HU Shun-yi;
胡順義;
YU Zheng-tao;
余正濤
《中國中文信息學(xué)會2015學(xué)術(shù)年會(CIPS2015)暨第十四屆全國計算語言學(xué)學(xué)術(shù)會議(CCL2015)、第三屆基于自然標(biāo)注大數(shù)據(jù)的自然語言處理國際學(xué)術(shù)研討會(NLP-NABD2015)》
| 2015年
摘要:
針對漢語詞法分析中分詞、詞性標(biāo)注、命名實體識別三項子任務(wù)分步處理時多類信息難以整合利用,且錯誤向上傳遞放大的不足,提出一種三位一體字標(biāo)注的漢語詞法分析方法,該方法將漢語詞法分析過程看作字序列的標(biāo)注過程,將每個字的詞位、詞性、命名實體三類信息融合到該字的標(biāo)記中,采用最大熵模型經(jīng)過一次標(biāo)注實現(xiàn)漢語詞法分析的三項任務(wù).并在Bakeoff2007的PKU語料上進行了封閉測試,通過對該方法和傳統(tǒng)分步處理的分詞、詞性標(biāo)注、命名實體識別的性能進行大量對比實驗,結(jié)果表明,三位一體字標(biāo)注方法的分詞、詞性標(biāo)注、命名實體識別的性能都有不同程度的提升,漢語分詞的F值達到了96.4%,詞性標(biāo)注的標(biāo)注精度達到了95.3%,命名實體識別的F值達到了90.3%,這說明三位一體字標(biāo)注的漢語詞法分析性能更優(yōu).
劉君度
陳昌英
劉冰彬
公開公告日期:2001-04-11
摘要:
本發(fā)明是一種可用于移動通訊領(lǐng)域的中文信息處理 漢字?jǐn)?shù)字化編碼技術(shù)。該方法提供了一種新穎的漢字?jǐn)?shù)字化規(guī)范編碼輸入技術(shù)。它基于人們已有的知識儲備,將國標(biāo)GB2312-80的一、二級漢字及數(shù)萬條詞匯按聲、形兩部分進行數(shù)字編碼,通過科學(xué)地選取基本碼元和有規(guī)律的組合,使所需的記憶量降到最低限度。在進一步擴充字詞庫容量的基礎(chǔ)上,降低重碼率、減少擊鍵次數(shù),有效地解決移動通訊設(shè)備漢字、詞匯以及整句輸入困難的問題,給人們提供一種可用于數(shù)字鍵盤的既規(guī)范、又簡易便捷、能即學(xué)即用的漢字?jǐn)?shù)字化編碼快速輸入技術(shù)。
李恕德
公開公告日期:2000-01-26
摘要:
本發(fā)明屬于電子計算機中文信息處理 方面的一項系統(tǒng)軟件應(yīng)用技術(shù)。是一種漢語拼音方案。它輸入的不僅是單個漢字,也能做到按語句輸入。因為它有一套根據(jù)漢語實際需要而設(shè)計的字母、符號和數(shù)字系統(tǒng),有完善的拼寫規(guī)則。它能解決詞與短語的劃分問題、各類詞語的連寫和定型問題、同音同形詞語的區(qū)分問題。在表音、表義和降低重碼率方面均優(yōu)于其它編碼方案和《漢語拼音方案》。