一種基于狀態(tài)機(jī)的文檔文本自動提取方法

朱振廣; 何慧; 張宏莉; 李喬

国产bbaaaaa片,成年美女黄网站色视频免费,成年黄大片,а天堂中文最新一区二区三区,成人精品视频一区二区三区尤物

首頁> 中文期刊> 《計(jì)算機(jī)應(yīng)用與軟件》 >一種基于狀態(tài)機(jī)的文檔文本自動提取方法

一種基于狀態(tài)機(jī)的文檔文本自動提取方法

AI論文寫作 >>

開具論文收錄證明 >>

頁面導(dǎo)航

摘要
著錄項(xiàng)
引文網(wǎng)絡(luò)
相似文獻(xiàn)
相關(guān)主題

摘要

Nowadays, retrieving text contents from different format documents becomes a hot topic in internet researches. For the purpose of fetching text contents from documents as fast as possible, providing basic data for content retrieval and improving the overall efficiency of searching,an automatic text extraction method based on state machine has been put forward in this paper after analysing the Microsoft Office 2007 document format. Experiments show that the method proposed in the paper achieves the goal of good effect on text extraction in its correctness, memory cost and time cost.%對于不同文本格式下的文本內(nèi)容檢索是當(dāng)前互聯(lián)網(wǎng)研究的熱點(diǎn)問題之一.為了達(dá)到快速獲取文檔內(nèi)文本信息為內(nèi)容檢索提供基礎(chǔ)數(shù)據(jù)并提高整體檢索效率的目的,以Microsoft Office 2007文檔格式為分析基礎(chǔ),提出了基于狀態(tài)機(jī)的文本自動提取方法.實(shí)驗(yàn)證明,提出的方法在文本提取的正確性、內(nèi)存耗費(fèi)、提取時(shí)間方面達(dá)到了很好的效果.

著錄項(xiàng)

來源
《計(jì)算機(jī)應(yīng)用與軟件》 |2012年第12期|54-57|共4頁
作者
朱振廣; 何慧; 張宏莉; 李喬;
展開▼
作者單位

哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院黑龍江哈爾濱150001;

哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院黑龍江哈爾濱150001;

哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院黑龍江哈爾濱150001;

哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院黑龍江哈爾濱150001;

展開▼
原文格式 PDF
正文語種 chi
中圖分類理論、方法;
關(guān)鍵詞
狀態(tài)機(jī); 文本提取; Microsoft Office 2007文檔;

相似文獻(xiàn)

中文文獻(xiàn)
外文文獻(xiàn)
專利

1. 一種基于最少出現(xiàn)文檔頻的文本特征提取方法 [J] . 蘇丹 ,周明全 ,王學(xué)松 . 計(jì)算機(jī)工程與應(yīng)用 . 2012,第10期
2. 一種基于提取指紋方法的數(shù)字文檔拷貝檢測模型 [C] . 李旭 ,余靖 . 2005年全國理論計(jì)算機(jī)科學(xué)學(xué)術(shù)年會 . 2005
3. 基于深度神經(jīng)網(wǎng)絡(luò)的歷史文檔文本行提取方法的研究 [A] . 白如博 . 2020

獲取原文

客服郵箱：kefu@zhangqiaokeyan.com

京公網(wǎng)安備：11010802029741號 ICP備案號：京ICP備15016152號-6 六維聯(lián)合信息科技 (北京) 有限公司?版權(quán)所有

客服微信
服務(wù)號

国产bbaaaaa片,成年美女黄网站色视频免费,成年黄大片,а天堂中文最新一区二区三区,成人精品视频一区二区三区尤物

一種基于狀態(tài)機(jī)的文檔文本自動提取方法

摘要

著錄項(xiàng)

引文網(wǎng)絡(luò)

相似文獻(xiàn)

相關(guān)主題

期刊訂閱