国产bbaaaaa片,成年美女黄网站色视频免费,成年黄大片,а天堂中文最新一区二区三区,成人精品视频一区二区三区尤物

首頁> 中文期刊> 《計(jì)算機(jī)應(yīng)用與軟件》 >一種基于狀態(tài)機(jī)的文檔文本自動提取方法

一種基于狀態(tài)機(jī)的文檔文本自動提取方法

     

摘要

Nowadays, retrieving text contents from different format documents becomes a hot topic in internet researches. For the purpose of fetching text contents from documents as fast as possible, providing basic data for content retrieval and improving the overall efficiency of searching,an automatic text extraction method based on state machine has been put forward in this paper after analysing the Microsoft Office 2007 document format. Experiments show that the method proposed in the paper achieves the goal of good effect on text extraction in its correctness, memory cost and time cost.%對于不同文本格式下的文本內(nèi)容檢索是當(dāng)前互聯(lián)網(wǎng)研究的熱點(diǎn)問題之一.為了達(dá)到快速獲取文檔內(nèi)文本信息為內(nèi)容檢索提供基礎(chǔ)數(shù)據(jù)并提高整體檢索效率的目的,以Microsoft Office 2007文檔格式為分析基礎(chǔ),提出了基于狀態(tài)機(jī)的文本自動提取方法.實(shí)驗(yàn)證明,提出的方法在文本提取的正確性、內(nèi)存耗費(fèi)、提取時(shí)間方面達(dá)到了很好的效果.

著錄項(xiàng)

相似文獻(xiàn)

  • 中文文獻(xiàn)
  • 外文文獻(xiàn)
  • 專利
獲取原文

客服郵箱:kefu@zhangqiaokeyan.com

京公網(wǎng)安備:11010802029741號 ICP備案號:京ICP備15016152號-6 六維聯(lián)合信息科技 (北京) 有限公司?版權(quán)所有
  • 客服微信

  • 服務(wù)號