English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 62830/95882 (66%)
造访人次 : 4039825      在线人数 : 991
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/35009


    题名: 決策樹二階段局部特徵分類
    其它题名: The decision tree of the construct of the two-phase document classification system in local feature
    作者: 廖冠登;Liao, Kuan-teng
    贡献者: 淡江大學資訊工程學系碩士班
    蔣定安;Chiang, Ding-an
    关键词: 文件分類;決策樹;文字探勘;Document Classification;Decision Tree;Text Mining
    日期: 2005
    上传时间: 2010-01-11 05:53:43 (UTC+8)
    摘要: 利用關鍵字的觀念,我們可以從一群已經標示分類的文件,取得適當分類規則,也就是利用類別關鍵詞,並使用這樣的依據對未標示類別的文件進行分類的工作。
    文件分類的訓練學習過程從學習樣本文件開始,計算樣本文件特徵詞的出現情形與分佈的狀況,經過統計後判斷該特徵詞是否屬於有類別代表意義的詞,若是,則將其作為一種分類的規則;只是,一份文件的特徵詞往往有字詞之間關係的問題,除此之外,在一份文件中,也可能帶著大量雜訊。如何有效解決關聯性問題,並且過濾掉不必要的雜訊,所以在本文提出了決策樹法來解決字詞間相關性的問題,再配合局部特徵化,弱化不重要的關鍵詞,以突顯出重要的關鍵字,根據本論文結果得知,在少量樣本中,決策樹與特徵二階化的配合,在文件分類的正確率與回收率上,也有不錯的效能。
    By using feature keywords, we can obtain some appropriate rules from a group of labeled documents. According to this way, we can classify the documents which haven’t been labeled. In this paper, we will discuss how to choose some training datum to be a basic, to calculate all keywords’ weights, to judge the keywords’ importance by their distribution, and to solve the problems of keywords’ correlation.

    We will try to solve to avoid the relation of keywords efficiently and filter the noise. So, we use decision tree to solve relative problems, because it can ignore the relation from word to words in first step. Second, we use the two-phase local feature to reduce amount of noisy. In chapter 4 we can observe the results that are more efficiency than before.
    显示于类别:[資訊工程學系暨研究所] 學位論文

    文件中的档案:

    档案 大小格式浏览次数
    0KbUnknown280检视/开启

    在機構典藏中所有的数据项都受到原著作权保护.

    TAIR相关文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回馈