English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 64178/96951 (66%)
造訪人次 : 9424432      線上人數 : 10697
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋
    請使用永久網址來引用或連結此文件: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/35175


    題名: 局部特徵強化結合關聯式法則與特殊類別優先權分類系統建置
    其他題名: The construct of document classification system in strengthening local feature with association rule and special priority of classification
    作者: 廖英凱;Liao, Ying-kai
    貢獻者: 淡江大學資訊工程學系碩士班
    蔣定安;Chiang, Ding-an
    關鍵詞: 文件分類;關聯式法則;文字探勘;document classification;association rule;text mining
    日期: 2006
    上傳時間: 2010-01-11 06:07:01 (UTC+8)
    摘要: 利用關鍵字的觀念,我們可以從一群已經標示分類的文件,取得適當分類規則,也就是利用類別關鍵詞,並使用這樣的依據對未標示類別的文件進行分類的工作。
    文件分類的訓練學習過程從學習樣本文件開始,計算樣本文件特徵詞的出現情形與分佈的狀況,經過統計後判斷該特徵詞是否屬於有類別代表意義的詞,若是,則將其作為一種分類的規則。在一份文件中,也可能帶著大量雜訊,為了有效過濾掉不必要的雜訊,在本文提出了改良式TFIDF修正關鍵詞權重的計算方式,再配合關聯式法則,找出能幫助分類的複合關鍵詞,用來修正文件的權重,最後再根據文件資料的特性,給予不同類別不同的優先權。由本論文的實驗結果,在經過本論文提出的方法修正後,能夠大幅度提高文件分類的效率。
    By using feature keywords, we can obtain some appropriate rules from a group of labeled documents. According to this way, we can classify the documents which haven’t been labeled. In this paper, we will discuss how to choose some training datum to be a basic, to calculate all keywords’ weights, to judge the keywords’ importance by their distribution, first, we will use a better way to calculate the keywords weight, and then combine two words as a new word by association rule to help us increase the keywords. At last, according to the character of the datum, we give different category with different priority. It will make the classification more efficiency.
    顯示於類別:[資訊工程學系暨研究所] 學位論文

    文件中的檔案:

    檔案 大小格式瀏覽次數
    0KbUnknown295檢視/開啟

    在機構典藏中所有的資料項目都受到原著作權保護.

    TAIR相關文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回饋