English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 62805/95882 (66%)
造訪人次 : 3988149      線上人數 : 637
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋
    請使用永久網址來引用或連結此文件: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/52332


    題名: Improving the accuracy of text classification by the different classifier with multiple confidence threshold values
    其他題名: 利用不同分類器與多重靜態門檻值來改善文件分類的準確度
    作者: 黃蕙華;Huang, Hui-hua
    貢獻者: 淡江大學資訊工程學系博士班
    葛煥昭;Keh, Huan-chao
    關鍵詞: 關聯式分類;文件分類;文字採擷;Association Classification;Text Classification;text mining
    日期: 2010
    上傳時間: 2010-09-23 17:33:21 (UTC+8)
    摘要: 在使用Associative Classification (AC)做分類時,通常會將無法利用Class Association Rules(CAR)做分類的資料,直接歸類到一個預先設定的類別,以避免資料無法被分類的問題。但在使用CAR建立AC分類器時,規則信賴度的標準很難設定,定得太高會將很多可能有用的規則刪除而造成許多資料不能使用CAR做分類,而定得太低則又容易產生分類錯誤,這些情形都會影響到分類準確性。為了解決預設類別和低信賴度規則造成分類錯誤的問題,提升分類結果的準確度,我們提出同時使用兩種不同分類器的概念,依據分類器特性,在不同階段做不同的事。本論文將利用貝氏分類器對訓練文件做分類,然後利用所得之平均準確率來設定門檻值,篩選出滿足門檻值條件的CAR。由於這些CAR之準確度皆高於貝氏分類器的結果,我們可利用這些篩選出CAR來進一步改善分類的結果。而針對CAR不能分類的文件,則以貝氏分類器來分類。經由實驗證明,這種結合不同的分類器的優點的作法的確可獲得比僅使用單一分類器更好的分類效能,換言之,這種結合不同的分類器的優點的作法可有效提升文件分類的效能。
    Each type of classifier has its own advantages as well as certain shortcomings. In this paper, we take the advantages of the Associative classifier and the Naive Bayes classifier to make up the shortcomings of each other, thus improving the accuracy of text classification. We will classify the training cases with the Naive Bayes classifier and set different confidence threshold values for different class association rules (CARs) to different classes by the obtained classification accuracy rate of the Naive Bayes classifier to the classes. Since the accuracy rates of all selected CARs of the class are higher than that obtained by the Naive Bayes classifier, we could further optimize the classification result through these selected CARs. Moreover, for those unclassified cases, we will classify them with the Naive Bayes classifier. The experimental results show that combining the advantages of these two different classifiers better classification result can be obtained than with a single classifier.
    顯示於類別:[資訊工程學系暨研究所] 學位論文

    文件中的檔案:

    檔案 大小格式瀏覽次數
    index.html0KbHTML303檢視/開啟

    在機構典藏中所有的資料項目都受到原著作權保護.

    TAIR相關文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回饋