English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 50122/85141 (59%)
造訪人次 : 7886382      線上人數 : 44
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋
    請使用永久網址來引用或連結此文件: http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/95186


    題名: 一個處理概念漂移的垃圾郵件分類演算法
    作者: 周清江;陳昱辰
    貢獻者: 淡江大學資訊管理學系
    關鍵詞: 郵件分類;概念漂移;資料偏斜;E-mail categorization;Concept drift;Data skewedness
    日期: 2009-05
    上傳時間: 2014-02-11 15:49:13 (UTC+8)
    摘要: 垃圾郵件氾濫的問題一直沒有得到徹底的解決,各種垃圾郵件防治機制紛紛興起,其中以機器學習為主的垃圾郵件分類過濾最為盛行,而這些方法,主要都是基於所有的資料在固定不變的環境下之假設,但是在實際環境中,郵件內容會隨著概念的漂移而不斷變動,使得分類器在模型建立之初,都有不錯的分類效果,但隨著時間的演進與概念的漂移,郵件的分類正確率會逐漸下滑,因此必須有一個學習的機制,針對資料集中新進與舊有郵件做相關的學習與調整。另一個郵件分類的問題是資料的偏斜,由於垃圾郵件的氾濫,垃圾郵件個數通常明顯的比正常郵件來的多,在分類的過程中,雖然大類別都有著較高的召回率,但是小類別的召回率卻相對不佳,本研究提出一個演算法IFWB,以貝氏分類為基礎,採用IGICF擷取關鍵字,結合一個漸進遺忘機制與分類成本架構,來解決郵件分類中概念漂移與資料偏斜的問題,並且透過實驗來驗證本研究所提出的郵件分類方法。
    關聯: 第二十屆國際資訊管理學術研討會論文集=Proceedings of the 20th International Conference Information Management,10頁
    顯示於類別:[資訊管理學系暨研究所] 會議論文

    文件中的檔案:

    檔案 大小格式瀏覽次數
    一個處理概念漂移的垃圾郵件分類演算法_中文摘要.docx14KbMicrosoft Word93檢視/開啟

    在機構典藏中所有的資料項目都受到原著作權保護.

    TAIR相關文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回饋