English
| 正體中文 |
简体中文
|
全文筆數/總筆數 : 64178/96951 (66%)
造訪人次 : 11066556 線上人數 : 23735
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by
NTU Library & TKU Library IR team.
搜尋範圍
全部機構典藏
商管學院
資訊管理學系暨研究所
--會議論文
查詢小技巧:
您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
進階搜尋
主頁
‧
登入
‧
上傳
‧
說明
‧
關於機構典藏
‧
管理
淡江大學機構典藏
>
商管學院
>
資訊管理學系暨研究所
>
會議論文
>
Item 987654321/95186
資料載入中.....
書目資料匯出
Endnote RIS 格式資料匯出
Bibtex 格式資料匯出
引文資訊
請使用永久網址來引用或連結此文件:
https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/95186
題名:
一個處理概念漂移的垃圾郵件分類演算法
作者:
周清江
;
陳昱辰
貢獻者:
淡江大學資訊管理學系
關鍵詞:
郵件分類
;
概念漂移
;
資料偏斜
;
E-mail categorization
;
Concept drift
;
Data skewedness
日期:
2009-05
上傳時間:
2014-02-11 15:49:13 (UTC+8)
摘要:
垃圾郵件氾濫的問題一直沒有得到徹底的解決,各種垃圾郵件防治機制紛紛興起,其中以機器學習為主的垃圾郵件分類過濾最為盛行,而這些方法,主要都是基於所有的資料在固定不變的環境下之假設,但是在實際環境中,郵件內容會隨著概念的漂移而不斷變動,使得分類器在模型建立之初,都有不錯的分類效果,但隨著時間的演進與概念的漂移,郵件的分類正確率會逐漸下滑,因此必須有一個學習的機制,針對資料集中新進與舊有郵件做相關的學習與調整。另一個郵件分類的問題是資料的偏斜,由於垃圾郵件的氾濫,垃圾郵件個數通常明顯的比正常郵件來的多,在分類的過程中,雖然大類別都有著較高的召回率,但是小類別的召回率卻相對不佳,本研究提出一個演算法IFWB,以貝氏分類為基礎,採用IGICF擷取關鍵字,結合一個漸進遺忘機制與分類成本架構,來解決郵件分類中概念漂移與資料偏斜的問題,並且透過實驗來驗證本研究所提出的郵件分類方法。
關聯:
第二十屆國際資訊管理學術研討會論文集=Proceedings of the 20th International Conference Information Management,10頁
顯示於類別:
[資訊管理學系暨研究所] 會議論文
文件中的檔案:
檔案
大小
格式
瀏覽次數
一個處理概念漂移的垃圾郵件分類演算法_中文摘要.docx
14Kb
Microsoft Word
175
檢視/開啟
在機構典藏中所有的資料項目都受到原著作權保護.
TAIR相關文章
DSpace Software
Copyright © 2002-2004
MIT
&
Hewlett-Packard
/
Enhanced by
NTU Library & TKU Library IR teams.
Copyright ©
-
回饋