English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 64178/96951 (66%)
造訪人次 : 10719768      線上人數 : 19185
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋
    請使用永久網址來引用或連結此文件: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/114438


    題名: 適用於分類變數資料的二元不平衡資料自動分類系統
    其他題名: Automatic binary classification system for imbalanced data with categorical explanatory variables
    作者: 葉丞峻;Yeh, Cheng-Chun
    貢獻者: 淡江大學統計學系碩士班
    陳景祥
    關鍵詞: classifier;data complexity;data mining;imbalanced data;分類技術;資料探勘;資料複雜度;類別不平衡
    日期: 2017
    上傳時間: 2018-08-03 14:52:36 (UTC+8)
    摘要: 隨著科技的進步,許多產業都應用自動化的作業模式,使得現今人類的生活更便利也更有效率。若我們能將自動化的概念導入資料分析的流程中,便能使資料分析者在作業上的負擔降低。本研究參考了資料複雜度指標對常見分類技術的影響,針對二元分類的類別不平衡資料,使用三種不同的重抽樣方法對資料進行類別的平衡,期望能夠建立一個有效的類別不平衡資料自動二元分類系統。研究結果顯示,本文提出的方法能夠有效的選出最好的分類技術。整體而言,羅吉斯迴歸在二元分類不平衡問題有較好的表現。
    As technology advances, automated operations are used by many industries, it makes human life much easier and more efficient. Automated operations will reduce the burden on the data analyst if the concept of automation can be imported into the data analysis.
    In this study, influences of data complex indices on common classifier are evaluated and three different re-sampling methods are used for binray imbalanced data. The results show that our proposed procedure can effectively select the best classifier. For binary classification of imbalanced data, the Logistic regression has a better performance.
    顯示於類別:[統計學系暨研究所] 學位論文

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML188檢視/開啟

    在機構典藏中所有的資料項目都受到原著作權保護.

    TAIR相關文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回饋