English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 62819/95882 (66%)
造访人次 : 4006261      在线人数 : 584
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/114438


    题名: 適用於分類變數資料的二元不平衡資料自動分類系統
    其它题名: Automatic binary classification system for imbalanced data with categorical explanatory variables
    作者: 葉丞峻;Yeh, Cheng-Chun
    贡献者: 淡江大學統計學系碩士班
    陳景祥
    关键词: classifier;data complexity;data mining;imbalanced data;分類技術;資料探勘;資料複雜度;類別不平衡
    日期: 2017
    上传时间: 2018-08-03 14:52:36 (UTC+8)
    摘要: 隨著科技的進步,許多產業都應用自動化的作業模式,使得現今人類的生活更便利也更有效率。若我們能將自動化的概念導入資料分析的流程中,便能使資料分析者在作業上的負擔降低。本研究參考了資料複雜度指標對常見分類技術的影響,針對二元分類的類別不平衡資料,使用三種不同的重抽樣方法對資料進行類別的平衡,期望能夠建立一個有效的類別不平衡資料自動二元分類系統。研究結果顯示,本文提出的方法能夠有效的選出最好的分類技術。整體而言,羅吉斯迴歸在二元分類不平衡問題有較好的表現。
    As technology advances, automated operations are used by many industries, it makes human life much easier and more efficient. Automated operations will reduce the burden on the data analyst if the concept of automation can be imported into the data analysis.
    In this study, influences of data complex indices on common classifier are evaluated and three different re-sampling methods are used for binray imbalanced data. The results show that our proposed procedure can effectively select the best classifier. For binary classification of imbalanced data, the Logistic regression has a better performance.
    显示于类别:[統計學系暨研究所] 學位論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML140检视/开启

    在機構典藏中所有的数据项都受到原著作权保护.

    TAIR相关文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回馈