English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 64178/96951 (66%)
造訪人次 : 9553779      線上人數 : 17722
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋
    請使用永久網址來引用或連結此文件: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/102332


    題名: 可處理巨量資料的平行化CHAID決策樹
    其他題名: Paralleled CHAID decision tree algorithm with big-data capability
    作者: 蔡育儒;Tsai, Yu-Ju
    貢獻者: 淡江大學統計學系碩士班
    陳景祥
    關鍵詞: 資料探勘;分類器;CHAID決策樹;平行化;data mining;classifiers;parallel;CHAID
    日期: 2014
    上傳時間: 2015-05-04 09:53:09 (UTC+8)
    摘要: 隨著科技的進步,Big-Data的時代正式來臨。在資料量急增下,電腦處理速度的改良已成為一項重要的發展技術。若將資料處理及分析的時間縮短,可以提早進行預測或判斷,平行化處理就是減少分析時間的一個方法。本研究探討資料探勘常被使用的決策樹方法與平行化運算的結合。我們改寫了CHAID決策樹在合併及判斷變數的運算法則,利用多核心計算,使決策樹的建構時間縮短。在結論中,模擬的結果顯示,當CPU 的核心為一顆以上時,CHAID決策樹的計算時間比單核心狀況明顯縮短。在處理更大的資料量時,我們節省的時間會有更明顯的差異。
    As technology advances, the era of Big-Data has finally arrived. As the amount of data increases , the improvement of computing speed becomes an important development technology. If data training and analysis time are reduced, we could make the prediction or decision much earlier then expected. As a result, parallel computation is one of the methods which can reduce the analysis time. In this paper, we rewrite the CHAID decision tree algorithm for parallel computation and Big-Data capability. Our simulation results show that, when the CPU has more than one kernel, the computation time of our improved CHAID tree is significantly reduced. When we have a huge amount of data, the difference of computation times is even more significant.
    顯示於類別:[統計學系暨研究所] 學位論文

    文件中的檔案:

    檔案 大小格式瀏覽次數
    index.html0KbHTML510檢視/開啟

    在機構典藏中所有的資料項目都受到原著作權保護.

    TAIR相關文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回饋