摘要: | 隨著資訊時代的來臨,資料量與年劇增。要在這龐大的資料中找尋相關的資訊,實非易事。而利用電腦來將性質相近的的資料或文件排放在一起,以提高文件分類的正確性與一致性,便於使用者能夠快速地檢索到相關資訊的文件自動分類研究便應運而生。自從Maron於1961年提出首篇的文件自動分類的論文以來,傳統的分類方法不外乎機率模式與向量模式。近年來的研究也加入了統計分析、專家系統、和自然語言處理等先進的技術,以提高分類的正確性。本研究計畫的主要目的,是嘗試利用類神經網路的強大學習能力,來學習文件的內在分類規則,以期達到文件自動分類的目的,並提高其分類的正確性。在本研究中,我們將以ACM Computing Reviews的分類法(共有11個大類和80個中類)作為分類的依據。再以其中的論文題目當作該文件的素描(profile)。在類神經網路的分類實驗上,我們將先嘗試利用三種不同監督式學習網路模式來作實驗:即倒傳遞網路、機率神經網路、和學習向量量化網路。此外,並實驗傳統的機率模式與向量模式的分類結果,以作為類神經網路模式實驗比較之用。 |