淡江大學機構典藏:Item 987654321/22960
English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 62822/95882 (66%)
造訪人次 : 4018809      線上人數 : 1081
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋
    請使用永久網址來引用或連結此文件: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/22960


    題名: 運甪重複句排除技術於中文文件自動摘要之研究
    作者: 魏世杰;陳姿妤
    貢獻者: 淡江大學資訊管理學系
    關鍵詞: 自動摘要;TFIDF;相似度;Hownet;重複句排除
    日期: 2007-05
    上傳時間: 2009-11-30 14:27:00 (UTC+8)
    出版者: 桃園縣:銘傳大學資訊管理學系
    摘要: 本研究針對中文文件,以TFIDF 法為基礎,同時考量句子與文章標題句之間的相似度,作為選取文章內重要句子的方法;並基於Hownet計算詞彙之間的同義詞相似度,結合Jaccard 概念詞相似度函數,過濾摘要中資訊重複的句子,以期提升自動摘要結果的精確度。
    實驗結果發現,使用TFIDF 為基礎的詞彙權重計算,若配合句子與文章標題句之間的相似度特徵,可提升摘要結果的平均精確度約7% 。而摘要結果中結合Jaccard概念詞相似度函數與基於Hownet 所求得的同義詞相似度,用於重複句排除的計算上,可達到提升摘要精確度的效果。
    關聯: 第十八屆國際資訊管理學術研討會論文集=Proceedings of 18th International Conference on Information Management
    顯示於類別:[資訊管理學系暨研究所] 會議論文

    文件中的檔案:

    沒有與此文件相關的檔案.

    在機構典藏中所有的資料項目都受到原著作權保護.

    TAIR相關文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回饋