淡江大學機構典藏:Item 987654321/22960
English  |  正體中文  |  简体中文  |  Items with full text/Total items : 62805/95882 (66%)
Visitors : 3936832      Online Users : 828
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
Scope Tips:
  • please add "double quotation mark" for query phrases to get precise results
  • please goto advance search for comprehansive author search
  • Adv. Search
    HomeLoginUploadHelpAboutAdminister Goto mobile version
    Please use this identifier to cite or link to this item: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/22960


    Title: 運甪重複句排除技術於中文文件自動摘要之研究
    Authors: 魏世杰;陳姿妤
    Contributors: 淡江大學資訊管理學系
    Keywords: 自動摘要;TFIDF;相似度;Hownet;重複句排除
    Date: 2007-05
    Issue Date: 2009-11-30 14:27:00 (UTC+8)
    Publisher: 桃園縣:銘傳大學資訊管理學系
    Abstract: 本研究針對中文文件,以TFIDF 法為基礎,同時考量句子與文章標題句之間的相似度,作為選取文章內重要句子的方法;並基於Hownet計算詞彙之間的同義詞相似度,結合Jaccard 概念詞相似度函數,過濾摘要中資訊重複的句子,以期提升自動摘要結果的精確度。
    實驗結果發現,使用TFIDF 為基礎的詞彙權重計算,若配合句子與文章標題句之間的相似度特徵,可提升摘要結果的平均精確度約7% 。而摘要結果中結合Jaccard概念詞相似度函數與基於Hownet 所求得的同義詞相似度,用於重複句排除的計算上,可達到提升摘要精確度的效果。
    Relation: 第十八屆國際資訊管理學術研討會論文集=Proceedings of 18th International Conference on Information Management
    Appears in Collections:[Graduate Institute & Department of Information Management] Proceeding

    Files in This Item:

    There are no files associated with this item.

    All items in 機構典藏 are protected by copyright, with all rights reserved.


    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - Feedback