淡江大學機構典藏:Item 987654321/22960
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 62822/95882 (66%)
造访人次 : 4020058      在线人数 : 946
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/22960


    题名: 運甪重複句排除技術於中文文件自動摘要之研究
    作者: 魏世杰;陳姿妤
    贡献者: 淡江大學資訊管理學系
    关键词: 自動摘要;TFIDF;相似度;Hownet;重複句排除
    日期: 2007-05
    上传时间: 2009-11-30 14:27:00 (UTC+8)
    出版者: 桃園縣:銘傳大學資訊管理學系
    摘要: 本研究針對中文文件,以TFIDF 法為基礎,同時考量句子與文章標題句之間的相似度,作為選取文章內重要句子的方法;並基於Hownet計算詞彙之間的同義詞相似度,結合Jaccard 概念詞相似度函數,過濾摘要中資訊重複的句子,以期提升自動摘要結果的精確度。
    實驗結果發現,使用TFIDF 為基礎的詞彙權重計算,若配合句子與文章標題句之間的相似度特徵,可提升摘要結果的平均精確度約7% 。而摘要結果中結合Jaccard概念詞相似度函數與基於Hownet 所求得的同義詞相似度,用於重複句排除的計算上,可達到提升摘要精確度的效果。
    關聯: 第十八屆國際資訊管理學術研討會論文集=Proceedings of 18th International Conference on Information Management
    显示于类别:[資訊管理學系暨研究所] 會議論文

    文件中的档案:

    没有与此文件相关的档案.

    在機構典藏中所有的数据项都受到原著作权保护.

    TAIR相关文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回馈