淡江大學機構典藏:Item 987654321/101616
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 62819/95882 (66%)
造访人次 : 4000612      在线人数 : 745
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/101616


    题名: Chinese textual entailment with wordnet semantic and dependency syntactic analysis
    其它题名: 使用語意詞彙網路及語法相依性分析於中文文本蘊涵關係之研究
    作者: 杜駿;Tu, Chun
    贡献者: 淡江大學資訊管理學系碩士班
    戴敏育;Day, Min-Yuh
    关键词: 文本蘊涵;語意特徵;相依性分析;語法特徵;機器學習;支持向量機(SVM);Textual Entailment;Semantic Features;Dependency Analysis;WordNet;Syntactic Features;Machine learning;support vector machine (SVM)
    日期: 2014
    上传时间: 2015-05-01 16:12:13 (UTC+8)
    摘要: 文本蘊涵辨識(RITE)是一個效能評鑑任務,目的在評鑑系統自動偵測語句之間 "推論關係" 的能力,例如蘊涵(entailment)、意譯(paraphrase)、矛盾(contradiction)等。

    本研究提出加入語意詞彙網路(WordNet)及語法相依性分析(Dependency syntactic analysis)之特徵方法用以處理NTCIR-10 RITE-2子任務之文本蘊涵辨識。語意詞彙網路通常用於辨識詞彙程度的蘊涵關係,語法相依性方法是一種將兩文本進行相依樹之轉換並計算兩子樹之編輯距離(Edit Distance)。

    本研究實驗結果顯示,利用我們系統所加入之語意特徵為基礎,並利用機器學習進行特徵的分類,使用特徵選取的方法得到最佳化的特徵組合,在NTCIR-10 RITE-2之中文文本蘊涵辨識的整體準確率在繁體BC子任務中達到73.28%,在簡體BC子任務中達到74.57% ,本研究的主要貢獻為,我們於實驗中加入語意特徵方法對中文文本蘊涵辨識之準確率有大幅提升之效果。
    Recognizing Inference in TExt (RITE) is a task for automatically detecting entailment, paraphrase, and contradiction in texts which addressing major text understanding in information access research areas.

    In this paper, we proposed a Chinese textual entailment system using Wordnet semantic and dependency syntactic approaches in Recognizing Inference in Text (RITE) using the NTCIR-10 RITE-2 subtask datasets. Wordnet is used to recognize entailment at lexical level. Dependency syntactic approach is a tree edit distance algorithm applied on the dependency trees of both the text and the hypothesis.

    We thoroughly evaluate our approach using NTCIR-10 RITE-2 subtask datasets. As a result, our system achieved 73.28% on Traditional Chinese Binary-Class (BC) subtask and 74.57% on Simplified Chinese Binary-Class subtask with NTCIR-10 RITE-2 development datasets. Thorough experiments with the text fragments provided by the NTCIR-10 RITE-2 subtask showed that the proposed approach can improve system''s overall accuracy.
    显示于类别:[資訊管理學系暨研究所] 學位論文

    文件中的档案:

    档案 大小格式浏览次数
    index.html0KbHTML517检视/开启

    在機構典藏中所有的数据项都受到原著作权保护.

    TAIR相关文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回馈