淡江大學機構典藏:Item 987654321/105540
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 62822/95882 (66%)
造访人次 : 4015208      在线人数 : 559
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library & TKU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: https://tkuir.lib.tku.edu.tw/dspace/handle/987654321/105540


    题名: 以N-gram為基礎之網路新聞讀者情緒預測方法
    其它题名: Prediction of news readers' emotion by N-gram
    作者: 沈育信;Shen, Yu-Hsinh
    贡献者: 淡江大學資訊管理學系碩士在職專班
    張昭憲
    关键词: 文章情感分析;文字探勘;斷詞;資料探勘;Emotion Analysis;text mining;N-gram;Word Segematation;data mining;Performance
    日期: 2015
    上传时间: 2016-01-22 14:58:39 (UTC+8)
    摘要: 隨著社群網路的興起,群眾開始習慣在網路上發表意見,並進行評論。使用者在網路的活動,留下了大量的公開資料,若能仔細加以加析,便可獲得寶貴的訊息,了解民眾的喜好與需求。由於具有高度實用性,產、官、學各界紛紛投入網路與情探勘(Public Opinion Mining)的行列中。本研究以網路新聞讀者情感預測為目標,希望能了解讀者對於剛刊登新聞之可能反應,以做為當局發布新聞、制定決策時之重要參考。為此,本研究長時間大量蒐集網路新聞,使用N-gram技術對於網路新聞進行斷詞,對於常用字詞進行次數統計,並配合讀者的情緒投票,產生新聞與讀者情感之預測模型。對待測新聞進行預測時,本研究亦嘗試各種不同的相似度計算方法,以提升準確率。本研究蒐集2013年12月8日至2014年11月12日止,共193,489筆新聞進行實驗,結果顯示本研究提出之方法在特定新聞類別中具有良好準確率。此外,我們也發現新聞蒐集時間增長時,預測準確率更可獲得明顯提升。其次,當有重大新聞發生時,延後塑模的時間點可獲得更佳的預測結果。
    With the rise of community networks, people began to get used to show their opinion and comment. Network users leaving a large number of publicly available data by their activity. We can extract data to useful and precious information by analysis data carefully to understanding the requirements and preferences of people. Due to highly practicable of emotion analysis, filed , academic and government join the research of public opinion mining.
    This study will focus on prediction of news readers’ emotion. Government or companies can make decision by referring to emotion of news readers. Collecting large internet news long time and make word segmentation by N-gram on every news. Statistic frequency of key word and create emotion model by news readers’ emotion voting.
    When predict readers’ emotion of news, this study try to use three method to improve accuracy rate. This study collect internet news from December 8 2013 to November 12 2014, total 193,489 news. This study present high accuracy in some specific category of news. In this study, accuracy rate will improve apparently with news collection time. When grave news occurred, postpone the model timestamp will get better accuracy rate.
    显示于类别:[資訊管理學系暨研究所] 學位論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML142检视/开启

    在機構典藏中所有的数据项都受到原著作权保护.

    TAIR相关文章

    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library & TKU Library IR teams. Copyright ©   - 回馈