摘要:論文一本體論在自動問答系統(tǒng)中的應(yīng)用駱正華基于本體來組織問句的方法,并探討在基礎(chǔ)上分析問句的方法,并利用本體向量來聯(lián)系問句實例和領(lǐng)域知識,達(dá)到問題和答案的連接。領(lǐng)域具體事實知識的表示采用標(biāo)記規(guī)范,主題操作事件或業(yè)務(wù)實體描述或?qū)傩浴?/p>
論文 一、本體論在自動問答系統(tǒng)中的應(yīng)用_駱正華
基于本體來組織問句的方法,并探討在基礎(chǔ)上分析問句的方法,并利用本體向量
來聯(lián)系問句實例和領(lǐng)域知識,達(dá)到問題和答案的連接。
用戶提交的問句
進(jìn)行分詞、 詞性標(biāo)注、 語塊劃分等淺層句法分析
在語塊結(jié)構(gòu)化的問句實例中找相似的問句
構(gòu)造本體的目的都是為了實現(xiàn)某種程度的知識共享和重用。
領(lǐng)域知識可劃分為三個層次,通用概念知識->領(lǐng)域概念知識->具體事實知識。
領(lǐng)域具體事實知識的表示
采用XML標(biāo)記規(guī)范,主題、操作事件或業(yè)務(wù)實體、描述或?qū)傩浴?/p>
問句語義的表示
主題、疑問塊、問句語義表示
問句向量本質(zhì)上有三種情況
主題+實體+屬性
主題+事件+角色
向量是一組無序的關(guān)鍵字
二、一種基于加權(quán)語義相似度模型的自動問答系統(tǒng)_劉亞軍利用語義樹中詞語間的距離和語義樹的高度來計算詞語間的語義相似度
利用詞語間的語義相似度和詞語的權(quán)重進(jìn)一步計算用戶問題與答案庫中問題間的語義相似度。
關(guān)鍵詞語(權(quán)重高的詞語)
三、自動問答系統(tǒng)中的問題理解研究_曹志娟QA系統(tǒng)主要分為五個部分
問題理解、信息檢索、信息處理、答案抽取、FAQ系統(tǒng)。
主要是三個主要部分
問題理解
信息檢索
答案抽取
講述問題理解的兩個關(guān)鍵點:問題分類和問句擴(kuò)展。
問題分類
詞法分析:問句分詞和標(biāo)注
問題分類:基于答案對象的類型分類,增加疑問詞短語分類、問題標(biāo)準(zhǔn)型、特征詞分類
1. 識別問句中的疑問詞,根據(jù)疑問詞找到句型模式集合 - 人、地點、具體時間、持續(xù)事件、數(shù)量、原因、方法、其他 2. 與集合中的句型規(guī)則進(jìn)行匹配,從而得到問題標(biāo)準(zhǔn)型 - 通過形式語言制定具體規(guī)則 - 通過概率分類的方法 3. 再根據(jù)特征詞確定問題領(lǐng)域 - 特征詞的擴(kuò)充
問句擴(kuò)展
問句重寫-更改為定制的模板
關(guān)鍵詞擴(kuò)展
名詞、動詞的關(guān)鍵詞
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/43286.html
摘要:考慮這樣一個計算集合,它可以被允許在每一個節(jié)點和可能的圖結(jié)構(gòu)中,并定義了一個函數(shù)族。傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)能夠被看做擁有等于層數(shù)的深度比如對于輸出層為隱層數(shù)加。理論結(jié)果證實那些事實上所需要的節(jié)點數(shù)隨著輸入的大小指數(shù)增長的函數(shù)族是存在的。 查看論文 Yoshua Bengio, Learning Deep Architectures for AI, Foundations and Trends i...
摘要:實驗結(jié)果實驗數(shù)據(jù)集數(shù)據(jù)集都是新聞類網(wǎng)頁,從五個中文新聞網(wǎng)站中收集一百個頁面這最多也就五類吧,而且也就五百個,好像有點少了吧結(jié)果與驗證性能指標(biāo)這這這比較文本長度就了那不是只要包含新聞?wù)牟痪秃昧恕? 《Web Content Extraction Using Clustering with Web Structure》引用 Huang X, Gao Y, Huang L, et al. ...
摘要:分塊效果如圖所示聚類由于不同網(wǎng)頁之間設(shè)計和布局存在較大差異,作者選擇了作為聚類算法來解決簇數(shù)目未知簇形狀未知噪聲等問題未給出距離函數(shù)。 《Web Content Extraction Through Machine Learning》 通過機(jī)器學(xué)習(xí)來提取網(wǎng)頁內(nèi)容 2014年,未見期刊會議上登載,作者 Ziyan Zhou @stanford.edu 簡介 數(shù)據(jù)集 以新聞文章網(wǎng)站為主數(shù)...
摘要:后文將圍繞做一些介紹。盡管如此,的使用對新手而言仍然充滿了困難。本系列文章基本為個人見解,難免有錯誤與誤解,如有客觀錯誤歡迎提出。 前言 說到Android的污點分析框架,網(wǎng)上的搜索結(jié)果大多指向靜態(tài)的FlowDroid與動態(tài)的TaintDroid。盡管由于加固、混淆等技術(shù)使得針對Android的靜態(tài)分析越來越困難,但靜態(tài)分析的無先驗分析能力無法被動態(tài)分析取代,使得靜態(tài)分析仍有發(fā)揮空間。...
閱讀 1706·2021-10-28 09:32
閱讀 614·2021-09-24 09:47
閱讀 2934·2021-09-02 15:11
閱讀 2741·2021-08-09 13:46
閱讀 2892·2019-08-30 15:55
閱讀 1077·2019-08-30 15:54
閱讀 3311·2019-08-29 14:12
閱讀 812·2019-08-26 13:40