文本語義腦圖基本原理1、以讀者當前搜索詞作為啟始節(jié)點(一起始列),后續(xù)(右側)的第n列數(shù)據(jù)是由前n-1列的節(jié)點元素概念之間語義關聯(lián)推導而得。2、共有4種不同的節(jié)點類型:中心節(jié)點(a),直接關聯(lián)節(jié)點(b),間接關聯(lián)節(jié)點(c),弱關聯(lián)節(jié)點(d)。從搜索詞(a)出發(fā),體現(xiàn)a推導b,b推導c,c推導d的上下層級關聯(lián)(啟發(fā)式知識關聯(lián)揭示)。3、單一列向量空間內,由上至下所有節(jié)點之間依據(jù)該文本概念詞的語義權重和文獻時序權重排序(語義概念權重有序)。4、任意概念節(jié)點右上數(shù)字角標表示其在當前Top-N搜索結果中的文獻數(shù)。點擊該文獻數(shù)則鏈接至相應的命中文獻(文本概念的細分聚類及其迅速定位)。5、選擇語義腦圖中任意節(jié)點(x)作為興趣點(聚焦節(jié)點),可以進一步推導出該節(jié)點的所有直接關聯(lián)節(jié)點(y)。(隱形識發(fā)現(xiàn))6、興趣聚焦操作時(x-y)左上角標指引聚焦關聯(lián)文獻。7、任意節(jié)點可以作為新的起始中心節(jié)點(a),重構一幅全新的語義腦圖(擴散思維)。8、跨語言搜索時,系統(tǒng)可以同時分別生成中文和英文兩張語義腦圖。文獻資源可以在哪里查到?上海信息化文獻知識發(fā)現(xiàn)
二次文獻(secondarydocument):是指文獻工作者對一次文獻進行加工、提煉和壓縮之后所得到的產物,是為了便于管理和利用一次文獻而編輯、出版和累積起來的工具性文獻。檢索工具書和網(wǎng)上檢索引擎是典型的二次文獻。三次文獻(tertiarydocument):是指對有關的一次文獻和二次文獻進行入的分析研究綜合概括而成的產物。如大百科全書、辭典、電子百科等。檢索狹義的檢索(Retrieval)是指依據(jù)一定的方法,從已經(jīng)組織好的大量有關文獻中,查找并獲取特定的相關文獻的過程。這里的文獻,不是通常所指的文獻本身,而是關于文獻的信息或文獻的線索。廣義的檢索包括信息的存儲和檢索兩個過程(StorageandRetrieval)。河南文獻知識發(fā)現(xiàn)聯(lián)系人上海半坡的遠程訪問服務能夠促使圖書館現(xiàn)有數(shù)字文獻館藏發(fā)揮更大的讀者服務效益。
文獻數(shù)據(jù)庫簡介一、定義及分類:文獻數(shù)據(jù)庫,是指計算機可讀的、有組織的相關文獻信息的**。按照國別分:可分為外文文獻數(shù)據(jù)庫及中文文獻數(shù)據(jù)庫按照信息類別可分為:期刊論文數(shù)據(jù)庫、**數(shù)據(jù)庫、會議論文數(shù)據(jù)庫、學位論文數(shù)據(jù)庫……;按照學科領域分類,例如生命科學領域有PubMed數(shù)據(jù)庫,工程技術領域有EI數(shù)據(jù)庫,化學領域的SciFinder,Reaxys,F1000,NANO數(shù)據(jù)庫;按照信息類型可分為:全文數(shù)據(jù)庫及文摘數(shù)據(jù)庫。1)中文全文數(shù)據(jù)庫舉例:2)英文全文數(shù)據(jù)庫舉例:3)文摘數(shù)據(jù)庫二.文摘數(shù)據(jù)庫與全文數(shù)據(jù)庫的比較二者主要區(qū)別在于用戶在全文數(shù)據(jù)庫中可以直接下載文獻,而文摘型數(shù)據(jù)庫只提供了全文鏈接,無法下載全文,用戶需要點擊鏈接前往期刊官網(wǎng)進行下載。
數(shù)據(jù)庫作為一種“宏文本”。數(shù)據(jù)庫收錄的數(shù)字化文本,文本性質并沒有改變。每個數(shù)據(jù)庫都可以看作一種**文本,不同的文本基于知識、邏輯、功能等被聯(lián)結成為巨大文本,是別集、總集、類書、叢書等傳統(tǒng)文獻形態(tài)的革新。單一、直接的文本閱讀銳減,取而代之的是數(shù)據(jù)庫形態(tài)的龐大的文本**。檢索界限消失后,古籍數(shù)據(jù)庫可以很大程度地“一站式”獲取所需文獻資料。關系型智能化的數(shù)據(jù)庫作為一種文本,其形態(tài)與功能較紙本時代有質的提升。歷史文本的空間化與可視化??梢暬軌虬嘀刈兞浚哂锌勺x性與可理解性。地理信息系統(tǒng)(GIS)技術***地促進了傳統(tǒng)文獻的圖表化、可視化,以動態(tài)的數(shù)字化地圖和知識圖譜體系,改變和豐富了傳統(tǒng)的文本形態(tài)和使用功能?!耙粓D勝千言”,文本內部蘊含的信息也具有可視化潛力。通過發(fā)現(xiàn)古代漢語文本特定的詞頻模式(如高頻詞、異常詞頻),可以借助文檔相似性比較、主題探測、趨勢發(fā)現(xiàn)等探索文本中特定的隱含語義關系,將難以理解的抽象數(shù)據(jù)空間轉化成具體直觀的視覺空間。查詢文獻知識需要付費嗎?
文本語義腦圖(Text Mind Map)為輔助讀者研判一篇文獻的相關性,檢索系統(tǒng)通常會針對某一文獻內容特征進行單一維度的文獻聚類細分。例如:依據(jù)關鍵詞或者依據(jù)作者對檢出文獻進行再聚類并揭示其所對應的相關文獻。 文本語義腦圖突破傳統(tǒng)搜索引擎查詢結果單維列表呈現(xiàn)的局限性,以讀者搜索詞為起點,形成一個m行乘n列的文本語義概念的關聯(lián)矩陣表達。其目的是輔助讀者發(fā)現(xiàn)搜索結果內的文本概念之間的隱性知識關聯(lián)以及拓展讀者啟發(fā)式發(fā)散思維。怎么查找文獻關聯(lián)的知識內容?網(wǎng)絡文獻知識發(fā)現(xiàn)用戶體驗
文獻知識到底是什么?上海信息化文獻知識發(fā)現(xiàn)
早期的文獻一般是通過口頭交談、參觀展覽、參加報告會等途徑獲取,不僅在內容上有一定的價值,而且能彌補一般公開文獻從信息的客觀形成到公開傳播之間費時甚多的弊病。它是指未經(jīng)過任何加工的原始文獻,如實驗記錄、手稿、原始錄音、原始錄像、談話記錄等。零次文獻在原始文獻的保存、原始數(shù)據(jù)的核對、原始構思的核定(權利人)等方面有著重要的作用。接下來,我們了解一下一次文獻的概念一次文獻(primarydocument):是指作者以本人的研究成果為基本素材而創(chuàng)作或撰寫的文獻,不管創(chuàng)作時是否參考或引用了他人的著作,也不管該文獻以何種物質形式出現(xiàn),均屬一次文獻。大部分期刊上發(fā)表的文章和在科技會議上發(fā)表的論文均屬一次文獻。上海信息化文獻知識發(fā)現(xiàn)
上海半坡網(wǎng)絡技術有限公司專注技術創(chuàng)新和產品研發(fā),發(fā)展規(guī)模團隊不斷壯大。公司目前擁有較多的高技術人才,以不斷增強企業(yè)重點競爭力,加快企業(yè)技術創(chuàng)新,實現(xiàn)穩(wěn)健生產經(jīng)營。上海半坡網(wǎng)絡技術有限公司主營業(yè)務涵蓋計算機軟件,網(wǎng)絡信息,技術咨詢,技術服務,堅持“質量保證、良好服務、顧客滿意”的質量方針,贏得廣大客戶的支持和信賴。公司深耕計算機軟件,網(wǎng)絡信息,技術咨詢,技術服務,正積蓄著更大的能量,向更廣闊的空間、更寬泛的領域拓展。