八方資源網(wǎng) > 八方資訊 > 商務(wù)服務(wù)資訊網(wǎng)

Nlpir Parser智能語義平臺(tái)全文搜索

時(shí)間：2017-04-21

　　全文索引用于處理大文本集合,利用它人們可以在海量文本中快速獲取需要的信息。全文檢索系統(tǒng)是按照全文檢索理論建立起來的用于提供全文檢索服務(wù)的軟件系統(tǒng)。一般來說，全文檢索需要具備建立索引和提供查詢的基本功能，此外現(xiàn)代的全文檢索系統(tǒng)還需要具有方便的用戶接口、面向WWW的開發(fā)接口、二次應(yīng)用開發(fā)接口等等。功能上，全文檢索系統(tǒng)**具有建立索引、處理查詢返回結(jié)果集、增加索引、優(yōu)化索引結(jié)構(gòu)等等功能，外圍則由各種不同應(yīng)用具有的功能組成。結(jié)構(gòu)上，全文檢索系統(tǒng)**具有索引引擎、查詢引擎、文本分析引擎、對(duì)外接口等等，加上各種外圍應(yīng)用系統(tǒng)等等共同構(gòu)成了全文檢索系統(tǒng)。
　　全文檢索的**技術(shù)是將源文檔中所有的基本元素的出現(xiàn)信息記錄到索引庫中。中文全文檢索技術(shù)在原理上同西文全文檢索是一致的，但漢字本身的特點(diǎn)使中文系統(tǒng)的實(shí)現(xiàn)比西文系統(tǒng)較為復(fù)雜。在西文中，文檔的基本元素是單詞，可以以單詞建立索引庫，而且單詞與單詞之間有**的間隔符空格，所以索引文件的建立相對(duì)簡(jiǎn)單。在中文系統(tǒng)中，基本元素可以是單個(gè)漢字字符，也可以是詞。
　　靈玖Nlpir Parser智能語義平臺(tái)全文搜索系統(tǒng)內(nèi)核經(jīng)過精心設(shè)計(jì)，具有高擴(kuò)展性和高通用性?？芍С治谋?、數(shù)字、日期、字符串等各種數(shù)據(jù)類型的高效索引，支持豐富的查詢語言和查詢類型，支持少數(shù)民族語言的搜索。
　　同時(shí)，全文搜索中間件可以無縫地與現(xiàn)有數(shù)據(jù)庫系統(tǒng)融合，實(shí)現(xiàn)全文搜索與相關(guān)的數(shù)據(jù)庫管理應(yīng)用系統(tǒng)。
　　其主要特色在于：
　　1、可以按照任意*字段的排序，支持*字段的搜索，也可以搜索多個(gè)字段，以及復(fù)雜表達(dá)式的綜合搜索;
　　2、支持精確匹配以及模糊匹配，默認(rèn)為精確匹配，忽略字母大小寫進(jìn)行模糊匹配;
　　3、實(shí)現(xiàn)的是多線程搜索服務(wù);
　  4、 每秒可索引3000條記錄(主要瓶頸為數(shù)據(jù)庫或文件記錄的讀取效率);搜索速度在毫秒級(jí)別。
　  5、兼容當(dāng)前所有廠商的數(shù)據(jù)庫系統(tǒng)，其中SQL Server, Oracle, MySQL，DB2等。
　　Nlpir Parser智能語義平臺(tái)全文搜索系統(tǒng)可以適用于眾多應(yīng)用場(chǎng)景，它的廣泛適用性體現(xiàn)在能處理結(jié)構(gòu)化和非結(jié)構(gòu)化的各類文本數(shù)據(jù)，能夠采集各種來源文本，這些來源可能是跨越廣泛地理分布的，也可以是不同介質(zhì)、不同格式產(chǎn)生的文本。全文檢索具有對(duì)檢索出的文本進(jìn)行處理的能力，并且以用戶樂于接受的形式提供檢索并加工處理文本，使檢索系統(tǒng)功能得到了延伸。

詞條
詞條說明
語義分析：靈玖大數(shù)據(jù)文本挖掘
大數(shù)據(jù)挖掘是伴隨者互聯(lián)網(wǎng)的普及應(yīng)用和傳統(tǒng)信息檢索技術(shù)的不足提出并發(fā)展起來的。大數(shù)據(jù)挖掘是從大數(shù)據(jù)中發(fā)現(xiàn)有用的模式（其中的數(shù)據(jù)可以存放在數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他信息庫中），它旨在解決數(shù)據(jù)挖掘、信息檢索、知識(shí)抽取以及較廣泛的商業(yè)問題。面向大數(shù)據(jù)的挖掘比面向數(shù)據(jù)庫和數(shù)據(jù)倉庫的數(shù)據(jù)挖掘要復(fù)雜，因?yàn)榇髷?shù)據(jù)往往是無結(jié)構(gòu)的，通常是用長的句子或短語來表達(dá)文檔類信息；有些則可能是半結(jié)構(gòu)化的，當(dāng)然也包括大量的異構(gòu)信息、
靈玖軟件榮獲“中國大數(shù)據(jù)較佳行業(yè)實(shí)踐案例”
近期，**數(shù)據(jù)官聯(lián)盟舉行了“**屆大數(shù)據(jù)優(yōu)秀案例評(píng)選”的活動(dòng)，得到了**部門、傳統(tǒng)企業(yè)及大數(shù)據(jù)企業(yè)的一致認(rèn)可。本次評(píng)選活動(dòng)經(jīng)過兩個(gè)多月的收集和匯總，針對(duì)來自174家大數(shù)據(jù)企業(yè)提交的200多份大數(shù)據(jù)實(shí)施案例進(jìn)行了評(píng)選。經(jīng)聯(lián)盟*組按技術(shù)、創(chuàng)新和項(xiàng)目貢獻(xiàn)三個(gè)維度，評(píng)出23個(gè)垂直行業(yè)的優(yōu)秀案例，以及13個(gè)技術(shù)領(lǐng)域的技術(shù)創(chuàng)新獎(jiǎng)。靈玖軟件以“國家某單位敏感信息精準(zhǔn)搜索與實(shí)時(shí)智能掃描引擎”案例被評(píng)為“中國大
靈玖：Nlpir Parser智能語義平臺(tái)提升文本挖掘效果
大數(shù)據(jù)挖掘是伴隨者互聯(lián)網(wǎng)的普及應(yīng)用和傳統(tǒng)信息檢索技術(shù)的不足提出并發(fā)展起來的。大數(shù)據(jù)挖掘是從大數(shù)據(jù)中發(fā)現(xiàn)有用的模式(其中的數(shù)據(jù)可以存放在數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他信息庫中)，它旨在解決數(shù)據(jù)挖掘、信息檢索、知識(shí)抽取以及較廣泛的商業(yè)問題。作為大數(shù)據(jù)挖掘領(lǐng)域中的一個(gè)重要研究分支，文本挖掘與處理主要研究從非結(jié)構(gòu)化及半結(jié)構(gòu)化的海量Web文本信息中挖掘有**的信息，處理其中可能隱藏著的概念及其聯(lián)系，并完成可能的
NLPIR大數(shù)據(jù)語義系統(tǒng)文本數(shù)據(jù)分析挖掘平臺(tái)
近年來，隨著Internet?的迅猛發(fā)展以及人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)能力的大幅度提高，大規(guī)模的網(wǎng)絡(luò)文本庫不斷涌現(xiàn)。為了便于在海量文本庫中搜尋、過濾、管理這些文本，基于人工智能技術(shù)的文本自動(dòng)分類方法成為人們研究的焦點(diǎn)。數(shù)據(jù)挖掘技術(shù)本身就是當(dāng)前數(shù)據(jù)技術(shù)發(fā)展的新領(lǐng)域,文本挖掘則發(fā)展歷史較短。傳統(tǒng)的信息檢索技術(shù)對(duì)于海量數(shù)據(jù)的處理并不盡如人意,文本挖掘便日益重要起來,可見文本挖掘技術(shù)是從信息抽取以

標(biāo)簽：Nlpir Parser智能語義平臺(tái)全文搜索

聯(lián)系方式聯(lián)系我時(shí)，請(qǐng)告知來自八方資源網(wǎng)！

公司名：靈玖中科軟件（北京）有限公司

聯(lián)系人：張寶

電　話： 010-62648216

手　機(jī)： 13681251543

微　信： 13681251543

地　址：北京海淀北京市海淀區(qū)蘇州街49-3號(hào)盈智大廈5層

郵　編：

網(wǎng)　址： ljrj123.cn.b2b168.com

八方資源網(wǎng)提醒您：
1、本信息由八方資源網(wǎng)用戶發(fā)布，八方資源網(wǎng)不介入任何交易過程，請(qǐng)自行甄別其真實(shí)性及合法性；
2、跟進(jìn)信息之前，請(qǐng)仔細(xì)核驗(yàn)對(duì)方資質(zhì)，所有預(yù)付定金或付款至個(gè)人賬戶的行為，均存在詐騙風(fēng)險(xiǎn)，請(qǐng)?zhí)岣呔瑁?

聯(lián)系方式