當(dāng)今時(shí)代是互聯(lián)網(wǎng)時(shí)代,互聯(lián)網(wǎng)作為這個(gè)時(shí)代的主題使得這個(gè)時(shí)代具有資源共享性和信息傳播性的特點(diǎn),給人們的生活帶來了便利。網(wǎng)絡(luò)在為人們認(rèn)識(shí)世界帶來便利的同時(shí)也為有害信息的廣泛傳播提供了便捷且廣泛的途徑。人們?cè)谙硎芑ヂ?lián)網(wǎng)帶來的便利的同時(shí),也常常會(huì)受到一些非法信息的滋擾。因此信息安全問題對(duì)于維護(hù)網(wǎng)絡(luò)環(huán)境的健康有著十分重要的意義。 目前網(wǎng)絡(luò)的過濾技術(shù)主要有三種,它們是基于URL過濾方式、基于文本的過濾方式和基于圖像內(nèi)容的過濾方式。這幾種過濾技術(shù)各有優(yōu)劣,有的實(shí)現(xiàn)比較簡(jiǎn)單,有的具有較廣泛的適應(yīng)性,有的效率高實(shí)時(shí)性較強(qiáng)。單一采用某一技術(shù)的準(zhǔn)確性不高,而考慮到圖片和圖片附近的文字一般具有相同的類別,它們有相互補(bǔ)充說明的特性,所以綜合考慮圖片和文本的分類特點(diǎn)是主要的過濾方式。 主要以過濾敏感信息為主要目的,基于內(nèi)容的文本過濾技術(shù)和圖像過濾技術(shù)是針對(duì)文本過濾的特征提取和圖像過濾中的膚色檢測(cè)方面的技術(shù),并根據(jù)敏感圖像的特點(diǎn),提出一種連通域探測(cè)算法,實(shí)驗(yàn)中該算法表現(xiàn)出較好的可靠性和較少的時(shí)間開銷。 LJKeyScanner過濾系統(tǒng)就是一款由靈玖軟件研發(fā)的敏感信息過濾系統(tǒng),它將各環(huán)節(jié)的特征提取和優(yōu)化算法及分類等算法應(yīng)用于文本和圖像過濾模塊,并對(duì)網(wǎng)絡(luò)敏感信息過濾系統(tǒng)的實(shí)驗(yàn)結(jié)果進(jìn)行分析,**了較好的效果。 LJKeyScanner關(guān)鍵詞敏感掃描系統(tǒng)主要完成對(duì)待檢測(cè)網(wǎng)頁的敏感關(guān)鍵詞檢測(cè),并對(duì)檢測(cè)出的敏感關(guān)鍵詞,標(biāo)出其在源文件中的位置,將檢測(cè)結(jié)果與檢測(cè)時(shí)間等信息寫入敏感關(guān)鍵詞檢測(cè)結(jié)果表中。系統(tǒng)在敏感詞檢測(cè)期間需要駐留內(nèi)存,通過加載敏感關(guān)鍵詞知識(shí)庫來做敏感關(guān)鍵詞的檢測(cè)。同時(shí),還可以準(zhǔn)確的檢測(cè)出待檢測(cè)文本中的敏感關(guān)鍵詞,敏感詞位置及上下文摘要等具體信息,并在實(shí)際的頁面中將檢測(cè)出的敏感關(guān)鍵詞進(jìn)行了標(biāo)注,管理員可以通過檢測(cè)出的敏感詞進(jìn)行判定,并反饋給系統(tǒng),及時(shí)較新詞庫。以防止網(wǎng)頁不良信息的蔓延和給社會(huì)和人們帶來重大損失。
詞條
詞條說明
Nlpir Parser數(shù)據(jù)智能平臺(tái)文本挖掘系統(tǒng)
文本挖掘(Text Mining)是一個(gè)從結(jié)構(gòu)化或非結(jié)構(gòu)化文本信息中獲取用戶感興趣或者有用的模式的過程。文本挖掘的主要目的是從非結(jié)構(gòu)化文本文檔中提取有趣的、重要的模式和知識(shí)??梢钥闯墒腔跀?shù)據(jù)庫的數(shù)據(jù)挖掘或知識(shí)發(fā)現(xiàn)的擴(kuò)展。 文本挖掘是從數(shù)據(jù)挖掘發(fā)展而來,因此其定義與我們熟知的數(shù)據(jù)挖掘定義相類似。但與傳統(tǒng)的數(shù)據(jù)挖掘相比,文本挖掘有其*特之處,主要表現(xiàn)在:文檔本身是半結(jié)構(gòu)化或非結(jié)構(gòu)化的,無確定形式并
隨著計(jì)算機(jī)科學(xué)的不斷發(fā)展和成熟,計(jì)算機(jī)應(yīng)用開始邁人知識(shí)處理、語言理解階段,人們對(duì)計(jì)算機(jī)的智能提出了新的要求隨著社會(huì)的日益信息化,人們?cè)絹碓綇?qiáng)烈地希望能較好地同計(jì)算機(jī)交流。自然語言就是這樣一個(gè)媒介。 自然語言理解是計(jì)算機(jī)科學(xué)中的一個(gè)引人入勝的、富有挑戰(zhàn)性的課題。從計(jì)算機(jī)科學(xué)特別是從人工智能的觀點(diǎn)看,自然語言理解的任務(wù)是建立一種計(jì)算機(jī)模型,這種計(jì)算機(jī)模型能夠給出象人那樣理解、分析并回答自然語言(即人
靈玖LJParser中文分詞系統(tǒng)有什么特點(diǎn)?
詞法分析是自然語言處理的基礎(chǔ)與關(guān)鍵,是計(jì)算機(jī)科學(xué)中將字符序列轉(zhuǎn)換為單詞序列的過程?;救蝿?wù)是從字符串表示的源程序中識(shí)別出具有獨(dú)立意義的單詞符號(hào),其基本思想是根據(jù)掃描到單詞符號(hào)的**個(gè)字符的種類,拼出相應(yīng)的單詞符號(hào)。 靈玖LJParser中文分詞系統(tǒng)是靈玖軟件經(jīng)過多年研究工作積累的基礎(chǔ)上,研制出的分詞系統(tǒng),主要功能包括中文分詞;英文分詞;詞性標(biāo)注;命名實(shí)體識(shí)別;新詞識(shí)別;關(guān)鍵詞提取;支持用戶專業(yè)詞
NLPIR中文信息系統(tǒng)洞察挖掘行業(yè)發(fā)展趨勢(shì)
進(jìn)入21世紀(jì),面對(duì)網(wǎng)絡(luò)時(shí)代信息的爆炸式增長(zhǎng),中文信息處理作為一項(xiàng)基礎(chǔ)性、普適特性的信息技術(shù),面臨著挑戰(zhàn)和再次發(fā)展的機(jī)遇,在互聯(lián)網(wǎng)時(shí)代則顯示出其優(yōu)勢(shì)。它的開發(fā)利用關(guān)系到我國今后信息產(chǎn)業(yè)乃至社會(huì)經(jīng)濟(jì)的發(fā)展和安全,具有巨大的經(jīng)濟(jì)**和社會(huì)**。 中文信息處理包括了有關(guān)中文信息的采集、存儲(chǔ)、傳輸和利用,是指利用電子計(jì)算機(jī)和現(xiàn)代通信、照明、排版、等自動(dòng)化技術(shù)對(duì)漢字信息進(jìn)行輸入輸出整理、加工、轉(zhuǎn)換、傳輸、復(fù)
公司名: 靈玖中科軟件(北京)有限公司
聯(lián)系人: 張寶
電 話: 010-62648216
手 機(jī): 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區(qū)蘇州街49-3號(hào)盈智大廈5層
郵 編:
網(wǎng) 址: ljrj123.cn.b2b168.com
NLPIR語義挖掘助各行業(yè)建數(shù)據(jù)內(nèi)容處理技術(shù)屏障
NLPIR大數(shù)據(jù)語義平臺(tái)為畢業(yè)論文增色
NLPIR漢語分詞為自然語言信息處理提供新方法
NLPIR大數(shù)據(jù)挖掘?yàn)橹形男畔⑻幚硖峁┙鉀Q方案
NLPIR大數(shù)據(jù)平臺(tái)實(shí)現(xiàn)中文自動(dòng)語義挖掘
糾文網(wǎng)為畢業(yè)論文格式難題運(yùn)用人工智能技術(shù)解決
NLPIR語義平臺(tái)KGB知識(shí)圖譜搜索實(shí)現(xiàn)可視化挖掘
NLPIR大數(shù)據(jù)挖掘通過知識(shí)圖譜展現(xiàn)智能語義關(guān)系
公司名: 靈玖中科軟件(北京)有限公司
聯(lián)系人: 張寶
手 機(jī): 13681251543
電 話: 010-62648216
地 址: 北京海淀北京市海淀區(qū)蘇州街49-3號(hào)盈智大廈5層
郵 編:
網(wǎng) 址: ljrj123.cn.b2b168.com