網康網頁過濾庫突破2000萬
日前,網康科技發布消息,截至2011年2月,其上網行為管理產品的核心技術“網頁預分類過濾數據庫”已經突破2000萬條URL,繼續保持了其“全球***的中文網頁過濾數據庫”的領先地位,并且在內容覆蓋范圍、分類精準度和過濾速度等方面遠遠超出同類產品,倍受業界廠商和用戶的關注。
自2005年網康科技***次發布“網頁過濾數據庫”以來,通過“網頁預分類數據庫”技術進行網頁訪問過濾就成為了上網行為管理產品必不可少的重要功能之一。而在早期,這種數據庫的URL條目積累主要依靠“網絡爬蟲”+“智能分類”+“人工校驗”的方式進行,存在積累速度慢,更新不及時的缺憾。隨著互聯網技術的發展,網康科技不斷引入分布式計算、云分析、語義分析等新技術,使得“網頁預分類過濾數據庫”技術飛速發展,目前每日更新URL數量已經達到300萬條,最終在2011年年初突破了2000萬大關。
與時俱進 迎接網頁應用挑戰
“網頁預分類過濾數據庫”技術的發展和應用,大大提升了上網行為管理類產品的部署價值,從最初幫助用戶屏蔽“內容不健康”的不良網站,到封堵“偷菜、炒股、游戲”等Web 2.0網頁應用提高工作效率,以及過濾“論壇、博客”類網站保護機密信息外泄,“網頁預分類過濾數據庫”技術已經發展成為上網行為管理產品的核心技術。
網康科技“互聯網應用及內容研究實驗室”網頁預分類研究小組組長張永臣介紹說:“隨著互聯網應用的日趨豐富和復雜,尤其是Web 2.0之后,網頁已經不僅僅是一個HTML文檔,最典型的示例就是‘開心網’的‘偷菜’。”而隨著這種網頁應用的流行,上網行為管理產品的網頁過濾功能也需要與時俱進,“網康科技的網頁預分類過濾數據庫技術可以實現對開心網分項控制,例如允許登錄開心網,但是不能進入“停車、偷菜”等子應用,這就是網康科技給用戶帶來的精細化管理價值。”
啟用云分析 實現分鐘級實時過濾
在Web 2.0時代網頁內容的變化更為頻繁,而要滿足用戶精準、有效的網頁訪問控制要求,就必須加快網頁的抓取、分析、分類過程,為了實現這個目標,網康科技適時啟用“云分析”技術。一方面,網康科技利用“云計算”技術在全國部署了大量云服務器,同時進行網頁內容抓取、分析、分類工作,加快了對網頁內容的實時跟蹤,達到“分鐘級”的分類更新,即當網頁內容發生變化后的1分鐘內,網康網頁預分類網頁過濾數據庫就能完成對其內容變化的分析,并根據變化重新進行分類。
另一方面,在開啟云分析模式下,當用戶訪問網頁時如果遇到未分類網頁或者網頁分類不精準的情況,可以立即向網康云服務器發送請求,云服務器接到請求后將實時進行智能分析和分類,并將結果反饋給用戶,之后再更新到總過濾數據庫中供其他用戶使用。
目前,網康科技的上網行為管理用戶可以在設備中設置每天更新“網頁預分類過濾數據庫”,以獲得***的網頁分類結果。
定位中文網頁 優勢不容超越
網康科技是網絡應用管理領域的的領導廠商,是上網行為管理理念的開創者和***品牌,多年來堅持自主研發和技術創新,深厚的技術積累讓網康更了解中國用戶的上網習慣,結合中國的法律、道德、文化環境,最終形成了國外同類產品無法逾越的、具有中國特色的“全球***的中文網頁過濾數據庫”。在分類準確度、中文內容分析、網頁應用識別等方面,網康科技的技術實力已經達到國際***水平。
在國內,網康2000萬條URL的數據庫更是遠超行業平均水平。網頁過濾數據庫的形成是一個不斷積累的過程,并且要隨著互聯網發展帶來的挑戰而不斷進行技術創新,以應對新形勢下用戶對上網行為管理的更高要求。網康科技作為“網頁預分類過濾數據庫”技術的***,經過6年多不斷探索和積累,并引入了“網絡爬蟲系統”“網頁智能分類系統”“分布式計算”“語義分析”“云分析”等高精尖技術,不僅提高了產品的核心競爭力,也使用戶能夠獲得更高的應用價值。