一级在线播放-一级午夜视频-一级午夜免费视频-一级日本强免费-日韩精品免费看

起重學院
下載手機APP
當前位置: 首頁 ? 起重學院 ? 電子商務 ? 正文

聚類搜索引擎的對象、功能、算法分析

來源:中國起重機械網
|
|
|

聚類對象分析

 

現有聚類搜索引擎的聚類對象主要包括三類數據:商業數據、評價數據、社交數據。

商品數據主要包括對服裝、電器、化妝品等數據信息進行分類整理,例如用戶在淘寶網輸入“牙膏”關鍵字,在網頁上立馬顯示出“功能”、“品牌”、“產地”等分類信息,并按照銷量、價格、信用進行了排序,對商品的聚類分析清晰明確。評價數據主要包括論壇對相關主題的討論信息,博客的交流信息,商業網站對商品的滿意度評價信息等。大連海事大學的魯明羽、姚曉娜等人提出一種基于模糊聚類的網絡論壇熱點話題挖掘算法,通過分析帖子和用戶間的影響力傳遞,來判斷是否為焦點人物和熱門話題[11]。社交數據主要包括社交網絡注冊用戶個人資料信息、用戶關注度信息、用戶之間交互信息等社交數據資源。社交數據隱含了大量可以用于聚類的關聯信息,對實現智能和個性化聚類搜索具有重要意義。此外,聚類對象按數據類型還可以劃分為文本數據、多媒體數據等。

 

 

聚類功能分析

 

聚類搜索引擎的聚類功能主要有智能聚類、去重、多媒體、覆蓋性等能力。

智能聚類:聚類搜索引擎大多具有這項功能。目前做得最好的如Vivisimo系統,它最大的特色是會對搜索結果自動分類,采用專門開發的啟發式算法來集合或聚類原文文獻。

去重:去重可以取掉大部分的廣告網頁并節省掉用戶的選擇時間,是十分實用的一項聚類功能。國內的比比貓的去重功能非常出色,在用戶獲得多個搜索引擎的搜索結果后,比比貓可以自動為用戶獲取最有搜索結果并取掉重復的信息。

多媒體:除了文本聚類,聚類搜索引擎還關注視頻、音頻等多媒體信息進行聚類的功能,商業化、集成化、多媒體化的氣息更加濃厚。搜狗音樂推出了新版的聚類頁面,可視化強,用戶輸入音樂名稱,將獲得全新的聚類結果,該結果首先按照音頻特征聚類,再按照文本信息聚類,保證搜索界面顯示的音樂相關度最高。

覆蓋性:聚類搜索引擎一般基于一些大型通用搜索引擎的數據資源,這樣能夠保證搜索的結果覆蓋全面,可聚類的對象內容豐富。

 

 

聚類算法分析

 

聚類搜索引擎的聚類算法主要有層次聚類、樹狀聚類、網狀聚類、圓形聚類。其中Carrot2Clusty(clusty.com)iBoogie( iBoogie.com)等系統使用層次聚類的方法,按照來源及站點進行聚類。PinkySeach[12]Mnemomap(mnemomap.org)系統是使用樹狀結構的聚類算法,將聚類的結果以列表的形式展示出來。UJIKO系統(ujiko.com)是使用圓形結構的聚類算法,它將搜索結果聚類后按照主題自動分類成圖形界面顯示出來。Quintura系統(quintura.com)是使用網狀結構的聚類算法,是通過標簽云的形式將在語義上相關的詞聚類,構成網狀鏈接。

?

移動版:聚類搜索引擎的對象、功能、算法分析

主站蜘蛛池模板: 亚洲综合色在线观看 | 亚洲国内精品久久 | 狠狠狠色丁香婷婷综合久久俺 | 五月欧美激激激综合网色播 | 亚洲欧美一区二区三区九九九 | 色五夜| 虎虎影院| 男人的天堂aa | 国产成人久久蜜一区二区 | 伊人网站在线观看 | 日本在线一级 | 国产精品毛片久久久久久久 | 自拍欧美日韩 | 国产999在线 | 国产成人精品日本亚洲专一区 | 亚洲精品tv久久久久久久久 | 性网站视频 | 国产日韩视频 | 在线小视频你懂的 | 性强烈的欧美三级三p视频 一级电影免费 | 欧美综合网站 | 免费在线观看一区二区 | 在线观看欧美日韩 | 婷婷丁香在线视频 | 久久久久久久国产精品毛片 | 中文字幕欧美日韩 | 亚洲精品美女久久久久 | 国产成人综合一区精品 | 国产成人久久精品二区三区 | 久久久久免费精品国产 | 亚洲自拍成人 | 亚洲国产成人99精品激情在线 | 国内自拍第五一页 | 亚洲欧美一区二区三区另类 | 成人欧美一区二区三区视频xxx | 中文字幕动漫精品专区 | 一区二区三区四区精品 | 国产男女视频 | 男人v天堂 | 欧美资源站 | 久久国产精品一区 |