135 2295 6919
135 2295 6919
公司主站W(wǎng)ebsite:
www.controlmeasurement.com
電子郵箱:
qykh2009@163.com
公司地址:
北京市朝陽(yáng)區(qū)亞運(yùn)村天創(chuàng)世緣B2座30整層
Software 軟件百科
類(lèi)別:網(wǎng)站建設(shè)訪(fǎng)問(wèn)量:2174編輯:houwenqian 日期:2024-11-01 20:58:00
如果要想判斷一個(gè)C2C網(wǎng)站的好壞,首先要從系統(tǒng)構(gòu)架的角度衡量一個(gè)搜索系統(tǒng)的高效性和擴(kuò)展性。通過(guò)比較國(guó)內(nèi)外優(yōu)秀的電子商務(wù)網(wǎng)站看出,國(guó)內(nèi)C2C網(wǎng)站的搜索技術(shù)與國(guó)外的搜索技術(shù)有較大的差距。這些差距不僅僅體現(xiàn)在技術(shù)細(xì)節(jié)上,更主要的是C2C網(wǎng)站管理系統(tǒng)系統(tǒng)架構(gòu)的設(shè)計(jì)上。
C2C網(wǎng)站的搜索系統(tǒng)分為索引構(gòu)建和搜索兩大部分。索引構(gòu)建部分介紹了在C2C電子商務(wù)網(wǎng)站搜索系統(tǒng)中索引的構(gòu)建過(guò)程。首先使用送料機(jī)提取商品信息,將處理過(guò)的商品信息送入搜索數(shù)據(jù)庫(kù),然后由一個(gè)消息系統(tǒng)將商品更新以消息的形式發(fā)送給搜索引擎,搜索引擎建立索引,搜索引擎利用搜索關(guān)鍵字對(duì)商品在索引內(nèi)進(jìn)行搜索。
和人類(lèi)不同,計(jì)算機(jī)不能夠理解人類(lèi)自然語(yǔ)言文檔的結(jié)構(gòu),它們也不認(rèn)識(shí)詞語(yǔ)和句子。對(duì)于計(jì)算機(jī)而言,一篇文檔只不過(guò)是一組0和l的序列。計(jì)算機(jī)不知道空格可以用來(lái)區(qū)分一篇文檔中的瑚與詞。因此,人們必須給計(jì)算機(jī)編程來(lái)區(qū)別詞與詞,這就是所謂的分詞。這樣的分詞程序常稱(chēng)作分詞器或者解析器。
在C2C網(wǎng)站系統(tǒng)分詞過(guò)程中,解析囂需要知道如何確定這個(gè)代表的是一個(gè)詞,那個(gè)代表的是標(biāo)點(diǎn),還有一些不能打印的控制符。解析器還要能區(qū)分像郵件地址、電話(huà)號(hào)碼和URL等實(shí)體。在分詞的過(guò)程中,還需要存儲(chǔ)分詞的很多特性,如分詞的大小寫(xiě)、語(yǔ)言編碼、詞性和位置等。
在C2C網(wǎng)站系統(tǒng)數(shù)據(jù)庫(kù)中,一個(gè)對(duì)象代表的是一個(gè)數(shù)據(jù)庫(kù)實(shí)體。用戶(hù)通過(guò)數(shù)據(jù)庫(kù)罩面的信息查找到與查詢(xún)條件相匹配的結(jié)果。根據(jù)應(yīng)用的不同,查詢(xún)結(jié)果對(duì)象可以是文檔、圖片或者聲音。通常情況下這些文檔不是直接存儲(chǔ)在C2C網(wǎng)站的搜索系統(tǒng)中,而是存儲(chǔ)他們的應(yīng)用或者原數(shù)據(jù)庫(kù)。太多數(shù)的C2C網(wǎng)站搜索系統(tǒng)都可以計(jì)算出每個(gè)結(jié)果與查詢(xún)條件的匹配度,并根據(jù)量化的匹配度對(duì)結(jié)栗對(duì)象進(jìn)行評(píng)級(jí),高級(jí)別的結(jié)果對(duì)琢可以顯示給用戶(hù)。如果用戶(hù)想優(yōu)化查詢(xún),這個(gè)查詢(xún)的過(guò)程可能需要多次反復(fù)。
再來(lái)分析一下C2C網(wǎng)站搜索系統(tǒng)竹后臺(tái)。C2C網(wǎng)站搜索后臺(tái)是牲個(gè)搜索系統(tǒng)的基礎(chǔ),也是直接影響搜索系統(tǒng)性能的最關(guān)鍵部分。C2C網(wǎng)站搜索后臺(tái)的大部分功能都是圍繞著索引來(lái)的,所以可以把C2C網(wǎng)站搜索系統(tǒng)后臺(tái)再次分為兩個(gè)部分,即索引子系統(tǒng)和搜索予系統(tǒng)。索引子系統(tǒng)主要是為商品信息建立索引。C2C網(wǎng)站搜索子系統(tǒng)主要是從已有的商品索引中找到滿(mǎn)足查詢(xún)條件的商品。對(duì)于C2C網(wǎng)站搜索系統(tǒng)后臺(tái)來(lái)講,商品的數(shù)量是影響系統(tǒng)架構(gòu)的主要因素之一。原因非常簡(jiǎn)單,在C2C電子商務(wù)網(wǎng)站上,商品的修改非常頻繁,索引只能使用內(nèi)存索引,不能使用磁盤(pán)索引。當(dāng)商品索引的容量大于服務(wù)器的內(nèi)存的時(shí)候,商品索引只能分布在多臺(tái)服務(wù)器上。索引的分布式存放比單一存放復(fù)雜的多,本文所研究的系統(tǒng)架構(gòu)是基于分布式索引的系統(tǒng)架構(gòu)。
【上一條】 沒(méi)有上一條
【下一條】 沒(méi)有下一條