
1、 搜索詞分析:系統需要對用戶(hù)的搜索詞進(jìn)行預處理,包括改寫(xiě)糾正錯誤、近義詞、補全搜索詞等,很多用戶(hù)在搜索過(guò)程中都會(huì )為了方便輸入不完整的內容或者是不小心輸錯,系統要提前做好準備,才能去給出準確的搜索答案。
2、 分詞計算:用戶(hù)的搜索詞比較長(cháng),就需要工具來(lái)就行拆分,若是用整個(gè)搜索詞來(lái)做匹配,召回率會(huì )非常低。不同的分詞工具使用的算法不同,因此最好就是要了解清楚如何置入工具。
3、 索引匹配:創(chuàng )建商品之后,系統就會(huì )把商品名稱(chēng)分詞并且建立索引庫,商品類(lèi)目和品牌也能納入其中,這樣就能獲得商品候選集。
4、 商品候選集:匹配出相關(guān)類(lèi)目以及和文件相關(guān)的所有商品,以類(lèi)目+文本為最高優(yōu)先級,對所有商品進(jìn)行排序,以便于用戶(hù)搜索的時(shí)候能夠搜索到自己想要的商品,也能讓信息整合分類(lèi)變得更加簡(jiǎn)單。