來(lái)源:本站日期:2018-7-3
搜索功能對(duì)電商來(lái)說(shuō)非常重要,當(dāng)用戶(hù)帶著清晰的意圖去查找自己需求的產(chǎn)品時(shí),卻沒(méi)有得到他想要的產(chǎn)品,這在很大程度上直接影響了用戶(hù)關(guān)于產(chǎn)品的體驗(yàn)。
第一. 優(yōu)化ik分詞詞庫(kù)
大部分電商都是通過(guò)分詞來(lái)提高產(chǎn)品的召回率以及相關(guān)度的排序,而分詞詞庫(kù)則是確保分詞準(zhǔn)確的要害。
而ik詞庫(kù)分為基礎(chǔ)詞庫(kù)、擴(kuò)展詞庫(kù)和stopword,分詞是根據(jù)基礎(chǔ)詞庫(kù)里的詞來(lái)分,擴(kuò)展詞庫(kù)則是對(duì)基礎(chǔ)詞庫(kù)的補(bǔ)償,而stopword里的詞就是被過(guò)濾掉的詞。
首先是清洗基礎(chǔ)詞庫(kù)的無(wú)效字詞,以非名詞和相關(guān)度過(guò)低的字詞為主;
其次是補(bǔ)償擴(kuò)展詞庫(kù),究竟ik詞庫(kù)是只是個(gè)詞庫(kù),沒(méi)辦法自動(dòng)更新,與時(shí)俱進(jìn),我們要自己跟上潮流去新增詞匯;
最終就是增加stopword,這個(gè)網(wǎng)上查找一下就有了,ik自帶的stopword量很少,通過(guò)補(bǔ)償,可以有效地過(guò)濾掉一些不必的分詞效果。
第二. 要害詞綁定類(lèi)目來(lái)輔佐語(yǔ)義辨認(rèn)
語(yǔ)義辨認(rèn)就是,系統(tǒng)會(huì)自動(dòng)識(shí)別關(guān)鍵詞代表什么。而現(xiàn)在無(wú)法從技術(shù)層面去實(shí)現(xiàn)查找的語(yǔ)義辨認(rèn),只會(huì)去悉數(shù)召回匹配到標(biāo)題稱(chēng)謂里包含查找要害詞的產(chǎn)品。
為此只能通過(guò)人工的方法去將要害詞和類(lèi)目進(jìn)行相關(guān),相當(dāng)于給要害詞打了標(biāo)簽,確保了搜索效果的相關(guān)度。