電商入門(4):如果我來(lái)負(fù)責(zé)搜狗云表情的搜索功能,會(huì)怎樣去優(yōu)化?

QJQ
7 評(píng)論 9213 瀏覽 41 收藏 8 分鐘

通過(guò)體驗(yàn)云表情APP的搜索功能,本文作者希望從APP端展現(xiàn)出來(lái)的規(guī)律和現(xiàn)象,猜測(cè)目前云表情搜索功能的后臺(tái)邏輯,進(jìn)而假設(shè)如果是自己負(fù)責(zé)云表情搜索功能,會(huì)怎樣去優(yōu)化搜索。

之前抽出時(shí)間體驗(yàn)了一下搜狗云表情APP,這是一款工具型APP。先說(shuō)說(shuō)為什么會(huì)把它列入到電商入門的系列里面呢?因?yàn)橹坝姓f(shuō)過(guò),如果有機(jī)會(huì),我要說(shuō)一說(shuō)電商里面的另一個(gè)靈魂——搜索,現(xiàn)在積蓄還不夠,所以會(huì)抽出時(shí)間去研究一下其他具備搜索功能的APP,希望能逐步提煉出一些自己的東西,以后才有可能寫出電商領(lǐng)域的搜索。(ps:如果把云表情的單個(gè)表情比作電商的一個(gè)sku,你可能會(huì)對(duì)我的意圖理解得更深刻些~)

通過(guò)體驗(yàn)云表情APP的搜索功能,我希望從APP端展現(xiàn)出來(lái)的規(guī)律和現(xiàn)象,猜測(cè)目前云表情搜索功能的后臺(tái)邏輯,進(jìn)而假設(shè)如果是自己負(fù)責(zé)云表情搜索功能,會(huì)怎樣去優(yōu)化搜索。

所以本文的大概框架和思路是:現(xiàn)象?→?猜測(cè)?→?優(yōu)化,一共寫了4個(gè)case:分類及元素歸屬、關(guān)鍵詞匹配效率、語(yǔ)義分析以及標(biāo)簽體系。

注:下文元素指一個(gè)表情(jpg、gif、……)

Case1:分類及元素歸屬

現(xiàn)象:

  • 輸入任意不同關(guān)鍵詞,轉(zhuǎn)搜索結(jié)果頁(yè),可見(jiàn)結(jié)果列表分暴漫、視頻截屏、卡通形象、純文字4類聚合展示全部匹配元素;
  • 切換分類,比如從暴漫切換到視頻截屏,各類中所包含的元素不重復(fù)。

猜測(cè)如下:

  • 沒(méi)有前、后臺(tái)分類的區(qū)分,前臺(tái)分類即為后臺(tái)分類,也就是說(shuō)云表情后臺(tái)只有:暴漫、視頻截屏、卡通形象、純文字4個(gè)分類;
  • 每一個(gè)元素只能歸屬于一個(gè)后臺(tái)分類,進(jìn)而導(dǎo)致每一個(gè)元素只能歸屬于一個(gè)前臺(tái)分類。

優(yōu)化:

后臺(tái)分類是用來(lái)管理素材的,一般枝葉較密;前臺(tái)分類是方便用戶篩選的,一般枝葉稀疏,兩者用途不一樣。從可擴(kuò)展性角度出發(fā)(素材增多),前、后臺(tái)分類一致不利于日后類目擴(kuò)展以及應(yīng)對(duì)素材急劇增加帶來(lái)的問(wèn)題。

  • 建立前臺(tái)分類和后臺(tái)分類;
  • 一個(gè)前臺(tái)分類可對(duì)應(yīng)多個(gè)后臺(tái)分類;
  • 每一個(gè)元素僅可掛在一個(gè)后臺(tái)分類上,但在前臺(tái)展示時(shí),可能出現(xiàn)在多個(gè)前臺(tái)分類中。

Case2:關(guān)鍵詞匹配效率

現(xiàn)象:

分別輸入“快樂(lè)”、“快樂(lè)寶”、“快樂(lè)拉”和“寶拉”4個(gè)關(guān)鍵詞(由表情包“快樂(lè)寶拉”拆分得來(lái)):

  • “快樂(lè)”和“快樂(lè)寶”可搜索得到“快樂(lè)寶拉”表情包,“快樂(lè)拉”和“寶拉”無(wú)表情包展示,但在結(jié)果列表中有“快樂(lè)寶拉”相關(guān)元素展示;
  • 搜索“快樂(lè)拉”關(guān)鍵詞,在結(jié)果列表中包含“快樂(lè)”、“快樂(lè)寶拉”和“拉”3者元素之并集。

猜測(cè)如下:

  • 依據(jù)關(guān)鍵詞優(yōu)先查詢表情包庫(kù),若無(wú)匹配表情包(名稱),則僅在結(jié)果列表中展示全部與(已拆分)關(guān)鍵詞匹配的元素;
  • 表情包搜索不支持表情包(名稱)中間空缺(如快樂(lè)*拉這樣),但支持尾部空缺(如快樂(lè)寶*這樣)[注:但某些關(guān)鍵詞,如“快樂(lè)”,卻能匹配出“我超快樂(lè)”表情包];
  • 按關(guān)鍵詞搜索元素時(shí),結(jié)果列表包含該關(guān)鍵詞所有被拆分的有效(包括模糊匹配)關(guān)鍵詞包含元素之并集。

優(yōu)化:

  • 優(yōu)化搜索關(guān)鍵詞與表情包(名稱)匹配效率,如“寶拉”和“快樂(lè)*拉”能匹配出“快樂(lè)寶拉”表情包;
  • 優(yōu)化結(jié)果列表(即有效(包括模糊匹配)關(guān)鍵詞包含元素之并集)排序,如優(yōu)化搜索“快樂(lè)拉”關(guān)鍵詞的結(jié)果展示列表。

Case3:語(yǔ)義分析

現(xiàn)象:

  • 分別輸入“開心”、“快樂(lè)”和“高興”3個(gè)同義詞,轉(zhuǎn)搜索結(jié)果頁(yè):
  • 關(guān)鍵詞“開心”對(duì)應(yīng)結(jié)果頁(yè),匹配出了“不開心”表情包;
  • 各關(guān)鍵詞對(duì)應(yīng)結(jié)果列表頁(yè)中元素有交集(比例很高)。

猜測(cè)如下:

  • 尚未做語(yǔ)義分析功能;
  • 假設(shè)第一條成立,那么同義詞搜索對(duì)應(yīng)結(jié)果呈現(xiàn)出高相似度的現(xiàn)象,可以說(shuō)明一個(gè)元素可能對(duì)應(yīng)多個(gè)標(biāo)簽,比如結(jié)果中相同元素均具備“開心”、“快樂(lè)”和“高興”三個(gè)標(biāo)簽,所以不論搜索“開心”、“快樂(lè)”還是“高興”,它們都能出現(xiàn)在結(jié)果列表中。

優(yōu)化:

優(yōu)化語(yǔ)義分析功能,至少在搜索結(jié)果中不能出現(xiàn)自相矛盾的元素,比如搜索“開心”,結(jié)果中出現(xiàn)“不開心”元素。

Case4:標(biāo)簽體系

現(xiàn)象:

  • 輸入關(guān)鍵詞“開心”,轉(zhuǎn)搜索結(jié)果頁(yè):
  • 開心?表情包中部分表情,并未展現(xiàn)在下方結(jié)果列表中。

猜測(cè)如下:

  • 每一個(gè)元素都存在一個(gè)或多個(gè)關(guān)鍵詞(標(biāo)簽),同一個(gè)表情包可以收錄具備不同標(biāo)簽的元素(通過(guò)其他案例發(fā)現(xiàn)同一個(gè)元素可以被不同表情包收錄);
  • 補(bǔ)充:通過(guò)以上case2其實(shí)還可以猜測(cè):后臺(tái)可能沒(méi)有從表情包的維度去維護(hù)標(biāo)簽(對(duì)表情包來(lái)說(shuō),可能僅僅只維護(hù)了一個(gè)表情包名稱)。

優(yōu)化:

  • 一個(gè)表情包代表同類型元素的合集,它們一般具有相似的屬性(標(biāo)簽),后臺(tái)可以在表情包的維度維護(hù)標(biāo)簽,表情包下所有元素繼承表情包的標(biāo)簽,這樣可以解決當(dāng)搜索“開心”時(shí),“開心?”表情包中所有元素也會(huì)陳列在下方結(jié)果列表中。
  • 后臺(tái)建立完善的表情包體系,因?yàn)樵谠厝找嬖龆鄷r(shí),元素分門別類以表情包這個(gè)維度聚合必然是未來(lái)的發(fā)展方向。

我最近也是想多積累一些搜索相關(guān)的知識(shí)點(diǎn),歡迎大家和我討論,在底下留言就可以了~

持續(xù)產(chǎn)出干貨是我的初衷,相信也是你關(guān)注我的初衷!

相關(guān)閱讀

入門電商,先從線下到線上說(shuō)起

電商入門(2):購(gòu)物車功能要點(diǎn)和背后邏輯

電商入門 (3):電商CMS,一勞永逸的建站方案

 

作者:QJQ,微信公眾號(hào):倔牛的人生

本文由 @QJQ 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)源于網(wǎng)絡(luò)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 然后就是不斷的評(píng)估建模bulabula

    來(lái)自北京 回復(fù)
  2. 其實(shí)都是本質(zhì)標(biāo)簽體系,切分term,在把這些term經(jīng)過(guò)一系列的數(shù)據(jù)計(jì)算加權(quán)(包括詞的基礎(chǔ)熱度、詞相關(guān)性、圖本身質(zhì)量等等維度)等最終得出分值再展現(xiàn)

    來(lái)自北京 回復(fù)
  3. 同建議做個(gè)配圖,方便理解

    來(lái)自山西 回復(fù)
  4. 贊一個(gè)文章調(diào)理清楚,如果配圖就能不用費(fèi)勁腦補(bǔ)咯。

    另外我認(rèn)為這樣類比有點(diǎn)牽強(qiáng),畢竟前后端菜單掛靠的設(shè)計(jì)電商是標(biāo)配。或許可以找?guī)讉€(gè)小伙伴組隊(duì)一起,分專題討論,一個(gè)人負(fù)責(zé)一個(gè)平臺(tái)。京東淘寶亞馬遜一人一個(gè),從葉子類目的維護(hù)到搜索,從運(yùn)費(fèi)模板設(shè)計(jì)到排名競(jìng)價(jià),或許針對(duì)性強(qiáng)一點(diǎn)哈。

    回復(fù)
    1. 本文相對(duì)電商入門系列前3篇文章,確實(shí)有點(diǎn)晦澀。
      研究電商搜索的時(shí)候一般最好是研究電商,但是為了積累其他行業(yè)內(nèi)搜索相關(guān)功能知識(shí)點(diǎn),退而求其次的選擇了一些不相關(guān)的東西,哈哈哈~
      電商的搜索太復(fù)雜了,如你所說(shuō)的,和類目、商品屬性等等一系列都有關(guān),如果可以咱們可以一起討論啊,搜索我之前也沒(méi)接觸過(guò),還在學(xué)習(xí)中,需要和各位朋友學(xué)習(xí)~

      來(lái)自北京 回復(fù)
  5. 關(guān)鍵詞匹配搜索這里,我認(rèn)為是采用了 文本分詞和ES搜索。
    (“快樂(lè)”和“快樂(lè)寶”可搜索得到“快樂(lè)寶拉”),是因?yàn)榍熬Y匹配;
    (“快樂(lè)拉”關(guān)鍵詞,在結(jié)果列表中包含“快樂(lè)”、“快樂(lè)寶拉”和“拉”)是因?yàn)椤翱鞓?lè)拉”分詞成了“快樂(lè)”和“拉”,然后通過(guò)ES搜索出來(lái);
    (“快樂(lè)”,卻能匹配出“我超快樂(lè)”表情包)同樣是因?yàn)镋S搜索的結(jié)果。

    而采用這種分詞和搜索方式,優(yōu)化點(diǎn)恐怕是不好解決了。

    來(lái)自廣東 回復(fù)
    1. 可以,可以,我先去研究下文本分詞和ES搜索這兩個(gè)詞的概念,看來(lái)搜索這塊兒我還是很業(yè)余的,哈哈哈

      來(lái)自北京 回復(fù)