分析2018年「人人都是產(chǎn)品經(jīng)理」網(wǎng)站的文章數(shù)據(jù)
在八月的尾巴,深入分析2018年人人都是產(chǎn)品經(jīng)理網(wǎng)站上的文章數(shù)據(jù),你的文章上榜了嗎?筆者爬取了網(wǎng)站1月到現(xiàn)在的文章數(shù)據(jù),希望發(fā)掘數(shù)據(jù)背后潛藏的價值。
一. 匯總分析
通過閱讀量排序,得到了Top10閱讀量的熱點文章,總的來看大家偏向于閱讀技術(shù)類的文章,特別是與PRD相關的文章。一方面,PRD擁有較為全面的體系,可以讓讀者系統(tǒng)深入地去了解某個APP或者事物;另一方面,PRD撰寫是許多新人難以掌握的技能,值得反復閱讀與學習。
從收藏量榜單分析,與閱讀量相似的是,大部分人都傾向于收藏PRD分享文章,PRD被普遍認為是產(chǎn)品經(jīng)理有用且值得持續(xù)學習的技能。除此以外,一些原理性的知識或者職場道路的發(fā)展也被大家認為十分值得收藏的內(nèi)容。
基于點贊量榜單看,PRD幾乎消失了。大家更多偏向于對于更為細節(jié)的方法論進行點贊,閱讀這些文章后筆者發(fā)現(xiàn):相比起收藏量榜單,點贊量榜單上的文章閱讀時間更短、閱讀難度更低、趣味性更高……
總的來說,用戶點贊的驅(qū)動力來自于閱讀文章帶來的愉悅感;而收藏的話,用戶則基于文章的可學習性進行收藏——值得反復閱讀。
二.“標題文”分析
筆者設置了這樣的指標來識別標題文:
標題黨可能性數(shù)值 = 閱讀量 /(點贊量+收藏量)
如果這個數(shù)值越大表明了更多的人只是閱讀而無收藏/點贊,這說明了文章的趣味性或者價值并沒有達到讀者的預期,也就是說文章為標題黨的可能性越大。
這十篇文章在所有的文章里擁有最大的標題黨可能性數(shù)值,較大一部分屬于活動策劃類或者深度技術(shù)類文章。
這一類文章較難借鑒導致了收藏量的低迷,同時由于文章閱讀體驗一般也沒有引發(fā)較高的點贊量,最終出現(xiàn)高閱讀量下少人點贊或者收藏的情況。還有一種可能是這些文章不適合人人都是產(chǎn)品經(jīng)理的受眾。
那么哪些文章是干貨呢?
這一類的文章可操作性強、閱讀起來簡單易懂成為了大多數(shù)人點贊或者收藏的對象。大家可以通過搜索閱讀這些文章,應該會有所得。
我們來從運營的角度分析一下網(wǎng)站的標題文情況:
可以看到數(shù)值集中分布于0-2000(占比87%),我們可以認為2000以下的是正常的文章,500以下是較為優(yōu)秀的文章(收藏率以及點贊率較高)。這樣的分布表明大部分文章?lián)碛辛己玫馁|(zhì)量,數(shù)值較大的(5000以上較大可能為標題文)文章只有63篇(占比1%)。
那么我們放大0-2000的分布情況來看:
發(fā)現(xiàn)文章數(shù)值以數(shù)值500為中間向兩邊遞減,進一步說明了文章質(zhì)量普遍較高,大部分文章都會獲得較高的點贊率與收藏率。
總的來說,網(wǎng)站中的標題文數(shù)量不多,絕大多數(shù)文章都對用戶產(chǎn)生了十分有用的影響,文章運營情況良好,編輯可以通過監(jiān)控干貨文來更好地設置推薦位。
三. 類別分析
人人都是產(chǎn)品經(jīng)理網(wǎng)站上的文章被分為了許多的不同的類別,筆者收集到的有以下十七種:
- AI人工智能
- 業(yè)界動態(tài)
- 交互體驗
- 產(chǎn)品經(jīng)理
- 產(chǎn)品設計
- 產(chǎn)品運營
- 分析評測
- 創(chuàng)業(yè)學院
- 區(qū)塊鏈
- 原型設計
- 大咖分享
- 數(shù)據(jù)分析
- 文案策劃
- 新零售
- 用戶研究
- 職場攻略
- 營銷推廣
那么大家發(fā)布的文章主要是哪一類別的呢?
發(fā)布文章最多的類別是業(yè)界動態(tài),是一些時效性較強的東西。可以發(fā)現(xiàn)技術(shù)性文章集中分布于數(shù)據(jù)圖的右邊,較少人去分享。
這也跟網(wǎng)站的定位有關,網(wǎng)站用戶更注重產(chǎn)品而非原理,偏好思想勝于技術(shù)。
結(jié)合“干貨”榜單分析,用戶對于職場攻略、新零售、原型設計和用戶研究等類目都有較大的需求,作家們可以更多地收集或者撰寫這幾類的文章。
結(jié)合“標題黨”榜單分析,用戶對于AI、區(qū)塊鏈與產(chǎn)品運營等文章的需求過剩,較多的文章并沒有對用戶產(chǎn)品實際有效的作用。
原型設計類別擁有最多用戶收藏,相反,AI較少人收藏與點贊。
以上的數(shù)據(jù)圖可以簡單地理解為用戶對于類別的需求,而實際上會受到文章質(zhì)量與閱讀數(shù)量的影響帶來偏差,筆者偷懶省去了對數(shù)據(jù)進行標準化的過程。
比如,新零售類目下?lián)碛辛硕嗥恼律习瘛案韶洝卑駟危鞘艿搅送惸肯缕渌唾澋褪詹匚恼掠绊憣е铝丝傮w分數(shù)不高。
來看點贊量排名,可以等同于用戶從最愿意到最不愿意看到的文章類別排序。
像創(chuàng)業(yè)、區(qū)塊鏈和AI人工智能這些類別的文章由于閱讀難度大導致了較少人點贊,而像業(yè)界動態(tài)這樣的過于泛濫的文章也會導致讀者不愿意去閱讀。
四. 網(wǎng)站總體運營情況
2018年截止到8月26日平均每周有82萬人次閱讀人人都是產(chǎn)品經(jīng)理文章,第一個低點是由于春節(jié)大家都傾向于過節(jié)與放松而較少閱讀。
近來的閱讀低點表明網(wǎng)站用戶有些許的流失,運營需要進一步優(yōu)化,最重要的核心競爭力就是內(nèi)容的質(zhì)量,建議編輯可以通過分析干貨指標讓更多的干貨文有較高的曝光率來提高閱讀量,實際上筆者列出的干貨文榜單上面的文章閱讀量都不是十分的高,可以說是在某種程度上“被埋沒了”。
由于6-7周屬于春節(jié)假期,網(wǎng)站總體的訪問量不大,可以忽略6-7周的特殊數(shù)據(jù)情況。
最后我們來分析網(wǎng)站總體上的文章有效性情況,每周的文章數(shù)總體來說還是處在平穩(wěn)波動中,而總體上看收藏數(shù)在以非常小的幅度減少。
以文章數(shù)與收藏數(shù)的比值設置了收藏比這一曲線,總體上看這一曲線在緩慢地走低,在上兩周達到了全年的低點,反映出每篇收藏量的減少。
兩個維度分析:
- 是不是每周推送的文章數(shù)過多了導致用戶沒有時間去好好閱讀每一篇文章?
- 是不是文章的質(zhì)量下降導致用戶更少地去收藏文章?
五. 總結(jié)
本文從淺度的匯總分析到標題黨識別分析到類別分析,最后回到了分析網(wǎng)站文章的總體情況。一步步拆解網(wǎng)站數(shù)據(jù)的價值,利用數(shù)據(jù)來推動網(wǎng)站更好地設計與推送文章,一些拙見希望能夠給大家?guī)硪恍┙梃b意義。
爬取了不少人人都是產(chǎn)品經(jīng)理網(wǎng)站的數(shù)據(jù),還望諒解,本意希望能夠推動網(wǎng)站更好地建設與發(fā)展!
如果有需要數(shù)據(jù)集或者爬蟲教程的小伙伴可以留言,如果人多的話筆者會另外寫一篇Python爬蟲入門教程,讓大家能夠在簡歷上增添爬蟲與數(shù)據(jù)分析技能。
本文由 @弓心?原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Pexels,基于 CC0 協(xié)議
好棒的文章!樓主能分享一下您的數(shù)據(jù)集嘛?我也一直想學爬蟲,應該怎么做呢?
求爬蟲教程啊,大神
數(shù)據(jù)爬取需求 蠻大的求指導(>﹏<)
請問數(shù)據(jù)來源是哪啊
大數(shù)據(jù)這么火,反而數(shù)據(jù)分析的文章排名那么靠后~~~
數(shù)據(jù)分析的平均點贊量和收藏量都是不低的,存在一定的需求缺口