有多少人看?那一國人?知道你的讀者:流量分析
WriterShelf™ is a unique multiple pen name blogging and forum platform. Protect relationships and your privacy. Take your writing in new directions. ** Join WriterShelf**
WriterShelf™ is an open writing platform. The views, information and opinions in this article are those of the author.
Article info
This article is part of:
Categories:
Tags:
Date:
Published: 2018/06/26 - Updated: 2021/04/11
Total: 2179 words
Like
or Dislike
More to explore
流量分析的主要功能:
介紹完功能後,還想要知道更多?我們就來分享一下我們在開發中所碰到的「故事」,算是深度介紹:
什麼是一個新的拜訪閱覽數?
幾乎每一個網站上網頁都有一個閱覽數,都會註明這個網頁或是文章被看了幾次,可是可能很少人知道,到目前為止,網路產業並沒有定義什麼是一個新的拜訪閱覽數,想想,如果有一個讀者連續刷這個網址 20 次,這算幾次呢?「思書」這個平台第一版是用了一個業界沒人敢用的標準,以「從來沒拜訪過」來作為閱覽數計算,簡單來說,如果你第一次拜讀了「思書」的某一篇文章,這文章的閱覽數會加一,但是以後,同一個 IP 不管你再回頭來閱讀這篇文章幾次,不管是多久,隔一年或三個月,這文章的閱覽數都不會再增加,除非是用新的 IP。 現在,這次我們把這個超嚴格的閱覽計數法改了,改成某一時段內拜訪不增加閱覽數,這依然算是一個很嚴格的規定,我們不想讓連續刷這個網址 20 次就增加20個閱覽數的濫用發生,但是我們認為,讀者隔了一陣子再回頭看同一篇文章,應該要算一個新的拜訪閱覽數。容我們不公佈同一時段內拜訪不增加閱覽數的時間長度,我們會依實用經驗來調整。
什麼是不重覆讀者?
不重覆讀者很間單啊,就是不同的人來閱覽這篇文章的數目,這麼簡單還不知道,哈哈哈哈,對不起了,我們真的還為這數目取得很傷腦筋,要做到不同的人判別,最簡單的方法就是像 Google 目前用的,在每個人的瀏覽器上,裝一個 Cookie (餅乾),所以餅乾不同,就是不同的人,這個方法也是目前業界認為最準確的計算法,但是「思書平台」最強調的就是隱私管理了,所以當這個方法被提出來時,馬上被人翻白眼,你不是隱私管理平台嗎?我們不管技術上 Cookie 能不能做到隱私,使用者就不會喜歡,所以我們就只能退而求其他方法了,我們後來就決定以讀者的 IP 來做不重覆讀者判斷,有沒有好處?有,如果使用者用好幾種瀏覽器來讀「思書」,這比用餅乾準,但是這種情況太少了,更多的情況是,一個校園或是公司都是共用一個 IP,這時我們就只會把這一群人都算成一個「相同的讀者」了,目前,我們沒有更好的方法,所以理論上,「思書」的不重覆讀者會有可能比較少,特別是讀者來自校園或是企業。
令人驚訝的搜尋引擎拜訪次數
在2018年6月14,我們這功能主體算完成了,測試後,就上線了,結果很驚訝的發現,各個搜尋引擎的「機器人」以難以相信的拜訪數,讀取「思書平台」內的各網頁,有多少呢?我們第一天的統計就有好幾萬次!我們雖然知道搜尋引擎的「機器人」拜訪數應該不低,但是這是我們第一次正式統計,這數字還是遠超過我們的預期!還好,我們有內建的搜尋引擎辨別功能,理論上我們能知道「機器人」是從那個搜尋引擎來的,統計了一兩天後,我們就發現有很多來自無用的搜尋「程式」,他們不是搜尋引擎,就我們已知算有名氣的搜尋程式就有三百多個,這麼多奇奇怪怪的搜尋程式對我們作者來說沒有參考價值,也太難以瞭解了,所以我們決定只紀錄與分析我們認為有用的搜尋引擎,這包含 Google,Bing,Yahoo 等等,容我們不公佈我們認為「有用的搜尋引擎」列表,這只是我們的認為。 這部分改變是約上線一個禮拜後,我們還決定不移除過去的紀錄,所以如果你在這篇文章發佈後的約 90 天內,你還可以看到各個無用的搜尋「程式」名稱在你的搜尋引擎來訪排名列表中,以後就看不到了,「思書平台」只分析三個月的資料,我們決定讓時間的河,慢慢流去我們的過程足跡。
新不知名「機器人」搞亂了我們的資料
網路的世界,永遠就有新小孩,上線沒幾天後,就發現突然有從美國來的網路流量大增,一天就有幾萬次,我們原來的「機器人」辨識程式「理論上」應該都能抓到所有的機器人,但是這是新的怪變種,沒抓到,糟糕,我們把「機器人」拜訪當成是「人」的拜訪了,簡單說,我們的流量數不正確了,怎麼辦?就只能改辨識程式,用更嚴格的辨識方法來抓機器人,那會不會把「人」的拜訪當成是「機器人」拜訪呢?說真的,不應該會,但這部分就要看讀者用什麼程式讀網頁了,大家常用的閱覽器是不會有誤判的,唯一有可能的就是很老很舊的瀏覽器了。 從 2018/6/19 問題發生到 2018/6/21 解決,這幾天的流量分析簡單來說就全錯了,我們討論後,很皮的還是決定不移除資料了,一樣,就讓時間的河,慢慢流去我們的過程中錯誤的足跡,三個月後,就消失在地平線了。
「思書」:我們不斷的往最好用寫作平台努力!