數據分析常用術語（上）

來源：奇酷教育發(fā)表于：2019-03-29 09:58:26

來盤點一下數據分析常用的術語解釋。建議大家收藏起來方便查看。

有個朋友是金融行業(yè)產品經理，最近在對已有的站內用戶做分層與標簽分類，需要對用戶進行聚類分析。一般從事數據分析行業(yè)的朋友對這類詞并不陌生，但是像市場運營人員就會把這類些名詞概念搞混，導致結果不準確。數據分析相關概念多且雜，容易搞混。為了便于大家區(qū)分，今天小編就來盤點一下數據分析常用的術語解釋。建議大家收藏起來方便查看。

按照以下三類進行匯總。

1、互聯(lián)網常用名詞解釋

2、統(tǒng)計學名詞解釋

3、數據分析名詞解釋

一、互聯(lián)網常用名詞解釋

1、PV（Page View）頁面瀏覽量

指某段時間內訪問網站或某一頁面的用戶的總數量，通常用來衡量一篇文章或一次活動帶來的流量效果，也是評價網站日常流量數據的重要指標。PV可重復累計，以用戶訪問網站作為統(tǒng)計依據，用戶每刷新一次即重新計算一次。

2、UV（Unique Visitor）獨立訪客

指來到網站或頁面的用戶總數，這個用戶是獨立的，同一用戶不同時段訪問網站只算作一個獨立訪客，不會重復累計，通常以PC端的Cookie數量作為統(tǒng)計依據。

3、Visit 訪問

指用戶通過外部鏈接來到網站，從用戶來到網站到用戶在瀏覽器中關閉頁面，這一過程算作一次訪問。

Visit可重復累計，比如我打開一個網站又關閉，再重新打開，這就算作兩次訪問。

4、Home Page 主頁

指一個網站起主目錄功能的頁面，也是網站起點。通常是網站首頁。

5、Landing Page 著陸頁

指用戶從外部鏈接來到網站，直接跳轉到的第一個頁面。比如朋友給我發(fā)了一個介紹爆款T恤的淘寶鏈接，我點開會直接跳轉到介紹T恤的那個頁面，而不是淘寶網眾多其他頁面之一，這個介紹T恤的頁面可以算作是著陸頁。

6、Bounce Rate 跳出率

指用戶通過鏈接來到網站，在當前頁面沒有任何交互就離開網站的行為，這就算作此頁面增加了一個“跳出”，跳出率一般針對網站的某個頁面而言。

跳出率=在這個頁面跳出的用戶數/PV

7、退出率

一般針對某個頁面而言。指用戶訪問某網站的某個頁面之后，從瀏覽器中將與此網站相關的所有頁面全部關閉，就算此頁面增加了一個“退出“。

退出率=在這個頁面退出的用戶數/PV

8、Click 點擊

一般針對付費廣告而言，指用戶點擊某個鏈接、頁面、banner的次數，可重復累計。比如我在PC端看到一則新聞鏈接點進去看了一會就關了，過了一會又點進去看了一遍，這就算我為這篇新聞貢獻兩次點擊。

9、avr.time 平均停留時長

指某個頁面被用戶訪問，在頁面停留時長的平均值，通常用來衡量一個頁面內容的質量。

avr.time=訪客數量/用戶總停留時長

10、CTR 點擊率

指某個廣告、Banner、URL被點擊的次數和被瀏覽的總次數的比值。一般用來考核廣告投放的引流效果。

CTR=點擊數（click）/被用戶看到的次數

11、Conversion rate 轉化率

指用戶完成設定的轉化環(huán)節(jié)的次數和總會話人數的百分比，通常用來評價一個轉化環(huán)節(jié)的好壞，如果轉化率較低則急需優(yōu)化該轉化環(huán)節(jié)。

轉化率=轉化會話數/總會話數

12、漏斗

通常指產生目標轉化前的明確流程，比如在淘寶購物，從點擊商品鏈接到查看詳情頁，再到查看顧客評價、領取商家優(yōu)惠券，再到填寫地址、付款，每個環(huán)節(jié)都有可能流失用戶，這就要求商家必須做好每一個轉化環(huán)節(jié)，漏斗是評價轉化環(huán)節(jié)優(yōu)劣的指標。

13、投資回報率（ROI：Return On Investment ）

反映投入和產出的關系，衡量我這個投資值不值得，能給到我多少價值的東西（非單單的利潤），這個是站在投資的角度或長遠生意上看的。

其計算公式為：投資回報率（ROI）=年利潤或年均利潤/投資總額×100%，通常用于評估企業(yè)對于某項活動的價值，ROI高表示該項目價值高。

14、重復購買率

指消費者在網站中的重復購買次數。

15、Referrer 引薦流量

通常指將用戶引導至目標頁面的URL（超鏈接）。在百度統(tǒng)計中，引薦流量叫做“外部鏈接”。

16、流失分析（Churn Analysis/Attrition Analysis）

描述哪些顧客可能停止使用公司的產品/業(yè)務，以及識別哪些顧客的流失會帶來最大損失。流失分析的結果用于為可能要流失的顧客準備新的優(yōu)惠。

17、顧客細分&畫像（Customer Segmentation & Profiling）

根據現(xiàn)有的顧客數據，將特征、行為相似的顧客歸類分組。描述和比較各組。

18、顧客的生命周期價值 (Lifetime Value, LTV)

顧客在他/她的一生中為一個公司產生的預期折算利潤。

19、購物籃分析（Market Basket Analysis）

識別在交易中經常同時出現(xiàn)的商品組合或服務組合，例如經常被一起購買的產品。此類分析的結果被用于推薦附加商品，為陳列商品的決策提供依據等。

20、實時決策（Real Time Decisioning, RTD）

幫助企業(yè)做出實時（近乎無延遲）的最優(yōu)銷售/營銷決策。比如，實時決策系統(tǒng)（打分系統(tǒng)）可以通過多種商業(yè)規(guī)則或模型，在顧客與公司互動的瞬間，對顧客進行評分和排名。

21、留存/顧客留存（Retention / Customer Retention)

指建立后能夠長期維持的客戶關系的百分比。

22、社交網絡分析（Social Network Analysis, SNA）

描繪并測量人與人、組與組、機構與機構、電腦與電腦、URL與URL、以及其他種類相連的信息/知識實體之間的關系與流動。這些人或組是網絡中的節(jié)點，而它們之間的連線表示關系或流動。SNA為分析人際關系提供了一種方法，既是數學的又是視覺的。

23、生存分析（Survival Analysis）

估測一名顧客繼續(xù)使用某業(yè)務的時間，或在后續(xù)時段流失的可能性。此類信息能讓企業(yè)判斷所要預測時段的顧客留存，并引入合適的忠誠度政策。

二、統(tǒng)計學名詞解釋

1、絕對數和相對數

絕對數：是反應客觀現(xiàn)象總體在一定時間、一定地點下的總規(guī)模、總水平的綜合性指標，也是數據分析中常用的指標。比如年GDP，總人口等等。

相對數：是指兩個有聯(lián)系的指標計算而得出的數值，它是反應客觀現(xiàn)象之間的數量聯(lián)系緊密程度的綜合指標。相對數一般以倍數、百分數等表示。相對數的計算公式：

相對數=比較值（比數）/基礎值（基數）

2、百分比和百分點

百分比：是相對數中的一種，他表示一個數是另一個數的百分之幾，也成為百分率或百分數。百分比的分母是100，也就是用1%作為度量單位，因此便于比較。

百分點：是指不同時期以百分數的形式表示的相對指標的變動幅度，1%等于1個百分點。

3、頻數和頻率

頻數：一個數據在整體中出現(xiàn)的次數。

頻率：某一事件發(fā)生的次數與總的事件數之比。頻率通常用比例或百分數表示。

4、比例與比率

比例：是指在總體中各數據占總體的比重，通常反映總體的構成和比例，即部分與整體之間的關系。

比率：是樣本(或總體)中各不同類別數據之間的比值，由于比率不是部分與整體之間的對比關系，因而比值可能大于1。

5、倍數和番數

倍數：用一個數據除以另一個數據獲得，倍數一般用來表示上升、增長幅度，一般不表示減少幅度。

番數：指原來數量的2的n次方。

6、同比和環(huán)比

同比：指的是與歷史同時期的數據相比較而獲得的比值，反應事物發(fā)展的相對性。

環(huán)比：指與上一個統(tǒng)計時期的值進行對比獲得的值，主要反映事物的逐期發(fā)展的情況。

7、變量

變量來源于數學，是計算機語言中能儲存計算結果或能表示值抽象概念。變量可以通過變量名訪問。

8、連續(xù)變量

在統(tǒng)計學中，變量按變量值是否連續(xù)可分為連續(xù)變量與離散變量兩種。在一定區(qū)間內可以任意取值的變量叫連續(xù)變量，其數值是連續(xù)不斷的，相鄰兩個數值可作無限分割，即可取無限個數值。如:年齡、體重等變量。

9、離散變量

離散變量的各變量值之間都是以整數斷開的，如人數、工廠數、機器臺數等，都只能按整數計算。離散變量的數值只能用計數的方法取得。

10、定性變量

又名分類變量：觀測的個體只能歸屬于幾種互不相容類別中的一種時，一般是用非數字來表達其類別，這樣的觀測數據稱為定性變量?？梢岳斫獬煽梢苑诸悇e的變量，如學歷、性別、婚否等。

11、均值

即平均值，平均數是表示一組數據集中趨勢的量數，是指在一組數據中所有數據之和再除以這組數據的個數。

12、中位數

對于有限的數集，可以通過把所有觀察值高低排序后找出正中間的一個作為中位數。如果觀察值有偶數個，通常取最中間的兩個數值的平均數作為中位數。

13、缺失值

它指的是現(xiàn)有數據集中某個或某些屬性的值是不完全的。

14、缺失率

某屬性的缺失率=數據集中某屬性的缺失值個數/數據集總行數。

15、異常值

指一組測定值中與平均值的偏差超過兩倍標準差的測定值，與平均值的偏差超過三倍標準差的測定值，稱為高度異常的異常值。

16、方差

是在概率論和統(tǒng)計方差衡量隨機變量或一組數據時離散程度的度量。概率論中方差用來度量隨機變量和其數學期望（即均值）之間的偏離程度。統(tǒng)計中的方差（樣本方差）是每個樣本值與全體樣本值的平均數之差的平方值的平均數。在許多實際問題中，研究方差即偏離程度有著重要意義。方差是衡量源數據和期望值相差的度量值。

17、標準差

中文環(huán)境中又常稱均方差，是離均差平方的算術平均數的平方根，用σ表示。標準差是方差的算術平方根。標準差能反映一個數據集的離散程度。平均數相同的兩組數據，標準差未必相同。

18、皮爾森相關系數

皮爾森相關系數是用來反映兩個變量線性相關程度的統(tǒng)計量。相關系數用r表示，其中n為樣本量，分別為兩個變量的觀測值和均值。r描述的是兩個變量間線性相關強弱的程度。r的絕對值越大表明相關性越強。

19、相關系數

相關系數是最早由統(tǒng)計學家卡爾·皮爾遜設計的統(tǒng)計指標，是研究變量之間線性相關程度的量，一般用字母r表示。由于研究對象的不同，相關系數有多種定義方式，較為常用的是皮爾森相關系數。

20、特征值

特征值是線性代數中的一個重要概念。在數學、物理學、化學、計算機等領域有著廣泛的應用。設A是向量空間的一個線性變換，如果空間中某一非零向量通過A變換后所得到的向量和X僅差一個常數因子，即AX=kX，則稱k為A的特征值，X稱為A的屬于特征值k的特征向量或特征矢量。

下一篇:數據分析常用術語（下）上一篇:數據分析避坑指南——數據分析入門

Python交流群
635448130點擊加入群聊
UI設計交流群
579150876點擊加入群聊
Unity交流群
495609038點擊加入群聊
HTML5交流群
645591648點擊加入群聊

亚洲免费一级高潮_欧美极品白嫩视频在线_中国AV片在线播放_欧美亚洲日韩欧洲在线看

數據分析常用術語（上）

欄目導航

奇酷熱點

常見問題

奇酷技術交流中心

相關文章