Linear regression
輸出變數:連續(ex : 實數)
回歸係數意義:
(以x-y座標,二維回歸分析為例)
x每增加一個單位,y會增加多少
舉例:
身高-體重
身高每增加一公分,預期體重就會增加多少
Logistic regression
輸出變數:離散(ex : 是/否、有/無、男/女)
回歸係數意義:
(以x-y座標,二維回歸分析為例)
x每增加一個單位,y有發生事件(event)相對於沒有發生事件的機率會增加幾倍(即勝算比會增加多少)
(勝算比:x增加一單位,y事件發生相對於沒有事件發生的比值)
舉例:
頭髮平均長度-性別
假設event為"是女生"
頭髮平均長度每增加一公分,(是女生)/(是男生)增加多少
圖取自:http://www.saedsayad.com/logistic_regression.htm
對於為什麼兩者圖形會有這樣的差別
我的理解是,因為logistic的輸出是離散的,因此一旦超過了某個臨界值後該輸出屬於某一類的機率基本上就固定了
就以頭髮為例,若頭髮長度介於耳朵與肩膀之間是男生還是女生比較難分,但這個區間非常的小,一旦頭髮再長一點或是再短一點,是男生或女生的機率就會大幅的增加,一旦短或長到一個程度(像是光頭或是及腰長髮),是男生或女生的機率基本上就會趨近於1了
參考資料:
http://dasanlin888.pixnet.net/blog/post/34468457-logistic-regression%E4%BB%8B%E7%B4%B9---%E6%99%A8%E6%99%B0%E7%B5%B1%E8%A8%88%E6%9E%97%E6%98%9F%E5%B8%86%E9%A1%A7%E5%95%8F%E6%95%B4
留言列表