最新整理logistic回归分析

发布时间:2024-11-12

第十六章 logistic回归分析

logistic回归为概率型非线性 回归模型,是研究分类观察 结果(y)与一些影响因素(x) 之间关系的一种多变量分析 方法大城小事 1

问题提出: 医学研究中常研究某因素存在条件下某结果是否 发生?以及之间的关系如何? 因素(X) 疾病结果(Y) x1,x2,x3…XK 发生 Y=1 不发生 Y=0 例:暴露因素 高血压史(x1):有 或无 高血脂史(x2): 有 或 无 吸烟(x3): 有或无大城小事

冠心病结果 有 或 无

研究问题可否用多元线性回归方法?

a b1x1 b2 x2 bm xm y1.多元线性回归方法要求 Y 的取值为计量 的连续性随机变量。 2.多元线性回归方程要求Y与X间关系为线 性关系。 不能回答“发生 3.多元线性回归结果 Y 与否” logistic回归方法补充多元线性回归的不足大城小事 3

Logistic回归方法该法研究是 当 y 取某值(如y=1)发生的概率(p)与 某暴露因素(x)的关系。

p( y 1/ x) f ( x),即p f ( x)

P(概率)的取值波动0~1范围。 基本原理:用一组观察数据拟合Logistic模型, 揭示若干个x与一个因变量取值的关系,反映y 对x的依存关系。大城小事 4

第一节 logistic回归 一、基本概念1.变量的取值 logistic回归要求应变量(Y)取值为分类变量 (两分类或多个分类) 1 Y 0 出现阳性结果 (发病、有效、死亡等) 出现阴性结果 (未发病、无效、存活等)

自变量(Xi)称为危险因素或暴露因素,可为连续变 量、等级变量、分类变量。 可有m个自变量X1, X2,… Xm大城小事 5

2.两值因变量的logistic回归模型方 程一个自变量与Y关系的回归模型 如:y:发生=1,未发生=0 x : 有=1, 无=0, 记为p(y=1/x)表示某暴露因素状态下, 结果y=1的概率(P)模型。 0 x

e P( y 1 / x) 0 x 1 e

1 p( y 1 / x) 1 exp[ ( 0 x)]大城小事 模型描述了应变量 p与x的关系 6

P概率 1 p( y 1) 1 1 exp[ ( 0 x)]

z 0 1 x0.5

Β为正值,x越 大,结果y=1发 生的可能性(p )越大。

-3

-2

-1

0

1

2

3

Z值

图16-1 Logistic回归函数的几何图形 大城小事

几个logistic回归模型方程

e p1 P( y 1/ x 1) 0 x 1 e

0 x

e P( y 0 / x 1) 1 1 p 1 0 x 1 e e p0 P( y 1/ x 0) 0 1 e 0 e P( y 0 / x 0) 1 1 p0 0 1 e大城小事

0 x

0

logistic回归模型方程的线性表达对logistic回归模型的概率(p)做logit变 换,

p log it ( p) ln( ) 1 p

方程如下:线形 关系

y log it ( p) 0 1 x1

Y~(-∞至+∞)

截距(常数)大城小事

回归系数9

在有多个危险因素(Xi)时多个变量的logistic回归模型方程的线性表达: 公式16-2

P logit(p) ln = 0 1 X 1 2 X 2 m X m 1 P 或

p( y 1/ x1 , x2 xk ) 大城小事

1 1 e ( 0 1 xk .... k xk )10

2.模型中参数的意义 P ln = 0 1 X 1 1 P Β0(常数项):暴露因素Xi=0时,个体发病 概率与不发病概率之比的自然对数比值。

P( y 1 / x 0) ln 1 P( y 0 / x 0) = 0 大城小事 11

Xi=1与Xi=0相比,发生某结果(如发病)优势 比的对数值。

i

的含义:某危险因素,暴露水平变化时,即

P 1 /(1 P 1) ln OR ln P0 /(1 P0 ) log itP 1 log itP 0

P1(y=1/x=1)的概率 P0(y=1/x=0)的概率

( 0 1 x1 ) ( 0 x0 ) 1 x1

OR e

P odds1 1 /(1 P 1) OR P0 /(1 P0 ) odds0大城小事 12

Y 发病=1 不发病=0

危险因素 x= 1 x= 0 30(a) 10( b) 70(c) 90(d) a+c b+d 危险因素 x= 1 x= 0 p1 p0 1-p1 1-p0

Y 发病=1 不发病=0

a p1 a c

有暴露因素人群中发病的比例大城小事

多元回归模型的的

i

概念

P logit(p) ln = 0 1 X 1 m X m 1 P

i 反映了在其他变量固定后,X=1与x=0相比发生Y事件的对数优势比。 回归系数β与OR X与Y的关联 β=0,OR=1, 无关 β>1,OR>1 , 有关,危险因素 β<1,OR<1, 有关,保护因子 i

大城小事 。 事件发生率很小,OR≈RR

二、logistic回归模型的参数估计1. 模型中的参数(βi)估计,

P ln = 0 1 X 1 2 X 2 m X m 1 P

通常用最大似然函数 (maximum likelihood estimate, MLE)估计β, 由统计软件包完成。(讲义259页)大城小事 15

OR e

如X=1,0两分类,则OR的1-α可信区间 估计公式

e

(b j u / 2 Sb j )大城小事

Sb j

为回归系数 的标准误

(公式16-10)

最新整理logistic回归分析.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219