四个脑卒中量表信度与效度的对比研究
中华物理医学与康复杂志 1999年第3期第21卷 论著
作者:王新 王拥军 刘峥 曲镭
单位:王新,曲镭 050071 石家庄,河北省人民医院康复中心;王拥军,刘峥 首都医科大学宣武医院神经内科
关键词:脑卒中;量表;信度;效度
【摘 要】 目的 通过纵向对比,研究比较四个具代表性的脑卒中量表在我国使用的信度和效度。方法 对100例连续住院急性脑卒中患者进行脑卒中量表的评定。信度检验用kappa相关。内容一致性检验用Cronbach α相关。结构效度用Spearman相关。预测效度应用协方差分析和 logistic回归。结果 脑卒中患者神经功能缺损评分标准(以下简称“评分标准”)最省时,脑卒中病损评估记录(stroke impairment assessment set, SIAS)最费时。四个量表均有较好的信度、内容一致性、结构效度和预测效度。只有“共济失调”评定者间信度一致性差(k=-0.04)。美国国立卫生研究院卒中量表(the NIH stroke scale,NIHSS) 的预测能力最充分,是唯一所含项目均有预测值的量表。NIHSS评定的神经功能缺损范围最大。结论 在多中心的临床研究中,推荐修订后使用NIHSS。
【中图号】 R743.5
Comparative study in validity and reliability
of four stroke scales
WANG Xin, WANG Yongjun, LIU Zheng, et al.
Department of Rehabilitation, Hebei Province People's Hospital, Shijiazhuang 050071
【Abstract】 Objective The validity and reliability of the four strokes in our country which are the most representative in the world were determined by longitudinal comparative study.Methods 100 consecutive inpatients with acute stroke were included.Interrater and intrarater reliability was analyzed by using Kappa correlation.Internal consistency was expressed with Cronbach's α coefficient. Convergent validity and concurrent validity was determined by Spearman rank correlation coefficients. Predicative validity was assessed by analysis of covariance and logistic regression.Results Completion of Chinese Scale of Clinical Neurological Deficit of Stroke Patients(abbr. Chinese Scale) was the shortest, and that of Stroke Impairment Assessment Set(SIAS) was the longest.All the four stroke scale had good reliability, internal consistency, construction validity and predicative validity. Interrater reliability of only one item in NIHSS had poor agreement (limb ataxia k=-0.04). NIHSS score best predicted outcome and little additional information was added by the others. NIHSS was only scale that its all items have prognostic value. The range of neurological defect as NIHSS evaluate was the widest.Conclusion In future multicentral clinical study, NIHSS is recommended after revision.
【Key words】 Stroke Scale Reliability Validity
脑卒中评定量表在监测病情变化、判断疗效、预测结局以及大样本的临床试验研究中起着重要的作用[1]。但是,目前国际上还没有一个公认的可用于多中心临床研究的脑卒中评定量表[2],影响了临床科研资料的可比性。本文选择四个有代表性的脑卒中评定量表与已广泛承认的残疾量表(barthel index, BI)[3]、残障量表(oxford handicap scale, OHS)[4]结合做纵向对比研究,了解它们的信度和效度,为建立标准统一的脑卒中神经功能缺损评定量表提供依据。
1 对 象 和 方 法
1.1 研究对象
1997年9月~1998年2月间连续住院、有明确病灶的急性脑卒中患者,除外入院时昏迷、痴呆者共100例(男63例,女37例);平均年龄63岁(36~85岁);缺血性卒中82例,出血性卒中18例;病灶部位:双侧27%,右侧37%,左侧31%,脑桥小脑5%。入院时距发病平均为41 h(2~70 h),平均住院25 d(10~44 d)。最后随访距发病时间平均68 d(45~98 d)。合并高血压者占66%,合并心脏病者占39%,合并糖尿病者占17%。发病前生活完全自理。入院后神经科常规检查和治疗。
1.2 量表选择
1.2.1 NIHSS是美国应用最广泛的脑卒中量表。本文使用的是包含13个项目的修订版[5]。
1.2.2 UNSS(unified form for neurological stroke scale)[6] 由斯堪的那维亚卒中量表(scandinavian stroke scale, SSS)和大脑中动脉神经量表(middle cerebral artery neurological scale, MCANS)总和而成,包含12个评定项目,是少有的几个含有肌张力评定项目的量表之一。
1.2.3 SIAS[7]是日本学者设计的包括22个评定项目的脑卒中量表。它不但包含认知功能评定,还包括“健侧”的评定。
1.2.4 “评分标准”[8] 是我国第四次脑血管病学术会议通过的脑卒中患者临床神经功能缺损评分标准,由SSS修订而来,包含8个评定项目,对各项目的评分重新进行了加权。
1.3 研究方法
入院24 h内进行四个脑卒中量表的初次评定,连续5 d,两次评定间隔16~24 h,第5 d加评 BI。出院前24 h和发病45 d至3个月间进行出院评定和随访评定,评定内容包括四个脑卒中量表、BI和OHS。
随机选取40例随机分两组,一组由同一检查者于第1次记录后2~3 h进行再次评定 ,连续5 d。另一组由另一名神经科医师于第1次记录后2~3 h进行。两名评定者在本研究开始前共同评定患者,统一评定步骤和方法。
统计在 SPSS for windows 6.0软件包上进行。
2 结 果
100例患者住院期间死亡2例,复发3例;随访期间死亡3例,复发1例,6例失访。通过相关分析发现本组患者的一般资料中只有年龄对随访结局的影响有统计学意义。
2.1 评定时间
评分标准需用的时间最短,平均4.6 min;NIHSS和UNSS为6.5 min;SIAS所需使用时间最长,平均12 min,20%的患者需要时间超过14 min。
2.2 信度(表1~4)
表1 NIHSS的信度(Kappa值)
项 目
重测信度 评定者间信度
意识水平 0.826**
0.599**
意识水平提问 0.788** 0.725**
意识水平指令 0.748** 0.716**
眼外斜 0.831** 0.843**
视野 0.756** 0.673**
面瘫 0.772** 0.715**
上肢运动 0.912** 0.875**
下肢运动 0.856** 0.855**
共济失调 0.284(p=0.004)** -0.04(p=0.68)
感觉 0.638** 0.612**
忽视症 0.553** 0.316(p=0.001)**
构音障碍 0.788** 0.771**
失语 0.834** 0.797**
总分 0.895** 0.858**
注:**P<0.01
表2 UNSS的信度(Kappa值)
项 目 重测信度 评定者间信度
意识水平 0.857** 0.555**
语言 0.800** 0.654**
眼运动 0.821** 0.817**
面瘫 0.840** 0.764**
上肢肌力 0.946** 0.913**
手肌力 0.954** 0.835**
下肢肌力 0.920** 0.811**
足背曲 0.841** 0.804**
上肢张力 0.889** 0.862**
下肢张力 0.876** 0.769**
定向力 0.852** 0.863**
步态 0.890** 0.870**
总分 0.904** 0.844**
注:** P<0.01
表3 评分标准的信度(Kappa值)
项 目 重测信度 评定者间信度
意识 0.871** 0.673**
水平凝视功能 0.816** 0.743**
面瘫 0.825** 0.758**
语言 0.869** 0.826**
上肢肌力 0.943** 0.871**
手肌力 0.979** 0.896**
下肢肌力 0.931** 0.848**
步行能力 0.931** 0.745**
总分 0.927** 0.841**
注:** P<0.01
表4 SIAS的信度(Kappa值)
项 目 重测信度 评定者间信度
膝-口试验 0.901**
0.824**
屈髋 0.856** 0.765**
伸膝 0.872** 0.782**
手功能 0.918** 0.790**
踝关节检查 0.834** 0.864**
上肢深腱反射 0.696** 0.686**
下肢深腱反射 0.695** 0.582**
上肢肌张力 0.891** 0.689**
下肢肌张力 0.877** 0.683**
手掌轻触觉 0.723** 0.697**
足底轻触觉 0.594** 0.651**
拇指或食指位置觉 0.794** 0.588**
拇趾位置觉 0.756** 0.641**
上肢关节活动度 !
!
下肢关节活动度 1.00 0.874**
疼痛 0.885** 0.890**
体位 0.721** 0.625**
腹肌检查 0.906** 0.833**
视空间缺失 0.684** 0.689**
言语 0.921** 0.743**
健侧股四头肌肌力 0.807**
!
健手握力 0.836**
0.751**
总分 0.874** 0.824**
注:** P<0.01;! 完全一致
2.2.1 重测信度:四个量表所有项目的k值均有统计学意义。评分标准总分重测信度最好。
2.2.2 评定者间信度:NIHSS的“共济失调”项目一致性差,其它项目k值均有统计学意义。总分评定者间信度最好的是NIHSS。
2.2.3 内容一致性:NIHSS、SIAS、UNSS和评分标准的Cronbach α值为0.826、0.932、0.884和0.853。
2.3 效度
2.3.1 共同效度:四个脑卒中量表间相关性很好,r值0.859~0.980;其中评分标准与UNSS的r值最高,这与它们同源于SSS一致。与BI的相关性很好,r值 0.828~0.877。由于评分标准和UNSS评定内容包含残疾项目-步态[9],去除步态评分后再次做相关分析发现:评分标准和 UNSS与NIHSS r值升高为0.928和0.895;与SIAS和BI降低为0.879、0.900和0.821、0.810(均取绝对值)。这一方面说明评分标准和UNSS去除步态项目后仍有很好的结构效度;另一方面说明SIAS也包含残疾的内容。
2.3.2 共变效度:四个量表间存在共变效度,r值0.48~0.65,均有统计学意义。
2.3.3 预测效度:四个脑卒中量表第5 d评分与出院、随访结局以年龄做协变量做协方差分析(表5)发现:四个量表均能预测整组患者的结局,但不能对某个个体进行预测。
表5 用入院第5 d四个量表的总分与出院、随访结局比较量表的预测值
NIHSS 评分标准 UNSS SIAS
均数 范围 均数 范围 均数 范围 均数 范围
出院
BI(100~95) 2.3
(1~4)**
2.1
(0~6)**
1.8
(0~4)**
71.3
(55~76)**
BI(90~0) 7.8 (1~23)** 16.1 (0~40)** 11.4 (0~28)** 49.6 (21~76)**
死亡 22.0 (15~29)** 30.5 (18~43)** 22.5 (13~32)** 22.0 (13~31)**
随访
BI(100~95) 3.0 (1~7)** 4.5 (0~12)** 3.4(0~8)** 67.3 (51~76)**
BI(90~0) 8.8 (1~23)** 18.3 (2~40)** 13.0 (1~28)** 46.1 (21~75)**
死亡 15.4 (6~29)** 28.2 (18~43)** 18.4 (10~32)** 32.4 (13~52)**
注:以出院、随访结局(BI值及死亡)分组,将各组患者的四个量表第5 d总分以年龄为协变量做方差分析。** P<0.01
logistic回归分析四个量表第5 d总分对死亡结局的预测性:四个量表均进入方程,总预测准确率为95.7%。用logistic回归分别分析四个量表第5 d总分对死亡结局的预测性:NIHSS的预测准确率最好(95.7%),评分标准、UNSS和SIAS的预测准确率为94.7%,说明NIHSS对死亡预测能力最充分。
将四个脑卒中量表第5 d总分共同与随访结局(因变量)做logistic逐步回归发现:入选自变量界限值取0.5时,四个量表均归入方程,总预测准确率为81.18%;入选自变量界限值取0.1时,仅评分标准归入方程,总预测准确率降为77.65%。这说明评分标准对随访结局的预测性最好,但补充另3个量表中有预测性的内容可提高它的预测效度。
四个脑卒中量表第5 d各项目评分与出院、随访结局做 logistic逐步回归发现:NIHSS和 UNSS的意识评定未归入方程,考虑可能为病例选择的影响。评分标准的面瘫、UNSS的足背曲、SIAS的手掌触觉和上下肢关节活动度也未能归入方程,考虑它们对结局无预测值。
2.3.4 敏感性(表6):NIHSS随访时最好积分患者的百分率最低(22%),说明其总的敏感性最好,但包含较多不敏感项目(入院时最大评分的百分率超过50%的项目有7项);SIAS的敏感性最差。NIHSS在入院5d内的不可查项目最少;SIAS不可查项目最多。
表6 四个脑卒中量表敏感性比较
NIHSS 评分标准 UNSSSIAS
1(项) 7 3 4 9
2(%) 1.12(6500次) 2.25(4000次) 1.5(6000次) 5.16(11000次)
3(%) 22 26 32 24*
注:1入院时为最大评分的百分率>50的项目; 2入院5 d内不可查项次的百分率;3随访时最好积分患者的百分率,该值越小说明量表评定的神经功能缺损范围越大;*健手握力稍差总分记75分的患者也算满分。3 讨 论
经过长期临床经验,专家们发现好的脑卒中评定量表应满足以下标准[10]:①包含广泛领域的神经功能缺损评定项目,包含的项目对结局有预测值;②量表的重测信度和评定者间信度佳,内部一致性好;③应具有结构效度(共同效度、共变效度)、预测效度和内容效度;④量表应该敏感,评分应覆盖神经功能缺损的整个范围;⑤应使用方便,易于掌握(评定时间应少于14 min)。这存在着矛盾:为了可信,应只包含容易评分,定义明确的项目;但为了敏感,应包含体现各种脑卒中类型的评定项目,其中某些肯定是较困难,甚至是不可能评分的。所以,在制订统一脑卒中评定量表时应综合分析,全面考虑。
本研究课题通过首次对来自美国、欧洲、日本和我国的四个脑卒中量表的纵向对比研究,得出以下结论:
①评分标准是最省时、信度效度较好的量表。但存在一定的缺陷:步态是残疾评定项目,在出血性卒中急性期使用困难;对结局的预测能力不够全面,需要补充;可能受加权影响,面瘫项目没有预测值;所评定的神经功能缺损范围小于NIHSS和SIAS;不适于椎基底动脉系卒中使用。
②UNSS也是一个省时方便、信度较好的脑卒中量表,具有良好的结构效度。但它的内容不及NIHSS全面,预测效度不及评分标准;包含残疾评定项目-步态;足背曲项目没有预测值;所评定的神经功能缺损范围最小。但在一般临床用于监测患者的病情变化时不失为一个有效的量表。
③SIAS的信度、结构效度较好,但三个项目没有预测值;所评定的神经功能缺损范围比NIHSS小;包含残疾评定,费时较长,不利于急性期重复使用,是一个适用于脑卒中恢复期的量表。由于其Cronbach α值过高,应注意研究去除内容重复的项目。
④ NIHSS是一个省时方便、可信有效且内容较全面的综合性脑卒中量表,所评定的神经功能缺损范围最大;所有项目均有预测值。它的缺点是急性期不敏感项目较多,但这是综合性脑卒中量表不可避免的缺陷[11]。另外,包含一个评定者间信度差的项目-共济失调,但这是四个量表中唯一一项评定椎基底动脉系卒中较特异性的项目,应保留并修订以利于使用。
总之,在今后的多中心的临床研究中,我们建议修订后使用NIHSS。
参 考 文 献
1 Olhaberriague LD,Litvan I,Mitsias P,et al.A reappraisal of reliability and validity studies in stroke. Stroke,1996,27:2331-2336.
2 Van Gijn J.Measurement of outcome in stroke prevention trials. Cerebrovasc Dis,1992,2(suppl 1):23-34.
3 Collin C.Reliability of the Barthel ADL Index. Int J Rehabil Res, 1987, 10:353-356.
4 DeHaan R,Limbury M, Bossuyt P, et al. The clinical meaning of Rankin ‘ Handicap’grades after stroke. Stroke, 1995, 26:2027-2030.
5 Brott T,Adams HP, Olinger CP, et al. Measurements of acute cerebral infarction: a clinical examination scale. Stroke,1989,20:864-870.
6 Orgogozo JM,Asplund K, Boysen G. A unified form for neurological scoring of hemispheric stroke with motor impairment (letter).Stroke,1992, 23:1678-1679.
7 道免和久,才藤荣一,千野直一,他. 脑卒中患者机能评价法探讨(2)-Stroke Impairment Assessment Set ( SIAS). リハ 医学, 1990,27:547-548.
8 中华医学会神经病学分会. 脑卒中患者临床神经功能缺损程度评分标准.中华神经科杂志,1996,29:381-383.
9 De Haan R, Horn J, Limburg M, et al. A comparison of five strokes scale with measures of disability, handicap, and quality of life. Stroke, 1993, 24: 1178-1181.
10 Hantson L, DeWeerdt W, DeKeyser J, et al.The european stroke Scale. Stroke, 1994, 25: 2215-2219.
11 Bogousslavsky J, Hennerici MG. Stroke scores and scales. Cerebrovasc Dis, 1992, 2: 239-347.
页:
[1]