量化质量管理研究
摘要:
相对于制造业,民航维修业在对安全、品质高要求的同时还很强调运营时效,同时又具有管理分散、受环境和运行条件影响大、分工细且深度不同、专业性强且对人依赖度大等不利因素。本文以质量管理的角度,从设计不同运行方式到持续评价各个阶段,借鉴飞机工程管理以及风险管理的思路和方法,建立多维度可量化的质量管理体系,以提高质量管理的水平和整个体系运行的品质。
随着民航业的快速发展,民航维修业的业务量也越来越大,为了保证事故发生率逐年降低,对维修管理的要求也将越来越高。而随着行业和公司业务的快速发展,维修工作的覆盖面越来越宽,操作细节要求越来越高。同时维修专业还有分类多、工作分工跨度大,且专业性强等行业特点。那么如何才能将风险降至最低,如何才能发现体系的运行偏差,如何才能评价体系运行状态,这些都是现在民航各家维修单位都要面对的一项重要的系统工作。
本文将以春秋航空维修工程部正在探索推行的实际做法为例,介绍从设计源头开始就立足将风险管理融入质量管理并且借鉴飞机工程管理思路建立量化分析模型,形成整套闭环体系的做法,抛砖引玉,供同行们讨论。
一、 管理基础——系统工作分析和系统描述
如何将维修工作中各类接口和风险找出来,并加以分析和控制呢?首先从初始系统工作分析和系统描述入手,理清我们有哪些“活”要干、谁来干。这项工作的目的不仅要分析出各岗位需要完成哪些“活”——任务,还要分析和描述出这些任务间的相互关系、信息流转、接口对接以及这些任务的源头要求。通过源头和任务最终结果的比对、接口信息的匹配,可以发现现有任务与源头的偏离点,找到没有明确职责和岗位的工作任务。系统描述的结果是工作都有程序可依,真正做到文实相符。有了以任务和接口为基础的系统描述,开展系统工作分析就可以有的放矢,可以针对规章符合性、工作任务环境条件、任务所需输入、任务结果输出、任务触发条件、人员岗位资质等进行系统化分析。分析的结果用于校正和更新系统描述,使得系统描述始终保持文实相符。
(一)系统工作分析的核心——“任务”,以任务定职责
考虑到维修体系工作复杂性,需要同时满足CCAR-121部、145部等规章对维修管理和实施的要求,流程完整性要求和操作细节要求都十分重要,但针对不同工作侧重又有所不同。如:对于工程管理类工作,主要关注流程完整性和操作原则,单个案例的操作符合原则即可,但不能出现信息断点;而一线维修和接送飞机勤务工作则对于操作细节要求比较高,一线员工原则上应该按照操作细节要求精确的执行。
为了可以针对不同侧重点,可采取分层级分析的方法:按照职责不同将系统工作分析划分为两个层级:将流线和操作分开进行分析(就像飞机维修中,排故工作一样:故障隔离判断是按照《故障隔离手册(TSM/FIM)》中的排故步骤顺序以流线方式进行,而每一步具体的操作细节又是按照《飞机维修手册(AMM)》相关要求进行)。
具体划分如下:
1. 流线层级:由质量部门统一负责,侧重流线设计,界定职责,解决做什么以及信息流转和接口,信息不中断;
2. 操作层级:由各业务部门负责各自操作的部分,侧重解决如何操作,以及操作中如何避免差错,降低风险。
由于上述两个层级在分析时是分开进行的,而最终又要能在《工作程序手册》或者《岗位说明书》一类的文件体系中集中展现,为了便于这样的集中首先需要一个核心来关联上述两个层级,同时还要改变原先以行政部门为核心的工作程序体系,取而代之的是以任务为核心、产品为接口、突出流线的工作程序体系。工作流程由任务组成,任务的先后执行顺序确定了流线顺序。而任务之间则以产品作为接口,即前一任务的输出产品作为后一任务的输入产品,并根据不同情况下的不同输出产品作为后续流线流向的区分。而任务的边界则以不跨岗位或者一个工作者合理的工作能力范围为界。如果把一个流程想象成飞机系统的一张系统工作原理图,任务就像各个部件,根据上游输出的不同情况完成各自的功能,最终完成整个系统的工作。就像下面两张图所示,左侧的是飞机的系统原理图,不同的部件间通过导线相连,导线传递的是上游部件的输出信号,部件根据这个信号完成既定的工作逻辑,输出信号,继续往下传递,最终完成整个系统的工作;右侧则是按照这个原理建立的流程分析的流程图,其中黄色的表示任务,类似左侧图中的部件,蓝色表示产品,类似左侧图中的导线上传递的电位信号。每个任务根据上游的输出,即本任务的输入产品确定执行条件,并完成具体的操作,再将产出的输出产品输送给下游任务,最终一直到输出到存档,代表一个流程的结束。
为了保证系统工作分析不出偏差,分析的源头以规章条目为基础,结合公司实际运行操作以及责任划分,进行具体分析。通过对规章条目逐条分解,找到规章要求整个维修体系做什么,再根据公司已有的组织架构进行划分职责,确定不同部门做什么,再将多条规章条目的类似分析进行合并,汇总到一个流程中,并确定具体需要哪些任务,每项任务都要确定责任岗位。以下图为例,规章条目CCAR145.33的要求通过分析、归类、组包最终确定任务。
(三)任务的接口——“产品”,以产品查断链
分析出任务后,如何将任务关联起来呢?接下来就需要结合各任务在实际工作的流程中所处的位置,有针对性地分析其输入和输出产品,并通过产品的链接来分析是否有输入产品没有来源或者输出产品没有后续承接任务或没有归档。特别要注意输入产品没有来源的情况,这说明本项任务执行所需条件缺失,那么在执行时将无法按照设计要求进行操作,就存在先天不足,为日后运行埋下隐患。因此,针对这样的产品断链,需要进行再次分析和追溯,确定该产品由哪个任务产生,哪个岗位负责。任务流线中所有产品经过此类分析后,可最大程度地减少信息断链的可能。以我公司实际尝试为例,经过两轮分析,建立的任务数从原先初步描述得出的1100余条任务增加到1532条,这些新增的任务就是为了产出或者承接那些断链的产品,而增加的实际工作。
(四)以任务为核心将源头要求、责任人、执行细节、培训要点关联起来
有了任务和负责的岗位,并且也清晰的获得了任务来源,则任务执行中的规章要求就得以明确,并可建立对应关系。这样规章符合性就可与实际执行的工作程序相结合,一方面通过流线接口,另一方面通过操作原则来保证工作程序从结构上符合规章的要求。同时,根据任务的具体操作可建立具体体现操作细节的操作指南。由此再进行岗位培训的分析,可提炼出对应的岗位培训提纲。
经过上述的系统分析,就可建立起以“任务”为核心、以“产品”为接口的系统描述体系(如上图)。该体系可以简述成任务的流线,每一个任务包含要素:何岗位,获得何产品,做何事,输出何产品。同时围绕任务,可将责任岗位、以及源头要求、执行细节、岗位培训要求、甚至下一步将阐述的风险控制措施、各类检查/审核要点全部关联起来,作为质量管理的基础。
二、 管理前提——量化质量管理的初始建立
在完成系统工作分析和系统描述后,得到了一张维修体系运行的总体蓝图,图中有各类任务作为流线的基础,它们通过产品关联起来,组成了整个维修体系运行的基础。“任务”既然是核心,如何将其尽量全面地展现和描述呢?“量化”将是最客观的方式。接下来将围绕“任务”,根据两个层级的分工建立量化分析模型,确定任务需要关注的重要方面找到风险以及可能存在的危险源,并加以评估和控制。
第一步,确定重要任务。
为了便于对整个体系运行的持续评价,质量部门希望定位重要的任务,这样利于突出重点设计审核和监督检查以及风险分析。因此,可借鉴MSG-3逻辑建立任务重要性的评估,从任务错误执行的后果以及任务设置原因两个方面进行评价,得到重要任务。
任务执行错误的后果:以无法进行后续工作且此情况可以被记录为最低风险,而执行错误后续工作不能发现,且影响适航性、运行中不被发现为最大风险,将任务执行后果分为五个等级:
|
等级 |
描述 |
|
1 |
本任务不执行或错误下一步无法执行,且此情况可被记录 |
|
2 |
本任务不执行或错误下一步无法执行,不被记录和报告 |
|
3 |
本任务错误不能被后续步骤发现,但后果仅影响效率和质量 |
|
4 |
本任务错误不能被后续步骤发现,但后果影响适航性,运行中可发现 |
|
5 |
本任务错误不能被后续步骤发现,但后果影响适航性,运行中不被发现 |
任务设置原因:以无具体操作类任务为最低风险,而用于防差错且为评估类任务为主为最大风险,将设置原因分为四个等级:
|
等级 |
描述 |
|
1 |
仅为符合性操作或流程性操作,任务以传递信息为主,操作较少 |
|
2 |
为后续步骤必备的前提工作准备,任务以操作为主,评估判断较少 |
|
3 |
为后续步骤必备的前提工作准备,任务以评估判断为主 |
|
4 |
为减少前步骤错误,任务以评估判断为主 |
借鉴风险等级矩阵的评估方法,参照下表,确定任务等级。
|
后果 设置原因 |
1 |
2 |
3 |
4 |
5 |
|
1 |
1 |
2 |
3 |
4 |
4 |
|
2 |
1 |
2 |
3 |
4 |
4 |
|
3 |
2 |
3 |
3 |
4 |
5 |
|
4 |
2 |
3 |
4 |
5 |
5 |
任务等级如下, 质量部门将重点关注等级在3级及以上的任务,而5级任务则是重中之重:
|
任务等级 |
描述 |
|
1级任务 |
简单操作类任务,未完成后果很小,且可质量可探测 |
|
2级任务 |
简单操作任务,未完成后果很小,但质量不可探测或复杂任务但未完成可探测 |
|
3级任务 |
未完成后果不大,但结果隐性 |
|
4级任务 |
未完成可能引起适航性后果 |
|
5级任务 |
复杂类任务,未完成会引起适航性后果 |
第二步,确定重要维度。
业务部门关心任务的执行风险,以及如何控制风险,防范维修差错。可由业务部门受聘风险专家和质量部门共同对任务的执行进行分析,从下图的六个维度进行量化评估。具体参见如下评级原则,评分总原则以数值低为风险最低、数值高则为风险最高:
1. 启动,衡量任务是否可及时启动:
|
分值 |
描述 |
|
1 |
事件触发,且被动接收信息启动 |
|
2 |
事件触发,且主动获取后启动 |
|
3 |
由责任岗位自行启动,且为日常工作 |
|
4 |
由责任岗位自行启动,频率低于月度(每年执行不足11次) |
2. 执行,衡量任务执行的复杂度:
|
分值 |
描述 |
|
1 |
程序步骤或指南要求少于三项,并方便记忆 |
|
2 |
操作基于系统,且评估判断输出结果少于两项含 |
|
3 |
操作基于系统,且评估判断输出结果高于两项 |
|
4 |
独立操作,但可方便访问系统,且评估判断输出结果少于两项含 |
|
5 |
独立操作,但可方便访问系统,且评估判断输出结果高于两项 |
|
6 |
外场操作,工作中不便查手册,且评估判断输出结果少于两项含 |
|
7 |
外场操作,工作中不便查手册,且评估判断输出结果高于两项 |
3. 输出/输出产品,衡量任务接口的可靠度:
|
分值 |
描述 |
|
1 |
基于软件系统 |
|
2 |
基于表单工卡,记录全存档 |
|
3 |
基于表单工卡,记录不留存 |
|
4 |
其他方式流转的产品 |
4. 操作技能,衡量任务对技能的特殊要求:
|
分值 |
描述 |
|
1 |
仅需工作程序培训 |
|
2 |
责任岗位的主要任务 |
|
3 |
需专项技能培训 |
5. 硬件,衡量任务对硬件的依赖:
|
分值 |
描述 |
|
1 |
无需硬件设备 |
|
2 |
仅需要一般硬件设备,任务完成对硬件依赖不大 |
|
3 |
必须硬件设备,但任务完成并不主要依赖硬件 |
|
4 |
必须硬件设备,并且硬件是该任务的主要完成保障 |
6. 环境,衡量任务对环境的依赖:
|
分值 |
描述 |
|
1 |
对环境无要求 |
|
2 |
改善环境能提高任务完成的效率或质量 |
|
3 |
任务有明确的环境要求依据 |
针对得分高的维度进行风险分析,“启动”从启动遗忘、启动不及时入手分析;“执行”从技能、工作复杂入手分析;“输出产品”从接口入手分析;“操作技能”从人员资质、培训要点入手分析;“硬件”从硬件可靠使用入手分析;“环境”从环境可控入手分析。
第三步,补充风险分析。
上述步骤的分析完全以任务为出发点进行,存在分析片面的缺陷:虽然任务不涉及,但具体执行中由于客观原因导致执行超出任务界定范围。为了做到减少遗漏,特进行本步骤:以事件为基础的分析。通过风险专家的行业工作经验,以及行业内历史上的典型不安全事件,由事件分析入手,得出可能存在的风险,并分析其危险源,并将适用我公司运行的危险源与可能涉及的任务关联,得到行业风险库,作为第二步任务分析风险的补充。
第四步,找危险源。
综合第二、第三两步分析所得的风险,由风险专家分析其对应的危险源。并对这些危险源进行专家评分,确定风险等级。(此处分析方法同风险管理中危险源的分析和评级,本文不再赘述)。最终根据风险等级视情建立风险控制措施。
第五步,建立风险控制措施。
防控风险的核心就是风险控制措施。措施是否合理、是否具有较高的防控水平是制定风险控制措施的主要考虑方向。最高效的控制措施是固化在系统或硬件里的流程或操作细节,这样的措施可以避免人为因素,可以广泛地正确执行;次之就是将控制措施固化在流程表单或者工卡等和操作直接相关的文件上,此类措施只要按照文件要求执行就可防住风险,但不能防住人为因素中疏忽或者不按手册施工等因素导致的后果;再低一等就要让风控措施成为操作者的技能,此类措施通过培训来落实;等等。总之,风险控制措施按照对人为因素的有效控制依次递减的方法逐渐降低可靠性。通过上述分析,可以将风险控制措施分为以下七类:
1:系统逻辑和软件流程。
2:表单,工卡等操作文件。
3:初始培训或特殊复训要求或特殊技能要求。
4:其他任务。
5:流程规定。
6:通过控制环境或者硬件。
7:施工风险提示。
将危险源及其风险措施都与对应的任务建立关联。这样可以保持控制措施可持续被任务引用,保证其在手册层面持续有效,同时在其他以任务和出发点的分析、评估、检查时都可以引用。
第六步,写手册。
根据上述系统工作分析得出的任务流线,以及源头文件要求和初始风险分析得到的各类风险控制措施,由质量部门组织编写工作程序手册,将具体措施的执行要求固化在任务对应的规定中;对于有具体操作细节的,则编入操作指南中。
通过上述步骤,具备量化基础的质量体系就建立好了,当然评估维度的等级划分可随着工作侧重不同进行调整。后续在运行中,将通过各类偏差来分析根原因,不断修正设计和实际运行的偏差,反复迭代,最终达到安全、高效的运行基础。
以我公司的实际工作为例,总计建立流程86个,任务1827个,其中5级任务46个、4级任务178个、3级369个其余为2级和1级。任务对应2095个培训要点包含在511个培训提纲内。总体涉及937条风险,1821条风险控制措施,分类如下:
|
控制措施类别 |
数量(条) |
|
系统逻辑和软件流程 |
102 |
|
表单,工卡等操作文件 |
35 |
|
初始培训或特殊复训要求或特殊技能要求 |
176 |
|
其他任务 |
223 |
|
流程规定 |
1001 |
|
通过控制环境或硬件 |
110 |
|
施工风险提示 |
174 |
三、 管理手段——量化质量管理的持续评价
经过各维度量化分析后,建立了初始的程序体系,各类风险控制措施和操作原则如何在实际运行中不断提高改进呢?这就需要质量建立全面评价方法,持续对系统进行分析、评价、调整。做法同样可以借鉴飞机维修方案的设计理念,对于重要系统设立检查要求以及检查间隔;在运行中,通过下发工作单卡完成对该系统的重复检查,来发现存在的问题。
首先,还是从任务分析入手,经过上述任务分析,找到了重要任务,以及各任务的重要维度,并结合风险控制措施、源头规章的要求、操作指南的操作细节等方面,评估需要建立的检查要点。侧重流线执行方面的纳入年度审核要点;而侧重步骤执行效果的则纳入监督检查要点,并根据任务的重要性和执行量,确定检查频次或取样量。
以我公司评估为例,当前有效的1827项任务中1207个任务需要审核,共计2443项审核要点。而目前共有252个任务需要监督检查,检查要点共计823个。实际运行中还可根据量化评级各维度的重新评估和修正而进行调整,来扩大或收紧检查范围。
第二,检查要点的制定和第二部分任务的各维度分析相关,在各自维度中评分较高,也就是具有较高风险时,则检查要点也从这个方面入手。
第三,对于风险控制措施也可建立专门的检查要点,来检查措施是否有效。比如,控制措施是第5类流程规定,可通过询问或者问卷来检查操作者是否熟练掌握规定要求,以及规定的来源为了防控何种风险;如果控制措施是第3类培训,可通过对多个参训过的人员抽样检查来评估培训的有效性。
有了上述详细的、和源头设计紧密相关的检查要点,每次检查的全面性就得到了保障,之后做个评价结论也将较为准确。
以我公司实际工作为例,过去的12个月中,内审使用检查要点2149项次,共66个要点有检查发现,涉及64个任务。监督检查使用要点2253项次,共109个要点有检查发现,涉及27个任务。而同期发生偏差事件涉及17个任务。通过这些任务统计和相互比对,可定位问题多发的任务,以及没有被质量探测范围覆盖而存在问题的任务。针对这两个问题,一方面根据实际偏差情况重复本文第二部分中量化分析以找到问题根源并加以补充控制措施;另一方面同时修订检查范围和要点保持质量的探测和实际运行动态相连。这就像飞机投入运行后,针对发现的故障缺陷进行分析找到设计源头的问题并加以改装,同时修改飞机维修方案以备之后可以发现类似问题。
第四,对偏差可量化的持续分析。可先制定需要量化的根原因的维度。对每一例偏差都进行量化分析,找到所有引起本次偏差的根原因。针对可改进的根原因制定精确的措施加以预防。而一段时期内根原因还可量化归类,进行再分析,查找趋势性问题。针对趋势性问题可提高风险控制措施等级,同时也便于管理层从深层次去分析查找管理问题。
通过上述三个方面,可较为清晰地构建以任务为核心的维修体系运行蓝图,并且通过多维度量化找到涉及的风险并加以控制,同时经过针对性设计的审核和检查要点可动态地对体系弱点加强监管弥补体系缺陷。在实际运行中,通过提高质量体系的敏感性,善于发现偏差并加以量化分析,查找根原因。针对单个偏差,可制定纠正预防措施,如达到触发风险分析的等级,则还要评估原有风险控制措施是否有效并视情制定新的控制措施。并且还可按不同阶段归纳分析引起偏差的根原因以提高控制等级或解决管理问题。
总之,通过在我公司的实验和初步运行效果来看,整个质量管理可通过量化模型来细化分解各项要求,并通过持续的量化分析来修正原有缺陷实现自我完善,对维修体系持续改进提供了一个可行的方法。

