民航旅客数据应用与管理研究
摘要:随着我国民航管理水平的提高和技术水平的提高,飞机越来越成为旅客的选择。同时,随着旅客数量的增加和民航信息化建设的加快,航空公司积累了大量的旅客数据,运用先进的数据挖掘手段,从海量的旅客数据信息中分析和发现有用的价值,从而协助航空公司制定更加科学合理的经营战略,已经成为航空公司经营管理的重要手段。
在使用和分析数据的同时,保护旅客数据的安全也成为民航相关单位必须要承担的责任。数据安全是网络安全的一部分,网络安全是信息安全的一部分,所以确保旅客信息数据安全不仅仅是满足《网络安全法》和相关规范的要求,也是坚守平安民航的底线。
下面结合民航旅客数据中常旅客数据介绍论述在民航经营中的重要作用,最后概括性的论述民航中的旅客数据的安全问题以及管理旅客数据的方法和方案。
一、民航常旅客的概念
常旅客简单的说就是经常坐飞机的旅客,成为航空公司常旅客计划中的会员。
常旅客数据通常是用PNR数据分析而来,比如某航空公司,通过旅客乘坐该航司航班的次数决定该旅客是否能定义为常旅客,根据每年该旅客飞行次数和飞行里程的不同,定义为常旅客的等级也不同。目前,国内航空公司对常旅客定义的标准各不相同,对常旅客会员的区分标准也不相同,对各种级别会员的提供的待遇也各有差异。
二、民航常旅客数据的应用与价值
目前各个航空公司都具备有大量的常旅客数据,也有针对这些数据的价值所配备的分析系统,比如国航的OMIS系统和AHM系统,是综合了多方面数据的综合查询分析系统;海南航空公司引入马克威分析系统,对市场价格、旅客运输量等变化趋势进行分析,设立了以乘客偏好主题等多种业务模型的挖掘。另外,有的航空公司对数据的分析直接使用目前主流的数据挖掘软件,如国外的大型统计分析软件SPSS。SPSS的数据挖掘组件可以在后台将关联规则、主成分分析等机器学习技术结合应用到业务中,并通过图形界面直观展示分析结果。国内的大型挖掘分析系统有DMiner,提供数据查询结果可视化、层次结构可视化、多维数据结构可视化等多视角展示的特色功能。但是针对直接使用数据分析软件如SPSS,来为其数据作挖掘分析的公司,其业务流程相对固化,无法灵活组合自定义的挖掘模型,仅能选择按照一套挖掘算法进行分析和结果输出,这一问题也是大型数据分析的缺陷。
由于旅客行为数据获取的信息量激增,要分析的数据越来越庞大,而且决策对分析结果的产出速度要求越来越高,仅使用单服务器或伪分布的计算环境已经越来越不能够适应大数据的读取和分析了,对大数据分析工具的需求十分显著。
1、常旅客数据在客户价值评估中的应用
传统的常旅客计划中航空公司普遍采用常旅客数据进行旅客细分,即根据旅客累积的飞行里程将常旅客划分为白金卡、金卡、银卡和普通卡等多个等级,以此对不同等级的旅客提供不同的优惠服务。这种细分方式考虑的指标过于单一,无法全面充分地挖掘客户的潜在价值。例如一个经常购买低折扣机票的旅客,虽然积累的里程较多,但其价值并一定高于购买全价票甚至商务舱的商务旅客。因此,基于常旅客信息数据进行客户价值分析对于航空公司为不同目标市场提出差异化策略法达到为航空公司的发展提供决策支持的作用
基于常旅客信息数据进行客户价值挖掘,首先要建立一套科学合理的指标体系,指标体系设置的合理性直接影响客户价值评估的准确性。如果指标体系不够完备,就无法对航空旅客的客户价值做出客观公正的评估,无法识别出真正对航空公司有价值的客户。因此,我们在建立航空旅客的客户价值评价值指标体系时还应遵循一些客观因素。
2、常旅客数据在客户关系管理中的价值
客户关系管理是企业借助信息技术为手段,融合以客户为中心的思想,最终为实现提高业务操作效益和利润增长目标,所运用和创造设计的软硬件系统和各种业务解决方案及管理办法和制度的综合。
首先,客户关系管理是一种改善航空公司和常旅客之间关系的新型管理方式,其核心思想是航空企业将常旅客视为最重要的资产,提高常旅客对航班条件、旅行环境、服务水平、运输安全等的认可与满意程度,建立常旅客与航空公司之间的信任关系,满足常旅客的个性化需求,加强常旅客与航空公司之间的消费感情,依据常旅客对航空公司的认知和信任程度发展潜在旅客。其次,以计算机网络技术、通信技术为基础,完成从常旅客信息的采集、共享到常旅客信息的分析、反馈等业务。最后,民航常旅客关系管理的所有业务都围绕常旅客不同需求而设计,根据常旅客业务需求调整现有的业务流程,每位旅客对于航空公司而言都是具有鲜明需求的个体,航空企业应根据旅客需求为每位旅客提供个性化服务。
三、常旅客数据使用中存在的问题
(一)民航业自身数据保护存在漏洞
民航界泄露信息主要包括住户的名称、地址、电话号码、电子邮件地址、护照号码、账户信息、出生日期、性别、航班抵达和起飞信息、预约日期、沟通偏好、支付卡号和日期等等。
就在过去的短短五年中,民航业就发生了多起用户数据泄露事件,泄露的用户信息将近1000万人次起,五年中影响较大的比如:2014年日本航空电脑受到攻击,近19万旅客的数据被调出,泄露的信息包括了:会员号、会员办理时间、姓名、出生日期、性别、联系方式及其工作地相关信息;2018年4月英国航空的系统被攻击,旅客被盗信息包括姓名,信用卡账单地址,邮箱地址以及所有的银行卡信息,英航因此也被提起了集体诉讼面临罚款;2018年10月一直入选最佳航空公司的国泰航空对外宣布,它们发现超过940万乘客资料曾遭到未获授权浏览,这次事件是目前为止民航业造成影响范围最广的一次泄露事件。
(二)不断出现新技术应用导致的数据泄露对民航业是新隐患
2019年,深圳市深网视界科技有限公司被曝发生大规模数据泄露事件,超过250万人的数据可被获取,有680万条数据疑似泄露,包括身份证信息、人脸识别图像及图像拍摄地点等。这个事件对于处于智慧化发展阶段的民航来说,反响巨大。目前人脸识别、人证合一等技术已经被应用于机场安检人证合一验证、人脸登机等自助服务场景中,需要民航相关单位采取更加严格的防护措施,来保护旅客的面部识别、乘机轨迹等信息。
四、民航旅客数据安全管理的方法与方案
(一)民航旅客数据安全管理常用方法
目前国家层面、民航局、各民航企事业单位都充分重视数据安全。2018年民航局就对信息安全提出了“顺应国际形势,落实国家政策法规”。
欧盟的“通用数据保护条例”的颁布实施,对于我国大多数飞行欧洲国家航线,或者与欧洲国家有旅客服务的民航企事业单位而言,都需要进行遵守其相关数据保护规定。本节从民航旅客数据生命周期的角度,梳理民航旅客数据安全管理的常用方案。
1、数据发布阶段
因为大数据发布是动态的,所面临的风险要更大,且相同用户的数据来源较多,总量较大。为了保证用户数据的可用性,在数据发布时,会去掉可能泄露的隐私内容。传统针对数据的匿名发布技术,包括传统匿名方式、个性化匿名、基于“角色构成”的匿名方法等,可以实现对发布数据时的匿名保护。行业常用的是综合的数据脱敏算法,确保数据发布阶段的数据安全。
2、数据存储阶段
大数据的存储大多在云存储平台,与拥有者是分开的,云存储的服务商并不是可信的。用户的数据可能会被第三方盗取或者篡改。加密可能是传统手段,但是,所有大数据的查询和分析等操作需要云端操作,这将是传统加密手段新的技术挑战。
3、数据挖掘分析阶段
旅客数据通过挖掘分析,可以得到旅客的规律性,有助于服务质量的提高,也是民航业提高营销的目的。在大数据的环境下,数据具有来源多样性和动态性等特征,经过挖掘分析后,依然可以知晓用户的隐私。现在数据挖掘的隐私保护技术,就是为了研究更适合的数据隐藏技术,提高大数据可用性,以防利用从而导致隐私泄露。
(二)民航旅客数据安全管理方案
结合民航行业对旅客数据安全管理的需求,提出一个针对结构化数据和非结构化数据的安全保护方案,基本思路如下。
存储在数据库中,以字段形式存在的旅客数据,也即是结构化数据。结构化数据一般存储在数据库中。针对结构化数据可以采用安全审计和“主体到人客体到字段”的细粒度访问控制,同时可以对结构化数据进行加密,以防范来自于数据库和服务侧的威胁。
包含旅客信息的图像、音频、文档等数据,也即是非结构化数据。非结构化数据一般集中存储于企业文件服务器中,包含有音频、视频、图片、文档等多种格式。针对非结构化数据可以采用安全审计,以及文件透明加密。
1、结构化旅客数据安全保护方法
基于加密的结构化数据安全保护方法。本方法包括数据库安全模块、数据安全管理中心和密钥管理中心三部分。三者之间的关系是:数据安全管理中心与密钥管理中心进行密钥交互,获取加解密所使用的密钥;数据库安全模块可向管理中心反馈数据库操作数据,通过接收数据库操作数据,可支持对数据库操作的安全审计。具体保护方式如下。
数据库安全模块部署在应用服务端,主要是向数据库输出密文,数据以密文形式存储于数据库中。模块与数据库加解密管理中心进行交互,获取加解密策略以及密钥。
数据安全管理中心旁路部署,主要实现可视化和安全控制两个功能。管理中心可进行加解密权限规则的设置,颗粒度可以达到数据库表的行级、列级、字段级,加密策略的内容包括选择要加密的字段,以及所使用的加密算法,是否进行保留格式的加密;可进行“主体到应用用户,客体到字段级”的细粒度访问控制策略的设置。
密钥管理中心统一进行加解密所使用的密钥的管理工作。管理中心实现标准的密钥多级派生机制,在数据安全管理中心中根据加密策略具体生成工作密钥,最终下发给数据库安全模块以执行加解密。
2、非结构化旅客数据安全保护方法
基于加密的非结构化数据安全保护方法。针对非结构化数据的安全保护,可实现落盘加密,读盘解密,同时进行操作的安全审计,在应用条件满足时可实现“主体到人客体到文件”的细粒度访问控制。本方法包括文件安全模块、文件加密管理中心和密钥管理中心三部分。具体保护方式如下。
文件安全模块部署在文件管理应用服务器操作系统的驱动层,文件在被应用进行写的过程,可对文件进行加密;在读取的过程中进行解密。
文件进出存储磁盘的过程,都可以被文件安全模块记录,以便文件加密管理中心进行安全审计,进一步对审计记录进行综合分析,可以全方位获得敏感文件的被使用情况,及时发现存在的威胁。
文件加密管理中心,可以指定要加密的文件夹,该文件夹(及其子文件夹)的文件在保存时被加密,也可选择全盘加密;可选择要授权的应用,通过白名单机制使应用正常访问;未授权应用或者直接拷贝文件,只能读取密文文件。
密钥管理中心统一进行加解密所使用的密钥的管理工作。管理中心实现标准的密钥多级派生机制,在文件加密管理中心中根据加密策略具体生成工作密钥,最终下发给文件安全模块以执行加解密。
现如今民航运输在同行业中占据越来越大的比重。据报道,去年的旅客运输量已突破了6.1亿人次,随之而来的问题就是如此巨量的旅客信息保护,行业也面临着严峻的挑战。随着新技术的发展,云计算、物联网、人工智能、区块链等技术不断应用与民航当中,这些技术与大数据技术深度融合,同时又会产生新的海量的数据,这些数据将会成为航空公司越来越重要的信心资产,各航空公司也正在积极筹建基于多源数据的协同决策系统,随之而来的问题就是如此巨量的旅客信息保护,行业也面临着严峻的挑战。所以,民航相关行业应更加重视旅客数据的挖掘、利用和保护,更加依靠先进的信息技术手段,加大对数据使用和保护的投入,打造数字化、智慧化、信息化的民航,全面实现生产安全、信息安全和真情服务的有机统一。(作者:王东 深圳航空有限责任公司)
参考文献(注释)
[1] 徐公达,石丽娜.航空旅客运输管理[M].北京,航空工业出版社.2003
[2] 王扶东,马玉芳.基于数据挖掘的客户细分方法的研究[J].计算机工程与应用.2011
[3] 邓小勇,古林凡,李林玲等. 浅谈民航旅客信息安全的防护[J]. 湖北经济学院学报(人文社会科学版).2017