文旅大数据分析技术应用研究
河北省旅游业正处在十分关键的历史性窗口期和战略性机遇期,对文旅大数据进行分析与技术应用研究,有利于推动旅游业迈向高质量发展。依托旅游行业高价值外部数据的挖掘与分析,分析研究多个旅游数据核心应用场景,能使输出的大数据服务精准、全面、格调高、功能全面。
文旅大数据技术应用场景
(一)政府文旅
治理2018年,国家旅游局发布了一系列《旅游转型提升建议》,对旅游信息化发展提出建议,为旅游企业提供宣传信息,加快建设,促进旅游行业发展。河北省人民政府也编制了《河北省旅游高质量发展规划(2018-2025年)》,进一步明确了政府对文化旅游引领新时代的方向和对新需求新供给的呼唤,增强旅游发展新功能,从粗放低效发展方式向精细高效集约发展方式转变。同时也要求加强质量管理,其中涉及到加强信息技术与服务类、智慧旅游景区建设标准等,强化河北旅游产业运行监测与应急指挥平台建设,为旅游产业发展和旅游公共信息服务提供强有力数据和平台支撑。政府文旅治理过程中,文旅大数据分析应用技术赋能各大不同领域数字化管理创新实践,提供场景化解决方案,助力政府全面进入数字化和智慧化时代。
(二)景区治理
2020年6月,河北省文化和旅游厅组织召开2020年全省智慧景区示范点创建评定工作推进视频会议,统筹高效推进智慧景区建设,河北省文化和旅游厅二级巡视员杨军表示,当前,数字化、网络化、智能化已成为鲜明的时代特征,数字化转型成为大势所趋、必然选择,新基建为文旅产业转型升级、智慧旅游建设提供了新机遇。智慧科技赋能文旅产业发展,有利于提升文旅现代化治理能力、加快全域旅游发展、提高管理效能、优化公共服务、提升服务品质,促进文旅产业模式与业态创新,培育新的消费热点,形成产业发展新动能。通过提供多种文旅数据的技术分析与可视化,能够帮助景区主管单位更直观地把控全域旅游现状、旅游产业情况,辅助科学决策及景区管理。
(三)数字治理
近年来,随着文化旅游经济持续增长、各级政府的政策导向、以及消费升级和技术升级的不断演进,文旅产业受到各方持续关注和投入。在科技助力文旅融合发展的趋势下,“新文旅”更加强调智能化、品质化和IP化,注重通过数字治理,提升服务供给和用户体验,助力文旅产业高质量发展。2019年腾讯DCD联合OTA市场调研发布《2019中国文旅产业用户调研报告》,以科技+旅游的文旅数字化运营,可以发现和解决大众文旅需求的痛点。2021年1月人民文旅研究院发布了2020年第四季度《全国重点旅游城市文旅传播影响力报告》,报告拓展了第三季度报告的维度和数据范围,以2020年文化和旅游部公布的50个全国重点旅游城市文旅局新媒体官方账号数据为样本,综合评估样本城市文旅政务微博、微信公众号、抖音政务号的传播影响力。可见大数据的数字化分析技术可以更加科学、全面地评估地方政府的文旅传播影响力及其工作水平和质量。
(四)智慧旅游
2020年6月河北省文化和旅游厅印发《河北省智慧旅游专项行动计划(2020-2022年)》,全面提升河北省文化旅游产业数字化、智慧化应用能力,推进整个产业高质量发展,实现服务品质化。文件提出要大力提升文化和旅游公共服务信息化水平,这正是文旅大数据体现高价值的核心应用场景之一,能够加快河北省文旅智慧项目建设,推动河北省文化旅游向智慧化转型发展。
应用场景解决方案
(一)政府文旅治理中的全域旅游
数据中台构建国务院办公厅曾发布《关于运用大数据加强对市场主体服务和监管的若干意见》就要求各地运用大数据加强对市场主体服务和监管。借助于大数据,以政府为主导建立大数据全域游,政府相关部门可以充分获取和运用大数据信息,更加精准的引领发展方向,了解市场主体需求,提高服务和监管的针对性和有效性。全域旅游是加速旅游管理体制改革的必要手段。从旅游业发展现实来看,旅游活动已经远远超越旅游管理的范畴,旅游管理从单一部门行为到由政府机构统筹管理转变是必然选择。通过发展全域旅游,可以加速旅游管理体制的转变。全域旅游数据中台是一套可以让文旅数据用起来的机制,是一种战略选择和组织形式,是依据政府特有的组织架构和模式,通过有形的产品和实施发展论支撑,构建一套持续把数据价值最大化并提供政府管理和公共服务能力的机制。地方政府需要从最高层的战略上明确数字化转型和建设中台的意图,这样才能 真正的将数据中台落地实施,同时选用适用、适配、成熟完整的大数据平台工具,利用工具对整个略提供 保障,并对全链路的数据采集、开发、质量和流程进行保证,同时不断积累文旅经营数据、文旅用户行为 数据、文旅生态合作数据等。 全域旅游数据中台应具备的能力 :
1. 数据整合能力
汇聚整合能力是指数据治理、数据整合和数据管理能力,能够对多样的数据源进行合并和完善,保障数 据丰富和完善 ;能够提供任务配置、监控管理功能,让管理更加容易 ;能够将内部来源的外部各来源数据进 行统一接入、转换、写入,完成数据集成运营 ;制定数据目录与治理方案,政府可以方便定位所需数据,理 解数据;同时确定数据的访问权限,确保数据安全;提供可扩展的访问异构数据,提高数据可用性和易用性。
2. 数据分析与加工能力
全域旅游数据中台应具备数据提炼与分析加工能力,提供丰富的数据分析功能,完善的安全访问控制, 完善的数据质量保障体系,规范的可扩展的标签体系,智能的数据映射能力,简化数据资产生成。
3.数据服务能力
全域旅游数据中台应提供自然语言等人工智能服务,提供友好的数据可视化服务,便捷、快速的服务 开发环境,方便业务人员开发数据应用,提供实时流数据分析,提供预测分析、机器学习等高级服务。
4.智能数据洞察能力
智能数据洞察就是数据实时监测与洞察,可以实时监测数据,输出可视化图表,便于快速寻找各指标数据间的关系和规律,发现指标异常。从而能够全方位地洞察趋势、分析形式、指导决策。通过大数据的整合与分析,挖掘旅游行业数据价值,对旅游市场细分、旅游供给侧诊断等方面进行技术分析,有助于政府战略定位与创新业态,可以有效提升政府管理和公共服务能力,推动全域旅游发展。
(二)景区治理中的数字化转型
一直以来,很多景区并未在数字化转型方面重点发力。但在疫情防控的大背景下,景区无人化、非接触式建设的政策要求正在倒逼景区加快数字化转型。景区数字化转型是一个复杂的系统工程,既需要利用现代信息技术结合大数据技术,又需要将景区中科学规范的管理相结合。数字化景区建设是对景区硬实力和软实力的全面提升,主要由数字化景区基础平台建设、数据中心及存储平台、景区管理平台、智能分析模块、高层决策数据分析等部分构成。通过数字化转型的方式,提升景区运营效率,通过数字化,可以将景区前中后的服务流程实现自助化,例如,智慧闸机、扫码入园、刷脸入园、线上票务中心、数字化地图、VR视镜、AR互动、AI服务、虚拟形象、智能特效等,打造景区多业态管理中台。
1.数字化景区基础平台
建设数字化景区转型需要基础平台建设的支撑,首先是机房环境平台,机房环境平台的建设对实施全面的动力、环境、安全监控,实时监控机房的运行情况有着重要的作用,建设原则是优化机房管理流程,减少机房维护量,并对景区机房安全稳定运行有足够的保障作用,进而保障数据中心的可靠安全。其次是网络系统平台,也是整个系统的基础,应采用千兆以太网作为数据中心的局域核心网,为景区业务可靠、稳定的运行提供保障。
2.数据处理中心及存储平台
数据处理中心是整个系统的处理核心,担负着最为关键的应用处理和数据处理服务。数据处理需要高性能服务器支持,同时要求有较高的可靠性与健壮性。因此,要求具有高性能、高可靠性、大容量存储设备支持以及良好的系统扩展性。为了防止数据中心容易被病毒、木马、黑客入侵,建议使用Centos6.4或以上版本操作系统。数据处理中心应配置一台高性能、大容量的企业级磁盘阵列,利用两台高性能应用服务器进行热备份,容错。
3.景区管理平台
景区管理平台是景区实现数字化转型的管理核心,主要由信息管理子系统、景区管理子系统、售票管理子系统、检票管理子系统、设备租赁管理子系统、权限管理子系统等部分组成。系统可采用TCP/IP通信协议,将制票、售票、检票、设备租赁、中心管理有机地结合在一起,使各景区景点的数据与中心服务器的数据实时同步。系统既要保证运行的畅通,也要注重数据的积累、备份,注重数据的安全性、保密性,以便为进一步的数据分析做准备。
4.智能分析模块
通过数据中心和管理平台收集的大量数据,通过智能分析模块及时进行智能分析处理,并及时反馈给管理平台。还可以建设车源地智能分析模块,能够通过停车系统内的车牌自动识别,或者操作员手工收集的车牌信息,导入到中心数据系统,配合客源地智能分析。同时建设客源智能分析模块,通过游客在官网、微官网、分销平台的订票可以分析出游客的客源地的构成、游客指向以及发展趋势。
5.高层决策数据分析
用于实现上级随时随地查询整个景区运营各类数据、统计分析、人事情况等,用互联网的平台实现上级通过智能手机或电脑终端的查询。系统中高层查询系统是为方便高层人员随时查看景区运营情况提供的个性化服务功能。高层人员可以通过高层查询系统随时查看景区的日常销售情况,通过考勤查询模块了解所有人员的考勤情况。高层查询系统对高层人员普遍存在经常出差或电脑上网不方便,同时又需要及时掌握景区运营状况是很有帮助的。高层查询系统,方便高层实时了解掌握信息,实现信息的标准化、动态化管理,为高层的行政决策提供技术支持,可以根据用户输入的综合查询条件,快速检索出准确的信息,供高层随时查询调取。
(三)数字治理中的数字化运营
要实现景区的可持续经营发展,景区需要数字化运营赋能,通过数字化、智慧化建设进一步深度挖掘和创造用户需求。
1.线上大数据触点
线上建设微信生态数字化运营、B2C官网直销、B2B分销平台运营等,多种多样的数字化的运营解决方案都离不开各平台的全端数据采集、整理数据源、数据生态、数据接入和数据治理,基于数据采集与整合,可以实现分析数据、业务干预、效果评估的完整闭环,实现数据驱动业务迭代和增长。通过可视化操作与管理,实时、自助的数据洞察和业务验证,跨越数据与业务的鸿沟,释放生产力和想象力,提高运营效率。通过微信、短信、站内推送等运营场景,具备渠道对接与策略规则引擎配置能力,让全渠道触达与多触点运营成为现实。
2.文旅数字化运营
构建文旅数字化营销管理平台,可以快速获取推广流量,实现旅游数字化运营,运营高效可视化,助力精准营销。2021年,文旅直销进入“视频种草+社群营销”的新时代,直销将被抖音小红书企微等平台重新定义,直销已不再是微信公众号或小程序等传统的扫二维码方式。预计兴趣电商如抖音、小红书等新流量平台进入文旅领域,会直接改变文旅行业的直销格局。通过数字化运营模式,进行数字化营销传播,从而带来巨大的变革效果。
(四)智慧文旅大数据平台构建与应用
通过来自景区数据分析、旅业数据分析、营销指数、销售分析、游客画像、舆情分析等各类旅游业态数据,构建智慧文旅大数据平台。
1.构建智慧文旅大数据平台
通过数据资源池积累,采用数据清洗工具如数据查阅、缺失值一键插补、极端值处理、正则式文本剔除,并创新模型算法进行数据可视化展示,针对不同的流程和场景,进行智慧文化旅游的决策和提升,构建文化智慧旅游大数据平台。
2.旅游情绪监测与分析
基于信源数据,结合数据采集、算法技术与大数据分析为一体,经过传播路径分析、jieba分词、特征词提取、词云图生成,话题聚类等方法,为旅游景区进行旅游情绪监测与分析,进行舆情风险实时预警;通过情感分析工具贝叶斯网络、SVM、决策树等,进行情绪趋势、最新正/负面舆情、游客评价;通过满意度分析工具如景区评价指标体系、权重算法工具熵权法、层次分析法、模糊综合评价等,提供突发事件推送及预警,品牌评估与旅客满意度分析等,积极维护景区品牌形象。
3.游客画像与客流预测分析
采用游客特征工具t检验客流变动显著性研究、交叉分析目标人群定位、灰色关联度客流趋势对比等方法,利用大数据技术提升智慧旅游游客画像准确率;采用客流预测工具ARIMA、马尔科夫、多元线性回归、灰色预测等方法,对景区的智慧管理提供规划设计和运营管理的基本依据。
4.景区OTA游后评价综合分析
通过主流OTA趋势分析与数据分析,进行游后评价综合分析,进行多时段多维度景区满意度综合指数对比和评价分析,满意度一般包含8大维度:交通、配套、消费、服务、景观、安全、卫生、体验。
5.景区推广电子交互设施应用
(1)触摸式导览机的应用触摸式导览机根据景点的特点,如景点介绍,景点视频,景点新闻,景点活动等而制作的。通过添加交互式消息和其他链接,比激活留言簿中的手写内容更容易激发和保存访问者。景区的文旅触控展示,还可以为游客提供多样化的多媒体查询检索服务,可以展现景区的互动性和生动性,易用的操作以及数据的快捷更新可以增强景区体验,尤其可以借助虚拟现实(VR)、AR互动、虚拟形象、智能特效等多种媒体技术。
(2)建设户外LED大屏显示系统LED显示屏安装在每个景点的入口以及穿过景点的重要路口,并迅速披露诸如道路交通信息,停车场和旅馆之类的综合信息,以介绍旅游景点。在旅游旺季游客激增时(例如黄金周),可以循环播放重要景点的具体信息及实时客流量统计数据,为乘客提供参考,从而优化旅游路线规划。
(3)增设景区虚拟旅游模块创建重要而美丽的景点的全景照片,以生动地展览景点,在平台上发布全景照片,并在景点体验全方位的虚拟现实,这些虚拟旅游模块使游客可以提前体验这些景点,并吸引更多潜在的消费者一起旅行。
(4)基于移动端的APP和小程序的开发及应用为了给游客轻松便捷的旅行体验,可以开发和应用一些移动端的应用程序或微信小程序。在应用程序或微信小程序内,给游客展示电子地图,清晰展示参观区域,让作者可以更方便的规划便捷、省时的参观路线。另外还可以将应用程序或微信小程序集合自动识别或智能播报功能,让景区“活”起来,让游客身临其境,更加投入其中,这无形中增加了游客的旅游体验和质量。
文旅大数据分析技术底座
从文旅行业核心的应用场景出发,多渠道获取文旅高价值大数据,以大数据分析技术底座支撑,可以高效落实各场景解决方案。文旅大数据核心应用场景解决方案中普遍涉及到了文旅大数据的分析处理和大数据应用平台的构建,在这些大数据分析技术实现过程中需要一些技术底座支撑,通过多场景部署采集数据后,需要应用大数据分析处理技术进行数据处理和存储、数据清洗与分析、数据计算与可视化等流程,主要技术底座如图1所示:
(一)数据整理与存储对于采集到的各种来源的文旅大数据需要写入到数据仓库中,收集到的数据一般要先经过整理,常用的软件可以选择Tableau和Impure,它们是功能比较全面的,Refine和Wrangler是比较纯粹的数据整理工具。数据存储时可以选用流行Hadoop、Kafka、HBase等,可以基于Hadoop构建大数据平台、基于HBase和Kafka构建海量数据存储与采集平台,同时对应的应选择Yarn去对Hadoop做一些资源管理,更好的完成文旅数据存储。
(二)数据清洗由于数据来源广泛,数据类型难以统一,如果直接使用原始数据很难进行数据分析,严重影响数据决策与效率,需要对数据进行归一化等数据清洗工作,可以选用Kettle工具、RDBMS及MapReduce等。MapReduce作为Hadoop的查询引擎,是分布式数据和计算框架,也是一种编程模型,可以用于大规模数据集的并行计算,也可以进行文旅数据训练和清洗。
(三)数据查询分析技术层面涉及Spark的机制、生态系统,从应用角度可以实现日志分析、推荐系统、情感分析、协同过滤、搜索引擎、社交网络分析、新闻数据分析等多个常见的大数据场景下的数据分析。在每个场景中,首先对场景进行抽象与概括,然后将Spark融入其中构建数据分析算法,结合其他开源系统或工具可以构建更为丰富的数据分析流水线。
(四)机器学习机器学习相关算法,包括:K-近邻算法、决策树、朴素贝叶斯、逻辑回归与梯度下降、支持向量机、AdaBoost算法、线性回归、算法、Apriori算法、FP-growth算法、主成分分析和奇异值分解。
(五)数据可视化可以选择基于Flink的行为实时分析、行为数据可视化,也可以对接BI平台,将分析得到的文旅数据进行可视化,用于构建平台服务。主流的BI平台可以选择国外的敏捷BITableau、Qlikview、PowrerBI等,国内的可以选择SmallBI和网易有数。也可以选择基于ECharts和D3的可视化图表,以及多种过滤组件,支持多种可视化效果和自定义图表效果,满足多样化的大数据可视化需求。
大数据时代时一个伟大的时代,这个伟大的时代从根本上改变了我们的生活和想法,近年来各大信息企业纷纷落户河北,推动河北走向世界,其中河北的文化旅游,也要充分利用大数据、云计算、物联网等先进技术,走创新和可持续性发展的路线。大数据时代同时也是一个全新的时代,文旅大数据的价值亟需被挖掘利用起来,真正助力河北文旅行业的发展,进而促进京津冀文旅一体化发展。