大数据在博物馆中的应用与实践研究
一、国内外博物馆对大数据的研究与实践情况
世界各国博物馆均已较为广泛地开展了大数据的研究与合作,进行业务管理、资源建设、服务等方面的优化,并做出更好的决策。在美国博物馆联盟(American Alliance ofMuseums)发布的 2014 年趋势预测报告中,对非营利机构如何收集和使用大数据进行了总结,并提出大数据给博物馆提供了利用客流情况和展示技术受欢迎程度来评估参观者的新方法,认为这将会成为文博领域未来发展的重要推动力,博物馆应该尽快开展大数据的研究与应用。2015 年,Kinsley 和 Portenoy 从“机会与收益”“障碍与关注点”“面临的问题”等三个方面总结了大数据可能会给博物馆带来的影响,认为大数据为博物馆提供了一个更好了解参观人群和参观活动的机会,也帮助博物馆可以更好地开展自身业务。美国加州各博物馆对他们所面临的大数据的情况以及使用目标进行了梳理,提出大数据对于机构管理、馆藏建设、教育培训、会员发展、规划战略、参观服务和公共关系等都会带来益处。大英博物馆(British Museum)的大数据团队与微软合作,通过语音导览以及 WIFI 热点获得参观者的各种信息,并将数据提交到微软的数据分析平台 Azure 和 Power BI 进行分析,获得用户在特定展览中的参观时间、用于访问信息的设备以及语言喜好。这些数据可以用于识别参观者是否获得了参观所需的足够信息。卡内基艺术博物馆(Carnegie Museum of Art)建立了 ArtTracks 项目以尝试收集最原始的数据,帮助管理专家、学者、软件开发者获取他们所需要的信息。这些数据可以检索、建立可视化环境,也可以让公众进行访问。诺门·罗克威尔博物馆(Norman Rockwell Museum)与 Digiwork公司合作,通过大数据分析为博物馆提供决策支撑。Digiwork 公司通过分析当期销售数据及顾客留下来的姓名、地址、社交媒体等数据,得出用户采购商品倾向、采购时间等结果,
帮助博物馆理解用户的采购需求。科罗拉多历史中心(History Colorado Center)以及迪法恩斯动物园与水族馆(Point Defiance Zoo &Aquarium)都与 IBM 的 Bright Star 系统合作,从销售系统采集参观者相关的数据并进行实时的分析,帮助机构进行人力配置、空间使用、会员系统、定价与沟通等方面的更有效决策。美国加州各博物馆曾经对大数据用途进行了梳理,以博物馆内部业务及管理部门为维度进行细分,总结了大数据对于各个部门的影响及用途。澳大利亚文化公司 Dexibit 的首席执行官Angie Judge 认为大数据分析业务可以降低成本,提高内部业务效率。国内博物馆的先行者故宫博物院、上海博物馆、首都博物馆等已经开始了大数据的研究与应用。国家文物局等政府机构也开始重视大数据,并采取措施推动博物馆大数据的应用与建设。时任故宫博物院副院长冯乃恩提到在数字故宫社区建设中引入了“大数据”的概念,并在其指引下建设了故宫世界文化遗产监测平台,可以对文物建筑、馆藏文物、室外陈设、植物动物、环境质量、基础设施、安全防范、非文物建筑、观众动态、监测保障等方面的数据进行不间断的监测。上海博物馆的“可视化
数字中心”涵盖了“数据汇聚—分析—可视化—控制展示”,配套展示和控制装置,经过快速配置安装,搭建与博物馆业务规模相匹配的大数据中心。国家文物局牵头,与北京市文物局、首都博物馆等合作,建设了“北京市博物馆大数据平台”
,整合了北京市多个博物馆的馆藏资源、文创产品等,并利用互联网进行共享传播。可以看到,国际上很多博物馆已经意识到大数据对于博物馆管理、评估等方面的重要作用,开展了较多的研究与实践,并取得了很好的应用效果。而国内仍以大型博物馆如故宫博物院、上海博物馆、首都博物馆等为主进行大数据的研究与实践,研究与应用较为碎片化,缺乏整体的规划。源于此,本文将对国内外博物馆大数据研究与实践情况进行调研与梳理,形成博物馆大数据应用框架,为国内博物馆提供参考。
(一)博物馆使用大数据的目的
博物馆使用大数据主要有四个目的,为争取资金及投入、提高展陈效果、做好场馆安全管理、提高内部效率。
- 争取资金及投入
国外博物馆通常为非营利机构,依赖于社会捐赠运行,对捐赠者进行汇报以获得更多资助是其重要资金来源之一。捐赠者也希望可以了解其所捐赠款项的使用情况,要求博物馆有效地使用捐赠资金。大数据分析可以提供更详实、清晰的说明报告,更有针对性地向资助者呈现资助资金的使用情况。 - 提高展陈效果
大数据可以从三个方面帮助文博场馆提高展陈效果。第一,借助大数据分析,促进展厅的合理设计和资源合理分配;第二,利用大数据分析,可以提高公众服务质量;第三,大数据本身作为展览展示的一部分,增加展厅中的信息化效果。
(1)促进展厅合理设计和资源合理分配对场馆运营大数据进行分析,可以促进展厅合理设计和资源合理分配。如,通过对观众行为进行调查,可以判断观众对于当前展览的态度,进而帮助决策后续展览是否需要推迟、取消或者缩小空间占用。同时,博物馆的开、闭馆时间也可以根据数据分析结果进行调整,以满足不同时间的观众参观需求。
(2)提高公众服务质量
利用大数据分析用户行为及心理,可以对用户画像,了解用户需求;并根据结果调整策略,以增加用户黏性,更好地发挥博物馆的传播与教育功能。例如,对相关社交媒体进行分析,可以识别当前年轻人的兴趣与关注点,有利于吸引年轻人成为新的观众。通过分析用户的交互数据,在空间布置、讲解服务等方面更加有策略性。用户通过网络访问网站或在馆区内游览时,可以通过信息识别或基于地理位置的服务,向用户推送文创产品或食品的信息与优惠券,提高用户购买欲望,达到增加销售额度的目的。例如诺门·罗克威尔博物馆通过分析当期销售数据,以及顾客姓名、地址、社交媒体等信息,得出用户喜好并进行相关推送,使博物馆产品增加了 150% 的重复采购率,销售额度同比增加了 77%,全年营业额超出了预期的16%。
(3)作为展品进行可视化展示
通过将大数据可视化,可以深度剖析大数据内部的潜在关联信息,将数量巨大、逻辑不明显、复杂枯燥的大数据信息转化为视觉信息,以几何图形将每个单独的数据指向进行具象化,并与数据集进行交互。大数据可视化后也可以成为强交互性的多媒体展品,适合在科技场馆中进行展示。一方面,可以增加互动性,增强展览的科技感和展示效果;另一方面,有利于观众理解大数据内涵,从而提升科普教育效果。美国 911纪念博物馆(9/11 Memorial Museum)中采用了时间轴的展示方式,将 911 事件发生以来媒体报纸上各种相关报告的大数据和关键词提取出来,并展示在大屏幕上,帮助公众理解 911事件的影响范围及其发展时间线。在第二届数字中国建设峰会上,中国科学院通过实物模型、展板、视频、交互体验等多种方式,集中展示了其 A 类战略性先导科技专项“地球大数据科学工程”在卫星研制、地球大数据科学平台等领域内的一系列自主研发成果,尤其是数据获取和应用方面的新技术、新方法,获得了参观者的广泛欢迎。
- 场馆安全管理
博物馆是公共场所,需兼顾场地、人员和展品藏品安全。安防系统可以通过部署多种传感器,监控展厅中的大数据并建设数据围栏,对各种数据进行分析以提供安全信息,如展厅中人员密集、设备温度达到上限等,并根据预设配置发出预警。法国卢浮宫(Musée du Louvre)与IBM 公司合作开发智能保护系统,用于保存和保护其设施与艺术品,出现了对整个基础设施管理与保护的可视化,包括博物馆各个业务流程、展室及其中的各种设施系统的初始规划、清洁、维护和废弃处理等。 - 提高内部效率
对博物馆各类型运营数据进行分析,可以使管理部门减少消耗在手动管理数据和制作报告上的时间,从而将更多时分配在审视和理解数据上。通过对博物馆的经济数据、展览数据等进行分析,管理部门可以了解如何对资金进行最佳分配,如何在特定时间将资金投入的收益最大化,调整资金在不同业务流程中的分配,或者强制暂停无收益业务,提高博物馆运行效率,降低运营成本。对博物馆建筑、服务器等基础设施的基本数据进行收集分析,对于判断建筑及设备是否正常运行以及未来的预算制订有很大的帮助。
(二)大数据的类型
根据产生的载体不同,博物馆大数据主要类型包括四个:对藏品、展品进行管理活动时产生的数据;由观众在参观时的行为所构成的系统数据;由第三方社交网络广泛应用所产生的未经处理和筛选的数据;博物馆日常管理和经营活动中生成的各种数据,比如博物馆所举办各类活动的照片、视频,博物馆精品图片,以及网络上其他博物馆的相关资料等。
- 藏品、展品数据
藏品数据包括管理数据与流转数据。管理数据指博物馆藏品的数量、种类、位置、状态等。流转数据指藏品在使用中产生的借用信息、出入库盘点记录等。 - 观众参观行为数据
观众参观行为数据指观众来到场馆参观过程中,通过记录观众个体的各种行为产生的数据。其中,线下行为数据包括参观时间和路径、特定区域停留时间、文创产品与食品的购买情况等,线上行为数据包括在网站中的点击量、浏览时间等。 - 互联网数据及社交网络数据
网站数据、微信端数据包括实时的点击量、评论、访问来源分布等。社交媒体数据包括在微博、微信上传播的博物馆藏品、展览、场馆等信息。 - 管理、经营活动数据
(1)观众群体数据,指将观众看作一个群体而进行统计所得的数据。这些数据分为两类,一类是实时数据,如展厅某个时刻的参观人数、离开人数、展厅内逗留人数、某固定区域中的观众人数等。第二类是统计数据,即以周、月、年等时间段为单位,对以上数据进行叠加后产生的统计结果,如年、月参观人数等。
(2)设备状态数据,指在场馆内使用的各种设备的运行情况。第一类是运行状态实时数据,即机房设备数据,包括网络、主机、安全情况,设备是否正常运行,媒体终端播放的内容等。第二类是故障数据,指设备的运行、损坏及维
修情况等。
(三)大数据的收集方法
博物馆已经有成熟的方法来收集传统管理数据,对于其他类型的大数据而言,还需要采取一些新的手段。
- 通过活动主动收集
博物馆通过活动等方式让参观者留下真实的信息,或者让用户允许馆方使用技术手段收集各种信息。这些活动可以通过线下或线上方式进行。活动过程中,可以让观众按照馆方要求参加一些互动,如在固定位置拍摄照片、发现一些科
学问题的答案等。
2.通过场馆设备离线收集
离线收集即通过线下设备对用户数据进行收集。线下设备也分为两类,一类是利用场馆设备(如蓝牙、Wi Fi 等)连接移动设备进行收集。例如美国大都会艺术博物馆(MetropolitanMuseum of Art)使用数字 beacon 等电子传感器通过参观者的手机等移动设备进行通信,获取参观者信息,记录他们的行为等。
- 在线收集
使 用 Cookies 等 浏 览 器 缓 存 方 式 来 收 集用户信息已经是互联网网站通用的一种手段。Cookies 是指某些网站为了辨别用户身份、进行 session 跟踪而储存在用户本地终端上的加密数据。大英博物馆等重要博物馆的网站都使用了 Cookies 来收集用户的访问信息,同时进行了隐私声明。另外博物馆网站也可以使用一些工具包如百度统计、Google Analysis 等进行访问统计。但是这些工具包只能统计宏观数据,无法区分个体。
(四)博物馆大数据分析的实施方式
博物馆实施大数据分析的方式通常有两种,即与公司企业合作,以及使用开源软件自行分析。
- 与公司企业合作
借助公司企业成熟的大数据分析系统及团队来实施大数据分析,是一种很合适的方法。国际上很多博物馆都在与知名公司合作进行大数据收集与分析以提高工作效率和效果。
2.自行使用开源软件开发
用于大数据的数据存储、调度管理、内存管理、数据处理等方面的开源软件有很多,例如 Spark、WEKA、YARN、Kylin、Solr、Mongo DB 等,加州大学伯克利分校(Universityof California, Berkeley)的数据分析团队就整合了各种开源软件建立大数据技术框架,在这里不再赘述。博物馆更注重于大数据的可视化演示,而不是大数据的分析过程。Chartio 是一款简单易用的可视化工具,可以将各种 SQL检索结果或者非结构化数据转化为图表,使用灵活,支持拖拽
。达拉斯艺术博物馆在其展厅中就使用了 Chartio 来呈现本馆“DMA 的朋友”项目大数据。
三 、对博物馆大数据应用与实践的思考及建议
1.转变对待数据的思路,不断从专业角度学习与理解
大数据改变了传统博物馆对待数据的态度。传统博物馆运营模式当中,数据作为一种记录存在,其主要作用是佐证,使用方法有限。这并不利于博物馆的进一步发展。在大数据时代,博物馆应该改变这种数据的收集、运营和使用模式。
- 可以借鉴零售领域的大数据应用经验
博物馆需要获取参观对象的信息,零售业也有相同的需要,甚至在盈利的驱动下更迫切。
使用大数据来分析大量数据点(如脱销比率、价格提升幅度、实际销售率等),建立以用户为中心的环境组合,根据分析结果将相关产品组合起来,放在其销售模式数据库中,在特定时间、特定地点围绕特定产品进行促销,同时收集顾客数据来优化产品组合。这样可以为顾客提供更多个性化的智能零售体验。来博物馆参观的公众群体的需求,使博物馆管理机构有必要更好地理解如何使用博物馆,而不是仅仅根据专家的建议增加面积或根据历史重要性提供展品。
- 重视社交媒体及互联网资源对博物馆的影响力
- 重视大数据隐私保护
由于大数据需要对用户画像分析,因此很多时候会透露用户的隐私,例如饮食习惯、实时位置等。博物馆在收集大数据之前,必须要尊重用户隐私,让用户知悉数据收集情况,获得用户授权,并且不得泄露和用作他处。制作一份清晰可靠的隐私声明是必须的。
- 控制对大数据的期望
大数据广泛使用的今天,也有人对大数据究竟能够给博物馆带来多少收益产生质疑。尽管如今数据驱动已经成为决策的重要手段,但是对于承担公益使命的文博机构来说,还是需要仔细考虑通过大数据分析获得的决策并进行取舍。例如,如果大数据分析结果显示 VR或者 IMAX 电影对于观众的吸引力大大高于传统展览,博物馆是否可以将所有的展厅改为 VR体验馆或者 IMAX 电影院?博物馆应该立足于自身的职能,有限、有目的地使用大数据,在可行范围内进行数据驱动的决策。