智能语音导览系统在博物馆的建设实务
提要:本文从博物馆业主角度出发,介绍智能语音导览系统在博物馆中的建设实务。结合广州十三行博物馆智能语音导览项目工期、投资、原有场馆设施基础、观众群体等实际因素,介绍项目需求形成的过程及内容,并简要介绍与之相关的工程知识。
一、广州十三行博物馆简介
“十三行”是大航海时代以来世界从彼此分割的几大洲走向全球化、近代化的一段波澜壮阔的历史。历史研究认为,十三行商贸活动深刻影响了世界及中国的近代化进程。
为客观重现这段历史,以史为鉴,荔湾区委区政府在2016年建成开放了广州十三行博物馆(以下简称:我馆)。我馆位于广州市西堤二马路37号,系原十三行商馆区遗址所在,馆舍设于文化公园原展览中心二楼、三楼,展览面积约6000平方米,收藏、展示明清时期的广彩瓷、广绣、广式家具、通草画等各类文物近2000件套。
二、广州十三行博物馆语音导览项目的建设内容
(一) 项目需求形成的背景
我馆是集文博研究、展览陈列、教育宣传为一体的专题性博物馆,是海丝文化的重要展示窗口。随着移动互联网的发展,无线终端和无线应用的快速普及,网络提供信息服务已成为一种趋势。博物馆要与时俱进,为社会提供更好的服务,互联网是必然选择。
在此背景下,我馆考虑结合馆舍展览实际情况,拟结合移动端与语音导览技术,拓宽参观者的体验渠道,形成智能语音导览系统的建设需求。我馆的智能语音导览系统核心是为游客提供普通话、英语的智能导览,增加游客对十三行历史文化的认识理解。
(二)项目的总体目标和功能规划
项目的出发点是补充目前馆内多媒体导览信息不足,并降低讲解员劳动强度,使讲解员能从繁杂的日常讲解工作中抽脱,以从事更有价值的劳动,项目核心需求是采购语音导览内容,通过分析入馆游客记录,我们明确了初步建设内容:
1、在内容上,拟制作专业版的中文普通话、英语及针对青少年的趣味版等3个版本,并编写了基本的导览词;
2、在语音输出方面,拟制订适合年轻人使用习惯的微信智能导览版,以及适合老年人及小学生使用习惯的机械式导览机;
3、考虑到对新技术的应用以及提高中小学生对博物馆的吸引度,我们拟在成本控制的前提下,尝试使用智能机器人导览。
4、为支持上述系统的运作,配套建设基于馆舍的WIFI系统,在全馆覆盖WIFI信号;
5、另外,据(《关于广州市政府信息化云服务平台资源租赁服务相关事项的通知》)要求,拟通过租赁服务器的方式,建立初步的数据库,以容纳馆内基本信息,综合官网、微信、移动终端APP等各类平台功能共享利用的资料。
(三)具体建设内容及技术要求
1、 关于语音导览内容
(1)关于选择导览点
制作语音,要先结合实际选取适当的导览点。在选取标准上,我们主要考虑:以文物为主,突出有特色的重点文物;考虑展线实际分布,避免游客在狭窄通道过度集中,避免安全隐患;考虑机器人的自主识别能力,避免选点过于集中,降低机器人的识别难度。结合展厅面积及展览游线实际,最终选取了60个文物点进行语音介绍,共制成60段语音备选,并编制了游线分布图(如图一)。
图一
(2)关于文本长度
参考约260字/分钟的语速,以及普通游客平均约在感兴趣的文物前停留一到两分钟的参观体验,我们拟制的语音文本每段长约200字,翻译为英语口语也控制在相近字数范围内。虽然不同游客对不同的文物感兴趣的程度并不一样,但我们目前还无法收集分析到具体哪几件文物对哪种类型的游客是十分感兴趣的,因此我们制作的语音文本长度大致相近。
经开馆一年多的实践使用,原导览词较符合使用需求。为贴合语音导览实际,我们再次组织相关专家,就书面语及口头表达的差异,并针对新研究成果对原导览词进行了微调,形成了约12000字的导览稿。
(3)关于版本
在语音版本方面,普通话是我国的官方语言,因而我们的语音导览系统专业版为普通话;英语是目前较通行的语言,结合进馆游客数据分析,我们选择英语作为语音导览的外文版;结合我馆作为“关心下一代教育基地”的特殊性,拟制作针对青少年的趣味版,共三个版本。其中普通话版相对详尽,趣味版相对简单。考虑到语音导览的听觉效果,每个语种都邀请专业播音员进行录音。
2、关于通过微信输出语音内容
结合目前使用微信作为主流社交媒体的实际,我们针对智能手机用户,开发了微信导览系统,把语音及简单文字导入到微信及订制的APP内,进馆的智能手机用户游客可通过关注微信公众号,或下载APP,然后点击对应的展品编号,收听、收看对应的语音导览内容。
在“点选收听内容的方式”上,针对智能手机用户目前有蓝牙识别、红外识别、WIFI识别及扫描二维码识别、点选数字编码识别等几种方式,各有优劣。
前三种自动识别方式可以自主播放语音内容,不需要游客操作,且随技术进步,其安装稳固度、能耗、有效距离、穿透性、隐蔽性等问题都逐步得到较好解决。但展厅是一个展品密集的室内空间,两件展品的间距最短不到一米,大多在三五米范围内,这些自动识别技术目前多存在相互干扰现象。比较突出的是:游客正在听一个展品的导览,当移动角度或距离观察展品时,却切换到另一个展品的导览内容,这严重影响了体验。
二维码扫码识别是近年流行的识别方式,在各行各业都很受欢迎,在展厅使用可避免自动识别所产生的干扰。但在展厅内,珍贵展品往往置于玻璃柜内,且柜内有针对展品的不同角度的灯光,另外考虑到展览要突出展品的观赏性,展品说明牌一般做得不大,且多在展品下方。这样,游客在扫码时多需弯腰,持手机对焦,由于玻璃反光及灯光亮度等原因,往往一次扫描识别成功率不高,影响了体验。另外,在游客较多的情况下,大量游客围绕在珍贵展品旁边扫码,也影响安全。
数字编码的方式使用简单便捷,数字大小也容易把握,不影响展品说明牌的整体设计及美观。综合考虑了上述点选方式的优劣之后,我馆在微信实施“点选收听内容的方式”时,默认首选数字编码方式。
3、关于使用机械式导览机输出语音内容
针对非智能手机用户(主要是老年人及未成年人)我们购置了机械式讲解机。这种讲解机使用锂电池,可反复充电,带TFT显示屏,带插线耳机,使用后可进行消毒。语音可储存在机身,可选择通过自主触发RFID信号,或按键输入编码的方式收听,便于非智能机用户操作。
4、关于机器人讲解员
项目采取的机器人与打败一众围棋高手的AlphaGo、意大利的类人形机器人Face等明星机器人不同,这些机器人要么建立在强大的服务器和算法,要么集成了先进的材料仿真学技术,背后需要强大的资源支持。在具体项目预算及工期条件下,我们只能借助现有的成熟技术对项目投资进行控制,以满足需求。
(1)、关于产品选择标准
考虑到节约人力,把普通讲解员从繁重的日常接待任务中解脱出来,处理好重点接待任务并开展创造性工作;对接新技术,吸引青少年关注历史文化等因素,并结合兄弟馆的使用经验,尝试使用机器人讲解员。这是我们选择产品的出发点。
在前期调研中,我们调研了A、B两家供应商的产品。A产品是本地供应商,其产品是非人形机器人,能够实现基本的语音输出、自主识别地图及建立路线等功能,但机器软件开发不足,且每年需要交纳相当于采购价格15%的系统更新服务费用。B产品是外地供应商,产品是类人形机器人,能实现基本的语音输出、自主识别地图及路线等功能,可以免费提供软件更新服务,且可以配合业主需求进行简单的二次开发,承诺故障可以实现2小时线上解决,无法在线解决的问题,48小时现场解决。考虑到场地及使用功能适应性的二次开发难度,最终我们选择了B产品。
(2)、关于机器人机械参数
目前市场上的机器人有各自的外形及机械系统。外形最大的区别在类人形及非类人形。与我们未开展调研前形成的主观想法不同,在具体调研过程中,我们认识到机器人的外形制作是一个专业过程,要有成熟的模具、适合的材料、颜料。如按最初主观设想的十三行时期商人的形象,另要进行论证和史料比对,无现成可用成果。这些不利于工程项目进度管理和投资控制。调研后,我们摒弃了最初的主观设想,转而在市场寻找现实中有的产品,以集中精力处理好项目的核心需求。
项目使用的机器人外形为手捧显示屏的女孩,高约1.5米,重50KG,轮式驱动,运动速度约0.1—0.7米/秒,通过激光扫描的方式自动建立场馆地图并定位导览点的次序,运动时自主识别讲解定点位置,雷达最远可以识别16米内导览点,并躲避障碍,依次停留,也可通过人工后台导航。机器人使用24伏锂电池,可连续工作12小时,电量低于20%时自动可回到充电点充电,充电约需8小时。
5、 关于馆内局域网设置与外网连接
(1)、局域网布设情况
馆内每层展厅面积约2500平方米,是无间隔封闭区域,我们对现场进行了测量,博物馆外墙无线信号衰减在10-20个DBI,电梯井的衰减在20-30DBI,玻璃门窗在3-5个DBI。根据这个结果,结合展厅实际,最终在一楼布设10个AP,二楼布设8个AP。按每个AP最多可同时在线容纳60个终端,根据170—680人的瞬时峰值测算(据国家旅游局颁布的《景区最大承载量核定导则LBT034-2014》,参考秦始皇兵马俑博物馆2.5—10M2/人的标准),结合实际约1500人的日接待峰值,可以满足使用需求。
考虑到博物馆位于市区中心的公园内,为避免长时间蹭网行为,我们在测量信号衰减的基础上,靠近地面的二楼展厅采用了螺旋向心形AP线路布局(如图二),使WIFI信号尽可能集中在展厅区域。三楼展厅则考虑到展厅内空旷及天花吊顶布局的实际,沿天花内侧进行了回字形布局(如图三)。由于三楼展厅远离地面,加上外墙对WIFI信号的衰减作用,这个布局是在实际场地情况下的较优方案。
图三
图二
(2)、接入外网情况
在项目里,我们使用了微信、机器人导览等输出方式,游客使用微信收听导览语音时,需访问互联网;机器人也需通过互联网连接自身服务器进行软件升级及实时控制。基于这些实际因素,我们申请了光纤连接互联网,摒弃了仅使用内网的方案。
为更好满足游客的网络体验感,并尽可能抑制无效上网需求,我们实行实名制上网,后台记录登录者的身份信息;针对一般游客、工作人员、网络管理人员等设置了不同的权限;结合馆内最佳游览时间约2小时的实际,对游客上网的登录时间进行限制,连续上网超过2小时的,终端会自动断开连接,30分钟后才能重新连接;如有特殊需求的游客,可以向服务台提出申请,经网管批准后可以恢复在线;针对外网制定了禁止访问名单(如购物网站、小说浏览网站、影视网站等),并限制大流量下载行为。力图在现有技术及网速条件下,满足游客的访问需求。
三、语音导览项目因馆制宜的考量原则
综上,实施广州十三行博物馆的智能语音导览系统项目时,我们主要从以下三个方面进行考量:
(一)技术的先进性与适用性
1、技术升级换代快,超出馆内现阶段需求的多余功能不用,不能稳定、长期提供服务的技术不用。
2、开发、维护成本的可控性
基于以上两个原则,我们对关于是否使用全智能机器人技术(包括全智能导航、自动语音识别、智能搜索)进行了深度调研,最终结合博物馆日接待实际,目前市场上机器人的技术水平以及开发成本,所考察的供应商能提供的售后服务情况等,我们选择了类人形的非全智能机器人。
(二)注重差异群体的体验感
1、不同年龄段人群适用的终端不一样,儿童及老年人不一定都使用智能手机,需要有适合他们操作的终端。
2、不同年龄段、地域的人群适应的导览方式不一样,需要多版本的语音内容
基于以上两个原则,我们在语音的内容上设置了国语、英语、儿童等三个版本,在语音导览的输出上采取了微信、讲解机、机器人等三种形式,尽量满足不同游客的参观体验。
(三)安全是基础,兼顾效率
基于网络安全、用电安全、施工安全等角度,我们在AP布线、机房位置、机器人充电桩设置等方面结合场馆实际进行综合考量,在网络使用上合理设置上网行为管理。
基于以上的考量点,我们在招标文件里设置了332项技术指标,其中实质性响应指标42项,以保障工程方案满足馆方使用需求,并对施工过程进行了实时跟踪记录。
综上,我们认为对具体的博物馆而言:没有最先进的语音导览,只有最合适的语音导览。