数字化背景下人机交互对景观感知的4个结论

访问量:0张洋
结论与展望

人机交互不断革新人们和环境之间的交互方式,它将对人的行为和环境进行更全面的描述和反馈,让人们以前所未有的方式感知景观。未来在新信息技术、新交互方式、新智能反馈、新情感触发的背景下,人机交互可为景观感知创造更多的可能性。

1) 新信息技术:万物互联与数据感知

回溯在4G技术成熟和普及短短5年内带来的生活变革,它使移动互联网、电子支付、短视频、网络直播成为可能,4G和它催生的服务深刻改变了人们的认知和生活方式。随着5G甚至6G等新信息技术的普及,信息的传递速度将是4G技术的10倍以上,机器与机器之间有望实现真正的“万物互联”,数据流和信息流将进一步扩大人的信息感知维度,甚至有机会引发更多颠覆性的体验变革。但是当下也面临着诸多挑战,首先是物联网的覆盖范围仍然有限,制约信息获得的广度,因此,其覆盖的范围和类型需要进一步扩大;其次是传感设备的灵敏度、准确性和稳定性,制约着信息获取的深度,部分传感设备存在长期使用后灵敏度降低、信号容易被外界环境屏蔽或干扰等问题,同时传感设备的功能集成化和微型化也亟待提升。

2) 新交互方式:从单通道到智能融合

未来人机交互在景观感知中的四种新范式:信息技术、交互方式、智能反馈与情感触发
未来人机交互在景观感知中的四种新范式:信息技术、交互方式、智能反馈与情感触发

人机交互的方式正逐渐打破传统的桌面计算模式,呈现出多元化、创新化的特征。纵观整个科技发展史,变革基本是由交互体验革新引发的,鼠标和键盘标志着个人电脑(personal computer, PC)时代的开端,触摸技术标志着移动互联网时代的开端,而在AI时代,随着AI技术和深度学习算法的不断进步,人机交互将变得更加自然和方便[60]。单通道交互方面,相关技术的研究已经有所突破,但仍存在诸多需要攻克的难点。

例如,空中手势交互的种类和自由度从二维静态、近距离手势扩展到三维动态、远距离手势,并进入实际应用阶段,如谷歌眼镜“Google Project Glass”、微软全息眼镜“Microsoft Hololens”、AR头戴设备“Magic Leap One”,都可以实现手势“隔空”操作,但识别的准确性和范围还有待提高。多通道交互方面,由于人机交互表达的丰富性和模糊性难以准确映射为传统人机交互的界面操作,导致人机交互系统在多通道融合框架下难以准确理解用户意图,而且多通道的融合方法及交互系统依旧依赖于经验设计,缺乏“自我增长”的能力,同时系统的模型迁移能力在支持个性化用户行为的理解方面也需要提高[61]。

因此,构建具有智能增长能力的多通道信息融合和理解模型、训练计算机的类人认知与学习能力,以及训练系统的多通道选择与管控能力,将是多通道信息融合需要重点突破的方向。

3) 新智能反馈:从被动接受到主动交互

以人为起点的人机交互方式,未来可能会转变为以智能机器为起点的“主动交互”,机器通过城市计算、社会计算、情感计算等方式,对人的行为数据和生理数据进行挖掘和分析,计算出人的需求并主动输出执行结果,做出个性化的智能反馈。同时,人在景观中的交互将不仅限于被动体验,通过物联网、传感设备可以把更多的数据信息采集映射到数字世界中,再通过数字世界反向控制和优化物理世界中的场景,从而对环境形成有效反馈和改变。

当然,只有在“持续学习”策略的支持下,才能促使人和智能机器在环境中的共同进化,但现阶段大多数AI算法其实是“离线”的,即上传至网络物理系统中的模型是一个已经调试过的模型(如深度学习中的神经网络)[62],所以智能机器缺乏实质上的“持续学习”能力。因此,此方面的研究还需要继续深入,才有可能实现真正的智能反馈。

4) 新情感触发:情感计算与精准识别

未来随着情感计算相关技术的提升,将赋予智能机器在视、听等方面更强的情感识别能力,同时智能机器对人的思维理解、情境理解能力将更加完善,情感交互能力也将更加智能。但是,情感是人类最复杂的、最不可预测的表达形式,情感计算仍存在诸多技术难题有待解决,比如情感分析往往主要集中在单/双模态以及离散的基本情感类别等方面,缺乏更多模态及连续动态情感分析的系统研究。所以为了实现精准而科学的情感识别与交互,需要新技术、新设备的支撑,而这个过程将和传感技术、机器学习、可视化等的未来发展同步。

常见问题(FAQ)

未来“新信息技术”(如5G/6G)对景观感知的具体影响是什么?
新信息技术将从“广度”和“深度”两个维度重塑景观感知。1)感知广度(万物互联):5G/6G带来的超高速度与低延迟,将推动真正的“万物互联”,使环境中的更多元素(如土壤湿度、空气成分、动植物状态)被实时传感并数字化,极大扩展了人能感知到的环境信息维度。2)感知深度(数据流):海量实时数据流(Data Streams)将使景观从静态的视觉对象,变为一个动态的、可被量化分析的数据集合,人们可以感知到景观背后更微观、实时的变化,从而获得前所未有的深度认知。
文中提到“以智能机器为起点的‘主动交互’”,这在景观场景中可能如何实现?面临什么挑战?
“主动交互”意味着智能系统能预判需求并主动提供服务。1)实现场景:例如,系统通过可穿戴设备监测到游客心率升高、停留时间变长,结合其历史偏好,判断其对当前景点兴趣浓厚,便可主动推送该景点的深度历史典故或AR复原景象到其设备上。2)核心挑战:在于实现“持续学习”。目前AI模型多为“离线”训练,部署后难以在真实环境中持续进化。要实现真正的主动交互,系统必须具备在与人的互动中不断学习、优化反馈模型的能力,这是一个技术难题。
“多通道信息融合”在提升景观交互体验中的关键作用是什么?当前的主要瓶颈是什么?
关键作用在于实现更自然、高效、人性化的交互。1)作用:人在感知景观时,本就是视觉、听觉、触觉、语言等多通道并用的。多通道融合能让计算机像人一样,综合理解用户的手势、语音、视线、位置等多重信息,准确捕捉其复杂意图(如“我想了解前面那棵开红花的树的历史”),从而提供无缝的交互体验。2)当前瓶颈:a) 意图理解模糊:多通道信息的组合方式复杂,难以精确映射到具体操作指令。b) 缺乏“智能增长”:系统融合规则多依赖人工设计,无法自我学习优化以适应不同用户。c) 个性化适配难:系统难以迁移学习以理解不同用户的个性化行为模式。
“情感计算”的成熟将如何改变人与景观的互动关系?其技术难点何在?
情感计算将使交互从“功能响应”升级为“情感共鸣”。1)关系改变:景观将不再是被动观赏的客体,而能“感知”并“回应”人的情绪。例如,当系统识别出游客感到疲惫或压抑时,可自动调整景观照明、播放舒缓音乐或引导至安静休憩区,实现情感化的贴心服务。2)技术难点:a) 情感的复杂性与连续性:人类情感是微妙、混合且连续变化的,当前技术多集中于识别少数几种离散的基本情感,难以捕捉复杂、连续的情感状态。b) 多模态分析的欠缺:情感表达涉及面部表情、语音语调、生理信号、文本等多模态信息,现有研究对多模态数据的融合与连续分析仍不足。c) 情境理解的要求:准确识别情感必须结合具体情境(例如,在纪念碑前的沉默是肃穆而非无聊),这对机器的情境理解能力提出了极高要求。

推荐阅读 / 相关内容