刘伟:人机交互对未来指挥信息系统的影响

作者:刘伟 北京邮电大学人机交互与认知工程实验室主任、教授,远望智库特约研究员,本文为作者在未来战争论坛上的发言稿,经作者审阅!

前言

我的这个报告大概分五部分,第一部分是前言,我给大家推荐一本书,这本书的作者叫迈克尔.博兰尼,他是一位非常伟大的化学家和哲学家。他的哥哥卡尔.博兰尼是一个非常厉害的社会学家,写了《大转型》这本书。他的儿子约翰.波兰尼拿到过诺贝尔化学奖。所以博兰尼家族在世界很有声誉的一个家族。在这本书里面在《隐形的维度》里面说过一句话,叫“Wecan know more than we can tell”(我们知道的比我们说出来的要多得多)。这句话是什么意思呢?就是刚才博(音)研究员提到的,他说一个声纳员他训练了很长时间以后,他也不知道他为什么会很多事情,但是他说不出来为什么掌握了这些技能。但是他能知道这些事情。

下面我们就沿着这条思路往下走。我以前1999年在北航五系做什么呢?飞行员在飞机座舱里的人机交互。当时做这个博士论文。后来继续在北航做博士后,到北邮做老师,一直在研究SituationAwareness这个词。过一会我给大家解释一下,什么叫态势感知。在研究的过程中拿了三个国家自然基金,也做了很多工程项目,越做心越虚,越做越没有底气。后来我就不想再做课题了。觉得非常没有意思。为什么呢?因为我觉得越做下去自己越没有动力或者找不着一个梯子往下走。2012年我去了美国看了一下那里的一些研究。2013年我到了一个非常特殊的地方—剑桥。在英国我待了整整一年,那一年对我的改变非常大,睁开了我的眼睛。下面我想谈一下自己的改变。

在英国期间我特别关注了一下哲学。因为大家都知道人工智能,人机交互最早的时候往往是从抽象的东西开始的。当时我看了很多分析哲学的书。当时给我印象最深的是2500年前整个世界发生了很大的变化。在西方有一个科学和哲学之祖叫泰勒斯,他说过一句话,叫做Wateris best。水是最好的。而且非常有意思的是在我们中国有两个思想圣人也说过与水有关的话,一个是老子,一个是孔子。老子说过上善若水。孔子说过逝者如斯夫。这些关于水的描述是东西方思想在2500年前人类文明的起源。为什么这样说呢?大家可以看一下水孕育了生命这个大家都知道。另外水也孕育了文明。大家可能不是太关注四大文明古国的排序。我自己悄悄地梳理了一下,竟然发现咱们古代中国文明是排在最后一位的。

第一位的是美索不达米亚文明,就是两河流域,底格里斯河和幼发拉底河。它们大约出现在公元前的4000多年,就是距今现在6000多年已经出现了很伟大的文明,有了城邦,有了国家,有了文字。第二是埃及,古埃及文明。而且这几个文明非常有意思的是它大概延续了东非大裂谷,人类走出大裂谷的痕迹。从北非走到了中东,到了印度再到中国,非常有意思的轨迹。第三个文明是印度文明。印度文明它诞生的也是比咱们早一点,后来玄奘在那儿学了很多东西。古代中国文明的起源主要也都靠近水,四大文明起始都这样吧!包括两河,尼罗河,恒河,黄河,包括长江,珠江,都有人类活动的迹象。在这个文明里面非常有意思的我关注了一下,因为两河和尼罗河文明它直接诞生了古希腊文明,它影响缔造了古希腊文明。古希腊文明是欧洲文明之源,欧洲则是科学技术的源头。科学和技术是诞生在欧洲,欧洲文明更是起源于两河和尼罗河文明。在这个文明里边它研究人和物之间的关系。而恒河是研究神,人和神之间的关系。在中东一带有很多宗教,中东和印度起来很多宗教。基督教、佛教、伊斯兰教、犹太教、印度教等,大都在这一带兴起来的,主要涉及人和神之间的关系。更有意思的是这前三个文明,逐步的走下坡路了,巴比伦文明衰败了,印度实际上它的文明也不完整。还有埃及,埃及文明大家看也是支离破碎。而中国文明却比较完整地保存了下来。尽尽管它比前三个要年轻一点。为什么呢?是因为它的研究的和前三个文明不太一样,它研究的是人和人,人和环境之间的关系。我梳理了一下最早是人和物,人和神,人和人,人和环境之间的关系。而人机交互是什么呢?什么是机器?机器就是人造物,交互的本质就是人机环境系统之间的协调共在。现在最早人机交互它的起源在欧洲,应该是在欧洲。我查了许多资料,过会儿给大家汇报一下现代人机交互真正的起源点在什么地方。

概述

简单介绍一下历史以后我们可以看一下人机交互的本质,最近我一直在思考这个问题。从1999年做人机交互到现在我一直在思考,人机交互的本质是什么。最后我想用一个抽象的词叫beingtogether,就是共在、共存,这可能是人机交互的一个本质性的东西,至少在目前来看好像是比较合适的。那么什么是未来指挥信息系统的本质特性啊?刚才博(音)研究员提的非常好,他认为指挥信息系统是一个军事艺术。大家注意了,这句话很重要。是艺术而不仅仅是科学,而咱们现在在座的包括咱们很多科研院所都把它当做科学技术来研究,这是错误的。从本质上就开始出现了基础不牢,就晃了。它主要研究的是什么呢?人的智慧和机的智能怎么结合在一起的问题。这也是未来指挥信息系统的本质。我给大家介绍在英国的一年,我访学的大学是剑桥大学。我去之前我满脑子都是态势感知。到了那个地方以后我以为剑桥就是一个单纯的理工学校,是一个工科特别强的学校。到了剑桥以后我突然发现在这个诞生了牛顿、达尔文、麦克斯韦的这个圣地,它也是对人工智能和人机交互最具有开创性的一个地方。它相当于科学的耶路撒冷和曲阜,这是我的感觉。所以我细致地研究了一下它那边的一些典型的人。首先看左下角的这个人,这个长满了络腮胡子的人,他叫巴贝奇,他是发明了第一台机械式的计算机,他当时叫差分机是用来算对数的,也是硬件里面很早的一个人。

后来为纪念剑桥这些计算先驱们,比尔盖茨投了1亿英镑,在剑桥做了一个剑桥研究院。巴贝奇是剑桥大学三一学院的毕业生,剑桥大学的另外一个毕业生是三一学院的。三一学院非常厉害,它相当于剑桥里面的那个剑尖,31个学院里边最厉害的就是三一学院。谁要是进了三一学院那就是和牛顿、麦克斯韦是学长学弟那种关系,非常厉害。三一学院肄业生中有一个诗人叫拜伦。大家可能有看过《唐璜》,就是拜伦写的。他的女儿叫阿达,一个独生女阿达。她是世界是第一个程序员。所以整个计算机界很有趣的现象发生了:硬件是男人发明的,软件是女人制作的。当做完这个计算机以后,后来人们发现一个问题,其实软件的编制还是有问题的。因为它是基于规则的。于是剑桥又出了一帮很厉害的人,文学家、艺术家、哲学家,“知识就是力量”,说这句话的培根也是剑桥三一学院的。三一学院还有一个厉害的人,叫罗素。他是世界上第一个没用纯文学形式拿到诺贝尔文学奖的人,而是用哲学方面的书拿到诺贝尔文学奖。他的一个厉害的学生叫路德维希维特根斯坦。维特根斯坦是什么人?我给大家说,维特根斯坦是当今世界所有的哲学家投票近200年影响世界哲学的第一人。他当时在2013年投票的时候排在第一位。马克思排第九,他的老师罗素排第三。他当时开创的是分析哲学,研究语言逻辑的,社会化语言和自然语言处理。大家知道现在计算机对自然语言处理非常热,大家起源是他们开始的。所以大家可以看他的书。他一生里面就出版了一部书,书名叫《逻辑哲学论》,很薄的一本书,这是他一生的成就。咱们书店里有卖。你可以看一下他是怎样分析语言形式逻辑的。还有一个是计算机视觉的开创者叫戴维.马尔,他也是三一学院毕业的。所以大家看这几个人里边有很多是三一学院的。下面谈到计算机谈到人机关系我们不得不提到一个伟大的人物--图灵,图灵是剑桥大学国王学院毕业的。他的老师之一是维特根斯坦,刚才我们谈到的那个伟大的哲学家。他令人难忘的是其马拉松成绩很好。他曾在一次比赛中跑到过两小时46分零3秒,当时赢了伦敦奥运会的亚军,图灵的厉害可见一斑。这是剑桥过去的历史。

咱们再看看现在,在最近几年,人工智能有几个非常大的轰动事件。在算法里面有一个叫深度学习。深度学习的开创者之一叫Hilton,他是剑桥大学心理系毕业的。后来他到了苏格兰上了硕士博士,还有一个人就是Hassabis----阿尔法狗的开创者。他是剑桥大学计算机系的本科生。所以剑桥对人工智能,对人机交互的起源具和发展有很大的推动作用。接下来言归正传给大家说一下人机交互究竟起源在什么地方。

这个图片是剑桥的一个非常著名的酒吧,叫做eaglebar。这个酒吧里面有一个伟大的发现,是詹姆斯沃森和弗朗西斯克里克,1953年在这儿大喊一声,喊什么呢?这个酒吧的一个座位,在这个座位下面他们喊出了“Wediscover the secret of human being”(我们发现了人类的秘密)。就是说DNA在这个酒吧里首次发现双螺旋结构的。两人经常在这儿吃饭,这两个人在这讨论出来了双螺旋结构。另外在这个酒吧里面,从这个座位里边有一个顶板,这个顶板大家可以看上面全部都是用打火机或者用蜡烛烧的很多痕迹,那是美国第八空军在二战的时候干的,当时在整个英格兰大概是100多个机场,在剑桥周围10英里范围内有12座机场。美国第八空军战略轰炸部队就是驻扎在剑桥的这些机场内。他们的飞行员平时因为常常去轰炸德国本土、轰炸法国被占领区,所以被击落的概率很高,很害怕,平时也很无聊。于是他们经常去老鹰酒吧去喝酒。他们用打火机烧了他们的番号,烧了他们的姓名,大概的意思就是时刻准备着诀别。这个第八空军和英国的皇军空军常常发生很多的飞行事故。据统计,他们被德国人打下来的飞机非常少,大部分都是在机场起飞和降落的时候出现了各种事故,机毁人亡。于是在剑桥的圣约翰学院,第二大学院,他们请了一帮工程师协助心理学家建造了第一台飞行模拟器。是谁呢?是伊尔斯和克里克在1944年他们做了第一台的空军的飞行模拟器。主要研究为什么会在起飞和降落的时候出现了很多故障。在这个期间他们惊奇地发现是因为人机界面设计得太糟糕了,很多按钮在紧急情况下的时候他按错,造成了人员的无谓的伤亡于是进行了各种型号的改进。我们在北航做的时候也是做飞行员的人机交互,包括信息、界面和一些交互的研究工作。我们发现非常有意思,就是在很多信息的情况下包括各种各样的作战信息、驾驶信息,这些信息常常会出现波动,高级飞行员和新手对信息波动的敏感度不一样。大家可以看一下上面的那个红色的这个是新手对信息敏感的频次。而下面是高级飞行员的,是专家的。他是比较零散的,而且他捕捉信息的线段,就是那个尖那个三角形,最上面这个三角形的底边是比较短的。我们可用这个底边来算他对信息的敏感度,我们正在做这方面的算法。而那个飞行员要捕捉很多的信息,他才能够什么呢?实施行为,实施决策。于是在朝鲜战争以后美国人柏依德提出了一个包以德循环( Boyd Loop),在这个循环里面他也提出这种观点,包括了观察,调整决策行为。

大家注意,从单人的航空,飞行员的人机交互,慢慢衍生到了刚才陆老师提到了C2,C3,我就不再念了,整个的蔓延到了整个战场的态势,目前该领域非常热,刚才陆老师和博(音)研究员也提到了认知、认知科学。什么是认知科学?认知科学简单地说就是数据的输入、处理、输出、反馈一个信息流。这个信息流动过程,就是认知。所以这个认知很简单,是从人开始再回到人,这是一个闭环。我们现在也在做数据空间的一些设想,人怎样处理数据,机怎么处理数据。这个数据对整个态势的判断决策、辅助决策有什么样的影响?怎么优化?另外我介绍一个人,这个人叫MicaEndsley。我1999年老师给我布置博士论文选题的时候叫《飞行员视觉信息流研究》。当时我查了很多资料,后来与导师商量后否了的这个选题,选做situationalawareness态势感知研究,就是Endsley这位女科学家在1988年提出来的。我上网搜索到,她是南加州大学工业工程系毕业的,大概是1960年生人。2013年我回国的时候想邀请她到北邮去做一个SA报告,因为她开一个公司叫SA,就是Situational Awareness的简称。结果她的邮箱自动回复告诉我说她已被任命为美国空军首席科学家,这样她就不能到中国来了。而她提出得这个词SA已成为美国空军一个非常热的词。她自己也承认她的思想是源于中国的孙子,《孙子兵法》英文的名字就叫《TheArt of War》,《战争的艺术》就是《孙子兵法》。所以刚才博研究员提到了指挥是艺术。世界三大兵书中的其他两个兵法是克劳塞维茨的《战争论》---《战争的理论》,还有一个《五轮书》是日本人写的,日本人写的那个就是两个人格斗的策略,一部分是日本刀的刀法,另一部分则是竞技策略。

从上不难看出,只有中国人把战争看成是一个艺术,实际上也是一个艺术。这是Endsley在1988年human factor---人因工程学会的一个定义,对态势感知或者叫情景意识,我们翻译成汉语大概是那么一个意思:就是在一定的时空内对环境中的各组成成分的感知理解,进而预测规划未来的一个过程。我很好奇就上美国空军官网查了一下美国最近几届空军首席科学家的简历,查了从2000年到2013年五届,结果发现前三任全部都是硬科学,像机械,航空航天,这种专业性很强的。到2010年Maybury这届变化就比较大了,他是剑桥大学计算机系的,主要研究认知交互。他退下来以后,Endsley是工业工程专业的,研究situationalawareness,这两个人都偏软件系统的。所以美国空军有一个倾向,就是从硬转软。而且我们查了他的陆军,海军等官网,慢慢地都有这个倾向,即软件系统的专业的科学家当首席科学家,渐渐成为趋势。这意味着什么呢?意味着人工智能和信息化慢慢地已经超过了以前对诸硬科学的需求了。现在各个学科都在发展,发展的核心现在就是一个交叉融合。我问过他们,在酒吧里或者实验室里问过他们,他们大概就是说世界上本身不分学科,是人为地分了很多学科,然后大家就割裂开来了。现在这个时代又开始融合了,分久必合了。合的现在一个最主要的点就是cognitivescience,认知科学。所以刚才说的数据的数据流之输入、处理、输出、反馈,这就是认知科学。其实说人机交互不准确,应该叫人机环境系统交互。这个环境包括社会环境和自然环境,还包括真实环境和虚拟环境。所以人机环是一个比较完整的说法。这个机器是人造物,所以说人物环也可以。我们现在在做的主要的一个方向是人机环境系统工程,研究人、装备和环境之间的交互。

研究现状

咱们看一下现在的人机交互的研究现状。

理论方法现在涉及到人机的一些方法,包括上下文感知计算、多模态的感知等等的。这是衍生出来的技术。但是现在有一个很重要的点是情感计算。情感计算这块是非常难的点。为什么说它非常难呢?是因为情感计算,这块大家可能不是太清楚。它涉及到智慧的问题。情生智,人的情感产生了智慧。所以机器是冷冰冰的没有智慧。提到阿尔法狗这块现在的一个很重要的研究的现状是这样的,两大公司大家一定要关注,第一大公司是Google公司。一个是它收买的Deepmind公司,现在引起了大家的一再关注。第二个是谷歌无人车,这也是一个智能人机交互项目。谷歌公司现在的投入很大,它在这块是比较领先的。另外一个公司是美国的IBM公司,这个公司主要做深蓝,这是1997年做的项目,其次是沃森,沃森系统是2007年初步成形,现在正在渗透到医学或者是其他的一些领域。大家需要关注的这两大公司的这几个代表的产品,代表未来的技术的一个走势。我们自己在思考人工智能它的局限性的根源是什么。刚才我给大家说了情感。情感计算,情感的生成的智慧是人工智能里面的一个瓶颈。而为什么会产生这个呢?是因为现在的人工智能都是形式化,符号化的计算占主导。人的情感是无法符号化和形式化的东西。但是人的智能,人归纳出的规则\概率是可以符号形式化的,这是它的根。另外还有一个莫拉维克悖论,他大概是说像人的高级智慧/智能,有规则的东西是很容易编程的。但像人的感知运动--这种低级的技能或常识的东西是非常难编程的。这个简单吗?不简单。复杂吗?不复杂。这是他的一个悖论。我们认为未来的人机交互的指挥信息智能系统应该有四个特点,主动推荐,自主学习,自然进化和自身的免疫。这个是美军的一个系统,美军通过IBM的深蓝系统,它衍生的一套深绿,大家可以上网去查一下深绿系统,它是指挥控制系统,后来它进入了地下研究状态。

我们现在主要是在思考一个问题人机智慧,刚才提到的。怎么计算和算计,什么是计算什么是算计?计算是机械的,是符号化的,形式化的东西。算计是由内而外的东西,人的东西。算计比计算更厉害,计算机不会算计,它只会计算,只会搜索,只会强化学习,只会机器学习。它的学习和人的学习不一样。我们现在感知如果将来需要强人工智能,需要重新定义学习,理解知识、概念、信息这些最基本的词都需要定义。由于时间的原因我就不再展开了。

一点思考

下面我们再考虑一个问题,我一直在考虑什么是意识?怎样形成态势感知的?人的意向性是怎么来形成的。简单的说是无中生有和有中生无这两个。什么是无中生有呢?就通过对外界的刺激产生的数据和产生的数值,提取信息,形成知识。知识变成了逻辑。就是0到1的一个过程。有中生无是一个由意向性变成意识,由意识变成潜意识、下意识,最后变成无意识就这么一个过程。我们在研究深度态势感知,这个主要是用了一些基于规则和概率的方法,这是数学的方法。现在我们发现还不够。我们准备研究具有自主认知。什么是自主?自主简单的说是这样的,它具有这几个特点,自主包含了选择和控制和期望。人的自主性包含这几个基本的概念。传统的人工智能现在主要是数学方法。现在的人机环境系统交互就是加上一些自动化,加上弱人工智能,这是人机环境系统交互。人工智能已经有了一些限定的规则,而人机交互现在正在形成这种规则,一个大系统,社会环境和自然环境,如未来的指挥信息系统现在还没有游戏规则。所以大家都在摸着石头过河。也是陆老师刚才提到的,他说美军和咱们中国人民解放军现在同一起跑线上。为什么呢?因为没有规则。大家注意了,现在他也没有形成一套很厉害的东西。现在他们situationalawareness也在研究,咱们已经开始研究deepsituational awareness,现在都在一个起跑线上。所以咱们弯道超车。现在咱们正处在弯道上和他在一起,硬件上可能有一点差距,但是软件的差距不是很大。

作者:刘伟 北京邮电大学人机交互与认知工程实验室主任、教授,远望智库特约研究员,本文为作者在未来战争论坛上的发言稿,经作者审阅!

前言

我的这个报告大概分五部分,第一部分是前言,我给大家推荐一本书,这本书的作者叫迈克尔.博兰尼,他是一位非常伟大的化学家和哲学家。他的哥哥卡尔.博兰尼是一个非常厉害的社会学家,写了《大转型》这本书。他的儿子约翰.波兰尼拿到过诺贝尔化学奖。所以博兰尼家族在世界很有声誉的一个家族。在这本书里面在《隐形的维度》里面说过一句话,叫“Wecan know more than we can tell”(我们知道的比我们说出来的要多得多)。这句话是什么意思呢?就是刚才博(音)研究员提到的,他说一个声纳员他训练了很长时间以后,他也不知道他为什么会很多事情,但是他说不出来为什么掌握了这些技能。但是他能知道这些事情。

下面我们就沿着这条思路往下走。我以前1999年在北航五系做什么呢?飞行员在飞机座舱里的人机交互。当时做这个博士论文。后来继续在北航做博士后,到北邮做老师,一直在研究SituationAwareness这个词。过一会我给大家解释一下,什么叫态势感知。在研究的过程中拿了三个国家自然基金,也做了很多工程项目,越做心越虚,越做越没有底气。后来我就不想再做课题了。觉得非常没有意思。为什么呢?因为我觉得越做下去自己越没有动力或者找不着一个梯子往下走。2012年我去了美国看了一下那里的一些研究。2013年我到了一个非常特殊的地方—剑桥。在英国我待了整整一年,那一年对我的改变非常大,睁开了我的眼睛。下面我想谈一下自己的改变。

在英国期间我特别关注了一下哲学。因为大家都知道人工智能,人机交互最早的时候往往是从抽象的东西开始的。当时我看了很多分析哲学的书。当时给我印象最深的是2500年前整个世界发生了很大的变化。在西方有一个科学和哲学之祖叫泰勒斯,他说过一句话,叫做Wateris best。水是最好的。而且非常有意思的是在我们中国有两个思想圣人也说过与水有关的话,一个是老子,一个是孔子。老子说过上善若水。孔子说过逝者如斯夫。这些关于水的描述是东西方思想在2500年前人类文明的起源。为什么这样说呢?大家可以看一下水孕育了生命这个大家都知道。另外水也孕育了文明。大家可能不是太关注四大文明古国的排序。我自己悄悄地梳理了一下,竟然发现咱们古代中国文明是排在最后一位的。

第一位的是美索不达米亚文明,就是两河流域,底格里斯河和幼发拉底河。它们大约出现在公元前的4000多年,就是距今现在6000多年已经出现了很伟大的文明,有了城邦,有了国家,有了文字。第二是埃及,古埃及文明。而且这几个文明非常有意思的是它大概延续了东非大裂谷,人类走出大裂谷的痕迹。从北非走到了中东,到了印度再到中国,非常有意思的轨迹。第三个文明是印度文明。印度文明它诞生的也是比咱们早一点,后来玄奘在那儿学了很多东西。古代中国文明的起源主要也都靠近水,四大文明起始都这样吧!包括两河,尼罗河,恒河,黄河,包括长江,珠江,都有人类活动的迹象。在这个文明里面非常有意思的我关注了一下,因为两河和尼罗河文明它直接诞生了古希腊文明,它影响缔造了古希腊文明。古希腊文明是欧洲文明之源,欧洲则是科学技术的源头。科学和技术是诞生在欧洲,欧洲文明更是起源于两河和尼罗河文明。在这个文明里边它研究人和物之间的关系。而恒河是研究神,人和神之间的关系。在中东一带有很多宗教,中东和印度起来很多宗教。基督教、佛教、伊斯兰教、犹太教、印度教等,大都在这一带兴起来的,主要涉及人和神之间的关系。更有意思的是这前三个文明,逐步的走下坡路了,巴比伦文明衰败了,印度实际上它的文明也不完整。还有埃及,埃及文明大家看也是支离破碎。而中国文明却比较完整地保存了下来。尽尽管它比前三个要年轻一点。为什么呢?是因为它的研究的和前三个文明不太一样,它研究的是人和人,人和环境之间的关系。我梳理了一下最早是人和物,人和神,人和人,人和环境之间的关系。而人机交互是什么呢?什么是机器?机器就是人造物,交互的本质就是人机环境系统之间的协调共在。现在最早人机交互它的起源在欧洲,应该是在欧洲。我查了许多资料,过会儿给大家汇报一下现代人机交互真正的起源点在什么地方。

概述

简单介绍一下历史以后我们可以看一下人机交互的本质,最近我一直在思考这个问题。从1999年做人机交互到现在我一直在思考,人机交互的本质是什么。最后我想用一个抽象的词叫beingtogether,就是共在、共存,这可能是人机交互的一个本质性的东西,至少在目前来看好像是比较合适的。那么什么是未来指挥信息系统的本质特性啊?刚才博(音)研究员提的非常好,他认为指挥信息系统是一个军事艺术。大家注意了,这句话很重要。是艺术而不仅仅是科学,而咱们现在在座的包括咱们很多科研院所都把它当做科学技术来研究,这是错误的。从本质上就开始出现了基础不牢,就晃了。它主要研究的是什么呢?人的智慧和机的智能怎么结合在一起的问题。这也是未来指挥信息系统的本质。我给大家介绍在英国的一年,我访学的大学是剑桥大学。我去之前我满脑子都是态势感知。到了那个地方以后我以为剑桥就是一个单纯的理工学校,是一个工科特别强的学校。到了剑桥以后我突然发现在这个诞生了牛顿、达尔文、麦克斯韦的这个圣地,它也是对人工智能和人机交互最具有开创性的一个地方。它相当于科学的耶路撒冷和曲阜,这是我的感觉。所以我细致地研究了一下它那边的一些典型的人。首先看左下角的这个人,这个长满了络腮胡子的人,他叫巴贝奇,他是发明了第一台机械式的计算机,他当时叫差分机是用来算对数的,也是硬件里面很早的一个人。

后来为纪念剑桥这些计算先驱们,比尔盖茨投了1亿英镑,在剑桥做了一个剑桥研究院。巴贝奇是剑桥大学三一学院的毕业生,剑桥大学的另外一个毕业生是三一学院的。三一学院非常厉害,它相当于剑桥里面的那个剑尖,31个学院里边最厉害的就是三一学院。谁要是进了三一学院那就是和牛顿、麦克斯韦是学长学弟那种关系,非常厉害。三一学院肄业生中有一个诗人叫拜伦。大家可能有看过《唐璜》,就是拜伦写的。他的女儿叫阿达,一个独生女阿达。她是世界是第一个程序员。所以整个计算机界很有趣的现象发生了:硬件是男人发明的,软件是女人制作的。当做完这个计算机以后,后来人们发现一个问题,其实软件的编制还是有问题的。因为它是基于规则的。于是剑桥又出了一帮很厉害的人,文学家、艺术家、哲学家,“知识就是力量”,说这句话的培根也是剑桥三一学院的。三一学院还有一个厉害的人,叫罗素。他是世界上第一个没用纯文学形式拿到诺贝尔文学奖的人,而是用哲学方面的书拿到诺贝尔文学奖。他的一个厉害的学生叫路德维希维特根斯坦。维特根斯坦是什么人?我给大家说,维特根斯坦是当今世界所有的哲学家投票近200年影响世界哲学的第一人。他当时在2013年投票的时候排在第一位。马克思排第九,他的老师罗素排第三。他当时开创的是分析哲学,研究语言逻辑的,社会化语言和自然语言处理。大家知道现在计算机对自然语言处理非常热,大家起源是他们开始的。所以大家可以看他的书。他一生里面就出版了一部书,书名叫《逻辑哲学论》,很薄的一本书,这是他一生的成就。咱们书店里有卖。你可以看一下他是怎样分析语言形式逻辑的。还有一个是计算机视觉的开创者叫戴维.马尔,他也是三一学院毕业的。所以大家看这几个人里边有很多是三一学院的。下面谈到计算机谈到人机关系我们不得不提到一个伟大的人物--图灵,图灵是剑桥大学国王学院毕业的。他的老师之一是维特根斯坦,刚才我们谈到的那个伟大的哲学家。他令人难忘的是其马拉松成绩很好。他曾在一次比赛中跑到过两小时46分零3秒,当时赢了伦敦奥运会的亚军,图灵的厉害可见一斑。这是剑桥过去的历史。

咱们再看看现在,在最近几年,人工智能有几个非常大的轰动事件。在算法里面有一个叫深度学习。深度学习的开创者之一叫Hilton,他是剑桥大学心理系毕业的。后来他到了苏格兰上了硕士博士,还有一个人就是Hassabis----阿尔法狗的开创者。他是剑桥大学计算机系的本科生。所以剑桥对人工智能,对人机交互的起源具和发展有很大的推动作用。接下来言归正传给大家说一下人机交互究竟起源在什么地方。

这个图片是剑桥的一个非常著名的酒吧,叫做eaglebar。这个酒吧里面有一个伟大的发现,是詹姆斯沃森和弗朗西斯克里克,1953年在这儿大喊一声,喊什么呢?这个酒吧的一个座位,在这个座位下面他们喊出了“Wediscover the secret of human being”(我们发现了人类的秘密)。就是说DNA在这个酒吧里首次发现双螺旋结构的。两人经常在这儿吃饭,这两个人在这讨论出来了双螺旋结构。另外在这个酒吧里面,从这个座位里边有一个顶板,这个顶板大家可以看上面全部都是用打火机或者用蜡烛烧的很多痕迹,那是美国第八空军在二战的时候干的,当时在整个英格兰大概是100多个机场,在剑桥周围10英里范围内有12座机场。美国第八空军战略轰炸部队就是驻扎在剑桥的这些机场内。他们的飞行员平时因为常常去轰炸德国本土、轰炸法国被占领区,所以被击落的概率很高,很害怕,平时也很无聊。于是他们经常去老鹰酒吧去喝酒。他们用打火机烧了他们的番号,烧了他们的姓名,大概的意思就是时刻准备着诀别。这个第八空军和英国的皇军空军常常发生很多的飞行事故。据统计,他们被德国人打下来的飞机非常少,大部分都是在机场起飞和降落的时候出现了各种事故,机毁人亡。于是在剑桥的圣约翰学院,第二大学院,他们请了一帮工程师协助心理学家建造了第一台飞行模拟器。是谁呢?是伊尔斯和克里克在1944年他们做了第一台的空军的飞行模拟器。主要研究为什么会在起飞和降落的时候出现了很多故障。在这个期间他们惊奇地发现是因为人机界面设计得太糟糕了,很多按钮在紧急情况下的时候他按错,造成了人员的无谓的伤亡于是进行了各种型号的改进。我们在北航做的时候也是做飞行员的人机交互,包括信息、界面和一些交互的研究工作。我们发现非常有意思,就是在很多信息的情况下包括各种各样的作战信息、驾驶信息,这些信息常常会出现波动,高级飞行员和新手对信息波动的敏感度不一样。大家可以看一下上面的那个红色的这个是新手对信息敏感的频次。而下面是高级飞行员的,是专家的。他是比较零散的,而且他捕捉信息的线段,就是那个尖那个三角形,最上面这个三角形的底边是比较短的。我们可用这个底边来算他对信息的敏感度,我们正在做这方面的算法。而那个飞行员要捕捉很多的信息,他才能够什么呢?实施行为,实施决策。于是在朝鲜战争以后美国人柏依德提出了一个包以德循环( Boyd Loop),在这个循环里面他也提出这种观点,包括了观察,调整决策行为。

大家注意,从单人的航空,飞行员的人机交互,慢慢衍生到了刚才陆老师提到了C2,C3,我就不再念了,整个的蔓延到了整个战场的态势,目前该领域非常热,刚才陆老师和博(音)研究员也提到了认知、认知科学。什么是认知科学?认知科学简单地说就是数据的输入、处理、输出、反馈一个信息流。这个信息流动过程,就是认知。所以这个认知很简单,是从人开始再回到人,这是一个闭环。我们现在也在做数据空间的一些设想,人怎样处理数据,机怎么处理数据。这个数据对整个态势的判断决策、辅助决策有什么样的影响?怎么优化?另外我介绍一个人,这个人叫MicaEndsley。我1999年老师给我布置博士论文选题的时候叫《飞行员视觉信息流研究》。当时我查了很多资料,后来与导师商量后否了的这个选题,选做situationalawareness态势感知研究,就是Endsley这位女科学家在1988年提出来的。我上网搜索到,她是南加州大学工业工程系毕业的,大概是1960年生人。2013年我回国的时候想邀请她到北邮去做一个SA报告,因为她开一个公司叫SA,就是Situational Awareness的简称。结果她的邮箱自动回复告诉我说她已被任命为美国空军首席科学家,这样她就不能到中国来了。而她提出得这个词SA已成为美国空军一个非常热的词。她自己也承认她的思想是源于中国的孙子,《孙子兵法》英文的名字就叫《TheArt of War》,《战争的艺术》就是《孙子兵法》。所以刚才博研究员提到了指挥是艺术。世界三大兵书中的其他两个兵法是克劳塞维茨的《战争论》---《战争的理论》,还有一个《五轮书》是日本人写的,日本人写的那个就是两个人格斗的策略,一部分是日本刀的刀法,另一部分则是竞技策略。

从上不难看出,只有中国人把战争看成是一个艺术,实际上也是一个艺术。这是Endsley在1988年human factor---人因工程学会的一个定义,对态势感知或者叫情景意识,我们翻译成汉语大概是那么一个意思:就是在一定的时空内对环境中的各组成成分的感知理解,进而预测规划未来的一个过程。我很好奇就上美国空军官网查了一下美国最近几届空军首席科学家的简历,查了从2000年到2013年五届,结果发现前三任全部都是硬科学,像机械,航空航天,这种专业性很强的。到2010年Maybury这届变化就比较大了,他是剑桥大学计算机系的,主要研究认知交互。他退下来以后,Endsley是工业工程专业的,研究situationalawareness,这两个人都偏软件系统的。所以美国空军有一个倾向,就是从硬转软。而且我们查了他的陆军,海军等官网,慢慢地都有这个倾向,即软件系统的专业的科学家当首席科学家,渐渐成为趋势。这意味着什么呢?意味着人工智能和信息化慢慢地已经超过了以前对诸硬科学的需求了。现在各个学科都在发展,发展的核心现在就是一个交叉融合。我问过他们,在酒吧里或者实验室里问过他们,他们大概就是说世界上本身不分学科,是人为地分了很多学科,然后大家就割裂开来了。现在这个时代又开始融合了,分久必合了。合的现在一个最主要的点就是cognitivescience,认知科学。所以刚才说的数据的数据流之输入、处理、输出、反馈,这就是认知科学。其实说人机交互不准确,应该叫人机环境系统交互。这个环境包括社会环境和自然环境,还包括真实环境和虚拟环境。所以人机环是一个比较完整的说法。这个机器是人造物,所以说人物环也可以。我们现在在做的主要的一个方向是人机环境系统工程,研究人、装备和环境之间的交互。

研究现状

咱们看一下现在的人机交互的研究现状。

理论方法现在涉及到人机的一些方法,包括上下文感知计算、多模态的感知等等的。这是衍生出来的技术。但是现在有一个很重要的点是情感计算。情感计算这块是非常难的点。为什么说它非常难呢?是因为情感计算,这块大家可能不是太清楚。它涉及到智慧的问题。情生智,人的情感产生了智慧。所以机器是冷冰冰的没有智慧。提到阿尔法狗这块现在的一个很重要的研究的现状是这样的,两大公司大家一定要关注,第一大公司是Google公司。一个是它收买的Deepmind公司,现在引起了大家的一再关注。第二个是谷歌无人车,这也是一个智能人机交互项目。谷歌公司现在的投入很大,它在这块是比较领先的。另外一个公司是美国的IBM公司,这个公司主要做深蓝,这是1997年做的项目,其次是沃森,沃森系统是2007年初步成形,现在正在渗透到医学或者是其他的一些领域。大家需要关注的这两大公司的这几个代表的产品,代表未来的技术的一个走势。我们自己在思考人工智能它的局限性的根源是什么。刚才我给大家说了情感。情感计算,情感的生成的智慧是人工智能里面的一个瓶颈。而为什么会产生这个呢?是因为现在的人工智能都是形式化,符号化的计算占主导。人的情感是无法符号化和形式化的东西。但是人的智能,人归纳出的规则\概率是可以符号形式化的,这是它的根。另外还有一个莫拉维克悖论,他大概是说像人的高级智慧/智能,有规则的东西是很容易编程的。但像人的感知运动--这种低级的技能或常识的东西是非常难编程的。这个简单吗?不简单。复杂吗?不复杂。这是他的一个悖论。我们认为未来的人机交互的指挥信息智能系统应该有四个特点,主动推荐,自主学习,自然进化和自身的免疫。这个是美军的一个系统,美军通过IBM的深蓝系统,它衍生的一套深绿,大家可以上网去查一下深绿系统,它是指挥控制系统,后来它进入了地下研究状态。

我们现在主要是在思考一个问题人机智慧,刚才提到的。怎么计算和算计,什么是计算什么是算计?计算是机械的,是符号化的,形式化的东西。算计是由内而外的东西,人的东西。算计比计算更厉害,计算机不会算计,它只会计算,只会搜索,只会强化学习,只会机器学习。它的学习和人的学习不一样。我们现在感知如果将来需要强人工智能,需要重新定义学习,理解知识、概念、信息这些最基本的词都需要定义。由于时间的原因我就不再展开了。

一点思考

下面我们再考虑一个问题,我一直在考虑什么是意识?怎样形成态势感知的?人的意向性是怎么来形成的。简单的说是无中生有和有中生无这两个。什么是无中生有呢?就通过对外界的刺激产生的数据和产生的数值,提取信息,形成知识。知识变成了逻辑。就是0到1的一个过程。有中生无是一个由意向性变成意识,由意识变成潜意识、下意识,最后变成无意识就这么一个过程。我们在研究深度态势感知,这个主要是用了一些基于规则和概率的方法,这是数学的方法。现在我们发现还不够。我们准备研究具有自主认知。什么是自主?自主简单的说是这样的,它具有这几个特点,自主包含了选择和控制和期望。人的自主性包含这几个基本的概念。传统的人工智能现在主要是数学方法。现在的人机环境系统交互就是加上一些自动化,加上弱人工智能,这是人机环境系统交互。人工智能已经有了一些限定的规则,而人机交互现在正在形成这种规则,一个大系统,社会环境和自然环境,如未来的指挥信息系统现在还没有游戏规则。所以大家都在摸着石头过河。也是陆老师刚才提到的,他说美军和咱们中国人民解放军现在同一起跑线上。为什么呢?因为没有规则。大家注意了,现在他也没有形成一套很厉害的东西。现在他们situationalawareness也在研究,咱们已经开始研究deepsituational awareness,现在都在一个起跑线上。所以咱们弯道超车。现在咱们正处在弯道上和他在一起,硬件上可能有一点差距,但是软件的差距不是很大。


相关文章

  • 有人机_无人机协同任务控制系统_彭辉
  • 第29卷 增刊 航 空 学 报 Vol. 29 Sup. 2008年 5月 ACTA AERONAUTICA ET ASTRONAUTICA SINICA May 2008 文章编号: 1000-6893(2008)增-S135-07 有人 ...查看


  • 浅谈人机界面设计
  • 浅谈人机界面设计 摘要:近年来,随着计算机硬件的快速发展,新一代的计算机用户,在应用软件的可操作性以及软件操作的舒适性等方面对应用软件提出了更高的要求,除期望所用的软件拥有强大的功能外,更期望应用软件能尽可能的为他们提供一个轻松.愉快.感觉 ...查看


  • 美军无人机僚机技术研究取得阶段性进展
  • 张洋 中航工业发展研究中心青年学者 远望智库特约研究员 2017年3月,美国洛马公司领导的团队与美空军联合开展了新一轮有人机/无人机编组关键技术演示试飞,成功地对可支撑美空军"忠诚僚机"构想的一些关键技术进行了验证.该演 ...查看


  • 浅议新型人机交互方式的种类及应用特性
  • 引言:我一直这么认为,要想深入认知一个行业或者专业技能,必须先对其传播媒介有所研究,因为这才是能否将意图准确传递给大众的关键,能否实现的良好互动体验的关键.所以这篇论文我对时下流行的交互方式和新型交互设备做了类比分析,清晰指出各自的优缺点. ...查看


  • (乔一乐)可视化论文
  • 可视化仿真论文 展 望 虚 拟 现 实 技 术 姓名:乔一乐 学号:[1**********]7 专业:水工结构工程 指导教师:魏群 1 引言 虚拟现实是一种综合计算机图形技术.多媒体技术.传感器技术.人机交互技术.网络技术.立体显示技术以 ...查看


  • 无人机数据链系统介绍
  • 科技信息○科教前沿○SCIENCE &TECHNOLOGY INFORMATION 2009年第1期 无人机数据链系统介绍 易牧胡延霖李保林梁存真 (中国人民解放军郑州防空兵指挥学院河南郑州 450007) [摘要]探讨了国内外常用 ...查看


  • 语音识别的痛点在哪,从交互到精准识别如何做?
  • 语音识别是目前应用最成熟的人机交互方式,从最初大家体验过的有屏手持设备这种近场的语音识别,如Siri以及各种语音助手,到现在,语音识别的应用已经完成了向智能硬件以及机器人上延伸,不过,新的人机交互对硬件.算法要求更加苛刻,各企业正面临着巨大 ...查看


  • 自然人机交互技术中的界面设计
  • 第26卷第3期2008年05月 佳木斯大学学报(自然科学版)JournalofJianmsiUniversity(NaturalScienceEdition) v01.26No.3May 2008 文章编号:1008-1402(200s]0 ...查看


  • 人机界面设计
  • 自动化制造系统的人机界面设计 摘要:近年来,人机界面的设计理论已经更广泛地发展和应用到人一机一环境系统工程等领域,使工程技术设计与使用者的身心行为特点相适应,从而使人能够高效.舒适地工作与生活.为了使制造系统达到效率最大化.经济最优化,我们 ...查看


热门内容