发布时间:2020-09-20
8月29日至30日,由中国科学技术协会、中国科学院、南京市人民政府为指导单位,中国人工智能学会、南京市建邺区人民政府、江苏省科学技术协会主办的主题为“ 智周万物 ”的2020中国人工智能大会(CCAI 2020)在新加坡·南京生态科技岛举办。在30日大会主旨报告环节,人工智能促进会现任主席、南加州大学信息科学研究所科研副主任、ACM/AAAI Fellow Yolanda Gil 教授为我们带来了题为《深思型人工智能:洞见数据科学与科学探索的新关系》的精彩演讲。
Yolanda Gil
人工智能促进会现任主席
南加州大学信息科学研究所科研副主任
ACM/AAAI Fellow
以下是Yolanda Gil教授的演讲实录:
今天我很高兴也很感谢各位能够让我在这里给大家分享一些关于“思考型人工智能”的想法。
对我来说,思考型的人工智能可以看做是一系列能够推动人工智能的研究的准则,使人工智能更好地服务于数据科学,乃至帮助发掘人类各项科学研究成果。
近年来,人工智能展现出了超凡的能力。很长一段时间以来,人工智能取得的成果十分喜人。
我想在此着重列举一些,如:推荐系统、自动驾驶汽车、能够合作的机器人团队、以及IBM的Watson。同Watson相比即便是最厉害的问答选手也只得认输。
此外,我还想强调一下知识图谱,我们用这种技术改善搜索能力、让语音助手更好地接受以及执行指令。
之所以强调这些技术,是因为我想对以下两个研究主线进行一些对比。这其中,第一个主线是基于数据驱动的AI研究,第二个主线是知识驱动的AI研究(利用已有的知识来学习和获取新的知识)。
对我而言,这两条主线的研究实际上是相辅相成的。我并不认为所有的顶层方法都是知识驱动的,同样也不同认为所有的底层方法都是基于数据驱动的。实际上并不是这样的。
这里我只是想对AI中这两类常见的方法进行一个对比。当我们在谈论科学的时候,我们常常可以看到在,看到不同领域中相似的方法,例如,推荐系统和基于网络的机器学习方法在气候科学方面取得了巨大的成果。人们利用自动驾驶技术帮助机器人潜入海底并自主完成一些任务,例如帮助人们探索海底的未知地带、进行一些实验等等,这样的场景我们在火星上也能见到。
关于将机器人自动化应用于科学实验操作的研究非常多。在知识层面,我们在文本提取、文献组织以及知识图谱等方面取得了巨大进展。
Openfacts就是一个很典型的例子,这其中包含了与生物制药行业相关的大量的蛋白质结构和知识。
此外,在基于任务驱动的研究活动中,人们对工作流以及自动化工作流还展开了非常多的工作。所以说,如果我们要讲AI对科学的影响,那影响真的是太大了。无论是数据驱动的AI还是知识驱动的AI,都是如此,所以我也在此介绍一些最新的进展。
(幻灯片)顶部给出了两个更贴近数据驱动的例子,(幻灯片)底部给出了两个更贴近知识驱动的例子,这些例子都是两类方法协同发展的产物。我们也能看到人工智能正在改变科学,这多么激动人心!
当然,无论是数据驱动的AI还是知识驱动的AI,它们长久以来都在学习如何采纳、理解、产出新的科研观点。相关历史可以追溯到1950年代,那时候Herb Simon曾经对思维和行为过程进行了一些分析。后来人们在此基础上又展开了一系列的研究。
这一过程持续至今,AI在科学研究领域造就了许多强有力且具有开创意义的工作。在这次报告中,我想给大家主要分享我的四个观点。我会逐一为大家讲解。这其中第四个观点可能是最重要的一个,因为这里面我会针对思考型人工智能给出一些观点,并讨论科学研究领域真正需要AI具备什么样的能力。虽然我今天讲的是科学研究,但是这些思想在任何涉及到数据,理解以及知识推理的应用中都是适用的。
下面我会从顶层方法讲起:知识技术正变得越来越重要。我认为知识驱动的AI其重要性在日益凸显。我们可以看到,许多工业级的知识库为各种产品的推荐、各种类型的搜索服务等等提供支持。我们看到,在工业应用中,许多大型的知识库以知识图谱的形式呈现出来。
知识技术的另一次复兴则是在自然语言领域。许多研究专注于从文本、事实、关联实体的方式等方面提取常识性的知识。我们也能够在另一领域——计算机视觉领域看到相似的情况也正在发生。我们可以识别物体的类别、物体的特性以及物体之间的关系。这个过程类似于在数据库中,我们可以对物体信息进行关联并且回答一些问题。
此外,在机器学习领域,我们也能看到将知识和机器学习或数据科学处理相结合已是大趋势。此外,我们也看到在可解释机器学习模型方面取得了一些进展。我们也看到很多为了更好地理解数据而提出的对抗机器学习方法。我们看到人们对理论导向的(theory-guided)数据科学以及物理信息型(physics-informed)机器学习产生了极大的兴趣。类似的进展非常多,有各式各样的名字。
但是,这些方法真的可以把知识融入到机器学习模型中吗?特别是在科学研究领域,我们学习到的模型应该与现实世界的理论和物理规律相符合。所以,知识正变得越发重要。
相比之下人类的能力微不足道,我们我们得了解多少知识才能真正研究真正了解这个世界,才能准备好回答并吸收这个世界的问题与知识。
这里我想分享一张从谷歌上找到的JamieTaylor的幻灯片。在维基百科上有个页面,讲的是如果我们想要了解这个世界的一切,我们实际需要的文章数目将是多少。维基百科对其现有的文章数以及所需文章数进行了一个估计和对比。结果就是五百多万比一亿多。虽然我们已经整合了很多内容,但还有更多零零散散的内容被收录在类似维基百科的网站里。所以要想收集更多知识,我们必须付出更多。因此,知识驱动的方法其重要性与日俱增。
以上是我的第一个观点。是的,要实现这一点非常有挑战性,但我们需要进一步努力推进。我想讲的第二点是:一提到科学,我们就会想到极具创造力而又极其严谨的科学家群体。
我认为,AI可以在这方面为科学研究带来一些帮助,比如系统的、正确的、无偏的研究方式以及严谨的研究报告等。我为什么这么说呢?在我看来,人类的一些局限性正在妨碍科学的发展,这一点需要人工智能来帮助我们克服。一方面来看,人类并不一定能做到系统化。在这里我想举一个的例子来说明这个问题。ShawnPeters和一些其他的研究者曾使用文本提取系统来提取出版物中的化石报告。
类似地,Seb Skobski等人也曾花了几年的时间用人力去做了类似的工作。Shawn Peters发现,使用自动化系统得出的结果更加全面。使用自动化整合方法可以检测到比独立文献中报告中更加丰富的结论。所以,虽然我们在科学研究中对人类的能力给出足够信任,但事实上人类并非如我们想的那样有很强的系统性、一致性以及科学的方法论。
另一方面,犯错也是人类的弱点。虽然很多错误是无意的,但它们就像涟漪一般,实实在在影响了之后的科学发展。所以我们经常可以在出版物中看到一些勘误以及新的错误源源不断地出现。
我再举个例子:有个毕业生想要重现一篇被广泛引用的经济学论文,论文作者是两位哈佛教授。当学生从两位教授那里得到数据后,终于意识到两位教授在分析不同国家的数据时曾经跳过几行,也就是说二位在分析全球经济指标与趋势时,并没有分析那些不在他们考虑范围之内的国家。
虽然论文的结论没有什么大的问题,但是我想说的是,即便是最好的学者也有可能会犯错。我敢说我自己的文章中应该也有不少错误。我也敢肯定,没有人能够在其出版物中绝对避免潜在的错误。但重点是,我们要承认人类是会犯错的。甚至诺贝尔奖得主的论文都有可能被撤回。
所以我认为,人类必须承认自己在工作中是会犯错误的,即便是科学家也不例外。人类也有偏见,我在此引用一篇我很喜欢也觉得特别激动人心的研究。由于这个人工智能系统可以对古气候数据进行推理,并根据数据生成对过去气候条件的假设。因此研究人员查阅了一些文献以及相关的数据,并利用AI生成了一些与数据表现一致的假设,然后他们将人工智能生成的假设展示给科学家、论文作者们看,并问作者,为什么文章里没有提到这些假设?
在我看来,这些假设非常有理有据但是科学家却选择忽略他们。在我看来,我们人类天然地对某些符合个人观点的特定假设、结论甚至是对世界的看法都有着特定的倾向。
这里的最后我想说,人类在报告方面做得很不好。我们写论文的时候并没有特别重视方法论的指导思想,而是是选择一个特定的方法,这远远算不算“指导”。结果这就导致了,在我们所做的一些研究工作中,科学刊物相当缺乏信息。右边,这些红色和绿色的图表中,绿色表示读者能够重现所读论文的内容,但其他的(红色部分)就很难重现了。
所以最后就导致了只有那些有技能有知识的论文作者,或者在此研究上有着相同知识技能水平的极少数人能够真正重现并理解这些研究。其他人重现所需要的时间则长得多,而且还不一定能够完成。对于两种不同的情况,都有相关的文章发表。
一些案例中,人们投入了大量精力并成功复现了论文中的研究。而其他案例中的人们则并没有做到。所以通过以上的例子我重点想说的是,人工智能能够提供系统的、正确的、不偏不倚的研究方法以及严谨的研究报告,这些也是我认为对于科学至关重要的东西。所以我希望人工智能系统能够更多参与到科学中来。
这个例子来自我们自己关于多组学整合工具分析在癌症上应用的研究,用于分析癌症数据。我们发现,尽管类似的选择有非常多,但此领域的所有文章都只用一个算法或者一种分析方式来分析数据,不同研究团队使用不同的方法。在右边你们能看到,我们在研究中找到的蛋白质变化非常大,这取决于我们用什么搜索引擎。而论文中使用的引擎各不相同。我们甚至很难找到使用多于一个搜索引擎的论文。这也就引出了个问题,我们究竟在研究中遗漏了多少重要的蛋白质呢?
所以我把这张图放在这里,就是为了审视一下我们自己,真正认识并承认我们人类并非不会犯错。在科学方面人类展现出了无比的创造力,但是我们也不能忽略人类在此方面的短处,而应该让人工智能系统作出贡献,让它成为科学的一部分。比如让人工智能检查我们的研究,或者在我们人类更容易不严谨的方面,让人工智能来做更加细化的事情。
所以我花了很多时间阅读并试着了解,认知科学家以及科学哲学家是如何看待科学进程的,在追求方法论以及考虑不同假设时,又有什么元素牵涉其中。我想这是个非常值得人工智能去探索的领域。
以上就是我的第二个观点,即AI在系统性、正确性以及无偏性的科学研究方面,能够做很多工作。即使你没有在从事科学研究,而是在为工业界或教育领域从事数据科学工作,那么也应当好好考虑一下AI能在这些方面究竟能做什么。
我要讲的第三点,是人工智能可以整合复杂系统的碎片化知识以及为我们的跨学科研究提供支持。我在第二点中提到过,我个人更认为人类个体是有某些限制的。但在第三点中,我想讲讲我们人类在进行合作化程度更高的研究时,以及在跨学科研究领域所遇到的挑战。
下面我来介绍一下这部分内容。
我觉得,如今人类面临诸多挑战,如:理解大脑、理解智力、理解复杂疾病、理解地球系统、理解我们星球在宇宙中的进化史以及在使用自然资源(如水资源)的同时要保证生态系统的稳定。
当我审视这些挑战时,它们往往会涉及多个不同的学科,每一个学科都是这些问题的一部分。当人类试图将所有这些学科、这些碎片整合起来的时候,这个代价是很高的。
有时我们努力想要在全局视角下理解某个学科的某个问题个问题。但是期间的不确定因素太多了,因为不同的研究人员会贡献出不同地区的数据,或者所收集到的脑部数据来自全球各地不同的机构,而要想整合所有这些数据,我们需要耗费大量的精力。
所以我认为,人工智能不仅仅能够在个人研究领域,更能在跨学科领域有所贡献。提到科学,我的这张图片就展示了合著者网络的变迁。
过去几百年间,你能够看到一个科学家独自在角落里思考问题、写出影响深远的书籍或文章。此前,科学家之间确实有过不同程度的交流,但是研究工作则是非常个人的事。
第二张图则展示了合著方式的开始。20世纪早期,你能看到科学家们开始真正地为了长期项目而合作。
这张图里的是沃森和克里克。有许多这样的科学家二人组或三人组,这样的形式持续了很长一段时间。上个世纪最后几十年的那段时间里,大量的科学家展开合作。
这是张关于人类基因项目的图片,其中的合著关系相当集中,但除此以外还有许多人在此项目中作出贡献、相互合作。最后一张,也就是最右边的这张图,是ATLAS合作项目的照片。这个项目与粒子物理有关,超过4000名作者参与合作并一起发表了主论文。这样的密度、联系是非常丰富且紧密的。这样大的规模,比我们可以常常在大型合作里看到的那种要高出几个数量级。
我们要认识到,如果要思考更加困难、更具挑战性的问题,这些作者网络就会变得更加复杂,而我们要协作的任务也就会更重,对于其他学科和工作的理解也会变得更困难。
这个例子来源于蛋白质体学,很实际的一个例子。我在幻灯片右侧展示的是实验选项。不同的实验室里有不同类型的实验,不同的实验又对不同类型实验方法论有技术和专业技能要求。
左侧的则是用于处理不同类型数据的计算分析,而分析数据可以有许多不同的方法、不同的计算工具。所涉及的技术如此多样,以至于如果你走进一个蛋白质体学的实验室,这些技能也肯定不会被完全包括在内的,即便是这方面的研究组织也做不到。
它们分布在不同的实验室以及大学组织里。确实,它们的多样性难以置信,而且如今正在越来越多。这里的展示我们可以看到:科学家收集宝贵的数据并按照个人需要分析数据,并不一定要在实验室或者组里的成员具备特定的专业技能。这是一篇面向Science审稿人的调查。我们可以说,他们是最有能力、联系最紧密的一群科学家。
但只有25%的人认为他们的实验室具备分析数据的能力。还有许多人认为合作者很有必要因为他们能够切实分析已有数据。我认为当我们研究所感兴趣的问题时,合作者的存在往往极大程度地推进了数据的利用价值。我认为,人工智能能够真正成为我们人类科学家的合作伙伴,因为人工智能系统可以从不同学科的复杂系统中,透彻且深入地整合碎片化知识。人工智能将会把人类目前研究的科学问题本质的边界拓宽。
在我们最近的一个研究项目中,我们着眼于不同学科模型的整合,因为我们需要这些模型来研究某些问题。例如世界上某些地区的粮食安全问题,洪灾问题,亦或者是低下含水层系统的可持续管理问题。因此,就像我在左上方展示的那样,我们需要去把不同学科的模型整合起来。
这些模型有很多不同的假设,会涉及很多不同的方法论。
在左下角,你能看到一个简单的卡通示意图,它能够告诉你水往何处去、农业循环等等信息。里面的内容相互交织。有表层水。有地下水。有的变成蒸汽进入大气里。图里有影响现在发展的气候元素。有人类的活动进程。所以必须要整合这些模型,因为你会发现每个学科只专注于整体的一个子集。
你们已经看到底部的水文模型中心会考虑到地表水,但是地下水、含水层是完全独立的模型。农业模型是另一种类型,它来自于另一个关于不同植物生长周期学科。
当然,它们会受到水资源的影响,但是这些模型并不是真的以水为中心。
所以需要整合所有这些碎片才能真正从宏观层面理解。这么做非常有挑战性。所以我们用人工智能来改善这一点。
这里我们给出的不同的模型来给大家展示AI可以做什么。每种模型都有详细的表示,比如:数据格式、每个模型都要考虑的物理变量。即使你使用不同的水文模型,它们也会在模拟中使用不同的物理变量。
这里还有约束和可调参数,让我们看到不同系统在不同条件或不同环境下的表现。我们使用所有这些信息来推理模型,将他们连接在一起,根据需要转换数据,并真正帮助分析场景、分析选项以及可能的干预措施,从而解决现实世界的问题。
这个例子告诉我们,我们在人工智能系统中获取的知识真的可以帮助我们进行进行多学科建模,而这一点又极具挑战性。开发一种集成模型可能需要数年的时间。以上是我对如今我们正在面对的大问题的一个总结。
我认为,我们不应该以人类的方式,从人类的个人主义视角出发,应对这些挑战。我们需要意识到,每个人的能力都有局限性,每个实验室的能力乃至每个学科的能力都是有限的。要充分利用人工智能系统帮助我们管理这个由知识、数据、信息和异质性组成的难以置信的复杂空间。
这就是我的第三个观点:人工智能将会在跨学科的研究中脱颖而出。
我的第四个也是最后一个观点,同时也是我演讲的主要观点:我们该如何设计人工智能系统以便它们能够真正参与到科学事业中来?它们真的可以成为人工智能科学家以及研究助手,帮助我们理解数据并在科学领域取得更加有效的进展么?
在这种思想的指导下,思考型人工智能其意义在于帮助我们思考如何设计这些系统。让我来描述一下思考型人工智能,并解释一下为什么需要它。
对我来说,近期最有趣的发现之一是:即使你把最好的计算机和最出色的人放在一起,也不一定能够得到最好的结果。这个例子来自于一个棋类游戏,它叫“自由象棋”。左边这里你们能看到冠军组。在自由象棋中,参赛的团队既可以是人类选手,也可以是任意的人机组合。你可以选择大师棋手,可以选择超级计算机,只要你愿意,也可以选择简单的电脑程序当队友。
这些比赛有什么发现呢?左边的是冠军队。他们发现,冠军队并不是有着人类大师棋手以及超级计算机或者有着最强算力的队伍。即便你不太擅长象棋,而且机器也没有那么强大,但是只要能够处理好过程,那就是顶级的队伍。
这也展现了过程的重要性。过程是什么呢?
这里的过程指的是,当棋赛开局时,应该让谁来走子,这种类似的问题。需要什么样的计算机程序,什么样的棋手以及什么样的技能?需要怎样才能组合好人类和计算机?在棋赛中段,当我们思考“女王”该如何移动的时候,谁来对此负责?
这一步该如何走?我们怎样根据这一步设计出一个策略呢?谁来走这一步呢?
所以,重点在于:明确流程并在合适的时间点需要采取合适的措施来解决问题。
定义明确的过程,这个概念在我们人工智能和人机协作的研究中高度强调了这一点。当然,它也引发了我的许多思考。
我们如何设计合适且可行的过程,来让人类和机器合作,以解决我所指出的这些科学挑战呢?所以我想到了思考型人工智能。我们如何设计出能够成为真正的科学家伙伴的人工智能系统呢?为什么不与国际象棋选手或者其他游戏的选手组成团队来进行自由式比赛,或和其他人类活动中合作呢?所以我想到了思考型人工智能。在我看来,思考型人工智能是我们应该用何种属性,或者何种原则来设计并使其最终成为真正的合作伙伴的人工智能系统。这背后的动机是,如果我们面面俱到地监管并复查机器的一举一动,确保他们正常工作,那么我们就永远不会与人工智能系统成为伙伴。这种做法只会让机器告诉我们“我已经做了三天的计算了。”“这是我发现的一个模式。”而不能告诉我们这个模式背后的意义或者它代表了什么。
那么这些人工智能系统的哪些特性让它们在进行科学研究时能够成为更加有用的伙伴呢?
这就是我提出的问题。
对此我提出了七个原则,希望你们在设计未来人工智能系统时能够,让它们真的能够进行合作性的活动,具有合作的能力。
第一个是理性原则。
也就是说:设计人工智能系统时,它们所了解的知识是清晰的,这能够规划他们的行为,并领导它们展现出特定的行为。为什么这一点如此重要?因为它是人工智能系统与其他科学家、人类科学家进行交流和交换信息的基础。
所以我在自己的研究中再三强调:合作时,我们应如何分享本体模型以及数据模型。我该如何向其他科学家展示我看待问题的方式,以及问题背后的意义?我为什么会问他们是不是这样?这是因为我试图仔细的表达这些术语的含义以及如何在人工系统中使用它们。
因果关系,因果图例,变量的表征。统计特性是非常有用的。在回答问题的过程中,高级方法和高级策略意味着沟通,意味着跟踪结果背后的原因。
这里是我举的例子,只需要一张纸或一个笔记本就可以做了,非常简单,然后就是解决问题了。
所有你完成的任务都是什么,每个都是如何完成的呢?也许有一组人就在研究这个问题,他们可以清楚地说明他们执行了哪些任务。这一切都应该落脚于AI系统所产生的行为和发现。否则就没有“我是理性的”这种理性表现。“我有知识,我用它产出行为。”我认为,我们很难相信这个人工智能系统真的做了有效的科学研究,起码在科学领域。
第二个原则就是关于上下文。
我相信思考型人工智能不应该只是坐在那里,等有人跟它说:“好,给这样的数据做个这样的数据分析,跟我说说有什么发现。”“精度达不到就换种方法。”
如果你这么做,那你不能说它是真正的合作伙伴。你只不过是在远程指导它罢了。所以我希望这些人工智能系统能够真正理解它们在做什么,以及它们这么做的目的,这样这些人工智能系统就可以自己弄清楚根据不同问题或任务该采用何种方法了。
这个例子来自于我之前给你们展示的MINT项目,我们整合了所有这些不同的模型。我们着重强调要解决的问题是什么?这些问题促使我们对于人工智能系统进行深入思考,即需要什么样的数据才能达到想要的模型分辨率。
模型中应该包含多少细节以及过程?有了这样的语境,我们就能了解在选择和整合模型数据方面,使用什么方法才是比较妥当的。
思考型人工智能的第三个原则就是主动原则。
如果我和人工智能系统搭档,还得每天用新的发现、阅读到的新的结果给它更新系统,那么人工智能对我而言作用实在有限。
而且这样的系统会很快就过时了。很有可能会过时(不好意思)。
我希望它能自我驱动学习,如果有了这个特点来学习新东西,那么不管是对于发表的论文、数据源或数据库里出现的东西等类似的科学记录,它都能通过独立的探究来学习。
它会像这样说:“呵,有意思。”“我读完了这个,但和我想的不太一样,我来试试做点研究吧。”“哦,原来是这样。”或者“我看到他们主张的上下文了。”诸如此类。
所以我认为,这些系统的东西能够获取发现并将剖析出它们真正的含义。这样的系统会学习需要的东西,以便能够跟上新知识和新的出版物。这一点我觉得很重要。
第四个原则,就是这些人工智能系统需要相互关联。
不仅仅是访问官方发表论文的出版商的网站,或者是浏览论文和文件的出处,而且是要有一个关于科学记录的、完整的知识网络。所以论文是一方面,另一方面是数据库。许多科学领域有本体模型,有标准。有传感器源。有许许多多的东西。有代码库,有科学软件库,也有模型库。这些人工智能应该具备通过网络走向世界各地的能力。
它们应该与现存的关于科学记录的知识网络连接起来。既要有学习的主动性,也要懂得如何从这个非常丰富的知识网络中提取知识。
我对于思想型人工智能的第五个原则是:表达。
其背后的含义是,AI能将它们的发现传达给不同的听众。这不仅仅是解释。
交流不仅仅是解释而是倾听对方提出的问题并做出回应,同时也可以通过提问或者讨论的形式跟进。或者“我知道你为什么问这个问题了,也许你是这么想的。”“你的问题确实说得通,因为你想从全局视角考虑我的研究结果。”
我们就这个问题也做了一些研究,我在这里展示如何从完全相同的分析中,强调分析过程的不同方面,在当下这个主题里。你可以强调你所使用的数据。也可以强调你所使用的的算法,可以是算法的种类,也可以是算法的特定形式,可能是算法的种类,也可能是特定的方式。或者你可以在很高的层次上强调你所遵循的方法。
能够多处定制化的解释,并进行后续的反复讨论,这一点是非常重要的。我认为这对于一个即将成为我们合作伙伴的人工智能科学家而言,意义非比寻常。
第六个思考型人工智能原则,我称之为道德原则。
对我而言,这意味着系统的局限性和所涉及范围的伦理问题。
如果有人问我们问题,或者要求我们做某项工作,我们可以说:“当然,我可以做分析。”“但是我对x、y、z方面并不熟悉。”
对我而言,这是合乎道德的。因为你想表达的是:在这个我们正在建立的合作关系中或者正在进行的任务中,你委托我来做;或者说在这个报告里我想向你展示某种技能;想告知或者警告你注意哪些我没有包括的内容,甚至是我没权限查看的数据等等。所以我认为人工智能系统通常不能传达它们所具有的作用域以及限制。我认为这是一个很大的缺点,对于我所设想的,与那些有思想的人工智能系统建立合作关系来说,这一点非常必要。
最后一个原则我称之为系统原则。
也就是说经过设计的系统原则。人工智能系统应当是复合型的,应当是有抽象结构的,应当在不同的任务或技能间有关联的。通常,我们设计的人工智能系统能够做到X,而另一个系统具备与X相关的其他能力,但是将二者结合起来以发挥更大的能力,则是一件非常困难的事。
如果我们组建一个人工智能系统来做蛋白质体学的研究,另一个做基因组学研究,那么我们可不可以通过某种手段将二者结合,使其能够研究“蛋白质体基因组学”呢?这个过程中会涉及到什么?我认为,我们还需要进行更多的思考,比如怎样设计人工智能系统才能使其更好地合作、使其能够和人协同完成任务。
以上就是我想说的,能让人工智能系统变成真正合作伙伴的七个原则。就像我在前面提到的自由象棋那样,人工智能系统可以在这几个原则的基础上,成为科学领域的主要角色。我描述了以上七个核心原则,对我而言它们可以在未来几年内推动非常多的人工智能研究。
综上所述,我的结论是:思考型人工智能是让人工智能在任何数据科学领域以及任何科学研究领域成为真正的合作伙伴的一种方式。
我绘制这片蓝图来引发大家思考,首先就是想强调知识在数据科学和科学研究中的重要意义。
我讲过了人类个体在从事科学研究方面的缺点。
我讲过了人工智能如何真正帮助我们提高质量与效率,甚至增强我们科学的有效性。
然后我告诉你们,人工智能在跨学科工作中的重要性,以及我们在帮助弥合词汇、方法论乃至跨学科视角的多样性方面还有很多工作要做,这些对于如今的科学问题来说都是至关重要的。
最后,我描述了为思考型人工智能设计的路线图,而且我认为如果我们继续追求思考型人工智能,我们会创造出非常有效的人类-人工智能合作模式。
(本报告根据速记整理)
CAAI原创 丨 作者Yolanda Gil教授
未经授权严禁转载及翻译
如需转载合作请向学会或本人申请
转发请注明转自中国人工智能学会