发布时间:2017-05-31
主持人:谢谢盛子夏先生给我们做的精彩分享,希望蚂蚁金服能提高他的产品和服务,让我们的生活得到提高。我们讲人工智能依赖大数据,是不是有了大数据就万事俱备了呢,大数据在某种程度上是不存在的,即使是对谷歌、蚂蚁金服来讲都是这样的。蚂蚁金服有这么多数据是不是有恃无恐呢?不是,也有很多挑战。第一个挑战,比如蚂蚁金服有上千亿资金,这些资金的流向怎么控制,这是个很重要的问题。蚂蚁金服已经是中国最大的网上基金销售平台,智能投顾、投资理财建议,让这几千亿的资金怎么流向,这是对宏观经济重大影响的事情,这个挑战是非常巨大的。
第二个巨大的挑战,用户的理解依然存在着挑战,每个人的情况都不一样,我们希望大家一起探讨研究这些问题,我们把事情做得更好。由于时间关系我的报告就不讲了,我用两三分钟的时间介绍一下我们的情况和我们的心得体会。
我来自FDT金融创新工场,负责FDT下面的一个子公司。FDT金融创新工场是做校园公益的,由聂凡淇先生在三年前创立。聂凡淇先生是学计算机的,心中坚信王侯将相宁有种乎,对于投资,他有深刻痛苦的体验。我们和全世界的高校,比如牛津大学、哥伦比亚大学、清华大学、南京大学一起建立金融实验室解决我们做公益的一些困惑。这些高校老师和我们一起合作解决这些难题,我们和业内企业建立合作,因为我们解决这些难题的技术不光有社会意义,还有巨大的商业价值,我们和金融机构银行券商一起紧密合作,来解决这些问题。
我们如何解决这些问题呢?智能金融交易,我们建立了评价体系,我们做了个性化的训练,智能交易方面我们在风险控制、交易资源分配、交易员的评价方面、智能投资方面,我们和周教师一起合作,把波动性降低,这是我们做的一些事情。
最后说一句,欢迎大家加入我们公司,赤裸裸的广告。下面大家攒了很多问题,留在会场的有问题的同学,请刚才演讲的各位嘉宾上台一起讨论问题。
刚才聂总没有演讲,聂总在金融交易方面有非常多的实战经验,做过巨量资金的操盘,把他请来一起讨论更有意思。我准备了很多问题,但是我不问,我问了就没完没了了,把机会留给现场的观众。
提问:我问一个关于概念的问题,前几年大家都在提智能金融、智慧金融,但是AI整个社会的热情是从去年以来才真正爆发起来,谈AI之前和过去这一年智能的内涵和概念发生什么变化感觉不是太清楚,我想请一直关注研究这个领域的几位老师说说你们的感受和想法,人工智能给智能概念赋予了新的能量还是前后没什么变化?谢谢。
周迅宇:你的问题是智能的内涵是什么,在金融行业中智能里面很重要的是学习和互动的因素,量化投资用已经知道的模型来自动为你提供一些方案,那些最多是专家型的,没有互动没有学习的概念,人工智能最重要的一环是机器学习,互动的程序在里面。刚才我举过例子,通过客户交易的行为来学习对风险的偏好,而不是通过问卷的方式,这就是一个比较简单的例子,但是我觉得这个很说明问题。
朱英姿:我说说想法吧,我觉得智能更多的是应用的东西,机器学习这个概念,它是从统计古老的科学里发展起来的,之所以现在这么火,人和机器谁赢都是一些应用,用到各种场景,背后的逻辑都是一直没有变,只不过数据量大了,运算量大了,其他各方面都发展起来了,云计算运算快了,才使得它成为可用的东西,能够超越人脑代替人做一些工作,这是我的想法。
盛子夏:我觉得这个问题跟我刚才讲的有一点相关,就是看人工智能,最早的人工智能最早五几年就发展了,中间有几波浪潮,一会儿火一会儿不火,中间有很多起伏,一直到二零零几年提出深度学习,理念提出之后立马让图象识别往前走了一大步,最近阿尔法狗的出现又让博弈类的加强学习的东西往前走了一步,发掘技术是在之前的,但是它的应用要很多技术合在一起才能发挥它的商业价值。云计算、通信技术、人工智能的成熟,这几个技术都合在一起,那个时候才能变得真正有价值,这是每次提出这样一个概念我们觉得最大的变化。
提问:朱老师,我2005年到2017年所有的Tick数据,现在有2700多支股票,加起来400亿,把它做成65万张画片,我拿2005到2016年的数据做模型,我要想做大数据必须做分钟级的策略,现在有没有券商或者机构可以把散户的账户联合起来,让每个人持仓做一个日内的Day Trader,这种服务有没有人做?
朱英姿:中国市场就像你刚才说的是有问题的,导致回测的时候回报没这么高的原因之一,如果绕开监管,实际是做了垄断的交易,别人不做你做一定是赚钱的,逻辑也是存在的,数据量是很大的。你需要调整,我相信这个策略,可以通过我们现在已有的统计,因为数据量足够大,问题是你能不能做。
聂凡淇:我觉得你这个问题问得太晚了,这已经不是一个问题了,而是已经实现的东西,现在政府把资金的效率提高到非常高,现在不是能赚钱的策略。我觉得做交易的时候永远要做到别人想不到的时候才能赚钱,每个人要想得远一点,你做这件事情怎么能够建议别人赢得这个机会,这个东西五年前就有人在想在做,这个东西不是新的东西,大家都看到这个点,就像周教授说的很显然收益一定会高于普通的。我给大家未来的方向,我们量化都在做结构化数据,通过Tick数据,通过AI,通过现在这些新的技术,最可能有非常好的结果是非结构化数据在金融的利用。
通过卫星图像可以看到这个公司的营运状况,这是以前投行做的事情,跟工程没关系,就是普通的文科生通过调研去做这件事,但你现在发现通过AI技术就可以做这件事了,而且做得比你还准确,你的优势就没有了。就像谷歌的专家也是结构化人工智能的专家跟我探讨方向的问题,我给他一个方向,往这边走会走得非常好,因为可以提前获取企业的fundamental的信息,不是通过Tick数据能够解决的,当然这是非常好的方向,大家可以往这方面努力,非结构化数据现在可以做得到,以前图象识别难度很大,现在技术已经解决了。
每个做投资的一定要提前看方向做事情,我在这里展开一下,我觉得人工智能在金融领域有非常大的前景,为什么现在非常火,人工智能火的原因是要基于数据的产生,如果数据产生了,有大量海量的数据完成人工智能的飞跃,为什么我们三年前跟周教授讨论金融大数据的研究,这也是为什么我们FDT在AI上投入非常大,非常看重这个方向,因为我们前期在金融大数据的研究,获取的这些数据方面可以给AI带来非常大的应用场景。
主持人:投资方面说不完,一句话两句话说不清楚,以后多交流。
提问:我有两个问题,第一我是个散户,周教授昨天说消灭散户,消灭可以,拿什么,我听周教授说是智能投顾,柳总说的智能交易,有了这个东西消灭我可以,我想问一下现在人工智能干掉李世石下围棋可以,无人驾驶可以,我们也相信可以,智能交易这件事情到底能不能让我一个散户相信你可以做到这件事情。个人感觉好像有点不一样,下围棋,任何一个人都相信他能干掉世界冠军,但是智能交易能不能干掉人类,再往下一步我有智能投顾了,这是我的秘密武器,阿尔法狗对阿尔法狗会产生什么现象?
第二个问题,想问一下平安科技的王博士,说到非人类的生物识别,我觉得作为人来讲,我面前有几个人,我一看这几个人我都认识,他们是不一样的,如果做猪脸识别的话,放了一个猪,计算机是人的识别,识别人和识别猪的时候是不一样的,思维过程是不一样的,在计算机里面识别一样吗,识别人和识别猪有什么不同?
周迅宇:消灭散户,希望市场参与者大部分是机构参与者,而不是所有小户,怎么把散户的比例降低,需要很长一段时间,美国也是散户,花了很多年时间才到现在,中国怎么做到,从娃娃抓起,从大学生做起,给大学生灌输这个理念,你的投资应该让那些专业的人去做而不是你自己搞,这里面FDT做了很多,这也是为什么我很欣赏这个公司,跟他们保持长期的合作关系。FDT在过去几年中在大学通过捐款,通过举办各种各样的活动,通过他们开发的APP,其实就是帮助大学生了解怎么样才是正确的交易行为,自然而然时间一长散户就没有了,当然有的那些可能交易了很长时间,积累了很多经验,可能已经是一个成熟的投资者,在一个健康市场里有这样一部分成熟的散户也是很好,不是真的要把他们赶尽杀绝,但是从根本上解决这个问题要从娃娃抓起,从中学生、大学生,FDT做了非常好的事情。
聂凡淇:这个话题我还是比较有发言权的,从我们数据分析来讲,一个市场很稳定的建构,从数据一看就很清楚,90%的人应该是做主动投资,国外很清楚,国外为什么是很稳定的结构,现在ETF投资非常被动的投资,连基金经理都干不过被动投资,何况散户呢?ETF都很难战胜,没有多少个基金经理人战胜ETF。中国散户非常多,这个信号是中国是个封闭市场,如果是对外开放的市场,国内各方面的工具可以随便用的话,散户真的是很难打败专业投资者,很多专业的基金经理是绝对收益,不管涨跌,不管出现什么情况都是赚钱的,所以散户能比过他们吗,不可能。美国高科技的量化交易竞争到毫秒级,这个技术的水平。
中国政府保护这个市场,让散户能够有序退出,这是中国监管层在做的事情。朱教授的博士生、研究生都在做这个课题,你们散户没有任何知识跟他们对抗,这怎么可能。让所有散户能认知到自己的弱点,现在不是说消灭散户,而是AI提供了普惠投资的手段,以前高盛1千万美金以下的客户都不收,现在AI 1000万以下的客户全部用机器人解决,AI是普惠金融的概念,使得普通投资者投资的门槛越来越低,你可以得到非常好的服务,专业级的像高盛级的服务,这是AI在金融领域的重大的贡献,AI也会帮助中国去散户化,帮助客户更加理性投资,这个非常重要,所以我们FDT在AI散户的投资有非常大的力度,我就说这点,谢谢。
王健宗:刚才这位同学提的问题很好,我简单说一下,图像的识别和理解,深度学习发展很快,以我这几年的经验,每个应用都有自己的特点和特征,人脸这块研究几十年了,人脸相对来说成熟,我们现在遇到的非人类的生物特征,我们发现套用人脸的方式完全不过分,人脸相关的算法,我们现在在猪方面有很科学的发现,原来有猪标,后来采集上来发现猪的鼻子和耳朵、身上的斑点纹很重要的特征,跟人脸有些特征有异曲同工之妙,这是具体问题具体分析。我做图像这块是各种各样的应用,我们平安有几千万的门店,我们以前都是派人去做拍照区分,现在是每天早上把照片传过来机器区分,第一线应用的需求方,回到图像这块,真的需要依据相关的数据。
外面模型都是开放的,有很多学问,你需要有很强大的数据的支撑,我做猪脸识别如果没有保险投到这么多猪的照片,我也做不了猪脸识别。没有数据何谈应用,当然我们目前也构建了全球Top100的超算能力,这点还是很重要的。数据+异构计算能力,算法上大家都是一个门槛,所以我讲算法讲得少,任何一个Master研究生学一两年,深度算法已经搞得非常多了,其实不难。在座有学生想进入非结构化领域其实很容易进来,大家已经没有门槛,感谢以前这些做CV的几十年的先辈的创新,让大家变得非常简单地进入CV领域、AI领域,我先说这么多。
主持人:我想问平安的王博士,刚才谈的小数据,做深度学习是从大数据来做深度学习,如果找特别精良的小数据做深度学习,不知道问得科学不科学,数据好多都是上亿的数据,咱们会对数据进行数据清洗,假如找各行各业的十个最顶尖的精英,把他们的知识转化成深度学习,跟大数据给我们提供的决策对比一下,我问的可能不是特别科学。
王健宗:要样本的学习是目前很热烈的方向,我举个例子,你刚才说找一些精英把交易的行为数字化之后,因为我们要解决一个问题,把正确的要识别正确,但是不能把错的识别正确,要找一些负样本。我最近研发一个很牛的超级查看员的机器人,他测损之后查看速度比人快,几秒能定损。我可以按照你这个思路去找,找平安里Top10的车险理赔员,比如有十年经验,他交一些数据,但是有个问题,部件是好的,对机器来说一定要认为它是好的,不能把它识别成错的。
小数据可以结合迁移学习做一些工作,迁移学习现在很火,我识别人脸方面的经验,是否可以直接迁移到识别猪脸呢,两个向量里找到共同的子空间,我们找一些优化,这也是未来的方向,甚至不需要数据,以前的模型直接用到相关的别的领域去,这都是一个方向,可以减少部分数据量。甚至现在用深度学习的训练可以把中间的特征提取出来,维度丰富一点,有很多工作可以去做。我觉得还是因人而异。
主持人:说到小数据我又来精神了,我补充几点,我之前的观点比较极端,这个世界没有大数据,只有小数据。即使是谷歌,他依然是,大数据那部分随便找个学生就可以搞定了,那些科学家在纠结什么呢,就是小数据。尾部风险是最重要的,小数据特别重要。征信领域,很大的数据,违约的坏人还是多的。我见过一份地下黑市的数据,2千万人的违约数据,意义在什么地方你们知道吗,一笔数据可能是几十万的代价换来的,比如他欠钱没还,在生活中我们很少有这样的数据,小是比较的小,正样本和负样本极度不平衡的时候对机器学习是很大的挑战,我们要做平衡,机器学习里的重大挑战,这个挑战不是对小公司小数据,对大公司大数据都依然存在这样的严重的挑战。这是我对小数据的一点感触。
现在已经12点50了,我们已经超时了,坚持到最后的全是真爱,别的会场都已经散去了,对人工智能和大数据真正热爱的人,人工智能大数据很多人讲是不是冬天,有人讲哈尔滨冬天还是广州冬天,我觉得很形象。人工智能已经出现了泡沫,但是就像互联网也出现过泡沫一样,现在互联网是无可争议的行业的大的变革,人工智能就类似于这样,它会出现泡沫,会回调,但是这是让它健康发展的必要的阵痛,这个时间点说不清,但是我觉得明年后年都可能出现。
我个人的观点和大家的交流,人工智能必须要垂直化,必须要专业化,要做人做不了的事情。普惠金融,盛先生做蚂蚁金服的助手,不是人做不了,而是服务于每个客人人就做不了,哪有那么多人力呢,还有的事情是个人也做不了,专家可能也很困难,要做这样的事情必须垂直化。我认为人工智能下一步就是要垂直化,在金融领域是最好的垂直化场景,场景化、垂直化、专业化都是差不多的意思。
最后一句总结,我希望大家一起在人工智能场景化、专业化、垂直化这一块一起努力,把它做好,让这个冬天来得更浪漫一点,飘点雪花,但我们还很温暖,谢谢各位。
(本报告根据速记整理)
CAAI原创 丨 作者系上述嘉宾
未经授权严禁转载及翻译
如需转载合作请向学会或本人申请
转发请注明转自中国人工智能学会