AI指数报告:人工智能发展的6个现状
人工智能行业发展得怎么样了?
每年,斯坦福大学人工智能研究所都会发布一个《AI指数报告》。可以说,这是全行业最有权威性和综合性的报告。
今天的《科技参考》,我就来为你解读 2022 年报告的要点。
一、论文方面
AI 方面的研究,从 2010 年到 2021 年持续高速增长,相关研究的论文数量平均年增长率是 33%。这说明,即便经历了 2 年多的疫情,AI 方面的研究热度也没有任何衰退。
2010 年 2021 年间,在人工智能内容方向,中国和美国在论文方面是跨国合作最多的。这一点可能很多人没想到。因为地缘政治紧张,大家很可能以为,从 2018 年起,双方合作的论文会减少。
但实际上,合作的论文从 2010 年一直增加到 2020 年,2021 年才回落到 2019 年的数量,接近 1 万篇,但仍然是排在第一名的。第二名是中国和英国,3500 篇;第三名是美国和英国,3300 篇。
中美合作论文的数量即便在 2021 年下降了,也仍然是美英合作数量的 3 倍。而且,中国和其他国家在 AI 上的合作也是全球最多的。
不过,今天的学术秩序让我们不能只看论文的数量,还要参考一下引用数。被引用得多,一定程度上也能说明这篇论文的发现更重要。虽然引用数也在被注水,但没有篇数的注水程度那么大,所以还是有参考价值的。
如果统计一下论文的被引用数,中国论文的优势就不会几倍于第二名、第三名了。
在所有人工智能的论文中,2021 年,中国的论文引用数占全部引用的 28%,排第一。排第二的是欧盟和英国,是 21%;排第三的是美国,17%。
除了论文之外,学术研究还包括会议。统计 2021 年会议出版物的数量,最多的是中国,占比 28%;排第二的是欧盟和英国,19%;美国占比 17%。
对比会议出版物的引用数,美国占 30%,欧盟和英国站 23%,中国占 15%。
二、专利方面
在专利申请数量方面,我们可以看出:人工智能方面的专利爆发是从 2016 年开始的,此后每年都会比上一年增加 50% – 100%。
2021 年比 2020 年的专利数量增加了 74%,而 2020 年比 2019 年增加了 100%。
如果按地区分,2021 年中国的申请数占全球一半以上,52%;美国占 17%,欧盟和英国占 4%。
不过,申请和授予是两个不同的状态,被授予的专利才更有含金量。这部分,2021 年,美国占比全球 40%,欧盟和英国占比 8%,中国占比 6%。
如果把三个地区的专利申请数/专利授予数的数字曲线对比着排开看,我们会发现一个很有意思的现象,那就是,中国的比例异乎寻常的高。
中国平均 62 个申请中有一个被授予专利,欧盟和英国平均 2.7 个申请里有一个被授予,美国平均 2.1 个申请里有一个被授予。20 – 30 倍的数据差异值得我们思考,因为这样的数据反应的是量大质低的专利申请大潮。
三、图像识别性能持续变强
第三个趋势是图像识别性能持续变强。这一点对很多人来说觉得没什么,时代在进步,科技在发展,人工智能识别图像的能力在提高。这有什么可惊讶的?
但你只要听过我们之前的芯片系列就会知道,性能的提升代价是极其巨大的。想要把性能提升 10 倍,靠现在堆算力而不改算法的方式,那要堆上亿倍的算力。
今天,人工智能界普遍使用 ImageNet 这个标准,来衡量图像识别算法的性能。这个图库里有上千万的图片可供训练,其中主要使用 top – 1 和 top – 5 两个准确度测试。 top – 5 是更加严格的。
人类在 top – 5 的测试中,平均成绩是 94.9% 的准确率。而今天的人工智能在不使用大规模数据训练的情况下,可以达到 97.9% 的准确率;使用大规模数据训练的情况下,甚至可以达到 99.02% 的准确度。
这方面,人工智能已经全面超越了人类。对图像特征的抓取能力超强,也让人工智能生出了对深伪技术的防御力。
我们之前在《081|AI:会带来什么潜在危机?》里介绍过人工智能今后会遇到的几个威胁,深伪(DeepFake)技术就是其中之一。网上现在已经有很多用这类技术伪造的明星动作片,或者政客大放厥词的视频。
实际上,这些都是通过人工智能虚拟出来的。而今天的技术水平已经很高了。只要愿意多花钱,就完全可以做出以假乱真的视频。那怎么办呢?
其实,解决办法也是人工智能,用人工智能识别出深伪技术。
今天使用深伪技术中的 Faceforensics 做的视频,用几个著名的识别算法,最高已经可以正确识别 99.98% 的深伪视频,最低也能达到 93.25%。矛和盾之战里,现在暂时是防守方全面胜出。
在图像特征抓取中,还有一种应用是预测身体动作的。这个技术最早是用于游戏或者科幻电影里人体动作捕捉的,但现在,已经可以用来监测真实人物几个身体关节的下一个运动方向了。
如果这项技术真的可以实现快速判断,今后如果拿它训练足球守门员,那守门员扑出射门或者点球的成功率会大幅提高。
在这个预测身体动作的专项测试(Leeds Sports Poses)中,2016 年的预测准确率还只是 91%,今天已经可以达到 99.5% 了,提高极为显著。
四、理解能力遇到天花板
当然,人工智能领域也并不都是好消息。刚刚和图像分类、识别有关的任务,是它能做的最好的领域。但只要转换到对语义的理解、场景的理解、人物关系的理解上,人工智能的表现就远不如一个 10 岁的孩子了。
比如说这样一个场景:在餐厅里,两个人坐在一张桌上吃饭,有服务员端着盘子站在旁边,坐在桌子左边的人伸手指向坐在右边的人。
如果让人工智能理解这个场景,让它说说为什么一个人会指另一个人,人工智能是完全应付不了的。但我们都知道,这个人可能是在给服务员提示,这是坐在那边的人点的菜。
因为这个场景实际上已经不是在找图像特征了,而是一种对内容的理解。
再比如,今天人工智能语言处理的程序会出现骂人、冒出种族主义极端言论的问题。微软就为它们推出的机器人 Tay 注册了推特账号,它会自动回复粉丝的留言。
由于微软的影响力大,大家又对它很好奇,于是这个机器人每天都会接收到大量真实的对话和提问。但就在它上线不到 24 小时,就变成了一个纳粹同情者、种族大屠杀的支持者。
虽然我们知道,它说什么是严重受到粉丝留言的影响的,而且来留言的人,有些可能就比较极端。但最后,它依然吸收了这些极端言论为自己所用。这也说明,人工智能在处理自然语言时,当前的水平更像是一个接下茬比较厉害的机器人。
这个机器人本身并不理解自己说的话具有什么含义,也许对语言文字里的情感倾向还能有所判断,但对是否符合道德标准,判断起来就不太准确了。
五、资金疯狂涌入,巨头已经形成
人工智能领域的投资,自从 2015 年以来就在持续快速增长。其中,融资、收购、私人投资是增长最大的。相比 2020 年,2021 年收购的规模是上一年度的 3.3 倍,私人投资是上一年的 2.0 倍。
在 2020 年,仅有 4 轮融资的总额超过 5 亿美元。而到了 2021 年,有 15 轮都超过了 5 亿美元。不过,投资规模虽然大幅增加,但被投资的对象却更少了。
这表明,人工智能领域的巨头已经形成,后来者想超越的难度越来越大。
六、大计算量带来的能耗并没有引起关注
最后是人工智能对能量的消耗。我们曾经在《科技参考》中介绍过,性能的提升要用巨大的训练量做代价,而巨大的训练量对应着巨大的能耗。
不过,由于这次撰写报告前,小组评估之后并不认为人工智能当前的规模会影响气候变化,所以能耗问题没有列在 2021 年的话题中。但很有可能会出现在 2022 年的报告中。
好了,这就是我对《AI指数报告》的解读。我也把报告的下载链接放在文末了。如果你想了解更多细节,可以复制链接下载报告。
好,这就是今天的内容。我是卓克,我们明天再见。
报告下载链接:https://reurl.cc/Epk0ak