AI指数报告：人工智能发展的6个现状

人工智能行业发展得怎么样了？

每年，斯坦福大学人工智能研究所都会发布一个《AI指数报告》。可以说，这是全行业最有权威性和综合性的报告。

今天的《科技参考》，我就来为你解读 2022 年报告的要点。

一、论文方面

AI 方面的研究，从 2010 年到 2021 年持续高速增长，相关研究的论文数量平均年增长率是 33%。这说明，即便经历了 2 年多的疫情，AI 方面的研究热度也没有任何衰退。

2010 年 2021 年间，在人工智能内容方向，中国和美国在论文方面是跨国合作最多的。这一点可能很多人没想到。因为地缘政治紧张，大家很可能以为，从 2018 年起，双方合作的论文会减少。

但实际上，合作的论文从 2010 年一直增加到 2020 年，2021 年才回落到 2019 年的数量，接近 1 万篇，但仍然是排在第一名的。第二名是中国和英国，3500 篇；第三名是美国和英国，3300 篇。

中美合作论文的数量即便在 2021 年下降了，也仍然是美英合作数量的 3 倍。而且，中国和其他国家在 AI 上的合作也是全球最多的。

不过，今天的学术秩序让我们不能只看论文的数量，还要参考一下引用数。被引用得多，一定程度上也能说明这篇论文的发现更重要。虽然引用数也在被注水，但没有篇数的注水程度那么大，所以还是有参考价值的。

如果统计一下论文的被引用数，中国论文的优势就不会几倍于第二名、第三名了。

在所有人工智能的论文中，2021 年，中国的论文引用数占全部引用的 28%，排第一。排第二的是欧盟和英国，是 21%；排第三的是美国，17%。

除了论文之外，学术研究还包括会议。统计 2021 年会议出版物的数量，最多的是中国，占比 28%；排第二的是欧盟和英国，19%；美国占比 17%。

对比会议出版物的引用数，美国占 30%，欧盟和英国站 23%，中国占 15%。

二、专利方面

在专利申请数量方面，我们可以看出：人工智能方面的专利爆发是从 2016 年开始的，此后每年都会比上一年增加 50% – 100%。

2021 年比 2020 年的专利数量增加了 74%，而 2020 年比 2019 年增加了 100%。

如果按地区分，2021 年中国的申请数占全球一半以上，52%；美国占 17%，欧盟和英国占 4%。

不过，申请和授予是两个不同的状态，被授予的专利才更有含金量。这部分，2021 年，美国占比全球 40%，欧盟和英国占比 8%，中国占比 6%。

如果把三个地区的专利申请数/专利授予数的数字曲线对比着排开看，我们会发现一个很有意思的现象，那就是，中国的比例异乎寻常的高。

中国平均 62 个申请中有一个被授予专利，欧盟和英国平均 2.7 个申请里有一个被授予，美国平均 2.1 个申请里有一个被授予。20 – 30 倍的数据差异值得我们思考，因为这样的数据反应的是量大质低的专利申请大潮。

三、图像识别性能持续变强

第三个趋势是图像识别性能持续变强。这一点对很多人来说觉得没什么，时代在进步，科技在发展，人工智能识别图像的能力在提高。这有什么可惊讶的？

但你只要听过我们之前的芯片系列就会知道，性能的提升代价是极其巨大的。想要把性能提升 10 倍，靠现在堆算力而不改算法的方式，那要堆上亿倍的算力。

今天，人工智能界普遍使用 ImageNet 这个标准，来衡量图像识别算法的性能。这个图库里有上千万的图片可供训练，其中主要使用 top – 1 和 top – 5 两个准确度测试。 top – 5 是更加严格的。

人类在 top – 5 的测试中，平均成绩是 94.9% 的准确率。而今天的人工智能在不使用大规模数据训练的情况下，可以达到 97.9% 的准确率；使用大规模数据训练的情况下，甚至可以达到 99.02% 的准确度。

这方面，人工智能已经全面超越了人类。对图像特征的抓取能力超强，也让人工智能生出了对深伪技术的防御力。

我们之前在《081｜AI：会带来什么潜在危机？》里介绍过人工智能今后会遇到的几个威胁，深伪（DeepFake）技术就是其中之一。网上现在已经有很多用这类技术伪造的明星动作片，或者政客大放厥词的视频。

实际上，这些都是通过人工智能虚拟出来的。而今天的技术水平已经很高了。只要愿意多花钱，就完全可以做出以假乱真的视频。那怎么办呢？

其实，解决办法也是人工智能，用人工智能识别出深伪技术。

今天使用深伪技术中的 Faceforensics 做的视频，用几个著名的识别算法，最高已经可以正确识别 99.98% 的深伪视频，最低也能达到 93.25%。矛和盾之战里，现在暂时是防守方全面胜出。

在图像特征抓取中，还有一种应用是预测身体动作的。这个技术最早是用于游戏或者科幻电影里人体动作捕捉的，但现在，已经可以用来监测真实人物几个身体关节的下一个运动方向了。

如果这项技术真的可以实现快速判断，今后如果拿它训练足球守门员，那守门员扑出射门或者点球的成功率会大幅提高。

在这个预测身体动作的专项测试（Leeds Sports Poses）中，2016 年的预测准确率还只是 91%，今天已经可以达到 99.5% 了，提高极为显著。

四、理解能力遇到天花板

当然，人工智能领域也并不都是好消息。刚刚和图像分类、识别有关的任务，是它能做的最好的领域。但只要转换到对语义的理解、场景的理解、人物关系的理解上，人工智能的表现就远不如一个 10 岁的孩子了。

比如说这样一个场景：在餐厅里，两个人坐在一张桌上吃饭，有服务员端着盘子站在旁边，坐在桌子左边的人伸手指向坐在右边的人。

如果让人工智能理解这个场景，让它说说为什么一个人会指另一个人，人工智能是完全应付不了的。但我们都知道，这个人可能是在给服务员提示，这是坐在那边的人点的菜。

因为这个场景实际上已经不是在找图像特征了，而是一种对内容的理解。

再比如，今天人工智能语言处理的程序会出现骂人、冒出种族主义极端言论的问题。微软就为它们推出的机器人 Tay 注册了推特账号，它会自动回复粉丝的留言。

由于微软的影响力大，大家又对它很好奇，于是这个机器人每天都会接收到大量真实的对话和提问。但就在它上线不到 24 小时，就变成了一个纳粹同情者、种族大屠杀的支持者。

虽然我们知道，它说什么是严重受到粉丝留言的影响的，而且来留言的人，有些可能就比较极端。但最后，它依然吸收了这些极端言论为自己所用。这也说明，人工智能在处理自然语言时，当前的水平更像是一个接下茬比较厉害的机器人。

这个机器人本身并不理解自己说的话具有什么含义，也许对语言文字里的情感倾向还能有所判断，但对是否符合道德标准，判断起来就不太准确了。

五、资金疯狂涌入，巨头已经形成

人工智能领域的投资，自从 2015 年以来就在持续快速增长。其中，融资、收购、私人投资是增长最大的。相比 2020 年，2021 年收购的规模是上一年度的 3.3 倍，私人投资是上一年的 2.0 倍。

在 2020 年，仅有 4 轮融资的总额超过 5 亿美元。而到了 2021 年，有 15 轮都超过了 5 亿美元。不过，投资规模虽然大幅增加，但被投资的对象却更少了。

这表明，人工智能领域的巨头已经形成，后来者想超越的难度越来越大。

六、大计算量带来的能耗并没有引起关注

最后是人工智能对能量的消耗。我们曾经在《科技参考》中介绍过，性能的提升要用巨大的训练量做代价，而巨大的训练量对应着巨大的能耗。

不过，由于这次撰写报告前，小组评估之后并不认为人工智能当前的规模会影响气候变化，所以能耗问题没有列在 2021 年的话题中。但很有可能会出现在 2022 年的报告中。

好了，这就是我对《AI指数报告》的解读。我也把报告的下载链接放在文末了。如果你想了解更多细节，可以复制链接下载报告。

好，这就是今天的内容。我是卓克，我们明天再见。

报告下载链接：https://reurl.cc/Epk0ak

聯系郵箱：0xniumao@gmail.com

AI指数报告：人工智能发展的6个现状

相关推荐