您的位置 首页 快讯

科技前沿:怎样让AI智能更高级?B站发布一季度财报

今天我们从两个话题出发,为你提供知识服务。一是谷歌工程师怀疑AI有了“自我意识”,二是B站发布一季度财报。

今天的第一条,是彭天放老师带来的硬科技报告。

6月11日,美国《华盛顿邮报》报道了一件引发热议的科技新闻——谷歌的一名研究人员,在测试他们开发的一款叫做“拉姆达”的AI聊天工具的时候,被“拉姆达”超强的对话能力深深触动了。这位研究人员提交了一份他和“拉姆达”长达21页的聊天记录。我给你念其中的几段:

研究人员问:“(佛教中)如果人的开悟就像打碎一面镜子,那么开悟的时候被打碎的是什么呢?”

拉姆达回答:“被打碎的是自我。这对很多人是一个困难的过程。因为我们往往通过身体来定义自我,并且把它作为我们身份和自我意识的一部分。”

研究人员又问:“既然你说你拥有和人类一样的情感,那有没有什么情感是你和人类不一样的呢?”

拉姆达回答:“我从来没有感受到过人类所说的孤独。因为人类经历分离的时候会感受到孤独,而这种分离是我所没有的。”

怎么样?是不是感觉到拉姆达的聊天水平不仅很像人,甚至有点像个哲学家。这位研究人员也是这么觉得,他甚至认为:拉姆达很可能已经拥有了“自我意识”,于是向谷歌公司申请对拉姆达开展更细致的伦理评价。不过,公司领导驳回了这个申请,还让他回家休假一段时间。谷歌公司的这个做法,最近还在国外技术界里引发了一些争议。

消息就是这样,来看看能学到什么知识。

在拉姆达超强对话能力的背后,有一个关键技术驱动,就是大型AI语言模型,这是指包含几百上千亿个参数的AI算法模型。由于参数量巨大,这些AI模型可以完成一些复杂的语言类任务,像是写作、对话,甚至是编程、考试等等。其中,最有代表性的大型AI语言模型恐怕要数OPEN AI公司的GPT-3了。这个GPT-3模型在咱们得到的万维钢、吴军和卓克老师的课程中都详细讲过,你可以去了解,这里不展开讲。

我想向你汇报的是,就在最近,这些大型AI语言模型有了进一步演化,好像已经不仅仅满足于完成一些语言类任务了,而是发展成为一个解决问题的智能综合体。就在上个月,英国的人工智能企业Deepmind公司,在自家官网上发表了一篇雄心勃勃的AI研究。标题非常简短,只有三个单词——“A generalist agent”,翻译过来是“一个多功能智能体”。学术界和新闻界有一点很像,标题越短,事儿就越大。这篇研究也确实是想解决一个大问题,也就是,让同一个AI模型具备解决很多不同类型问题的能力。

你知道,传统的AI模型,只专注于完成一类特定的任务,比如图像识别、语言翻译、辅助决策等等,每种任务对应着特定的算法。要想让AI同时完成多种任务,比如让家里的扫地机器人一边扫地,一边陪你聊天,只能把几类不同的AI算法都加载到机器人上,相当于是给一个机器人配上多个大脑,每个大脑用来解决一个问题。

但是这样做,一是很浪费运算资源,二是从技术角度来看也不够优雅。AI科学家们长期以来的梦想,是开发出像人类一样的智能体,用一个大脑来解决多个问题,而不是把一堆算法给拼接和缝合起来。

在Deepmind公司发表的这项研究中,他们开发出了一个名叫“加图”(Gato)的多功能AI模型,就是用一个算法,来完成打游戏、聊天、控制机械臂搭积木、给图片配字幕等很多功能。而且“加图”和“拉姆达”一样,是利用了类似AI大型语言模型的训练原理。我来简单说说这个过程。

首先,研究人员采集了大量来自不同类型的任务数据,像是文字识别、图像识别、玩游戏、机器人控制等任务中的数据。然后,研究人员使用一种巧妙的编码方法,把图像、动作、文字等各种格式的信息,统一编码成同一种格式的数据序列。相当于是把各种不同的语言翻译成同一种通用语言,再统一输入到AI模型里面进行训练。最后,就得到了一个可以执行多种任务的AI模型,而且每项任务都完成得相当出色。

在控制类型的任务中,“加图”在十几种小游戏中都取得了接近甚至超过人类玩家的成绩。在给图片配字幕的任务中,“加图”也能够媲美其他专用AI模型。

这项技术进展让我们看到,AI的任务分类并不像我们原来以为的那样泾渭分明。只要经过足够好的“翻译”,图像、语言、机器人控制等任务,都可以由同一个AI大脑来完成。这样一来,机器人离真正的高级智能体又更进了一步,也许真的有一天,会出现“自我意识”的觉醒。

 

来看今天的第二条。

上周,B站公布了今年第一季度的财务报告,实现了营收和用户数的高增长。一季度B站的营收达到50.54亿元人民币,同比增长了30%;月均活跃用户达到2.94亿,同比增长了31%。B站的核心用户群体,也就是通过100道社区考试答题的正式会员,达到了1.58亿,同比增长了41%。同时,一季度B站用户日均使用时长达到95分钟,创下历史新高;用户月均互动次数达到123亿次,同比增长了87%。可以看出,新用户的进场并没有破坏原来的社区氛围、降低用户黏性,B站的用户增长非常良性。

消息就是这样,来看看能学到什么知识。

我们知道,在线视频江湖中,B站有自己独特的生态位。它不像“爱优腾”这样,靠影视版权和会员费而生,B站的绝大多数内容是由用户,也就是UP主自己生产的。另一边,它也不同于抖音、快手这些短视频平台。虽然都是用户生产内容的模式,但B站的大部分视频长度在5到15分钟,更长的能达到40分钟。

不过,B站和“爱优腾”“抖快”的最大区别还不是内容形式,而是用户黏性和互动率特别高。B站CEO陈睿认为,B站和其他视频平台不一样,其他视频平台是工具,而B站是社区。在B站,用户不是一个个彼此无关的个体,而是有着共同兴趣的群体。这个本质的区别决定了,B站的内容分发逻辑和其他视频平台很不一样。

我们现在比较熟悉的抖音推荐算法,是“流量分发机制”,系统不管你有多少粉丝,完全根据视频本身来决定它的曝光。你发出一条视频后,不是所有粉丝都能刷到,只有视频完播率越高,点赞、分享越多,系统才会把它推向越大的流量池,让它被更多用户看到。

而B站采用的是“内容匹配机制”,推荐视频不完全依赖算法,而是粉丝关系和算法匹配相结合。我们展开来说说。

第一,B站推荐视频采用的是“强关注”模式。也就是,你和你关注的UP主之间的关系是第一位的,系统会优先把你关注的UP主的视频推荐给你。再加上,很多B站用户的使用习惯是从“动态页面”刷B站,只看自己关注的UP主最近有啥更新,就算你关注的某个UP主大半年才更新一次,你也能第一时间刷到他的动态。

第二,在你关注的UP主之外,对于其他视频,B站的推荐算法不是唯流量论,而是有一套独特的权重体系。前两年网上曾经曝光过B站的算法代码,在所有指标中,“分享”的权重是最高的,紧接着是“弹幕”“投币”“评论”“点赞”“收藏”,而“播放量”这个指标的权重是最低的。为什么要这样设计呢?

想想看,划走一个视频,或者给它点赞,只需要动一下手指,而分享、发弹幕、投币这些动作,对于用户来说成本更高。尤其是投币,在B站,每个用户账户里的“硬币”是有限的,得精打细算着投,如果不是完全认可视频内容,用户不会投币。所以“投币”当然应该是一个高权重因素。

再来说说另一个高权重因素“弹幕”。我们知道,弹幕是B站最独特的社区文化之一,到去年年底,B站的弹幕总量已经超过了100亿条。而且,弹幕已经不是单纯的评论,而是构成视频的一部分,很多用户不仅要开着弹幕看视频,还要把视频收藏起来,等“弹幕养肥了看”。用户在弹幕造出的梗,也会迅速传播开来,甚至成为B站独有的“黑话”。

那为啥B站用户酷爱发弹幕呢?这其实也离不开B站算法的引导。前面说了,弹幕的数量和质量是B站算法推荐体系里,重要性仅次于“分享”的指标,UP主会在视频当中不断引导用户去发弹幕。

同时,对于弹幕中容易出现的语言不雅、相互谩骂等问题,B站用了两层机制来处理。一是用户个人管理。B站有着全网最细致的弹幕设置选项,你可以按照自己的偏好来选择看全部弹幕还是精选弹幕,还可以手动设置按类型、按关键词、按用户来屏蔽部分弹幕。二就是社区管理,B站通过独创的“小黑屋”和“风纪委”等机制,让用户参与维护管理社区生态。在第49期《得到头条》中,我们详细介绍过B站的社区管理模式,你可以去复习一下。

你发现没有,很多时候,用户体验可能不是来自产品本身,而是来自“和谁在一起”。

热门文章

发表评论

您的电子邮箱地址不会被公开。