本期视频传送门:「大小马聊科技41(上)」
话题1、AI打游戏,到底有啥用?
话题2、极氪为谷歌Waymo造车,靠谱吗?
话题3、脸书新CFO,竟是成都妹子?
大小马聊科技,用毒辣视角,聊科技热点。
每周聊3个科技热点,我是小蛋泥,我是大卫,我是电动 Emma。
AI打游戏,到底有啥用?
我们先聊第一个话题, AI 打游戏到底有啥用?这是我们之前挖的一个坑,因为很多观众留言都想听大卫讲 AI 打游戏。其实说实话,我刚开始听到 AI 打游戏话题时,我内心还是有点犹豫的,因为我觉得游戏设计本身不就是给人玩的?然后你让 AI 打游戏,比如说让 AlphaGo 下围棋或者是打星际争霸,那这不是就是让游戏失去本来的意义和魅力了,我就挺怀疑的。大卫能不能先给大家讲讲我们为什么要关注 AI 打游戏?
其实我们不要把它理解为打游戏,大家知不知道博弈论的英文怎么说?叫 game theory 对不对?这个中文翻译成博弈论,实际上英文的原本的意思叫什么游戏理论,所以实际上这里面更多的讲究的是一种博弈的套路。
换成我们更接近现实的一个意义,这里面涉及到一个叫 automated planning 这个 automated planning 翻译成中文叫做自动化的规划。 那么我拿游戏当中举例子,大家再往现实生活中套,比如说我们打星际争霸,对于没有打过的朋友,我可以给你科普一下,就是它里面有采矿,跟所有的即时战略游戏差不多的,都是要采矿。
它还有一个人口,你不断的要 build up 房子,来满足人口需求。
其次还有它的科技树,就是你造不同的建筑物的顺序,让你生产出来兵种可以高级或者不高级,始终我们是面临三个 constrain ,三个限制条件。
第一个条件是说当条件理想的时候,我们既有钱又有人口的时候,我们可以想造什么就造什么。这个时候的 model ,在星际争霸里面叫做 concurrent model 就是我有钱我有人口,我想造什么就造什么,当没钱的时候,那我们是有一种策略对吧,是先造建筑物还是先怎么样干别的。还有一种就是资源优先,我是不是要先去获取资源?
所以大家在看,比如说我们现实生活中在施工在做一个工程的时候,假设我们要造一艘船,造船你就面临着要提前规划,你需要多少工人,多少 man power 然后你有什么样的工具,比如说吊车,你有多少电焊机?其次你的工序是什么样子的?那这些问题实际上都是 AI 可以帮助我们解决的。
也就是说游戏不只是说只是打游戏,而是把强化学习后的 AI 模型放到之后,我们工程生产当中的这种软件当中,它可以快速帮我们规划出一个生产线或者一个造房子。
比如说造房子当中的 BIM 就是很多行业的人都用这个,叫 building information management 它就可以帮我们说那你什么时候钢筋要到位,什么时候你的电缆要到位?你的人工要怎么算?如果遇到节假日,你要怎么休息?你可以往当中加那些 constrain 限制条件,所以我觉得这是它的现实意义。
是的,这个大卫也提醒我,我记得之前我在爱丁堡读硕士的时候,我的专业是 computer science ,就是计算机科学。其中有一门选修课就是 game theory ,我刚开始看标题,我本来以为是讲游戏的呢,我觉得应该挺有意思,结果就选了,结果这个课净讲什么算法,讲什么博弈论纳什均衡什么,这些的感觉搞了一门数学课似的。
后来我还听不懂那个课,因为感觉教授口音有点重,而且我上课也不专心听讲,后来就为了补课,我还去可汗学院,就是一个线上的教学平台,这个也推荐大家可以去关注一下。后来我就通过看线上课,过了那门课的考试,反正我觉得这个还挺有意思的,确实它不只是游戏这么简单。
这个游戏相对于之前大家熟悉的 Deepmind AlphaGo 最大的不同的就是大家下围棋也好下,象棋也好下,无论什么样的棋,其实都是一种全信息博弈。
什么叫全信息博弈,就是咱们两个看的是一个棋盘,你也不会说挡着不让我看,那样咱们怎么玩,但是星际争霸当中,实际上这个地图虽然是一个很大的地图,但是它是有迷雾的,你不用你的兵种过来,或者说你不用探测器,或者像人类的可以撒一个雷达。
神族是有那个叫 observer 就是小叮当,它可以飞过去看敌军的整个状况,这个时候你就可以实现了一种全信息博弈。
但是大多数情况下是一种非完全信息博弈,非完全信息博弈如果日常生活中大家比较喜欢打德州扑克,实际上德州扑克就是一种非完全信息博弈,虽然台面上有我们要去凑的牌,但是我们每个人手里的牌对方是不知道的。那这种博弈状况下实际上你还要猜对吧?所以我们还要拼心态,对不对?就是你可能看看我的微表情,大卫这个嘴角上扬了,是不是要赢了要 all in 了?然后其实我骗你的对吧。
所以就是你不知道别人全信息的这种是不是跟我们现实生活是更加接近的。
对的,跟我们现实世界是更加接近的。因为我们互联网时代已经解决了很多之前信息不对称的问题,比如说跨国交易,跨国做贸易,这个已经是解决了很多这方面的问题,但是还是一个非完全信息博弈的一个状态。
还有几点我觉得这个游戏很有意思的点,我给大家列出来,它是一个长时间规划,叫做 long term planning 什么叫 long term planning 呢?就是你不能一波推了,比如说大家 LOL 有的时候会面临一个说这边五个人对那边五个人。 OK 我这边给你那边一波推了,是有这种可能。
但是星际当中其实不太存在这种我一波给你推了,为什么呢?因为这个游戏构成是比较复杂的,而且这个地盘也比较大,你如果一波没有把我全推倒,因为 AlphaStar 它对面的人也是高手,其实都是大师级的高手,就是几乎不存在一波推倒的可能。
你没推倒我,但是你一直在发展低级兵种,比如说你上来一直造小狗,就是虫族造小狗,无限的造小狗,把所有的钱拿来造小狗,但是我这边已经开发出空军了,所以你推不掉我反而会被我反噬。
这种叫是策略上的错误,导致科技树没有提升,我这边高级兵种都能出来。
所以这个游戏当中还有一些博弈论是在于 long term planning 当中的。虽然它是 long term planning 但是它还有一个特点叫 real time 即时,大家玩围棋也好,中国象棋也好,它是回合制的。比如说我跟小蛋泥我下一个子,然后我拍一下那个表,小蛋泥在开始计时再拍一下这个表。所以当他在拍表的时候,我是只能思考不能动手对吧?但是星际这边你可以动脑动手,我也可以动脑动手,它是这种状态。
这里面还有一个概念,就是所有玩游戏的人都很清楚的叫做 APM ,就是 action per minute 就是你一分钟你手速有多快?这是拼手速。
但是恰巧在这个游戏当中,我仔细观察了一下,AlphaStar 的手速并不是特别快的,它是300 多 APM 也很快,但是人类能达到最高400多 APM ,而且平均下来也是 400 左右的 APM 。
那就说明什么,说明机器它每一个点它点的精确度是比人点的要高的。玩过游戏的人都知道,有的时候手是瞎点的,哒哒哒哒的一直点让它不断的走线,这样点但是机器在这里面它是很精准的在走线。
还有一个点是跟围棋不一样的,或者说跟象棋不一样的,象棋一般来说就是我往左边,比如说我跟你攻守双方,我拿炮打你,然后你拿車打我对吧,咱们两边相当于说在一个小范围内做攻守,但是星际争霸是可以同时多开的,我可以派兵偷袭你的家,你可以派兵偷袭我的家,咱俩还可以在地图上很多个点正面交战,它可以同时开五六个战场,这个时候不仅考验的是你的手速,还有你的地图上还不断的切换,你切换的时候还要再想,就是你这个时候打的是我这个兵,那我后面的要生产什么?
所以它是多战场同时开的,就是一个 large action space ,所以刚才我讲的这五点都是跟象棋完全不一样的,所以它的难度是非常高的。
跟那个围棋不一样吧?对,我这里稍微补充一下信息,大卫刚才讲的 AlphaStar 应该是AlphaGo 的升级版。
之前大家都是关注 AlphaGo 下围棋,后来其实 Deepmind 的公司我们之前视频也聊过,它又做了 AlphaStar 用个人工智能去打星际争霸。
星际争霸就是我们小的时候很多人玩的,就暴露年龄的一款游戏,主要是星际2。
对星际争霸 2 ,我刚才听大卫讲 AI 打游戏打星际争霸。我觉得在现实生活中的比较有意义的比如说在商场上打商战,比如说公司和公司之间这种博弈的,我觉得会比较有用,因为它一方面是你在生产方面就在资源怎么匹配的时候有用,另外你不能纯粹的 all in 。还有比如说在你不知道对方有什么资源的情况下去怎么进行你的策略,我觉得这个是 AI 打星际争霸可能在现实生活中的一个应用场景。
然后 AlphaStar 刚开始拿来的训练模型它不是上来就用很低级的训练方式的,它其实上来就用league 当中比较,就是钻石以上的 league 拿它来训练的,所以它的起点就很高。
这个里面有个特别逗的,它还有自我博弈,就是自己跟自己玩,刚开始快速推对方特别容易获胜,就是 rush 。
咱们都知道,无论是拿虫族的小狗,就是小狗的那种 rush ,还是说神族拿 zealot ,就是狂徒把别人 rush 掉。刚开始胜率就很高,后来换了一个大师的录像,然后大师就上来打防守战,防守后来就长期战,后来 AlphaStar 就不行了,但是训练,然后 AlphaStar 也学会上来先发展经济,就弄一堆民工采矿,然后先堆科技树,后来又把人类给推了。
后来这个又拿别人训练说可以偷袭,我空降到你这或者在你家边上造一个水晶塔,然后放隐形刀客。这个时候 AlphaStar 就有点吃瘪了,你知道吗?我还没见过这种操作,你上来给我放隐形,但是经过几百轮训练,它也学会了。
所以它这是每一次在一个自我迭代的过程中,而他这种自我迭代不是说长期打法就忘了 rush 了,它也会用 rush ,它每一次都是一个新的进化体,它就是通过学习人类的比较大师级的操作,然后去训练自己的模型对吧?
对,而且他每一个兵种,比如说举个简单的例子,这个 stalker 他是一个相对于 zealot 相对于狂徒的一个高级兵种。打 stalker 更高级的其实是用 immortal 就叫什么不朽者,不朽者特别擅长打带装甲的。
那么它们是怎么训练呢?就是我上来造很多 stalker ,然后看它什么时候达到一个纳什均衡要输了,然后在那个时候它会把它记录下来。这个就是我训练兵种达到一个 optimum ,然后再开始第二个兵种,第三个兵种第四个兵种,所以它其实是全兵种作战的。
不是说你们可能看视频看 AlphaStar 和 Liquid Mana 在打仗的时候就只用到了陆军,实际上他们在训练的时候是一直打到空军打到最高的 ladder, 就是科技树当中打到最高,但是为什么就没用呢?因为人类太菜了,就 10 比0。还没打到空军,每一场都输,最后 Deepmind 为了给人类点面子,说把规则稍微调一下,人类最后 1 比 10 惨败。
但是我有一个问题,今天的话题是说 AI 打游戏到底有什么用吗?但是听完你说我感觉不是所有的游戏,它对于模拟生产模拟发展这些都是同等积极的作用。
这个是即时战略游戏,叫 real time strategy ,这种游戏更类似以前,比如说咱们在牛津剑桥的时候看到有那种 war game store 你知道吧,就是卖那种 war game 的,类似棋牌的那种 war game 它其实是一种电脑版的 war game ,就是你有棋盘格,你上面有兵种,兵种有各种属性,还有科技树,然后你还要根据时间轴来积攒你的矿。
它是有很多很多 constrain 的,但是有些游戏它是没有这方面的 constrain 的。比如说像大家爱打的 LOL,它其实就少了很多 constrain ,它其实更多的是在配置和控制上面的。
除了大卫讲的星际争霸,我也仔细想一下到底 AI 打游戏对我们有什么实际的用处,我其实想到了三点。首先第一点我感觉现在游戏不只是这种即时策略,我之前比较爱玩的游戏是 switch 上面的叫塞尔达。
那它这种游戏是一种开放世界的这种游戏,之前像大家玩的吃鸡也都是这种开放世界的。因为我们其实只是开放世界的玩家之一,如果有更像人的这种 NPC ,就这种电脑玩家的话,然后用 AI 的实时的跟你一起玩的话,我觉得在开放世界当中它是一个相当于角色之一,我觉得这个是第一点。
第二点的话我觉得现在游戏这个概念我们应该把它想得更宽泛一些,把它当做现实世界和虚拟世界的一个连接口,比如说我们之前经常讲的自动驾驶模拟,你不可能在所有的情况下都是用实际的车去撞,实际的去碰。而且你把参数扒下来,其实是可以去更高效地去训练自动驾驶的,所以我觉得游戏的概念也可以是一种就虚拟场景的在一些产业方面的训练的作用。
第三个方面我其实还想到了,就是比较发散,有点科幻片的,我感觉以后会不会就是像我们做的 AI,机器人,就这些它会有自己的自主性,有点像终结者电影,就施瓦辛格演的那种,我感觉会不会以后有可能人类不是特别好控制 AI 机器人的时候的话,那相当于我们可能通过游戏,相当于给它找个事干,有点这种训练的方法一样,所以这个是比较我瞎想的一个开放的点,目前我是想到这三点。
你三点,我逐一回答一下。首先第一个你刚才提到那个游戏就是像吃鸡游戏,就 PUBG 它是一种沙盘类的游戏,而沙盘类的游戏实际上是很难做到强化学习的,或者说它是一种纯无监督模型。
我知道之前在给大家讲特斯拉 FSD 的时候也给大家讲过什么叫监督模型,什么叫无监督模型?就是为什么那种沙盘游戏对于电脑来说特别难玩呢?因为里面的变化太多,比如说你可以藏在哪偷猫人家一下。
我之前遇到更搞笑更搞笑的一个视频,就是两边组队,这边五个人,那边五个人,然后有这边的一个高手,就拿一个大狙,就是一个长瞄来瞄去,那边梆打死一个,呀怎么没死,等我又打一下,明明死了咋没死呢?他就一直待在那又打一下,又死一个。怎么还没死呢?后来这人就纳闷地走过去,梆梆一下,被对方打死了。
你知道为什么吗?因为对方五个人穿了五件一模一样的衣服和头盔,你知道这有多扯淡吗?他穿了五件一模一样的头盔,倒下一个,另外的兄弟就拿包扎给他治,然后又站起来一个健康的,然后倒下一个又站起来一个健康的。
这边这个人就觉得,你怎么四次你都不死,我就跑过去看一下,梆档被对方一枪爆头。所以你说这种玩法 AI 是没有见的,就没见过你人类这么骚的操作。对于这种无监督学习来说,其实强化学习已经失效了。
不过这也是这种沙盘游戏或者开放世界这种游戏的魅力,它就是各种随机性,各种不可控性,赢得游戏不一定是玩家的最终目标,大家有可能在游戏里头各种搞笑,然后各种瞎搞,其实生存就是他玩游戏的目标。
笑死我了,你想人类有多骚气,就是在面对这种操作上,但是星际本身它还是一个比较规范化的。虽然我刚才讲了它有很多相对于围棋更高维度的策略和玩法,但是它还不是那种纯开放性的游戏。比如说像 PUBG 就是吃鸡,它是一个特别开放的游戏,所以电脑过来肯定吃闷棍。
刚刚小蛋泥讲的第二个关于自动驾驶模拟的问题,这里面有一个比较贴切的例子,机器在做 planning ,比如说我们公司的工程师在用游戏引擎训练汽车在 planning 的时候,它也是制造了一个强化学习,而且也是有标准的。
这个标准其实不是人的标准,你看刚才我已经讲了像 PUBG 这种游戏,你的对手是人,人是很骚气的,人是没有标准的。但是车行驶在路面,它不是为了战胜人,这个本质是不一样的,它是为了让人或者说机器本身是有一个限制的。那么这个限制当中无非几个维度,有时间维度,有空间维度对吧,我这个车在路面上我还有限速的信息。
如果对面是行人,行人相对于车行人是 top priority ,那我肯定要让你,我不可能跟你玩一个很骚气的操作,我别你一下,你看你爽不爽对吧,机器是没有这种操作的。所以这个时候我们还是在用一个强化学习,就是有范本的。
只是说好一点的自动驾驶的 planning 相对于弱一点的,它是会让你的体验感更好,它的流畅性更高。
比如说举个例子,如果一个单行线两边的车只能通过一辆,就是一条路两条线这种单行线,如果有一个车占到你前面的车道,这个时候你就要逆行,你要 Sidepass 到逆行,然后再穿过它。那这个时候就有很多情况出现了,比如说这个车它虽然占了你的道,但它是溜着往前走的,或者这个车是停下来打双闪的,那你的策略就不一样,你这个时候如果要 Sidepass 它,如果对面来了一个车,那你肯定是要先让那个车对吧。
如果对面有一个行人,你也要先让这个行人,所以这里面你是可以枚举出来一些 scenario ,然后针对这些 scenario 再做训练,做出时间更快,然后让车运转的更平稳的这个策略的。
因为我刚才已经讲了你的终极目标不是战胜人,而是让车它跑得更平稳,所以这是一些区别。然后第三个关于小蛋泥讲的就是说它会不会成为一个 terminator ,我理解机器跟人打仗机器只能打得准,但是它没有人那么骚气。
所以战争实际上是没有一个严格意义上说我要怎么打,你要怎么打的。当然大家要遵守日内瓦公约,你不能虐待对方战俘等等,但是在我把你打败这件事情上实际上是没有什么限制的,我可以埋在土里对吧,我把我自己埋在土里,然后你一出来梆给你一枪。但这个时候机器就需要更高级别的传感器等等它才能发现。
如果是一个纯的 terminator ,就是我大胆的想象,它其实是很难跟人进行对抗的,因为人有各种各样很骚气的操作,它只是能比你跑得快,比你看得准,比你打得准。但是战争往往不是以这个为最终的决定目标的。
刚才你们说了一个很有意思的点,就是说现在游戏它变成一个现实世界和虚拟世界的连接,我觉得如果是按照这个逻辑的话,它的意义就不只是像你们刚才说的很多科技领域的意义。其实在人文领域,比如说我认识一个导演朋友,他也转行去在游戏行业里面去创作了。
其实这个再往深推一步,它有可能就是一种新的更加立体的电影的形式。也是我们现在很火说的那种元宇宙,所以在除了刚才我们说的这些科技领域的应用,其实它对于艺术的创作,还有整个影视发展其实也会有很颠覆性的印象。
我觉得对,我这回为了准备咱们节目,我 review 了几篇论文。当然作为一个谈话类聊天节目,堪比《锵锵三人行》,我们并不想把节目拉得特别深。所以我之后会把论文的链接让小蛋泥放在它下面,对于有需要的观众朋友们可以去看一下。
这里面有几个比较让我觉得很有意思的如何做 building order 就是建筑策略,就是在你有钱的时候,没有钱的时候,还有比如说突然你的矿不够了,或者说你被一个隐形的敌人被攻击的时候,你都有很多,就是它在策略上突然中断我之前所有的神经网络模型,拿一个新的模型处理这件问题,因为这个问题更棘手,所以这时候就是它一个策略中断,然后它再重新把策略打开,所以跟人的逻辑还是挺不一样的。
对是的,等到时候大卫把论文发给我,我会上传到小丹尼知识星球,大卫负责提供弹药,我负责来卖。
进货上了。
我觉得即使是像我这种既打游戏不多,然后对 AI 理解也有限的人,也很值得看看。因为像我们刚才说的,其实 AI 打游戏对于一些产业的发展甚至是世界的构建都越来越重要。那世界上绝大部分人连这一点其实都不知道,更不要说它里面的什么逻辑、战略什么的。
所以你这些不知道的情况下,你怎么参与到这个新世界的构建呢?所以我觉得就是还是要在这方面多学习,即使你不是这一行的人。
这个游戏的模型特别适合做沙盘推演,不只是说军事上的沙盘推演,我一直在想,就是说在工业生产上的沙盘推演也是很有用的。
比如说你一个生产线如何爬坡产能对吧,你现在就这么点钱,就这么一条生产线。那你如何在这么多 constrain 的状态下,你就这么多 man power ,然后做出一个最优解,那这里面都是可以用到一些强化学习模型。
其实我觉得这里面也是一个很好的商机,如果谁利用 AlphaStar 这套东西来重新训练一个 BIM ,就是 building information management 把这个东西加进去,那之后我们在造楼,比如说做造价的时候,就是建筑造价的时候,或者说在造船行业、汽车生产行业都可以有明显的效率提升。
我很早之前就知道其实宝马公司自己做了一套模拟引擎,就是这些生产线上面是怎么去给料,然后工人哪怕,就是它可以模拟出来人休息了调班了怎么样,如果给料给的不及时是怎么样的。
后来我有一次跟我那个朋友他是做汽车行业的研究员,他说他去访问了丰田公司,就丰田第六代的生产线,因为丰田给 Tesla 实际上是第五代生产线,丰田它有一个第六代生产线,它第六代生产线精确到什么程度呢?就是说把产线上的工人从 144 步减少到 72 步,它整整减少了一半的步数。所以他们其实在做组装的时候是很精确的,就是你多少步之内完成这件事情,相比之下,我觉得中国在做这方面还是粗犷很多的。
我其实听下来我感觉 AI 打游戏对我们的现实意义,我把它总结为两个方面。第一个方面就是大卫比较强调的偏理性的,就是在你资源有限的情况下,你是如何把它效率最大化,回报最大化。
就比如说在生产线,在这些制造方面怎么去,比如说通过打星际争霸这种策略性的游戏去获得最高的收益,这个是第一个方面。
第二个方面主要是 Emma 说的比较创新性、比较感性的方面,比如说做这种艺术创作什么的。
其实之前我们做《 DannyPal 》的节目也类似《大小马聊科技》,我们请过嘉宾是博柔和嘉剑。
他们是原来在清华读的本科,然后耶鲁读的硕士,他们主要是搞建筑的,我看现在他们在哈佛也在做一些事情,就是和游戏元宇宙相关的。我感觉这个方面也是相当于把游戏做成现实世界和虚拟世界的窗口,把它做成一种手段。那我觉得这个其实是两方面,我听到的对现实意义的价值。
还有一个刚才大卫说的很有趣的,这里面也会有一些商机,就是你用 AI 打游戏的那些技术去赋能原来的一些传统行业,这其实就是另一种互联网+只不过是 AI 打游戏+了。
那你说的这个腾讯很爱听,这腾讯,之前大家不是老说它游戏公司,感觉这种不是很符合社会主义价值观对吧,有点毒害青少年的感觉。但是腾讯这两年我自己作为腾讯的一个小股东,我就发现现在腾讯搞游戏也经常要往这种主旋律上靠对吧,比如说用游戏的手段去恢复古长城,或者是做一些公益相关的事情,我觉得还挺有意思的。
我小时候玩过一个游戏,叫做足球经理,我不知道小蛋泥玩没玩过,是可以经营一个足球俱乐部,然后买卖球星对吧,其实这就是一个我觉得很有意思的游戏,如果现在用强化学习来玩这个游戏,估计直接干出一个宇宙第一足球队。
是的,就是一个足球游戏,但是你上不了足球场的,都是全是在幕后的操作那种感觉。
实际上我们就讲到现实,现实一点我们永远都面临了很多 constrain ,有一次我跟我母亲聊天,他说如果有足够的钱和足够的时间,那你可以造出一个足够牛的,甚至是一个石油平台航空母舰都是可以的。
但是现实往往它不同的点就是,我们没有足够的时间,也没有足够的钱。那我们怎么造出一个优秀的产品?其实国与国之间也是这样的,没有一个国家拥有所有的资源对吧?然后每一个国家在这个地球上都是只有一块地盘,有这么多人,那你怎么造出来就是相对于别的国家更先进的更发达的技术和产品,这就是一个很庞大的星际争霸的一个体系了。当然这里面的 constrain 更多,不只是人的问题、钱的问题,还有很多可能我都一下子想象不到的这些 constraints。
大卫说这一点很有意思,我们最近不是在迪拜,大家都知道迪拜阿联酋肯定是特别的有钱,也是这种网红城市,我们上集视频也聊了。但是我们明显感觉其实哪怕像迪拜这么有钱,阿联酋这么有钱,它也是有各种这种限制的,也是有这种资源需要去匹配的。
比如说我们前两天登哈利法塔,它也就是在 2008 年出现经济危机的时候没钱了,也还是需要阿布扎比的酋长去支援它。
还有哪怕它投入钱再多的一些酒店,大楼什么的,其实你过了十来年再去看的话,我们像常驻北上广的这种人的话再来迪拜看,说实话就并没有那么的惊艳。所以我想说就是我很赞同大卫说的这点,就是哪怕你感觉再有钱,但你其实也是有各种限制的对吧,有时间限制、有钱的限制,所以我们还是可以通过这种游戏的模拟的手段,去各种的试,对吧。
刚开始很有钱的国家拼命造小狗,然后科技树没拔起来,被人家反噬。实际上这个例子在世界当中是很多的,也有很多后起之秀,单纯靠策略就赢了。
其实像迪拜这种地方,就迪拜和阿布扎比是既有钱,如果放在星际争霸里,你上来就感觉无限黄金了,你钱特别多,但人口不行,就是你没有那么多人,所以这时候怎么开始造房子,开始把人堆上来,你就可以玩命的造了。但是迪拜我觉得他们还是选择了一个比较好的科技树,就是没有做特别吃老本的事。
我想提出一个代表那种不喜欢玩游戏然后反游戏的人的问题。第一个问题就是市面上有多少游戏是真正对这种科技有用?对这种训练技术规划这些有用,有多少是真的就是让大家上瘾的。第二个问题就是你们刚才说的很多训练的用处,其实是不是用另一个东西也可以训练?比如说你如果是去厨房做菜,它也是要有限的资源人匹配料对吧。那为什么我们要选择一个这么男性化的场景去训练这些东西呢?
主要是星际争霸是一个明星游戏,当然你也可以用什么足球经理对吧,还有专门你刚才说的厨房,厨房里面有一个游戏,就专门经营一个厨房,经营一个餐馆的,就是你放多少椅子,放什么菜,吸引多少顾客来雇多少店员也可以。
但是还是维度有点低了,所以当时 AlphaGo 整个 Deepmind 团队选游戏的时候就选了这么个星际2的网红游戏,它没有选 Dota 或者 LOL,我觉得还是因为觉得 Dota 和 LOL 维度太少了,星际2确实是一个你能找到维度比较多的一个场景。
还有刚才第一个问题什么来着,第一个问题就是有多少的游戏真的是为了技术的发展,就像你们说的有多少是就是纯玩的纯玩的上瘾的,然后挣钱的。
这个问题很好,我记得我上大学的时候打星际,我本来是复习累了,想打会星际打完更累。就这游戏实在太烧脑子,然后手还疼,因为你手速要快,所以这个游戏不是那种休闲放松类游戏,它是一个就是说让你很集中精力,很拼手速的这么一个游戏,说实话它不放松。所以我有时候觉得人家打职业联赛,比如韩国那些打星际职业联赛的,我这份钱该人家赚,太难了。
我也觉得 Emma 问题特别好,我感觉真正对现实世界有用的游戏比例是特别少的,我觉得这个其实是我们做 AI 打游戏,它主要的目的是提升一种能力。游戏只是它的一个载体,比如说选了围棋,选了星际争霸 2 什么的,最主要是看我们训练的它的能力,而不是说看它载体到哪个游戏方面。
我感觉就是绝大部分游戏还都是供娱乐使用的,确实是会出现那种比如说沉迷或者什么的。但是我对游戏的感觉其实我很赞同段永平的观点,就是说其实游戏就是一个放松的,如果你不打游戏的话,你还是有其它的这种容易上瘾的酒烟什么的,所以不能怪游戏本身,要怪的话就怪那些容易上瘾的人,这个是我的观点。
人性之恶,这个就是人对很多东西都上瘾,你说你不让抽烟,他还可以对别的上瘾。但瘾这个事情实际上是在于人而不是在于载体对吧,那倒是不让抽香烟了,还有电子烟,电子烟抽多了也就上瘾。那你说不能把电子烟再戒了,那还有很多东西。
那倒是,因为我们就在阿联酋这种穆斯林的国家,女性都是我们上一节也聊了,女性都是黑布裹起来的,但是还是能在街上看到那些外围女,所以这些东西是封不住的。
极氪为谷歌Waymo造车,靠谱吗?
脸书新CFO,竟是成都妹子?
更多内容扫码查看原文:
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除