淘客熙熙

主题:alphaGo 系统以及人工智能的未来 -- pattern

共:💬83 🌺264 新:
分页树展主题 · 全看首页 上页
/ 6
下页 末页
              • 家园 你这是应该说“细思极恐”

                现在都看出来了,A狗只在乎输赢,所以赢一点就可以了,看不出棋力有多高,在于对手的棋力。

                谷歌的人说人家根本就没改狗狗的参数,与去年那场棋是一样的,倒是机器增加了20多台,但对于整体提高也不大。这是最惊人的地方。不是原来多数人以为的这四个月的进步很大的缘故。

                • 家园 我正在“细思”中:

                  一是 为深度学习这种代表性的成就感到震惊。

                  二是 alphaGo 实际上应该是代表过去所有的围棋高手们打败了李世石。侧面反映过去几年围棋界并没有很大的提高。

                  我对围棋只懂一些规则,所以对第二个判断不是很有把握。之所以判断李世石会赢,就是以前我有这个印象:就算是全盛时期的吴清源现在也无法在围棋界立足,说明围棋还是不停向前的。那么以谷歌团队对围棋的理解,估计他们会一股脑儿把过去的棋谱都拿来学,那就会造成一些旧的坏的也学进去了。现在看两点都可能估计错误。

                  “李世石连输五盘,气急败坏砸开了电脑,发现柯洁趴在机箱里“。这个笑话指出了一部分事实,趴在电脑里不是柯杰,而是过去的围棋大师。

                  • 家园 你可能还是把A狗当深蓝了

                    A狗自己跟自己左右手互搏自增棋力,有多少人类的知识在其中是个疑问。这次,尤其第二局A狗有几手让围观高手认为是业余棋,结果证明A狗高人一筹,甚至聂老脱帽致敬,说明A狗不全是跟围棋大师们在学。现在知乎上都在说A狗自创一派的事。

                    移步看知乎这里的详细评论: https://www.zhihu.com/question/41214240/answer/90119194

                    • 家园 我们在左右互搏这个问题上

                      不太一致。你大概是认为左右互博可以有很多超越人类的创新。

                      我认为左右互博只是弥补样本不足的问题。DEEPMIND 在他们的论文中说通过强化学习,策略网络的准确率从57%提升到了80%。我觉得这个小组还是通过人类的棋局来判断准确率的。但是人类的棋局太少,因此需要自我下棋来增多样本来提高网络的准确率。

                      核心就是我认为这些样本不太会有超越人类的创新。高水平的左右互博也许会有一些创新,但不太会有太大的比例。因为这相当于用蒙特卡洛算法可以下出大量超越现有水平的棋。如果这个能实现的话,也用不着深度学习了。

                      另一方面,左右互博的样本,还有一个可能是下了一盘臭棋,因此会降低网络的胜率。DEEPMIND是如何排除,或者是一股脑儿接收的。这个还需要进一步的细节。

                      • 家园 左右互搏是无理手变有理的必须过程

                        局部的变化有限,对手在你落子附近应手的可能性很大,这时用穷举能算出绝大多数的可能。大数据问题是应对,对手根本不理你的布局,天马行空地下,迫使你对应他的策略。 恰恰就是天马行空地下,用孤子影响大局对计算机是最难的。其实对人也很难, 主要就是靠经验,经验怎么来,不就是打谱,练习,比赛。 人通过复盘看出来的妙手,计算机为什么不能经验分析? 左右互博当然不需要每次都从星位开场,完全可以从任意棋谱的任意手开始。 大数据下,计算机也能总结出为什么妙手是妙手。

                        • 家园 人可以是判断是妙手,

                          需要高手反复评估,来回模拟才能判断。计算机是可以比人下得多得多,但是如何“总结”为什么妙手是妙手?需要人为干预,还是计算机自己来判断?计算机根据什么来判断?

                          根本上还是因为围棋的搜索空间太大,一个棋局的发展可能性太多。无理手变成有理手我觉得还是需要人工干预。要计算机能真正的自我学习,既上面提到的unsupervised learning ,在理论和实践上目前都还看不到。

                      • 家园 李喆这篇文章说的至今最清楚的

                        AI不会背谱。

                        http://sports.sina.com.cn/go/2016-03-11/doc-ifxqhmve9080655.shtml

                  • 家园 可能不仅仅代表了过去所有的围棋高手们

                    还代表了未来一段时间内的所有围棋高手们,原因就在于狗狗自己和自己下棋的RL方式

                    另外就是对于围棋这种有明确胜负的游戏来说,“旧的坏的”也许并不是那么明确,更大的可能是能捉住老鼠的就是好猫

                    但是细想之下,RL在这里的应用也许并不是像google论文里那么轻描淡写的简单,我觉得google至少掌握了两点领先全世界的黑科技

                    一是对outlier脏数据的处理技巧,二是加速深度学习训练的新技巧,尤其是针对一些特定loss函数的训练技巧

                    期待google的相关论文啊,任何一个放出来都是震动业界的超级核弹

                    • 家园 田渊栋这里有一篇详细分析

                      http://zhuanlan.zhihu.com/yuandong/20607684

                      另外,谷歌的文章也早就出来了, http://www.willamette.edu/~levenick/cs448/goNature.pdf

                      • 家园 谢谢链接

                        田的分析对搞这行的人来说没什么新意可言,只能算是个科普吧。。。

                        谷歌的nature文章是早就出来了,但是细节内容有所保留无疑

                        举个最简单的,比如谷歌说自己和自己下棋,每盘棋是只选了一个局面作为样本来进行训练

                        但是这个局面是怎么选出来的呢?我想如果是random,那结果一定不会是现在这样的

                        直观来看,最有效的样本应该是在“胜负手”的位置上,不仅学得的效果会好,而且训练速度也会快不少

                        当然“胜负手”的判断利用value network是能够做到的,但是这样的话value network和policy network之间一定会有一个成为整个系统的天花板,但是狗狗好像没碰到这个问题,所以一定是有黑科技没有公布出来

    • 家园 什么样的deep learning也只能来自现成的范例

      但人类有“背水一战”这样违反惯例的急智,人工智能怎么应付呢?

      • 家园 嗯,人工智能的标的物。。。不是人的智能

        从来都只是机器而已。

        当然,忽悠机器智能可以达到人的智能是可以的。比如用下象棋,和现在的下围棋。

        但是实话说,任何一个严肃地搞人工智能的人都知道。。。没有一个业内的专家知道,人的智能究竟是怎么一回事。但是他们都知道,人工智能是怎么一回事。

        而人工智能只是人类试图用自己已经掌握的数学知识,来对人的智能的某些现象,进行数学建模并试图验证这样的模型而已。

        比如,专家系统。。。是建立在数据库的搜索,匹配模型上的,下象棋,是建立在规则,演算基础上的,目标识别,是建立在特征抽取和空间变换/匹配上的,而目前的下围棋呢?是建立在高维空间级高维空间上的特征抽取和模式匹配上的。

        但是这些。。。真的就是人的智能了吗?不,远远谈不上。

        讲句难听点的话:随便拿两幅图像,人,都可以轻易地指出他们之间的共同点与差异点。而电脑呢?

        通宝推:秦波仁者,
      • 家园 人类智能的重要性并不只在于学习,还有破坏力

        任何体系的发展都离不开自身或者外部的破坏力,如果人工智能只能够从已有的知识获取经验,那不过是个更大号的搜索引擎。破坏性的力量从人类来说是基于某种化学机制下的异常模式,人工智能如何赋予这种破坏性可能是个复杂的科学和道德问题。

分页树展主题 · 全看首页 上页
/ 6
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河