主题：alphaGo 系统以及人工智能的未来 -- pattern

共:💬83 🌺264 新:

老大河待整

分页树展主题 · 全看首页上页下页末页

- - - - 复没啥话说了
        家园 你这是应该说“细思极恐”
        现在都看出来了，A狗只在乎输赢，所以赢一点就可以了，看不出棋力有多高，在于对手的棋力。
        谷歌的人说人家根本就没改狗狗的参数，与去年那场棋是一样的，倒是机器增加了20多台，但对于整体提高也不大。这是最惊人的地方。不是原来多数人以为的这四个月的进步很大的缘故。
        复你这是应该说“细思极恐”
        家园 我正在“细思”中：
        一是为深度学习这种代表性的成就感到震惊。
        二是 alphaGo 实际上应该是代表过去所有的围棋高手们打败了李世石。侧面反映过去几年围棋界并没有很大的提高。
        我对围棋只懂一些规则，所以对第二个判断不是很有把握。之所以判断李世石会赢，就是以前我有这个印象：就算是全盛时期的吴清源现在也无法在围棋界立足，说明围棋还是不停向前的。那么以谷歌团队对围棋的理解，估计他们会一股脑儿把过去的棋谱都拿来学，那就会造成一些旧的坏的也学进去了。现在看两点都可能估计错误。
        “李世石连输五盘，气急败坏砸开了电脑，发现柯洁趴在机箱里“。这个笑话指出了一部分事实，趴在电脑里不是柯杰，而是过去的围棋大师。
        复我正在“细思”中：
        家园 你可能还是把A狗当深蓝了
        A狗自己跟自己左右手互搏自增棋力，有多少人类的知识在其中是个疑问。这次，尤其第二局A狗有几手让围观高手认为是业余棋，结果证明A狗高人一筹，甚至聂老脱帽致敬，说明A狗不全是跟围棋大师们在学。现在知乎上都在说A狗自创一派的事。
        移步看知乎这里的详细评论： https://www.zhihu.com/question/41214240/answer/90119194
        复你可能还是把A狗当深蓝了
        家园 我们在左右互搏这个问题上
        不太一致。你大概是认为左右互博可以有很多超越人类的创新。
        我认为左右互博只是弥补样本不足的问题。DEEPMIND 在他们的论文中说通过强化学习，策略网络的准确率从57%提升到了80%。我觉得这个小组还是通过人类的棋局来判断准确率的。但是人类的棋局太少，因此需要自我下棋来增多样本来提高网络的准确率。
        核心就是我认为这些样本不太会有超越人类的创新。高水平的左右互博也许会有一些创新，但不太会有太大的比例。因为这相当于用蒙特卡洛算法可以下出大量超越现有水平的棋。如果这个能实现的话，也用不着深度学习了。
        另一方面，左右互博的样本，还有一个可能是下了一盘臭棋，因此会降低网络的胜率。DEEPMIND是如何排除，或者是一股脑儿接收的。这个还需要进一步的细节。
        复我们在左右互搏这个问题上
        家园 左右互搏是无理手变有理的必须过程
        局部的变化有限，对手在你落子附近应手的可能性很大，这时用穷举能算出绝大多数的可能。大数据问题是应对，对手根本不理你的布局，天马行空地下，迫使你对应他的策略。恰恰就是天马行空地下，用孤子影响大局对计算机是最难的。其实对人也很难，主要就是靠经验，经验怎么来，不就是打谱，练习，比赛。人通过复盘看出来的妙手，计算机为什么不能经验分析？左右互博当然不需要每次都从星位开场，完全可以从任意棋谱的任意手开始。大数据下，计算机也能总结出为什么妙手是妙手。
        复左右互搏是无理手变有理的必须过程
        家园 人可以是判断是妙手，
        需要高手反复评估，来回模拟才能判断。计算机是可以比人下得多得多，但是如何“总结”为什么妙手是妙手？需要人为干预，还是计算机自己来判断？计算机根据什么来判断？
        根本上还是因为围棋的搜索空间太大，一个棋局的发展可能性太多。无理手变成有理手我觉得还是需要人工干预。要计算机能真正的自我学习，既上面提到的unsupervised learning ,在理论和实践上目前都还看不到。
        复人可以是判断是妙手，
        家园 对机器来说，妙手就是这子一下，后面胜率提高很多。
        复对机器来说，妙手就是这子一下，后面胜率提高很多。
        家园 “后面胜率提高很多”
        怎么比？你就是下100万盘，对围棋来说还是小意思，太少了。只有一定概率说这不是一招臭棋，没法说这是一招好棋。
        复我们在左右互搏这个问题上
        家园 李喆这篇文章说的至今最清楚的
        AI不会背谱。
        http://sports.sina.com.cn/go/2016-03-11/doc-ifxqhmve9080655.shtml
        复我正在“细思”中：
        家园 可能不仅仅代表了过去所有的围棋高手们
        还代表了未来一段时间内的所有围棋高手们，原因就在于狗狗自己和自己下棋的RL方式
        另外就是对于围棋这种有明确胜负的游戏来说，“旧的坏的”也许并不是那么明确，更大的可能是能捉住老鼠的就是好猫
        但是细想之下，RL在这里的应用也许并不是像google论文里那么轻描淡写的简单，我觉得google至少掌握了两点领先全世界的黑科技
        一是对outlier脏数据的处理技巧，二是加速深度学习训练的新技巧，尤其是针对一些特定loss函数的训练技巧
        期待google的相关论文啊，任何一个放出来都是震动业界的超级核弹
        复可能不仅仅代表了过去所有的围棋高手们
        家园 田渊栋这里有一篇详细分析
        http://zhuanlan.zhihu.com/yuandong/20607684
        另外，谷歌的文章也早就出来了， http://www.willamette.edu/~levenick/cs448/goNature.pdf
        复田渊栋这里有一篇详细分析
        家园 谢谢链接
        田的分析对搞这行的人来说没什么新意可言，只能算是个科普吧。。。
        谷歌的nature文章是早就出来了，但是细节内容有所保留无疑
        举个最简单的，比如谷歌说自己和自己下棋，每盘棋是只选了一个局面作为样本来进行训练
        但是这个局面是怎么选出来的呢？我想如果是random，那结果一定不会是现在这样的
        直观来看，最有效的样本应该是在“胜负手”的位置上，不仅学得的效果会好，而且训练速度也会快不少
        当然“胜负手”的判断利用value network是能够做到的，但是这样的话value network和policy network之间一定会有一个成为整个系统的天花板，但是狗狗好像没碰到这个问题，所以一定是有黑科技没有公布出来
- 复 alphaGo 系统以及人工智能的未来
  家园 什么样的deep learning也只能来自现成的范例
  但人类有“背水一战”这样违反惯例的急智，人工智能怎么应付呢？
  - 复什么样的deep learning也只能来自现成的范例
    家园 嗯，人工智能的标的物。。。不是人的智能
    从来都只是机器而已。
    当然，忽悠机器智能可以达到人的智能是可以的。比如用下象棋，和现在的下围棋。
    但是实话说，任何一个严肃地搞人工智能的人都知道。。。没有一个业内的专家知道，人的智能究竟是怎么一回事。但是他们都知道，人工智能是怎么一回事。
    而人工智能只是人类试图用自己已经掌握的数学知识，来对人的智能的某些现象，进行数学建模并试图验证这样的模型而已。
    比如，专家系统。。。是建立在数据库的搜索，匹配模型上的，下象棋，是建立在规则，演算基础上的，目标识别，是建立在特征抽取和空间变换/匹配上的，而目前的下围棋呢？是建立在高维空间级高维空间上的特征抽取和模式匹配上的。
    但是这些。。。真的就是人的智能了吗？不，远远谈不上。
    讲句难听点的话：随便拿两幅图像，人，都可以轻易地指出他们之间的共同点与差异点。而电脑呢？
    通宝推：秦波仁者,
  - 复什么样的deep learning也只能来自现成的范例
    家园 人类智能的重要性并不只在于学习，还有破坏力
    任何体系的发展都离不开自身或者外部的破坏力，如果人工智能只能够从已有的知识获取经验，那不过是个更大号的搜索引擎。破坏性的力量从人类来说是基于某种化学机制下的异常模式，人工智能如何赋予这种破坏性可能是个复杂的科学和道德问题。

分页树展主题 · 全看首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明