淘客熙熙

主题:openAI又迭代出GPT4了,这次支持图片的理解能力了 -- 亮子

共:💬51 🌺146 🌵3 新:
分页树展主题 · 全看 上页 下页
            • 家园 谷歌与meta都有干货

              估计一个可能是近年总没突破于是投入方向或重视度级别低了,导致这次落人之后. 但新闻说谷歌这两天也要推出了,今天好像已经实测了不知结果如何. meta最近好像就是一个劲在裁人, 从元宇宙坑底爬上来过程中. 但meta的AI投入积累也是业内一霸. 都是重量级的人才集训营.

              百度做的其实反映了业界大部分人熟悉的程度,也符合对AI普遍的预判. 惊艳有突破的是OpenAI,这个要承认.但是差距是不是大到不可跨越,应该还没那么严重. 最大的意义一是指明了AI突破方向,拯救了AI拯救了党, 二是如果借这个人气带来一波产业革命, 别管真的假的, 对于全世界有产者无产者来说都是一剂强心剂, 全世界都快被逼到走投无路要重拾世界大战老剧本的节骨眼了, 要是来个峰回路转不是皆大欢喜的场面么.

              总之,不要纠缠几个大厂之间的内卷细节, 从全局看是好事,不是小好,是大好.

              • 家园 谷歌的bard这两天有人实测过了,跟百度半斤八两甚至略有不如

                b站知乎都有很多实测对比的,这个chatgpt看来是真有点门槛

            • 家园 现在压力来到两位马老板这边

              阿里怎么样我不太清楚。

              南山必胜客这次要是要是应对不好,二十年发展将毁于一旦。

              早几年我看过一篇文章,讲南山必胜客已经变成一家投资公司了。如果这篇文章写的是真的,那这下子那可就在劫难逃了。

              • 家园 据我所知,阿里还是在线的

                之前发布了M6(https://m6.aliyun.com/#/),不过前段时间杨红霞走了。。

              • 家园 企鹅这次确实很难办

                如果不尽快搞出一个能用的类chatGPT的东西出来,估计国家会出手对企鹅做拆分。怀璧其罪。

                • 家园 跟技术之外的东西相比,技术反而不难

                  1:算力便宜——好用的算力中国各种被禁,便宜的国产超算对机器学习模型而言相当难以使用。2;数据便宜——可以使用印度、巴基斯坦、尼日利亚、肯尼亚等地的便宜且懂英语的标注员,而中国没有母语为中文,又和印度、巴基斯坦、尼日利亚、肯尼亚一样廉价的标注员。印度IIT毕业生年薪百万卢比(8万RMB)是高薪,可以招到顶级的IIT毕业生,在中国能招个啥?还"河南河北云南贵州"呢? 工价完全不是一个层级的。1对应的是帝国霸权,2对应的是文化圈内极高贫富差距。这两点都是中国的巨大短板。

                  作者:还是不注名好

                  链接:https://www.zhihu.com/question/581806122/answer/2944141400

                  来源:知乎

                  著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

                  还有个问题就是腾讯的营收是基于「社交→游戏、视频、音乐等增值服务」的,腾讯怎么把AI嵌入到自己的业务流程?不知道。Microsoft是直接把AI生成文稿功能嵌入自家office的。

                  对于游戏和影视来说,最重要的反而是建立IP。然而王者荣耀没啥IP,只有关公战秦琼。

                  • 家园 射击的游戏快速识别,直接瞄准目标,AI完全可以做到。

                    射击的游戏快速识别,直接瞄准目标,AI完全可以做到。

                    我原来看过一位仁兄用AI做飞机游戏的瞄准射击,我很喜欢。

                • 家园 腾讯版ChatGPT,要来了

                  ChatGPT爆火后,科技大厂纷纷宣布自家大模型领域产品研发计划,股价应声大涨。

                  3月16日,百度正式发布其AI产品文心一言,李彦宏表示,“文心一言带来的优势,让百度智能云有可能成为市场*。”

                  仅仅一天后,微软宣布将通过Microsoft 365 Copilot,植入OpenAI两天前发布的GPT-4模型。据瑞士信贷估计,未来5年或将产生149亿美元收入。

                  不只提振股价,还能增进营收。于是,大模型的东风何时吹向腾讯,一直被外界所关注。

                  3月22日,腾讯公布其最新财报后,腾讯董事长兼CEO马化腾、总裁刘炽平等管理层召开了电话会议。

                  值得注意的是,这也是腾讯管理层首次在公开场合确认将推出类ChatGPT聊天机器人产品,并披露相应进展。

                  刘炽平表示,腾讯在AI领域的投入已经有很长时间,目前拥有足够的团队和技术开发出大模型产品。

                  他认为,腾讯“的业务主要就是社交,通讯和游戏,服务用户对用户的需求,其中包含着高质量的内容,生成式技术和基础模型技术自然能够为其提供非常重要的补充作用。”

                  刘炽平表示,“此类技术研发将推动公司既有业务的增长,提升变现能力,利用生成式内容精准对标用户需求的特点,不断优化广告产品效果,推升营收转化率,提高内容业务和平台的运营效率,为内容制作者和公司创造价值,提升用户参与度。”

                  基于此,刘炽平称,腾讯必然会投入各类资源来打造自己的基础模型技术,未来也会应用于各业务当中。

                  换言之,生成式AI将在不久后纳入腾讯旗下微信和QQ等产品中。

                  不止于此,随着业务模式的不断优化,刘炽平预计,“腾讯也将出现新的增长机会,正如互联网的发展一样,以打造有用的服务为开始,而后思考合适的商业模式,整体而言,这个领域为我们创造了非常令人兴奋的机会。”

                  刘炽平对于“催生新业务”寄予厚望,他认为,这将推动腾讯将“从满足用户对用户的需求,发展到用户到机器的服务领域。”

                  但显然,腾讯并不打算“拼速度”。

                  刘炽平表示,“我们希望沿着正确的路线踏实前进,不急于求成,先打好基础,再追求新进展,我们的*款产品将会是多次迭代之后的产品,整个过程将是长期的。”

                  而且,聊天机器人也将只是腾讯未来发布的众多产品中的一种。“我们视其为长期的发展机会,而非需要迫切解决的威胁,我们视其为工作重点,但抱着久久为功的态度,希望我们的努力是可持续的。”

                  据刘炽平介绍,腾讯“具备打造有竞争力产品的实力,有使用场景的资源,有数据方面的优势,有云计算基础设施方面的加持,有打造人工智能应用,为既有业务提供辅助方面的长期实践。”

                  具体而言,在基础设施方面,腾讯有足够的芯片来打造基础模型技术;更为重要的是,腾讯拥有非常强大的云业务和相关技术,以可拓展和高密度的方式来调整和使用芯片,打造能够满足性能的芯片集群,来训练大型的,以及随迭代数量增长而复杂型不断增长的基础模型。

                  值得注意的是,在财报电话会上,腾讯首席战略官詹姆斯·米歇尔也回答了成本相关问题。“大语言模型方面的成本不同,是一种固定成本,同创造的营收相比,这部分成本确实不小,但不会对利润率产生重大影响。其他公司,无论大小,也都需要负担这样一笔固定的成本,相比其他业务所提供的用户补贴之类的相关成本,我们认为这部分成本是合适的。”

                  刘炽平则补充到,“还有一部分成本是硬件成本,能够分摊到多年。”

                  事实上,腾讯在大模型领域的布局早已有之,其“混元”系列AI大模型覆盖NLP、CV、多模态等基础大模型以及众多行业/领域大模型。

                  ChatGPT爆火后,面对外界追问,腾讯也在2月9日就曾表示,在相关方向上已有布局,专项研究也在有序推进。

                  3月初,有报道称,腾讯类ChatGPT对话式产品正是由腾讯混元助手项目组(HunyuanAide)出面打磨。

                  据悉,混元助手项目组将联合腾讯内部多方团队构建大参数语言模型,其目标是“通过性能稳定的强化学习算法训练,完善腾讯智能助手工具,打造腾讯智能大助手,并能成为国内的业界标杆”。

                  尽管在财报电话会上,腾讯高管没有给出明确的时间节点,但也确实给外界吃了一颗定心丸:万事俱备,只待东风。

                  https://news.pedaily.cn/202303/510634.shtml

              • 家园 南山必胜客早就是投资公司了

                《原神》公测两年多了,现在还没有友商能拿出真正的竞品。

                • 家园 13年我开始用微信时,就估算出南山必胜客的

                  微信的红利可以吃十年。若十年之间没有进步,南山必胜客将成为下一个诺基亚。

                  • 家园 时隔近一年为什么腾讯还没有拿出来像样的《原神》竞品?

                    很多角度的回答都是对的,我再补充一个我视角切片中的答案

                    大厂掌握资源的人无法正确理解原神

                    ,所以抄不出来

                    最近面试了3个在鹅厂实习过的优秀应届生

                    他们的主要实习工作都是拆解原神

                    他们实习期间,所在项目总结原神成(zhuan)功(qian)的原因时,与所有玩家和从业者的分析都差不多

                    但是他们领导认为原神成功最重要的原因是以下3点,重要性依次下降

                    1、弱社交

                    2、角色营销

                    (指角色PV、游戏内剧情等)

                    3、开放世界

                    同学们纷纷表示不认可这个结论,他们认为原神更成功的地方在于美术渲染、角色塑造、剧情、战斗体验等高质量的游戏内容。

                    有一位同学的观点很棒,他认为所谓的弱社交并不是“弱”,而是经过设计,更平等,更适合普通年轻人,更适合二次元

                    用户的社交体验。

                    以此观之,部分大厂掌握权力和资源的人还在用“社交、营销、二次元、IP”的框架去理解原神,同学们能意识到的重点他们却看不到(或者装作看不到)

                    他们对美术、玩法、剧情之类的内容感知十分迟钝,在执行上还是高薪砸钱堆资源让大触听自己的话。

                    这种思维方式就像学渣思考学霸为什么成绩好,得出结论是学霸转笔的姿势非常独特,认为自己只要能复制转笔姿势,成绩就可以比学霸还要好。

                    一部分原因是大厂企业文化

                    和做事氛围导致只有经过市场充分验证和可量化的目标才会被上峰认可,另一部分原因就是掌握资源的人其实并不怎么热爱游戏,甚至不热爱玩游戏。

                    看不懂,学不像,只知道原神赚钱,我也要整一个,这是抄原神大厂普遍的现象。

                    https://www.zhihu.com/question/473981288/answer/2069727899

                    腾讯本来最擅长的打法是获取流量然后变现。比如大家都用qq微信,再把qq微信的使用者引导到腾讯自家游戏中。现在获取流量部分遇到了短视频的巨大挑战,变现方面又遇到了米哈游这种内容游戏(JRPG),抄都抄不过来。

  • 家园 转自鼎盛,文心一言有人测试了,写代码不行,逻辑性不行 -- 补充帖

    当然,再烂总归是自己做的,比亚迪跟华为的初代产品也是烂的不行,只要肯下功夫迭代总会变好的。

    【被迫上场?我们全方位测试了文心一言,只能说_____。【差评君】】 https://www.bilibili.com/video/BV1hY4y1X7Cs

    这里分类讨论一下二者的表现:

    1.写一首以猫为主题的打油诗 文心一言:生成了一首类似七言诗的作品,语感上更接近我们印象中的古诗,但是没看出和猫有什么关系,并且用了一个不存在的典故。 gpt4:生成了一段真。 打油诗,不咋押韵,用很白话的语言写了猫,文学性不咋地。 这个环节其实我觉得半斤八两。

    2. 写代码 让他们写一个点击会变色的按钮。 文心一言:生成了一段js代码,并且在要求它补充html和css的时候失败。 gpt4:直接生成了html+css+js代码,粘贴进浏览器就能运行,实测可用。 让他们写一个2048游戏 文心一言:生成了一段2048的js代码,因为主持人不是程序员,于是丢给了gpt4。 gpt4:直接指出了文心一言的代码变量名命名错误(用数字开头),数组上限错误(应该从0到2047而不是2048),让它修正后它修正了,并且指出文心一言这段代码并不是一个2048游戏代码(笑死,嘲讽拉满)。 让他自己写一个,它同样生成了一个html+css+js的2048游戏代码,主持人复制到txt里改个后缀就能玩了,就是有点简陋,并且新生成方块的逻辑是随机的。 把gpt4的代码丢回文心一言:文心一言并不能解析代码是什么意思,而是直接把gpt4的html给生成显示了…… 这算不算一个攻击漏洞 总之,写代码,被薄纱。

    3.写文章 让他们写本手、妙手、俗手那个高考题。 文心一言:文章全篇都是围绕围棋本身,更像本手、妙手、俗手的名词解释,主持人复制到浏览器搜索可见大片重复文字。 gpt4:逻辑吊打,从围棋术语引申到人生态度,至少是真的在写作文,不过这里主持人就没查重了,感觉不太严谨。 林黛玉倒拔垂杨柳 文心一言:开头还行,写一半逻辑没了,“用一根竹竿然后林黛玉爬上去然后倒拔了柳树”,所有人都没看懂林黛玉怎么拔的。 gpt4:试图用文学性取胜,有很多环境、人物语言描写等,但是理解成了把其中一个柳枝倒过来,操作是用红丝带拴着一个柳枝使它倒过来。 孙悟空穿回三国会发生什么 文心一言:这次老老实实列了四个可能性,说孙悟空有可能会和三国的人物相识,从而发生xxx故事。 gpt4:相比之下更厉害的地方在于,它会结合孙悟空的个人能力,比如头脑聪明,法力强大,再结合个人能力分析他在三国会怎样。 我也是看了gpt4的答案,才像弹幕里说的意识到,相比之下文心一言的回答可以把孙悟空换成隔壁小王,也没啥区别。 总结:逻辑性应试性的文章chatgpt吊打,脑洞类两个有时候都抽风。

    4.逻辑陷阱 类似于刘备和刘秀什么关系,爸爸和妈妈能不能结婚,番茄炒西红柿怎么做这种问题,文心一言的表现和gpt3差不多,会胡说八道。 gpt4基本都能识别出陷阱。 当然这个也是gpt4这次重点优化的一个部分,表现被薄纱我觉得没啥可惊讶的。

    5.数学题/逻辑题 用1234做24点 文心一言:傻了,直接出bug,大段无法理解的文字。 gpt4:先给你解释怎么一步步生成的24点,最后列出算式。 用3L和5L的水桶称出4L水 文心一言:3L水桶装满,倒进5L水桶里。 没了,摆烂了。 gpt4:第一步.3L装满,倒进5L水桶 ; 第二步 3L装满再倒进5L水桶,直到5L水桶装满; 第三步 把5L水桶倒空; 第四步 把3L水桶剩下的水倒进5L水桶 (此时3L水桶里还有1L水); 第五步 3L水桶接满,再倒进5L水桶(此时有4L水) gpt4不仅对了,还会分步骤,甚至会给括号解释内容。 被薄纱 另外直播快结束的时候好像还测了一个开根号的问题,文心一言又bug了,疯狂输出的那种bug。

    6.辩论赛 让他们扮演一个辩手,辩论“近墨者黑”和“近墨者未必黑” 文心一言:对不起,我不能扮演辩手和你辩论。 gpt4:好的,我将作为辩手和你辩论。 然后围绕“近墨者未必黑”,从个人选择和家庭影响两个缅方面展开了论述。 严格按照总-分-总模式形成了论点。 把gpt4的论点粘贴给文心一言试图让他反驳:好的,我来反驳。 然后把gpt4的论点复读机了一遍。 总结:被薄纱

    7.文生图以及文字转语音 文心一言:文生图没有一次达标的,让生成围棋棋盘,中间硕大的国际象棋; 让生成西红柿炒蛋,出来毫不相关的图; 让生成林黛玉倒拔垂杨柳,直接拒绝生成。 文字转语音:多次尝试关键词后,成功了。 不过恕我直言,这和其他文字转语音软件有啥区别啊…… gpt4:没有这个功能,被薄纱了呢(狗头。 没有测gpt4的多模态读图功能,虽然我觉得这才是多模态的核心。

    8.上下文理解 文心一言:上下文理解稀烂,很多时候两句话之间都无法形成记忆,更别说连续对话了。 gpt4:这还用赘述么,3.5时代就可以一直callback没问题了。 总结: 测到最后主持人绷不住了,总结文心一言的优势的时候说它有gpt不具备的文生图和语言功能,大家自行评判。

    其实chatgpt出现之所以惊艳众人,就是它强大的逻辑归纳能力,以及上下文语意理解能力是划时代的,和之前的人工智障观感完全不同; 再加上强大的代码生成能力,不止能写,主要是还能理解,论文类也不在话下,这种类似的应用就可以解放生产力。 文心一言的逻辑能力和上下文理解可以说还是很初级的水平,对于语意的理解也很一般,更别提整合信息的能力。 我们当然可以说给国产技术一些时间,关键是,openai给不给他们时间呢? 发布于 2023-03-16 22:46

分页树展主题 · 全看 上页 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河