主题：【整理】芯片败局 -- 拿不准

共:💬719 🌺8744 🌵286 新:

稷下学宫

你这几个问题都是很浅显的层次的问题

1. "meta的llama 2开源且可以直接用于商业化，这就决定了大部分国内的大模型没有存在的必要。" 为什么呢? 难道说国内的大模型都是基于llama 2？llama 2的开源会不会同样影响美国的大模型？

中国引进有商业化问题么？美国包括西方整体法律不适用与中国特殊国情，所以美国的license法律问题，这个问题上完全不存在疑问空间。用起来挣到钱就是真的，其他都是浮云。

2. "语料和模型输出的各种被阉割"，我猜想语料是指中文网一些被屏蔽的内容，模型输出的阉割是指输出中需要屏蔽的内容。但众所周知，这些屏蔽范围很明确，其实并不大。中文网绝大多数内容不在这个范围。您似乎认为有限的限制会对模型产生很大的影响，为什么？

目前大语言模型的一个共识是训练数据集的作用是决定性的，训练数据的潜规则一定会在模型的输出上反映出来。比如chatgpt不能说被认为是种族歧视的话，不论有多少训练中的证据，输出必须符合政治正确，那么只能在训练数据中下功夫，让大模型进入韭菜状态，被忽悠的大模型才是好的大模型，在输出的语言自然都是满满的正能量。

3. 如果"中国在算法，模型，训练方法上没有任何创新"，那中国如何又能"输出了大量优秀的AI人才"? 这些AI人才不能创新，又如何堪称"优秀"？

这也很好理解，AI需要数理基础，中国培养的人才这方面比较偏重。 AI本身的逻辑不需要太多的数理基础，但是AI运行与开发的工作目前让然是依赖于人类对数理知识1掌握。而中国教育制度的下的一个突出技能是数理技能，因此AI的开发目前绝大部非是华人，包括美国海华与大陆移民。尤其大陆移民，看论文署名就可以知道。

全看分页树展 · 主题跟帖

相关回复上下关系8
压缩 2 层
- - 🙂美国缺乏AI的应用场景。 9 绝对不是白领字0 2023-08-31 08:11:14
    🙂你这几个问题都是很浅显的层次的问题
    🙂接着问 7 zwx650 字1154 2023-08-16 00:08:22
    🙂语料虽然只是一方面，但对语言模型很重要 6 川普字3397 2023-08-25 00:50:16
    🙂还有一个有利与国内的地方忘了提 7 川普字872 2023-08-25 16:17:50
- 🙂关于华为的AI，一直有个疑问 4 光头佬字276 2023-07-31 00:55:17
  - 🙂华为实际控制的线超过若干条 205 陈王奋起字1625 2023-07-31 06:09:06
    🙂华为麒麟9000s芯片制程为5nm 19 真理字45 2023-08-29 04:14:04

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明