淘客熙熙

主题:openAI又迭代出GPT4了,这次支持图片的理解能力了 -- 亮子

共:💬51 🌺146 🌵3 新:
全看树展主题 · 分页 上页 下页
家园 你怕是觉得玩具总动员是科幻片吧?
家园 GPT就是从一个写代码的软件发展来的
家园 我倒觉得相反,迷茫的百度总算找到方向了

百度「文心一言」的真实内测使用体验如何? - 段小草的回答 - 知乎https://www.zhihu.com/question/589955024/answer/2940079055 看来似乎比发布会上还要好一点。百度难得以一次正面形象出现在公众视野里,这就是对当前的百度最大的意义。

all in ai一直没找到赢利点,要是没有chatgpt打开局面他还得指着遥遥无期的无人驾驶

家园 请问大佬鼎盛网址是多少

我怎么上不去了

家园 早看他不顺眼了

抢走一个亚裔女性。

家园 元宇宙就是虚拟数字世界、虚拟现实应该也是方向

和波士顿机器人似的,不成熟时就是巨量投入,投的早的赶不上开花结果就要赔钱离场。其实虚拟现实技术还需要些硬件算力升级,VR技术完善,AI的应用,人的兴趣习惯培养,应用的培育,应该也是未来的发展方向之一。

可是波士顿机器人还没成熟,就已经被倒卖十几手了

家园 元宇宙当然能成,但是扎克伯格做出来的元宇宙是这样式的

投资人:我与扎克阁下无冤无仇,阁下为什么要把我当煞笔

点看全图

点看全图

家园 技术还没达到零界点

先行一步是先驱,先行两步是先烈。

家园 技术能突破到,用人工指导,用AI建设完善虚拟世界

那到了爆发期,肯定比chatgpt火爆百倍

家园 设想一下,虚拟世界中,每个虚拟世界中的角色都是

一个CHATGPT技术为基础的NPC,每个NPC甚至各种生物野怪BOSS,都有自己的独特背景设定生活感情,可以很好的和真人互动,全世界的参与者互相无障碍沟通,几百种语言都可以实时翻译,没有语言障碍,这样的游戏有没有人愿意玩儿?这样的世界有没有人愿意参与和建设。

这个临界点估计快到了,5年可能都用不了

家园 肯尼亚数据标注“血汗工厂” ChatGPT光环照耀不到的隐秘

《科创板日报》2月11日讯(编辑 邱思雨) 能聊天、代写论文、作诗编程样样不在话下,ChatGPT发布不到一周便收获了百万用户。其锋芒从美国席卷到中国,但在地球另一边的非洲大陆上,一群为OpenAI工作的外包数据标注员,曾遭受过非人的精神折磨。

坐在电脑前、阅读一段文本、给出相应的标注、紧接着切换到下一段……这就是数据标注员的日常。在这场席卷中美两个市场的资本狂欢中,他们是边缘化的、被遗忘的却又至关重要的一个群体。

据美国《时代周刊》报道显示,为了训练ChatGPT,OpenAI雇佣了时薪不到2美元的外包肯尼亚劳工,他们所负责的工作就是数据标注。

数据标注的工作流程包括数据标注、打标签、分类、调整和处理等,是构建AI模型的数据准备和预处理工作中不可或缺的一环。对于ChatGPT这样的语言模型,如果没有人工标注来筛除一些不恰当的内容,那么它不仅会给出一些错误的信息,更会对用户造成心理不适。

更何况,类似ChatGPT这样的预训练模型在训练过程中需使用的数据样本较多,数据标注的需求较高。

那么如何规避上述问题,筛查出有害内容呢?OpenAI效仿了Facebook等社交媒体公司的做法——构建一个额外的AI模型,向它提供暴力、仇恨等带有攻击性的言论,从而让它学会识别相应内容。这样的模型会被内置到ChatGPT中,帮助后者过滤掉一些有害的文本。

在这个过程中,需要大量的人力来给攻击性言论做标注。于是,OpenAI在2021年底与一家外包公司Sama达成了合作。两者签署了三份总价值约20万美元的合同,OpenAI向Sama发送了数万个文本片段,包含大量的有关谋杀、自残、虐待甚至其他更加不堪的内容。Sama公司的每一个数据标注员的日常工作流程就是阅读文本并为其添加相应的标签。

“那是酷刑”

Sama是一家主营数据训练的公司,专注于为人工智能算法注释数据,客户包括沃尔玛、谷歌、通用汽车和微软等多个海外大厂。

Sama官网

据《纽约时报》早年报道和维基百科注释,Sama标榜自己为一家有道德的公司:“Sama的使命是在数字经济时代为低收入人群增加就业机会。”此外,公司声称已帮助超五万人摆脱了贫困。

而Sama数据标注员的真实工作情况如何?据《时代周刊》披露,根据资历和表现,Sama为OpenAI雇用的数据标注员的实际工资约为每小时1.32美元至2美元。有三位员工透露,在Sama,三十余名工人被分成三个小组,他们每九小时轮班阅读和标记150至250段文字,每段文字大约100词到1000词不等。

上述被采访员工均表示,这份工作给他们留下了“精神创伤”,虽然他们能够参加公司组织的团体心理辅导,但辅导并没有提供任何的帮助。此外,由于Sama对员工工作效率要求极高,所以公司很少组织心理辅导活动。有员工曾提出想与心理辅导员一对一进行咨询,但被Sama的管理层拒绝。

其中一位数据标注员坦言,在阅读了一些过于不堪的内容后,他反复出现幻觉。“那是酷刑。”他表示,“整个一周,你会反复的阅读这样的内容。等到周五,你会不停想象与它相关的场景。”

Sama的回应

低薪、高强度、创伤性的标注工作折磨着肯尼亚工人的身心。对于来自《时代周刊》等媒体的“控诉”,Sama回应外媒Quartz称,其支付给标注员的薪资几乎是东非其他内容审核公司的两倍,并给员工提供福利和养老金,并声称这样的待遇在东非并不常见。

据了解,肯尼亚并没有统一的最低薪资规定。但在内罗毕(肯尼亚首都),一个接待员的最低时薪是1.52美元,而Sama的数据标注员最低薪资仅为1.32美元。在Sama与OpenAI的合同中,OpenAI向Sama支付每小时12.5美元的工作费用,是Sama数据标注员最低薪资的9倍以上。

Sama的发言人还表示,在每九小时的轮班工作里,标注员只需要标记70段文字,而不是上文所述的150至250段文字。此外,数据标注员的税后时薪为1.46美元至3.74美元。合同中每小时12.5美元的工作费用覆盖了包括基础设施、质检、管理团队薪资等在内的所有成本。

针对员工遭受心理折磨的情况,Sama的发言人则声称,公司十分重视员工的心理健康。“我们为员工提供一对一的心理咨询。在审核、标注工作过程中,员工可以随时退出工作,且不会受到任何的惩罚。”该发言人补充道,“员工标注有害内容的时间是有限的,敏感信息会有专人处理。”

违法、解约和失业

2022年2月,OpenAI与Sama加深了合作,OpenAI要求Sama收集数千张暴力和黄色的图片,其中包括一些违法美国法律的内容。据《时代周刊》、《布鲁塞尔时报》等外媒报道,当月,Sama给OpenAI交付了一批1400张图像的样本,后者向前者支付了787.5美元。

但很快,两者的合作破裂。Sama在一份声明中表示,有关图像收集工作的原始合同并未包含违法内容,但工作开始后,OpenAI向其发送了一份附加说明,其中提及到一些涉嫌违法的内容。因此,Sama决定终止与OpenAI的合作。

在2022年2月下旬,陆陆续续有Sama的员工收到了转岗和裁员的通知。一位员工无奈的表示:“对我们来说,这是一份养家糊口的工作。而现在,仅有30多名工人被迫转到更低薪的岗位,其他人都面临失业。”

今年1月10日,Sama宣布取消所有涉及到敏感内容的工作,并表示不会与Facebook续签价值390万美元的内容审核合同。据了解,Facebook也曾被指控雇佣外包劳工来审核有害内容。

Sama表示,经团队多次讨论后,公司决定剥离自然语言处理和内容审核业务,专注于构建计算机视觉数据标注解决方案。

家园 一个小时挣够中国脱贫标准一天的钱,还要啥自行车?

中国脱贫标准就是一天消费两美元。肯尼亚人每天工作一个小时就脱贫了,还要啥自行车。他们难道比中国人高贵很多么?

通宝推:卡路里,
家园 所以说这是个能容纳廉价劳动力的巨大产业啊

不是整天担心产业转移之后中国的劳动力怎么安置么,这不产业来了么

连非洲黑叔叔都能做,这对于普通劳动力能有多大门槛

家园 够呛

机器学习的问题是学一次就够了。人类标注是加速优化过程,让系统更快的找到最优解。当它基本找到的时候,人类标注的意义就越来越小(因为机器的答案和人类越来越接近)。最后机器的答案可能比人类都准确了(人可以偷懒,搞错)。更加要命的是,当它学习完成之后,不用人类了。

就和当年谷歌围棋的原理一样。一开始学习人类棋谱,后来自己学自己。而一旦学完,直接就是巅峰。当年的alpha狗和今天的alpha狗没啥区别。人类没用了,除了跟着学。

够呛
家园 路要一步一步走,饭一口一口吃

既然现在标注有助于提升,那就搞,不要小搞,要大搞。不要妄想像其他什么人比如印度想走捷径,最后肯定是时间也没省下来,资源也浪费了白忙一场。

通宝推:桥上,
全看树展主题 · 分页 上页 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河