范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

我在大厂训练AI用鼠标拉框,一次赚3分钱

  完全就是民工了,这不是调侃。
  作者 | 刘鑫
  编辑 | 园长
  刺猬公社(ID:ciweigongshe)和何信通话的时候,他正在做数据标注的工作。
  电脑屏上的图片里,三三两两的人在操场上,或是在跳绳,或是在围观。何信要做的是用鼠标将正在跳绳的人框出来。"说出来你可能都不相信,就是画这一个框。"何信解释道,"好比你现在打开电脑,然后摁住鼠标右键拉一下,在桌面上就是一个框就是3分钱。"
  何信在做数据标注工作,何信供图
  何信做数据标注的工作有一年多,他自己成立了一个创业小团队,团队里有十几个人。他们的项目涉及百度、网易、阿里等互联网大厂,他也做细致的"打点"工作,类似一个鞋的边框打点一周,二十几个点,挣一到两角钱。
  "阿里众包、京东微工、百度众测、有道众包……"市面上这样的产品有很多,利用碎片化时间获得收入、操作简单无门槛是它们最主要的卖点。这类互联网大厂推出兼职平台,主要以众包的形式给用户分配任务,用户通过完成任务来获得报酬。但相较这些大厂的知名产品而言,兼职平台们的下载量并不高。
  刺猬公社查询产品下载量统计平台七麦数据后发现,AppStore中阿里众包、腾讯搜活帮、京东微工、百度众包等四款产品,近30日日均下载量未超过2000。
  图源:七麦数据 查询时间:2021年4月27日
  从产品数据上看,互联网大厂的兼职App只能说不温不火。在灵活用工、兼职经济高度发展的当下,这类兼职App为什么没做起来?都是谁在做这份工作?
  收益太少,羊毛难薅
  互联网大厂出品的兼职APP中,运作流程是:平台发布任务,用户领取任务验收后获得收益。综合各平台来看,主要有数据标注、数据采集、数据转写工作。细分到具体领域,又分为文本、图片、语音、视频等部分的信息处理。任务的价格一般在0.1元到几十元不等。
  在腾讯搜活帮里,李元接了十几单任务,赚了不到两块钱。
  放弃倒不是因为钱少,而是因为这份工作过于机械化,重复性劳动让李元很不适应。他大学读的是电子信息工程专业,毕业后工作也比较清闲。出于赚钱和打发时间的目的,李元下载了这款众包类型的软件。
  众包,通俗来讲,就是从大众那里寻找资源。它本意是指一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众志愿者的做法。
  以京东微工的数据标注为例,在最新一期的任务里要求对文本进行情感判断,根据自己的认知选择文本是正向、中性还是负面。该结算两分一条,以10条为结算单位,要求正确率100%。
  图源:京东微工
  数据采集一般为音频、图片、视频方面的采集,周舟热衷于做数字采集方面的工作,2019年高中毕业后,他开始尝试这方面的兼职工作。两年的时间,他陆陆续续赚了3000多。"我也没有天天去看,阿里众包在年终、年初、年底的任务很多。"
  在每个任务里,都有明确的要求,周舟认为这样很明确,可以很快地分辨哪些好做哪些不好做。
  图源:阿里众包
  相比于数据标注、采集方面的工作,数据转写的门槛稍微高些。所谓的数据转写,主要是各种语言转译工作,比如,在有道众包的少儿英语段音频转写里,要求口误重复、语法错误等如实转写,这对于答题者的英语水平要求不低。
  图源:有道众包
  为了确保用户所提交产品的质量,除了在提交内容上有所要求,在用户提交前也有所培训。在腾讯搜活帮里需要首先进行考试,考试通过后方能进行答题。周舟曾经做过这类型的考题,做完20道题,正确11道,他得出了结论——裸考必挂。
  李元参加这种考试,也没有一次就过的情况,"这种题目需要耐心和比较细腻的语感,而我是那种粗枝大叶的人,而且多次失败之后带来的挫败感太糟糕了。"
  图源:腾讯搜活帮
  等平台发任务——做任务——等平台审核是这类众包软件使用的常规流程,而在这些流程里有任何一个环节脱节,都会带来不好的用户体验。
  下载软件发现无任务可做,做任务时发现门槛过高,任务完成发现审核太久,审核后发现正确率不合格……在这条任务链里,用户会遭遇各样的问题,有网友在五个任务都审核失败后发文称"费力不讨好。"
  部分平台审核不合格后,价格会打折扣。但还是有人赚到钱了,在有道众包的3月酬劳排行榜上,第一名酬劳1945.99元。周舟对于自己两年多攒的3000多元表示满意,"因为目前还是在校生,没有工作。"
  "一小时10元吧。"何信评估了一下做众包工作的平均报酬。
  用户下沉,也在内卷
  兼职众包的平台用户,有一种团队化的趋势。
  就目前市面上的众包产品来看,任务很多是不定期推送的,新用户注册后平台上有可能面临无任务可领的情况,而相较于加公会做团队而言,普通用户赚的钱是很少的。
  而这份工作的主力,互联网巨头们可能也并没有瞄准客户端的普通用户。据何信了解,向他这样做团队接项目的同行有不少,在平台活跃着的也有很大部分是像他们这样的团队。
  相比于单独个人当兼职做,团队化容易的多。价格在近些年也有了不小的变化,以前价格很贵,现在的价格越来越低,由此带来用户的不断往下沉淀。何信表示用户下沉是要找便宜的劳动力。
  2016左右,那时候做数据标注的人还不是很多,何信说那时候价格是目前两到三倍,画一个框大概七八分钱。
  "以前做的人少就挣钱,现在做的人多了就不值钱了,就这个意思。"兼职众包的用户们,也在不可避免地遭遇内卷。
  在何信团队里,一个成熟的员工一小时能画600个框,按照一个框3分的标准,能赚18元。"但是这个价格是我完全不赚钱。"何信说。而3分的价格在面向用户的平台里很少出现,在用户平台端三分的价格算是很高的。何信找的熟人介绍做项目,一般接一个项目几千上万的量,然后做上一个月。
  这个行业流动性很大,重复性劳动和越来越低的价格让很多人止步于此。何信的团队不算大,上个月还是五六个人。来的员工一般都是学生,兼职在做这份工作。五六个兼职的同学才能留下一个,何信对自己团队流动习以为常。
  "一开始不熟悉业务,做不了那么快,几乎就赚不了什么钱,完全看自己做的数量。"何信解释团队流动大的原因。
  除了数据标注,何信的团队也做过涉及语音转义、数据采集等方面的工作,两三岁孩童的语音、粤语、陕西话的转义他们都做过。语音转义一般来说三分钟能给到七块左右,数据采集工作相对来说赚的更多,但过于费时费力,这块业务也慢慢搁下了。
  "车道线、车、人脸,人体……"何信做的数据标注类目有很多,但都是二维的。数据标注的同行们有的在做三维标注,这样的工作日薪能达300元左右。
  图源:百度众测
  但这样的薪资并不是普遍化的,简单重复性的二维图片数据标注工作薪资并没那么可观。
  小作坊的出现,是数据标注团队的一个大趋势。何信对于这份工作的人有大概的画像。在城乡结合部,或者乡村小作坊,有那么一批人,二三十岁,学历不是很高,就在县城做这样的工作。而很多人也有投资这种数据小作坊的打算。
  "我就形容它是网络时代的那种手工作坊。"何信对这种城乡结合部的小作坊下了一个定义。
  "网络时代的民工?"
  "完全就是民工了,这不是调侃。"
  互联网大厂,为什么需要人兼职训练AI
  "训练AI啊。"
  何信很明确的知道自己所做的工作,电子信息工程专业的李元也知道这份工作的意义,"平台给你提供的题目相当于是一个训练的样本。所有你做的题目就是AI的训练集,它会通过人类的这种思维判断去训练AI。"
  "能知道的只有他(平台)告诉我的。具体数据去哪了,用于什么了,没有去深究。"周舟只知道平台告知的信息,在阿里众包的一个任务中显示,您接受的任务中涉及对个人信息的收集,任务发布者承诺在此任务中收集到的个人信息将会用于"算法训练——牙齿病种识别"的目的,并仅限于任务发布者使用,并不向任何第三方转让、共享以及披露,匿名化或去标识化的除外。
  图源:阿里众包
  "我们要教机器认识一个苹果,你直接给它一张苹果的图片,它是完全不知道这是个什么东西的,需要现有苹果的图片,上面标注着"苹果"两个字,然后机器通过学习了大量的这类图片,才能认识苹果,其中将图片表示为"苹果"的工作就是数据标注。"
  腾讯搜活帮用上述例子,说明了数据标注的意义。数据标注员的工作就是在教机器学习。
  人工智能包含着机器学习,而监督学习是机器学习的一种训练方式,通俗来讲,是要给机器一种标准答案来不断进行训练,以此来达到人类一些识别认知的能力,这也是深度学习的一个目标。深度学习的成功所依赖的既不是算法,也不是计算能力,而是训练和验证数据的可用性,这些数据最终是通过人的参与获得的。
  这是一个非常重复性的劳动,因为机器学习需要大量的样本,大量的样本是由无数重复性劳动所造就的。
  而这种重复性劳动在很早之前就有了。2003年,一款"ESP游戏"就用了这种劳动,它的目的是通过互联网上人们的自由参与来获得描述图像的标签。在一个游戏中,两个玩家在屏幕上看到相同的图像,并被提示输入描述该图像的关键字。他们看不到对方正在键入什么,但如果两人输入相同的关键字足够快("匹配"),他们就会得到分数。实际上,这些关键字可以用作图像的精确标签。"ESP游戏"后来被谷歌收购,被称为谷歌图像标签。
  不止人工的重复性劳动,验证码也是训练机器的一种方式。验证码本身是在人机交互中构建,以验证用户实际上是"人工用户"的工具。reCAPTCHA公司扩展了这一原则,将人类用户的反应重新用作工业深度学习项目的培训数据。为此,用户需要解决一个小任务,如图像识别或文本识别,这对人类来说是一个低的障碍,但对计算机机器人来说是一个高的障碍。而reCAPTCHA也被谷歌收购了。
  科技自媒体"品玩"曾报道过类似的现象,验证码越来越有内容,比如标注门牌路牌,让用户帮分类数据库等。"品玩"也指出在 reCAPTCHA 官网上,Google 公开说明了 reCAPTCHA 集众人之力标注数据,训练 AI 的"众包"模式。
  网络中识别图片的验证码
  捕获人类的认知的方式已经不再局限于众包中的重复性劳动,将人类的认知嵌入到计算机网络中,让人和机器的关系更加密切,而这种隐性的认知捕获在互联网的各个角落都在发生着。
  在重复性劳动不断减少的当下,何信准备谋求新的出路。他的同行朋友们已经开始在做简单的数据AI,让简单型的数据标注工作交给机器来操作。
  用机器做出来的训练集来训练机器,是一个有意思的事情。
  在城乡结合部,一批二三十岁的人正在批量生产着AI训练集,重复是他们工作的常态。也正是因为如此,工作枯燥、报酬微薄,充斥着"训练AI"任务的众包兼职平台相当乏味,劝退了不少被兼职平台大厂背景所吸引的用户。
  而随着AI和机器的不断自我训练和进化,AI训练AI就在不远的未来,这类平台的未来可能性将会更小。
  备注:以上何信、李元、周舟均为化名
  参考资料:
  《Human-aided artificial intelligence: Or, how to run large computations in human brains? Toward a media sociology of machine learning》,Rainer Mühlhoff

好莱坞媒体高调报道中国解约事件,刘亦菲周冬雨成为众矢之的前不久BCI协会宣布禁用新疆棉,理由滑稽可笑,他们怀疑新疆棉花的高产跟西方大多数国家攫取第一桶金一样,都是靠压榨剥削劳动力得来的。决议通过后HM阿迪耐克等知名企业高调跟进,上演了一走到哪里都高唱中国人,这位59岁老戏骨把同行丢的脸捡了回来最近半年有位老戏骨商演的视频在网上爆火,每次打开某软件都能刷到他,点赞量动辄破万,播放量更是惊人。这位老戏骨就是59岁的吴毅将,还有5天就是他60大寿。吴毅将这个人不简单,娱乐圈起弃子事件一百八十度大转变!公开道歉之后,反被网友咬死在广电的封杀下,郑爽从当红顶流跌到人人避之唯恐不及,弃子门事件发酵多时现已进入冷却阶段。1月23日,郑爽称自己一直在争取孩子的单独抚养权,于2020年8月就已在美国法庭起诉张恒,而金城武和吴奇隆杨采妮舒淇的多角情事一1988年,香港商台举办十大靓人评选,32岁的张国荣高居榜首。在台湾有综艺之母之称的葛福鸿,则望着另一位美男子,有了冲动的想法。这位美男子,正是15岁的金城武。但在当时,他还很自两弹元勋邓稼先为造原子弹隐姓埋名28年,奖金让人震撼一1937年,日寇占领北京,13岁的邓稼先忍受不了这种屈辱,更看不惯侵略者的胡作非为,当众把一面日本国旗撕碎,扔在地上,狠狠踩了好几脚。3年后,局势更加紧张。邓稼先的父亲邓以蛰,是86年写书2000万字,被请任文化部长,王蒙豪言请不要考虑我!我愿意拼尽耄耋加饕餮之力,再当好中国文学生产一线的劳动力!说这句话的人,是一位86岁的老人,他从19岁开始写作,写了足足67年。三百多部作品,近2000万字,从提笔之日起,他的作品退出头条的余秀华继续写黄诗,声称我就是荡妇!竟花15万离婚近日,诗人余秀华要离开头条的消息引来一众关注。有网友猜测她离开的原因是喷子太多,而余秀华本人给出的理由却是情伤难愈,还说这是被羞辱的一年。被贴上脑瘫诗人,农村诗人标签的余秀华,却比从养鸡变赚455万,只因白鹿原付稿费时,陈忠实说了一句傻话在白鹿原里,风情万种又风流不断的田小娥,先后与四个男人有染。而她临死一幕更是让人震惊当她右腿搭上炕边儿,左腿跷起,背对鹿三时,一把尖刀刺穿了她的胸肋。田小娥猛然回头,喊了一声啊大呀3个名校毕业生口述实录我的真实支教生活,比你想得燃多了你在20多岁的时候,做过最一往无前的一件事是什么?有一群人的答案是去支教!相信很多人都曾有过一个支教梦。想趁年轻,去挑战自我,体验人生,去做一件热血又纯粹的事,去做心中认定有价值的9岁嫁作童养媳,95岁孤苦离世,她用72年守望丈夫的一句等着我如果有人说我死了,千万不要轻信谣言,记住,等着我!临别前,丈夫在池煜华耳畔留下一句叮嘱,转身而去。而她,为这约定苦等72年。26342个日夜,她始终倚门而盼,望向村口那条弯弯的小道盖茨曾遭遇两次婚恋危机?一年花40亿,他背后的女人有多牛很多人都知道比尔盖茨是世界首富,却不知道他的成功背后还有一位不得不提的女性。被时代周刊评为年度风云人物,福布斯把她列为全球最有权力的女性之一,华尔街日报评选她为商界女性50强第一名
鲁维的传奇人生给总统当女婿,娶过亿万女富豪,结婚4次后暴富身高1米72,国字脸,不管从哪个方面来看,波菲里奥鲁维罗萨都是个再普通不过的男人。可就是这样一个男人,却结婚五次。这其中,有总统的女儿,有世界级的超级女富豪,还有知名女演员。甚至于布丽吉特真机智和丈夫分居11年才离婚,这时马克龙已经事业有成到现在为止,布丽吉特都是最被人唱衰的第一夫人。前几天,马克龙在外视察的时候,突然被一个长发人士当众打了一巴掌。这要是放在其他总统身上,大家第一时间怀疑的就是有人搞事情。可搁在马克龙离婚4个月,赵丽颖见冯绍峰疑复婚,网友真的比吴某还渣!赵丽颖和冯绍峰要复婚了?前几天,赵丽颖被拍到乘坐冯绍峰的车,到冯家秘密约见,疑似藕断丝连。时隔4个月,赵丽颖冯绍峰的离婚真相,终于瞒不住了!1hr赵丽颖冯绍峰离婚,早有预兆。冯绍峰霍尊事件又有新料了,可能大反转?知名作家实名举报陈露霍尊事件又有新料了。之前看过我们文章的都知道,有一个叫陈露的女生,表示和另一位叫霍尊的歌手谈了九年恋爱最后无疾而终。不仅如此,霍尊出去吃饭买衣服还都花陈露的钱,光生日一个手表就送了突然官宣怀孕,首次曝光全家福,拒嫁豪门她才是人生赢家东京奥运会圆满结束!中国拿下金牌38枚,创造历史!中国跳水梦之队,更是出场即巅峰,实力碾压,七金五银!真可谓江山代有人才出,一代更比一代强。说起中国跳水队,我们永远忘不了的还有郭晶诗琳通放弃王储之位,奉献42年不结婚,却成全了哥哥的风流人生说起各国王室里特立独行的公主,诗琳通绝对榜上有名。从外形来看,这位公主貌似是村子里毫不打扮自己的农家老太太从内里来说,她博才多学,不但是泰国的高材生,就算是对汉文化也很有研究。而更左小青的离婚宣言,背后承载了什么?多少夫妻都存在的2个重要点左小青的离婚宣言,背后承载了什么?多少夫妻都存在的2个重要点序言婚姻是什么?或许没有人能够给予真正意义上的诠释!但我们可以理解为婚姻必须是切实平淡,且细水长流的!因为平淡才能长久,接连崩盘的流量明星为何能红?谁赋予了起飞的翅膀,存在有何价值从郑爽到吴亦凡,再到霍尊张哲瀚的接连翻车事件,让我们看到了娱乐圈的一个真相?那就只要和明星有瓜葛的人去爆料,这些所谓的明星,不是入狱就是被封杀,这也间接证明了娱乐圈的明星,是经不起谢霆锋觉醒后的霸气回归会让多少后辈流量明星羞愧难当?电影怒火重案精彩吗?精彩,火了吗?非常火!有人说如果再没这种疯批美人,娱乐圈真要完蛋了!有人说怒火重案已经达到了昔日港片巅峰期的水准。有人说像谢霆锋这样的实力派演员,就不应该待在厨太难过!速9泰瑞斯吉布森坦言,没有保罗沃克是多么的艰难速度与激情9自从上映后,就狂澜着票房。对于范迪塞尔和泰瑞斯吉布森来说,这简直是值得高兴的事情。这两位男演员,感谢世界各地影迷的支持。比起之前的几部电影,速度与激情9提高了风险的赌注被低估的李沁?阻止她爆红的不是演技,而是放纵后的贪婪近日李沁,以一句恋爱中不安的本质,是在意,被推向热搜。随后引起广泛讨论,事后,出自李沁的这句恋爱名言,被定义为金句!都说,李沁的这句金句,将恋爱的相处模式,解读得十分通透。当然,真