范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

AI催生这个新岗位!时薪最高30元!

  作 者丨江月
  编 辑丨陶力
  图 源丨视觉中国 人工智能产业发展催生了"新流水线工人",时薪介于10元至30元之间,它时髦的新名字叫"数据标注员"。
  人工智能大模型给人们带来强烈的智慧冲击,令人惊叹于它前沿的神经网络研究、精密的计算机设备和光鲜亮丽的精英人才结构。然而,这种智慧背后还有极致枯燥的工作。
  近期,南方财经全媒体记者留意到,全国多地数据标注招聘市场火热、相关创业模式也不断涌现。提升数据质量成为人工智能开发商"弯道超车"的一记策略,但为相关劳动者提升工作价值,也是长远发展中不容忽视的问题。
  数据标注市场需求大增
  "10元-30元/小时(与项目难度呈正相关,3D类>语音类>2D类>普通拉框转写类、打码类)。"4月13日,南方财经全媒体记者在招聘App"Boss直聘"上看到一则招聘广告中如是写道。在AI产业中,这类岗位令人联想起电子厂的"流水线"工作。
  2023年春天,市场的关注度被"大模型"吸走了一大半,但有一批公司正转移到"数据端"另辟蹊径,这是他们抓住这波AI浪潮的机遇。
  算力、算法、数据,是人工智能的"三驾马车"。一位从事计算视觉的程序员告诉南方财经全媒体记者:"对某些公司而言,算力、算法提优,远远没有数据提优的效益大。"
  眼下,算力和算法的赛道上,头部公司最为耀眼。无论是微软、谷歌、OpenAI,还是华为、阿里、百度,对大模型斥下的资金成本令其他公司望尘莫及,购买芯片动辄上千万元,高薪聘请(或"挖角")人才更不计代价。
  不过变革席卷全行业,"幕后英雄"也浮出水面。4月初在复旦大学举行的一场研讨会上,计算机科学技术学院教授、MOSS系统负责人邱锡鹏提到,OpenAI的成功不止来自大家津津乐道的模型、微软提供的昂贵算力,也得益于外包的专业数据清洗公司。
  美国某高校数据分析硕士专业毕业生李梦(化名)告诉南方财经全媒体记者,她目前正在一家生物医药公司实习,所做的工作正是优化数据标注程序。
  "大模型依赖数据训练,但要先做好数据采集、清洗、标注和质检。"李梦介绍。
  数据标注领域知名学术人物李飞飞,在2009年发布了ImageNet数据集的论文,激起一场算法竞赛。依托ImageNet海量得到标注的图片,算法公司展开了图像识别的竞赛,最低错误率者获胜。直到现在,很多人将ImageNet视为本轮人工智能浪潮的催化剂。
  如今,数据标注依然如此重要,且有更大需求量。人工智能在哪个行业施展拳脚,就需要哪个行业给模型大量"喂料",这不局限于城市安防、物联网、交通、生物制药。
  数据标注的"颗粒度"也在提升。4月5日,Meta人工智能实验室发表了有关Segment Anything这一计算视觉模型和数据集的论文。论文中提到,需要人工标记的图片高达12万张,平均每张图片有44个图层,每个图层的标注时间需要14秒。总体计算之下,人工标注的时间需要20533个小时。如果聘用一个百人团队每天工作9个小时,这需要23天。
  枯燥无味的流水线工作
  "如果数据量太大,一般公司会雇外包公司承担。"李梦向记者指出。外包公司将数据标注变成了算计件工分的一种工作。
  按照前述Boss直聘App上的广告,时薪价格依据工作内容不等。时薪能达到30元档的是指3D类工作,一般是对实际场景中的特定事物进行标注,例如对一条道路上的雷达车道线、雷达目标拉框。接着是语音类,是指对音转文、方言转写、唤醒助手等进行标注。
  2D类被认为更简单,是指对平面图像、文字段落进行标注,或者是OCR(文字识别)转写,例如对交通违规图片里的人和车、红绿灯、交通标示进行识别。
  价格最低的打码类,是指验证码里的计算题、哪些图片中含有火车这类工作。
  "数据标注十分枯燥无味,纯体力活,每标注200个就有一种想吐的感觉。"正在浙江某高校读研的小何对南方财经全媒体记者表示。
  以此谋生的数据标注师,工作强度可能更为难忍,除了需要耐心在电脑前面坐上几小时、耗尽眼力,可能还要面对原始数据里的限制级内容,涉及性、暴力、仇恨言论等。
  数据标注产业正在持续爆发。早在2021年,人社部就发布了《人工智能训练师》国家职业技能标准,覆盖数据标注员、人工智能算法测试员两个工种,反映当时相关产业已经成势。这份标准将人工智能训练师分为5个等级,从初级工到高级技师。
  数据标注看似"无脑",但却因实际落地需要而需要严谨的工作态度。比方说,如果对自动驾驶领域的标注缺乏质量把控,那么相关软件就无法令汽车安全地行驶在道路上。
  然而,围绕着数据标注员的低薪、长期伏案、内容重复和精神压力,社会舆论也正围绕着相关职业保护而发酵。如果无法改善数据标注师的工作环境、提升价值,这种职业的长久性仍令人存疑。
  市场前景看涨
  近期,南方财经全媒体记者从数个招聘渠道了解到,从北京、上海、广州到陕西榆林市清涧县、"大数据之城"贵阳市的惠水县百鸟河数字小镇,数据标注公司正在市场上急迫地发出招聘广告。与此对应的是,数据标识公司本身也被视为利益潜力大增的投资标的。
  记者发现,数据标识行业"个体户"正大量涌现。在百度贴吧上,大量项目正在召集所谓"团队"接标,从发帖内容可以看出,只要有一个相对固定人数、固定工作时长的团队,就可以接下大公司分发下来的项目标。有从业者介绍,刨去场地租赁、电脑和桌椅配置、每月水电费、人工开支,这种个体分包商赚取的是中间差价。
  不过,这个行业当然也正向着规模化、公司化的方向发展。行内有两种类型的公司,一种是大型互联网公司的内部部门、一种是外包公司。后者正成为资本市场上的"香饽饽"。
  2021年登陆科创板的海天瑞声,今年股价从1月初的60元水平一度暴涨至超过200元。该公司从事语音识别、语音合成、自然语言处理、计算机视觉等数据集技术开发。2022年,该公司收入达到2.63亿元,和2021年相比仅增长27.3%,净利润则微跌6.56%至2953万元。尽管如此,按照4月12日收盘价每股187元计算,该公司市值已经达到80亿元,动态市盈率为326倍。
  未上市的公司也获得了更多的资本青睐。2022年12月,星尘数据完成A轮融资5000万元,相距上一次2018年6月获得融资已经时隔4年半。这也反映,资本市场可能正重新关注这个新兴领域。
  "由于‘廉价劳动力’常常是数据标注公司的招牌,致使其无法获得足够的重视。"星尘数据在其官方一篇新闻稿中这样写道。该公司称,正通过自动化来提升标注效率。
  人工智能的飞轮滚动,数据还在海量增长。数据公司Exploding Topics的数据显示,2023年全球新增数据或将达到120ZB,2025年近一步达到181ZB。其中,美国、德国、英国、中国是排名前四的数据产生大国。
  不过,业内正在争议"以数据为中心的人工智能"是否将取代"以模型为中心的人工智能"。知名人工智能学者吴恩达(Andrew Ng)是前一论点的持有者,他曾多次强调,有标注的高质量数据才能释放人工智能的价值,如果业界将更多精力放在数据质量上,人工智能的发展会更快。
  基于原始数据增长而产生的数据标注,因此也仍继续扩大,并将市场需求而价值波动。华经产业研究院在近期的一份报告中预测,到2029年中国数据标注市场规模将达到204.3亿元。这和2019年的43.3亿元相比,增长了大约3.7倍。
  数据标注行业能否在未来去除"人力工厂"的标签,又将如何用自动化和技术手段提升数据策略、融入AI更高阶的发展浪潮中?人们拭目以待。
  SFC
  本期编辑 黎雨桐 实习生 余心雨 离开搜狗一年半后,王小川再创业:打造中国版OpenAI
  重磅发布!事关AI,国家网信办出手
  "令人不寒而栗",ChatGPT编造法学教授性骚扰丑闻
  阿里版GPT官宣开放测试体验!能写情书写菜谱

肚子里肠鸣,气体多,放屁多,怎么回事?屁的产生来自三个途径(1)吞咽食物时,空气随之进入消化道(2)肠道中食物经细菌发酵产生的气体(3)血液中的气体渗入到肠道内。人每天约有710升气体进入肠子,但大部分被肠壁的血管所吸女人生完孩子之后肚子的真实状态是怎样的?怀孕那些事儿孕期如何预防妊娠纹答主描绘的是妊辰纹,而我面对的是剖腹产后的刀疤。我怀孕的时候体重控制的很好,从98到115,涨了不到二十斤。之前做过不少功课,孕期一直控制饮食,少吃主掌握吃的方法辣椒也能养肠胃强体质!关键就在这几点辣椒,是中国人餐桌上一味重要的调味品,它带来的爽快刺激,让很多人都戒不掉。不过,随着人们对健康的重视程度不断提高,吃辣会致痘会伤胃等说法也逐渐流传开来实际上,辣椒也没大家想得那么差肿瘤患者饮食非常关键,发物和辣椒到底能不能吃?澄清几个常见的饮食误区来源浙江省肿瘤医院国科大肿瘤医院老话说,人是铁,饭是钢,一顿不吃饿得慌。肿瘤患者经常由于治疗或身体原因出现食欲不振,胃口不佳等现象。在治疗过程中常出现营养不良的症状,进而导致患者对又到吃花季!快来云南解锁春天的味道春到云南,赏花是一大幸事吃花同样也必不可少对于爱吃花善吃花的云南人来说没有一朵花能逃过云南人的舌尖阳光明媚的一天记者带着这股花吃的热情踏进农贸市场,不必左顾右盼鼻尖已漾起花与春日的苍兰诀还没开播,热度已破19亿,虞书欣又选对剧本了3月过后的影视剧市场,不出意外的话就是各大平台古偶战场。在古言剧中目前最吃香的就是仙侠玄幻了,自从仙剑系列走红之后,基本上每一年都会出现一部大火级别之上的仙侠剧。去年是千古玦尘,前忍了大半年,为何不公开跟魏大勋的关系?网友杨幂有苦说不出文娱圈里边每天都邑产生许多故意思的小段子和小八卦,一路走遍天下每天带你明白不同样的文娱八卦海洋,共享出故意思的文娱圈八卦段子,给朋友们带来少许小充分!现在的杨幂跟刘恺威也是分手良久夏雪宜为什么不爱何红药,原因金庸早就告诉你了大家好,我是花小慕,一个喜欢扒拉七八十年代经典影视剧的女编辑。上一期,我们怀着满腔的意难平去回顾了雪花神剑里开创师徒恋先河的玄凤恋,总算为小凤那种入了肺腑的遗憾找回了一点点圆满。不36氪首发原暴风TV联合创始人布局宠物用品赛道,uah有哈获峰瑞资本领投的数千万人民币PreA轮融资文姚兰36氪独家获悉,新锐宠物产品和服务品牌uah有哈宣布完成数千万人民币PreA轮融资,由峰瑞资本领投,天使轮投资方智行资本跟投。uah有哈创立于2019年,总部位于深圳,主张和GitHub上的优质开源游戏项目,每个都很厉害开源精选是我们分享GithubGitee等开源社区中优质项目的栏目,包括技术学习实用与各种有趣的内容。本期推荐的是几个优质的开源游戏项目。古代野兽AncientBeastAncie苹果手机享受最高价?美团外卖疑似大数据杀熟四川新闻网成都频道3月12日讯大数据杀熟已经成为困扰消费者的顽疾。近日,北京市消费者协会调查报告显示,86。91的受访者有过被大数据杀熟的经历。社交媒体上关于外卖平台疑似杀熟的投诉
社会上的规则1向别人证明自己是好人,等于自动放下武器,任人宰割。2男人好色,女人爱美,老人怕死,小孩爱聪明,穷人想暴富,富人想长生。3当有人突然从你的生命中消失,不用问为什么,只是ta到了该走未来五年,为了一家老小安稳活下去,要有这9个准备了头条创作挑战赛人类终其一生最恐惧的,莫过于对于未来的不确定性。以往之事儿已然发生,没有人会想太多当下之事儿依旧在继续,人们唯有做好本分唯有未来之事儿特别难测,让人心生恐惧。有句话是大鱼大肉吃太多?提醒备好5样解腻零食,清爽舒适过大年旧年钟声入新年,爆竹阵阵岁经添。喜庆的春节又来到,每个人的脸上都洋溢着过年的喜悦,和众多亲朋好友们欢聚一堂,推杯换盏之间诉说着过去一年的生活琐事,一片其乐融融的景象,也正是和谐美满潜伏,中西方恐怖精神的集大成之作东方与西方的恐怖片,秉持的是不同的恐怖美学。对于这两种截然不同的风格,评价自然是见仁见智。笔者认为,评价恐怖片的首要标准应是能否吓到人,其次才是影片中的隐喻,内涵,美术风格等等。因绚烂烟花送祝福这是1月22日拍摄的2023年南昌市迎春烟花晚会。1月22日大年初一晚,2023年南昌市迎春烟花晚会在江西省南昌市赣江老官洲上演。绚烂缤纷的烟花在夜空中争奇斗艳,为市民及游客送上新烟花爆竹禁令会全面放开吗?当此更吁注意燃放安全!随着一些地方禁烟花爆竹令的解除,还有未解除禁令的地方也呈放松之势,据说生产烟花爆竹的大省湖南在经历了几年的滞销后,今年突然脱销。中国人民在实现全面小康物质文明得到极大丰富之后,心中意外!梅西疑似拒绝续约,七大理由出炉,C罗怒喷经纪人对话曝光目前,梅西拒绝续约巴黎的消息满天飞,如果真的愿意续约,双方早就能官宣了。尽早完成梅西的续约绝对有利于更衣室稳定以及冲刺冠军。不过,网络上也有人罗列了梅西拒绝续约大巴黎的七个理由。第澳网第10日德约科维奇卢布列夫上演焦点战20岁新秀谢尔顿冲四强北京时间1月14日消息,2023赛季澳大利亚网球公开赛周三将进入到第10比赛日的争夺,男女单打下半区14决赛开打。德约科维奇与卢布列夫的焦点战于夜场上演。罗德拉沃尔球场卡普利斯科娃意甲十人国米不敌恩波利新华社罗马1月23日电(黎梦青)意大利足球甲级联赛第19轮23日继续进行,十人国米主场01不敌恩波利。1月23日,国际米兰队球员巴雷拉(右)与恩波利队球员阿克普罗(中)埃布埃希在比记者国米希望引进米伦科维奇替代什克里尼亚尔直播吧1月24日讯据记者IlarioDiGiovamb透露,国米希望引进米伦科维奇替代什克里尼亚尔。什克里尼亚尔与国米的合同将在今年6月到期,IlarioDiGiovamb指出,这花语你的怒放我的感伤云衡微语人生最美是清欢人心是看不到的你走两步就知道花语你是听不到的你仔细观赏就能发现我不一定等你给我的时间我会有重新的认识01以清净心看世界生命的过往有其太多的无常我们不一定左右突