童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

吴恩达ChatGPT课爆火:AI放弃了倒写单词,但理解了整个

4月28日 月依兮投稿
  没想到时至今日,ChatGPT竟还会犯低级错误?
  吴恩达大神最新开课就指出来了:
  比如让它反转下lollipop这个词,输出是pilollol,完全混乱。
  哦豁,这确实有点大跌眼镜啊。
  以至于听课网友在Reddit上发帖后,立马引来大量围观,帖子热度火速冲到6k。
  而且这不是偶然bug,网友们发现ChatGPT确实无法完成这个任务,我们亲测结果也同样如此。
  实测ChatGPT(GPT3。5)
  甚至包括Bard、Bing、文心一言在内等一众产品都不行。
  实测Bard
  实测文心一言
  还有人紧跟着吐槽,ChatGPT在处理这些简单的单词任务就是很糟糕。
  比如玩此前曾爆火的文字游戏Wordle简直就是一场灾难,从来没有做对过。
  诶?这到底是为啥?
  关键在于token
  之所以有这样的现象,关键在于token。token是文本中最常见的字符序列,而大模型都是用token来处理文本。
  它可以是整个单词,也可以是单词一个片段。大模型了解这些token之间的统计关系,并且擅长生成下一个token。
  因此在处理单词反转这个小任务时,它可能只是将每个token翻转过来,而不是字母。
  这点放在中文语境下体现就更为明显:一个词是一个token,也可能是一个字是一个token。
  针对开头的例子,有人尝试理解了下ChatGPT的推理过程。
  为了更直观的了解,OpenAI甚至还出了个GPT3的Tokenizer。
  比如像lollipop这个词,GPT3会将其理解成I、oll、ipop这三个部分。
  根据经验总结,也就诞生出这样一些不成文法则。
  1个token4个英文字符四分之三个词;
  100个token75个单词;
  12句话30个
  一段话100个token,1500个单词2048个
  单词如何划分还取决于语言。此前有人统计过,中文要用的token数是英文数量的1。2到2。7倍。
  tokentochar(token到单词)比例越高,处理成本也就越高。因此处理中文tokenize要比英文更贵。
  可以这样理解,token是大模型认识理解人类现实世界的方式。它非常简单,还能大大降低内存和时间复杂度。
  但将单词token化存在一个问题,就会使模型很难学习到有意义的输入表示,最直观的表示就是不能理解单词的含义。
  当时Transformers有做过相应优化,比如一个复杂、不常见的单词分为一个有意义的token和一个独立token。
  就像annoyingly就被分成“annoying”和“ly”,前者保留了其语义,后者则是频繁出现。
  这也成就了如今ChatGPT及其他大模型产品的惊艳效果,能很好地理解人类的语言。
  至于无法处理单词反转这样一个小任务,自然也有解决之道。
  最简单直接的,就是你先自己把单词给分开喽
  或者也可以让ChatGPT一步一步来,先tokenize每个字母。
  又或者让它写一个反转字母的程序,然后程序的结果对了。(狗头)
  不过也可以使用GPT4,实测没有这样的问题。
  实测GPT4
  总之,token就是AI理解自然语言的基石。
  而作为AI理解人类自然语言的桥梁,token的重要性也越来越明显。
  它已经成为AI模型性能优劣的关键决定因素,还是大模型的计费标准。
  甚至有了token文学
  正如前文所言,token能方便模型捕捉到更细粒度的语义信息,如词义、词序、语法结构等。其顺序、位置在序列建模任务(如语言建模、机器翻译、文本生成等)中至关重要。
  模型只有在准确了解每个token在序列中的位置和上下文情况,才能更好正确预测内容,给出合理输出。
  因此,token的质量、数量对模型效果有直接影响。
  今年开始,越来越多大模型发布时,都会着重强调token数量,比如谷歌PaLM2曝光细节中提到,它训练用到了3。6万亿个token。
  以及很多行业内大佬也纷纷表示,token真的很关键!
  今年从特斯拉跳槽到OpenAI的AI科学家安德烈卡帕斯(AndrejKarpathy)就曾在演讲中表示:
  而且他强调,模型的性能并不只由参数规模来决定。
  比如LLaMA的参数规模远小于GPT3(65Bvs175B),但由于它用更多token进行训练(1。4Tvs300B),所以LLaMA更强大。
  而凭借着对模型性能的直接影响,token还是AI模型的计费标准。
  以OpenAI的定价标准为例,他们以1K个token为单位进行计费,不同模型、不同类型的token价格不同。
  总之,踏进AI大模型领域的大门后,就会发现token是绕不开的知识点。
  嗯,甚至衍生出了token文学
  不过值得一提的是,token在中文世界里到底该翻译成啥,现在还没有完全定下来。
  直译“令牌”总是有点怪怪的。
  GPT4觉得叫“词元”或“标记”比较好,你觉得呢?
  参考链接:
  〔1〕https:www。reddit。comrChatGPTcomments13xxehxchatgptisunabletoreversewords
  〔2〕https:help。openai。comenarticles4936856whataretokensandhowtocountthem
  〔3〕https:openai。compricing
  (举报)
投诉 评论 转载

微信小游戏出现新爆款,居然出自一家棋牌大厂?途游游戏可能度过了10年以来最好的一年。每次在iOS畅销榜上留意新品的时候,总会不自觉地忽略棋牌和捕鱼类游戏。它们总归不那么游戏,不太具备参考价值。然而不可置否的是……孩子王KidsGPT智能顾问已通过APP、小程序等上线站长之家(ChinaZ。com)6月6日消息:孩子王表示,KidsGPT智能顾问已在六一童玩节期间通过孩子王APP、小程序、企微社群等上线应用。未来公司继续加大AI投入,积极探……2023年如何在快手做内容、做变现?我总结了7种最成功的MC随着内容行业逐渐成熟,创作者的竞争正逐渐演变为幕后MCN机构的竞争。MCN机构往往能极大程度影响创作者的成长速度和变现天花板。那么,最厉害的MCN机构都长什么样子呢?近日……黄老师被嘲,鸭头小哥带不动货:被流量击中的普通人能走多远当普通人意外爆火、一夜之间站上流量巅峰,后续道路将何去何从?近期,因长相帅气在淄博烧烤大潮中意外爆红的鸭头小哥正式开启了自己的直播带货事业。截至发稿前,账号淄博鸭头小哥已……庄俊:ChatGPT小红书电商卖货,日赚2000方法论2。0前言5月11日我写了一篇《ChatGPT小红书爆文,1天量产100篇笔记》(点击文字即可跳转),继上次写到关于ChatGPT如何批量产出笔记,我们今天继续2。0版本。……知乎合伙人李大海出任面壁智能CEO加速大模型研发站长之家(ChinaZ。com)6月2日消息:近日,知乎宣布合伙人、CTO李大海出任面壁智能的CEO,继续担任知乎的执行董事和CTO。知乎和面壁智能将在多个层面展开合作,成为新……腾讯广告全流量通投支持投放视频号竞价广告站长之家(ChinaZ。com)6月2日消息:微信广告助手宣布,为了帮助广告主轻松实现单条广告投放到腾讯全生态,降低广告投放的人力投入、操作复杂度和管理难度,提高起量效率,腾讯……在抖音只卖桶装面,销量100万单!各位村民好,我是村长。一个只卖桶装面食的账号,拍了960多个视频,涨粉80万、销量100万。今天和大家分享的这个账号很有意思,对于大家做抖音带货账号特别有启发。……为求效率最大化:AI测试中将矛头指向人类操作者快科技6月2日消息,自从ChatGPT爆火以来,大众对于AI攻击人类”的阴谋论就不曾停止,近日的一项模拟测试,在一定程度上更是加剧了人们对此的担忧。据外媒报道,在USAF……刘畊宏20秒短视频要价60万:抖音有6800万粉丝值吗?快科技6月3日消息,随着近日618大促开始,很多电商平台和商家都在努力推广,而明星、网红带货就是其中一种。比如大型的有京东直播与交个朋友、罗永浩的合作,罗永浩在首次京东直……“多巴胺穿搭”火爆全网,捧出又一个“涨粉黑马”“多巴胺穿搭”刷屏全网今夏第一股热浪来袭,而比气温飙升更快的,是爆火出圈的“多巴胺穿搭”。高亮的配色、夸张的配饰,加上各种撞色搭配,迎面而来就像是刮起了一股五颜六色……吴恩达ChatGPT课爆火:AI放弃了倒写单词,但理解了整个没想到时至今日,ChatGPT竟还会犯低级错误?吴恩达大神最新开课就指出来了:比如让它反转下lollipop这个词,输出是pilollol,完全混乱。哦豁,这……
微信视频号人人皆可创作的平台6条规律,总结社交产品特性究竟是什么在影响人的新闻消费习惯?探索过滤气泡背后的真相支付宝转型“数字生活开放平台”,这个战略靠谱吗?ToB企业如何搭建“线上直播体系”进行获客?产业路由器X:重构万亿产业共同体(二)2020春季全民战“疫”推动“宅经济”崛起认知偏见的终极列表:人类为何乱做决策产业路由器X:重构万亿产业共同体(一)产品经理周报第103期淘宝推出营销导购平台产品“淘花”;滴滴2020美妆行业发展趋势洞察养猪、遛狗、养鸡能赚钱,骗了谁?女性冬季关节炎频发牢记护膝大攻略新年拼职场跟岁总裁助理实习生学几招历史南唐为何没有统一中国苗邦千毒草草本乳膏的用法用量天山毒草草本乳膏我爱这四季幸福随想来北京实习四个月,患上了抑郁症,是否该放弃转正的机会离开这里新萌芽职业折射产业跃迁装配式建筑施工员像搭积木一样造楼房王者荣耀全新两款限定的皮肤。贵族玩家赚了怎么把视频或者文件上传到百度云盘里面消费者为什么不爱买新能源二手车烹饪小技巧帮你轻松补钙

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界