首页 网友热议 ChatGPT文风 原产地肯尼亚

ChatGPT文风 原产地肯尼亚

ChatGPT文风奇怪的原因(俗称AI味儿很浓)找到了! 肯尼亚作家:都是跟我们学的。 就在最近,一位肯尼亚作家的“控诉贴”登上Hacker News热榜—— 我是肯尼亚人。不是我…

ChatGPT文风奇怪的原因(俗称AI味儿很浓)找到了!

肯尼亚作家:都是跟我们学的。

就在最近,一位肯尼亚作家的“控诉贴”登上Hacker News热榜——

我是肯尼亚人。不是我的写作风格和ChatGPT一样,而是ChatGPT写作风格和我一样。

ChatGPT文风 原产地肯尼亚

一点进去才知道,原来这位朋友连续精心撰写的好几篇文章都被退稿了,而且理由还都是“太像ChatGPT”。

ChatGPT文风 原产地肯尼亚

emmm……一想到自己从小接受的教育都是“文章必须像一座完美的大厦”、“你必须展现丰富的词汇量”,而现在却被误认为出自AI,这位朋友实在忍不住发出怒吼:

对于那些热衷于侦查数字虚假性的侦探们,我想说:朋友,欢迎来到肯尼亚教室、会议室或公司内部Teams聊天室里一个典型的星期二。你们所认为的机器指纹,实际上却是我们教育的化石记录。

ChatGPT文风 原产地肯尼亚

而且很早就有消息指出,为了节省人力成本,很多AI模型厂商会把RLHF这类工作交给非洲人,所以模型的很多用语习惯也会偏向非洲那边。

所以我们有理由怀疑,难道ChatGPT真是从肯尼亚“偷师”写作技巧的?

咱这就火速围观一下——

“ChatGPT无意中在模仿我们”

事情是这样的。

来自肯尼亚的Marcus Olang’(以下简称小马)最近发文控诉,从年初收到第一条回复开始,他就陷入了需要“自证不是AI”的困境中。当时甲方给的回复是:

你写的挺好,逻辑也扎实,就是……能不能用更“像人”的方式重写一下?现在这个感觉,有点太像ChatGPT写的了。

而且不止是他,他身边的很多作家朋友也都收到了类似反馈。

而在仔细对比了自己和ChatGPT所写内容之后,小马最终无奈发现——别说,你还真别说,咱们的文风确实很像ChatGPT。

从某种意义上说,指控者并非完全错误。我的写作风格确实与大语言模型的输出结果有几分相似。

我们都倾向于使用结构严谨、平衡的句子。我们都喜欢使用过渡词,以确保逻辑流畅。我们都会偶尔使用(如今看来似乎成了罪证)连字符、分号或破折号来连接相关的想法,使其比简单的句号更显优雅。

不过在小马看来:

讽刺之处在于,这种讽刺或许会让我们的祖先会心一笑。

他表示,不是自己写得像ChatGPT,而是ChatGPT无意中在模仿他们——模仿他们这一代,以及过去几代在全球南方,尤其是在像肯尼亚这样的地方,经过严苛教育体系“锻造”出来的人。

从小到大,小马接受的写作指导都是讲求规范、讲求精心遣词造句(是谁DNA又动了?)。

我们从小被教导,文章必须像一座完美的大厦。引言是地基,主体是承重墙,结论是封顶,必须坚固、对称、无懈可击。我们要用“首先、其次、最后”来构建逻辑,要用“此外、然而、因此”来精确转折,要用“光辉灿烂”、“精疲力竭”这样的“好词”来展现词汇量。

这种写作,是我们的敲门砖,是我们在KCPE(小学毕业考试)决定命运的四十分钟里必须掌握的生存技能,是我们向上攀爬的阶梯。它严谨、清晰、富有说服力,但也因此,在今天某些人的耳朵里,它听起来“缺乏人性的温度”。

而这一套恰巧也被AI学去了。

讽刺来了,AI大模型(比如ChatGPT)正是从海量的书籍、论文、报告中学习写作的。而这些文本库中,充满了历史沉淀下来的、经典的、正式的书面语——也就是我们被训练去模仿的那种文体。所以,当AI为了显得“权威”和“可信”而输出时,它的文风自然就与我所受的教育产生了诡异的“孪生”效应。

所以,如今面对“文风像AI”的指责,小马愤而吐槽:

这台机器为了显得权威,最终听起来却像个英语作文得了“A”的肯尼亚小学毕业考试(KCPE)毕业生。它无意中复制了大英帝国的语言幽灵。

而且他还提到,现存的一些AI检测器往往更倾向于将流畅、逻辑严密、句式规整的文本标记为AI生成,而这恰恰是许多非英语母语者(尤其接受过严格正式写作训练的人)的写作特点,所以他们也更容易被误判。

总之,小马用自己的亲身经历告诉大家——

由于历史原因,一些非英语母语者的写作,本就是现有AI模型的“教材”,而现在他们却成了AI普及后的“受害者”。

这一说法也纷纷获得了网友们的认同:

ChatGPT文风 原产地肯尼亚

不过,令人啼笑皆非的是,小马的这篇感情饱满、“活人感”很强的文章,竟然还是被Pangram网站判定为100%由AI生成。

ChatGPT文风 原产地肯尼亚

啊这……小马不语,小马只是一味生气吐血(doge)。

因非洲人做RLHF,ChatGPT还爱用“delve”一词

而基于类似理由,人们还发现,ChatGPT似乎对“delve”(挖掘、深入研究)这个词情有独钟。

《卫报》曾有一篇文章指出,Jeremy Nguyen这位来自墨尔本斯威本科技大学的AI专家发现——

在PubMed这类专业学术网站上,“delve”的出现频率在近几年激增了10到100倍。

(PubMed主要收录了80余国5200+生物医学期刊,总量超3900万条文献。)

ChatGPT文风 原产地肯尼亚

这暗示了,有大量研究人员可能在用ChatGPT辅助写作,并将其偏好的词汇带入了正式学术文本。

这一现象还引来马斯克和YC联合创始人保罗·格雷厄姆的关注,后者发帖表示:

有人给我发了一封带“delve”一词的邮件,而这个词表明文本大概率是AI生成的(暗示对方用AI写项目书,还要找他投资hhh)。

ChatGPT文风 原产地肯尼亚

并且就在格雷厄姆发帖之后,ChatGPT官号还用这个词公开整活,继而引来无数网友跟风。

ChatGPT文风 原产地肯尼亚

ChatGPT文风 原产地肯尼亚

ChatGPT文风 原产地肯尼亚

不过,进一步的数据分析显示,“delve”远非孤例——

像“explore”、“tapestry”、“testament”和“leverage”等词汇,在ChatGPT生成的文本中出现频率也异常地高。

《卫报》在文章中详细揭开了这背后的谜底——

为了将大语言模型“驯化”成安全、有用、可控的聊天机器人,企业一般会雇佣大量人类测试员,让他们与模型互动并提供反馈(如点赞/点踩,或撰写理想的回复)。

模型从这些海量的人类偏好数据中学习,从而调整自己的行为,也即所谓的RLHF(基于人类反馈的强化学习)。

而出于人力成本考量,RLHF这项劳动密集型工作被大量外包给了肯尼亚、尼日利亚等英语区的非洲国家。

对这些国家来说,“delve”这样的词正是他们日常生活中自然、规范的商务或学术英语,因此被高频使用。

所以这些词也就自然在ChatGPT中高频出现了。

BTW,你还有哪些小技巧来鉴别某项内容是出自AI之手吗?

有网友先给大家打个样了:

ChatGPT文风 原产地肯尼亚

“幼兽般的呜咽”、“瞳孔缩成针尖”……嗯,一般人属实想不到了(doge)。

ChatGPT文风 原产地肯尼亚

AD 麦享生活

网购比价查优惠券就用麦享生活
领打车|外卖红包|美团|抖音团购也用麦享生活
各大应用商店均可搜索安装【麦享生活APP】

文章来源【快科技】,转载请注明出处,本文链接 : https://www.bltcool.com/65507.html
上一篇
下一篇

为您推荐

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部