赛博白月光

  • GPT-4o学习“波多野结衣”的次数,比“您好”还多2.6倍...

    GPT-5出世后,GPT-4o一度被网友亲切地称为“赛博白月光”。 然而没想到在它的知识体系里,对日本女优“波多野结衣”的熟悉程度,竟然比“您好”还要高。 最近,在预印本网站Arxiv上的这篇新论文,引爆了整个AI圈。 来自清华大学和南洋理工大学的几位研究者发现: 我们天天在用的大语言模型,比如ChatGPT,都被某些神秘的东方文字“污染”了。 污染数据里最引人瞩目的,就是老艺术家、AV女优波多野结衣的名字。 论文中把这些污染数据定义为“污染中文词元”,简称PoC Tokens。 在GPT的长中文词元(超过两个汉字)中,超过23%属于色情或赌博等灰色内…