从关于大学性骚扰的一篇博文谈起
发表时间:+-
从一篇大学性骚扰博文谈起
沙冷
版上有人发了一篇义愤填膺、声讨杨同学的博文:
https://blog.creaders.net/u/8399/202508/522093.html
笔者扫了两眼,就注意到几句关键表述:
“盯着一个男生的私处,看了一个多小时。”
“男生痒的不是地方,下意识地挠了几下。”
“下体骚痒挠一下。”
这些说法两两矛盾。如果只是挠一下或几下,不可能有人“盯着看一个多小时”。这种动作与时间的逻辑冲突,稍有常识的人都能看出来。由此可见,这篇文章缺乏起码的理性,这是第一。
第二,这篇文章还被转载到其他网站,点击量不少。但奇怪的是,这么显而易见的矛盾,却没有网友指出。这引出一个更严重的问题:这类未经质疑、反复传播的自媒体文章,极有可能被爬取进语料库,成为AI训练数据的一部分。它们就像中国青年报那些大量虚假报道一样,会成为“有毒语料”,在源头污染中国AI的认知。
第三,AI近年突飞猛进的一个关键原因,是2017年提出的“注意力机制”(attention mechanism)。它让AI在看到文章后,能根据上下文和历史数据迅速抓住重点。AI之所以变聪明,是因为它能抓住重点。如果中国网友普遍在阅读时抓不住重点,甚至关注点与AI差异显著,AI很可能会在暗中为这一群体贴上一个标签——“弱智读者群”。