【版权提示】信息来自于互联网,不代表外贸内参立场,内容仅供网友参考学习。如发现本站内容存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至[email protected],我们将及时沟通与处理。如若转载请联系原出处。
大语言模型在知识蒸馏过程中会悄悄植入自身偏好
《自然》杂志4月15日刊登的一项研究指出,大型语言模型(LLM)可能在训练过程中,把自身偏好的某些特征“悄悄传给”其他算法。即使研究人员已从训练数据中刻意剔除这些特征,它们仍可能顽固残留。例如,某个模型就通过数据中不易察觉的线索,将自己对猫头鹰的偏好“传染”给了其他模型。这提示,在开发大语言模型时,必须开展更严格、更全面的安全评估。
外贸快讯
扫描二维码,加入行业交流
优质外贸交流群,获得一手行业资讯~
活动推荐
多语言建站助力外贸获客
3月12日 · 线上活动
携手共创,期待您的声音
3月12日 · 意见征集
订阅外贸资讯
每周精选全球贸易动态,助您抢占市场先机