【网信办:利用合成数据进行模型训练和关键能力优化时,应当评估合成数据安全性】国家互联网信息办公室关于《人工智能拟人化互动服务管理暂行办法(征求意见稿)》公开征求意见的通知。其中指出,提供者开展预训练、优化训练等数据处理活动时,应当加强训练数据管理,遵守以下规定:使用符合社会主义核心价值观、体现中华优秀传统文化的数据集;对训练数据开展清洗、标注,增强训练数据的透明度、可靠性,防范数据投毒、数据篡改等行为;提高训练数据的多样性,通过负向采样、对抗训练等手段,提升模型生成内容安全性;利用合成数据进行模型训练和关键能力优化时,应当评估合成数据安全性;加强对训练数据的日常检查,定期对数据进行迭代升级,持续优化产品和服务的性能;保障训练数据来源合法、可追溯,采取必要措施保障数据安全,防范数据泄露风险。。