能否用品葱公开的备份数据训练一个语言模型？

Question

2024年4月18日AI GPT 品葱机器学习

20年的数据，全部是json格式，数据量挺大的。

感觉可以用来微调模型，模型名称就叫GPT-Pingcong吧。

问题是我不了解深度学习这块，而且不知道充满了种族歧视的数据能不能用来微调AI。

国外有一个类似的案例，一个YouTuber用4chan的数据微调出了一个种族歧视AI，不知道他是怎么做到的。

用品葱数据微调AI感觉会很有意思，可以体验被AI骂“滞纳猪”。

score 0 · Answer 1 · 2024-04-19T03:49:42+00:00

现在这些模型貌似都有防护功能吧，防止被训练成恶意AI。
国内大厂开源的中文AI模型我觉得就算用品葱数据去微调，也不会输出一点批评习近平的内容。