https://github.com/PincongBot/pincong
20年的数据,全部是json格式,数据量挺大的。
感觉可以用来微调模型,模型名称就叫GPT-Pingcong吧。
问题是我不了解深度学习这块,而且不知道充满了种族歧视的数据能不能用来微调AI。
国外有一个类似的案例,一个YouTuber用4chan的数据微调出了一个种族歧视AI,不知道他是怎么做到的。
用品葱数据微调AI感觉会很有意思,可以体验被AI骂“滞纳猪”。
现在这些模型貌似都有防护功能吧,防止被训练成恶意AI。
国内大厂开源的中文AI模型我觉得就算用品葱数据去微调,也不会输出一点批评习近平的内容。