2023/05/15 使用 ChatGPT 对数据集进行了重新标注(原本的数据质量太差了)
功能介绍
根据输入内容判断是否是垃圾评论。
示例:
- 正常评论 | 谁能告诉我xx怎么用吗?谢谢
- 正常评论 | 打开浏览器,直接在浏览器的搜索栏搜索软件的名称就可以通过搜索引擎找到软件的下载链接
- 垃圾评论 | 点开有惊喜:http://www.bhshare.cn/
- 垃圾评论 | 老夫掐指一算,你五行缺德,命里犯贱。
垃圾的定义
- 广告
- 脏话(含敏感词)
- 与主题无关的评论
补充
- 训练模型时使用的是一些游戏内的聊天数据
- 存在问题:在垃圾评论后面接一段很长的正常评论,会被识别成正常评论...