从训练AI到部署搭建网站(一)训练自己的聊天机器人

从训练AI到部署搭建网站(一)训练自己的聊天机器人

最近GPT非常火热,于是突发奇想能不能用自己和朋友聊天的数据训练一个对话机器人,不过因为自己第一次做这方面的内容,所以过程可能不是最优的方案

第一步:获取数据集

这里选用的QQ聊天 ,QQ聊天数据有加密。之前看见一篇博客说可以直接在电脑导出txt数据,但鉴于自己的聊天记录在手机上且手机未root,所以这里选择用MUMU模拟器。全过程可以直接参考:安卓QQ聊天记录导出、备份完全攻略 - roadwide - 博客园 (cnblogs.com)。这里写一下我用这个教程导出的过程,供参考。

登入QQ,把聊天记录先全部备份到电脑。再备份到MUMU模拟器的QQ上面。左下角三条横杠打开,选择聊天记录备份与恢复

记得先获取模拟器root权限,网易MuMu怎么开启root权限-百度经验 (baidu.com)

然后在MUMU模拟器上确认聊天记录已全部转移后,点开系统应用--》文件管理器-->/data/data/com.tencent.mobileqq/databases  里面的你的QQ号.db,然后根据大佬的python脚本处理.db文件。

第二步:处理QQ文本

我们获取的文件格式包括QQ号,日期, 时间等等,需要将它拆成一段段的对话以供训练,就自己写了个python代码处理原始文


比丘资源网 » 从训练AI到部署搭建网站(一)训练自己的聊天机器人

发表回复

提供最优质的资源集合

立即查看 了解详情