运行该项目的模型训练和模型预测脚本需要准备BERT中文版的模型数据,下载网址为:https://github.com/google-research/bert/blob/master/multilingual.md 。
利用笔者自己收集的2959个样本,对人物关系抽取进行尝试。人物关系共分为14类,如下:
{ "unknown": 0, "夫妻": 1, "父母": 2, "兄弟姐妹": 3, "上下级": 4, "师生": 5, "好友": 6, "同学": 7, "合作": 8, "同人": 9, "情侣": 10, "祖孙": 11, "同门": 12, "亲戚": 13 }
github地址:https://github.com/percent4/people_relation_extract