知网标注体系

一下为知网初步理解:
核心思想:
提取和标注 2个 或者多个 事物之间的对应关系

核心标注事物的2个基本概念:

部件 和 属性

关于对部件的认识是:每一个事物都可能是另外一个事物的部件,同时每一个事物也可能是另外一个事物的整体。

关于对属性的认识是:任何一个事物都一定包含着多种属性,事物之间的异或同是由属性决定的,没有了属性就没有了事物。

知网着力要反映概念之间和概念的属性之间的各种关系

 

 

总的来说,知网描述了下列各种关系:

(a) 上下位关系 (由概念的主要特征体现,请参看《知网管理工具》)

(b) 同义关系(可通过《同义、反义以及对义组的形成》获得)

(c) 反义关系(可通过《同义、反义以及对义组的形成》获得)

(d) 对义关系(可通过《同义、反义以及对义组的形成》获得)

(e) 部件-整体关系(由在整体前标注 % 体现,如”心”,”CPU”等)

(f) 属性-宿主关系(由在宿主前标注 & 体现,如”颜色”,”速度”等)

(g) 材料-成品关系(由在成品前标注 ? 体现,如”布”,”面粉”等)

(h) 施事/经验者/关系主体-事件关系(由在事件前标注 * 体现,如”医生”,”雇主”等)

(i) 受事/内容/领属物等-事件关系(由在事件前标注 $ 体现,如”患者”,”雇员”等)

(j) 工具-事件关系(由在事件前标注 * 体现,如”手表”,”计算机”等)

(k) 场所-事件关系(由在事件前标注 @ 体现,如”银行”,”医院”等)

(l) 时间-事件关系(由在事件前标注 @ 体现,如”假日”,”孕期”等)

(m) 值-属性关系(直接标注无须借助标识符,如”蓝”,”慢”等)

(n) 实体-值关系(直接标注无须借助标识符,如”矮子”,”傻瓜”等)

(o) 事件-角色关系(由加角色名体现,如”购物”,”盗墓”等)

(p) 相关关系(由在相关概念前标注 # 体现,如”谷物”,”煤田”等)

 

 

标注的基础格式:

W_X= 词语
E_X= 词语例子
G_X= 词语词性
DEF= 概念定义

 

样例:

NO.=000001
W_C=打
G_C=V
E_C=~酱油,~张票,~饭,去~瓶酒,醋~来了
W_E=buy
G_E=V
E_E=
DEF=buy|买

NO.=015492
W_C=打
G_C=V
E_C=~毛衣,~毛裤,~双毛袜子,~草鞋,~一条围巾,~麻绳,~条辫子
W_E=knit
G_E=V
E_E=
DEF=weave|辫编

 

初步认识(详细的需和董振东老师有进一步的交流后会有一个更好的认知)

优点:

1.有从语义层出发的, 比较完善的标注体系 和 有实践和验证性过的标注方法

2.在通用领域上有一个相对较好的效果(比如居家生活,人机对话短文本信息)

缺点:

1.对新兴事物标注表现不好(例如明星,新的科技事物)(对新兴事物不敏感)

2.对比较垂直领域标注表现不好

 

(未完.. 待续)

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *