根据76大细分词性对单词进行归组(一)
词性的重要性不言而喻,尤其是对于自然语言处理来说,哪怕就是记单词,根据
词性对单词进行归组也是非常有帮助的。
superword是一个Java实现的英文单词分析软件,主要研究英语单词音近形似
转化规律、前缀后缀规律、词之间的相似性规律等等。
各大词性广泛度排名:
1、N-COUNT(可数名词)(词数:5150)
2、V(动词)(词数:3881)
3、ADJ-GRADED(能被表示程度的副词或介词词组修饰的形容词)(词数:2583)
4、N-UNCOUNT(不可数名词)(词数:2038)
5、ADJ(形容词)(词数:1837)
6、N-VAR(可变名词)(词数:938)
7、N-SING(单数名词)(词数:721)
8、V-ERG(动词(及物/不及物))(词数:511)
9、N-PLURAL(复数名词)(词数:420)
10、ADV(副词)(词数:319)
11、N-MASS(物质名词)(词数:167)
12、CONVENTION(惯用语)(词数:158)
13、V-RECIP(相互动词)(词数:112)
14、N-IN-NAMES(名称名词)(词数:87)
15、PREP(介词)(词数:80)
16、ADV-GRADED(能被表示程度的副词或介词词组修饰的副词)(词数:67)
17、N-VOC(称呼名词)(词数:53)
18、N-TITLE(头衔名词)(词数:53)
19、COLOUR(颜色词)(词数:51)
20、N-COUNT-COLL(可数集合名词)(词数:50)
21、QUANT(数量词)(词数:44)
22、V-RECIP-ERG(相互动词(及物/不及物))(词数:43)
23、N-PROPER(专有名词)(词数:40)
24、EXCLAM(感叹语)(词数:38)
25、NUM(数词)(词数:38)
26、V-PASSIVE(被动动词)(词数:37)
27、CONJ-SUBORD(从属连词)(词数:36)
28、DET(限定词)(词数:29)
29、V-LINK(连系动词)(词数:26)
30、N-SING-COLL(单数集合名词)(词数:24)
31、PRON(代词)(词数:20)
32、ORD(序数词)(词数:15)
33、QUEST(疑问词)(词数:14)
34、FRACTION(分数词)(词数:12)
35、CONJ-COORD(并列连词)(词数:11)
36、MODAL(情态动词)(词数:10)
37、N-UNCOUNT-COLL(不可数集合名词)(词数:10)
38、PREDET(前置限定词)(词数:8)
39、PRON-INDEF(不定代词)(词数:8)
40、PRON-REL(关系代词)(词数:8)
41、PRON-REFL-EMPH(强调反身代词)(词数:8)
42、PRON-REFL(反身代词)(词数:8)
43、PRON-SING(单数型代词)(词数:7)
44、DET-POSS(所有格限定词)(词数:6)
45、N-FAMILY(家庭成员名词)(词数:6)
46、N-PROPER-COLL(专有集合名词)(词数:6)
47、ADV-BRD-NEG(广义否定结构副词)(词数:5)
48、ADJ-COMPAR(形容词比较级形式)(词数:5)
49、PRON-POSS(所有格代词)(词数:5)
50、PRON-PLURAL(复数型代词)(词数:5)
51、AUX(助动词)(词数:4)
52、ADV-COMPAR(副词比较级形式)(词数:4)
53、ADJ-SUPERL(形容词最高级形式)(词数:3)
54、ADV-INDEF(不定副词)(词数:3)
55、ADV-SUPERL(副词最高级形式)(词数:3)
56、COMB-in-COLOUR(与颜色词构成的词)(词数:3)
57、COMB-in-ADJ(与形容词构成的词)(词数:3)
58、DET-NEG(否定限定词)(词数:2)
59、N-VAR-COLL(可变集合名词)(词数:2)
60、ADJ-UNGRADED(不能被表示程度的副词或介词词组修饰的形容词)(词数:2)
61、COMB-in-ADJ-GRADED(与能被表示程度的副词或介词词组修饰的形容词构成的词)(词数:2)
62、QUANT-PLURAL(复数数量词)(词数:2)
63、CONJ-COORD-NEG(否定并列连词)(词数:2)
64、PRON-RECIP(相互代词)(词数: