基本信息
文件名称:根据76大细分词性对单词进行归组.pdf
文件大小:9.67 MB
总页数:84 页
更新时间:2025-03-08
总字数:约20.92万字
文档摘要

根据76大细分词性对单词进行归组(一)

词性的重要性不言而喻,尤其是对于自然语言处理来说,哪怕就是记单词,根据

词性对单词进行归组也是非常有帮助的。

superword是一个Java实现的英文单词分析软件,主要研究英语单词音近形似

转化规律、前缀后缀规律、词之间的相似性规律等等。

各大词性广泛度排名:

1、N-COUNT(可数名词)(词数:5150)

2、V(动词)(词数:3881)

3、ADJ-GRADED(能被表示程度的副词或介词词组修饰的形容词)(词数:2583)

4、N-UNCOUNT(不可数名词)(词数:2038)

5、ADJ(形容词)(词数:1837)

6、N-VAR(可变名词)(词数:938)

7、N-SING(单数名词)(词数:721)

8、V-ERG(动词(及物/不及物))(词数:511)

9、N-PLURAL(复数名词)(词数:420)

10、ADV(副词)(词数:319)

11、N-MASS(物质名词)(词数:167)

12、CONVENTION(惯用语)(词数:158)

13、V-RECIP(相互动词)(词数:112)

14、N-IN-NAMES(名称名词)(词数:87)

15、PREP(介词)(词数:80)

16、ADV-GRADED(能被表示程度的副词或介词词组修饰的副词)(词数:67)

17、N-VOC(称呼名词)(词数:53)

18、N-TITLE(头衔名词)(词数:53)

19、COLOUR(颜色词)(词数:51)

20、N-COUNT-COLL(可数集合名词)(词数:50)

21、QUANT(数量词)(词数:44)

22、V-RECIP-ERG(相互动词(及物/不及物))(词数:43)

23、N-PROPER(专有名词)(词数:40)

24、EXCLAM(感叹语)(词数:38)

25、NUM(数词)(词数:38)

26、V-PASSIVE(被动动词)(词数:37)

27、CONJ-SUBORD(从属连词)(词数:36)

28、DET(限定词)(词数:29)

29、V-LINK(连系动词)(词数:26)

30、N-SING-COLL(单数集合名词)(词数:24)

31、PRON(代词)(词数:20)

32、ORD(序数词)(词数:15)

33、QUEST(疑问词)(词数:14)

34、FRACTION(分数词)(词数:12)

35、CONJ-COORD(并列连词)(词数:11)

36、MODAL(情态动词)(词数:10)

37、N-UNCOUNT-COLL(不可数集合名词)(词数:10)

38、PREDET(前置限定词)(词数:8)

39、PRON-INDEF(不定代词)(词数:8)

40、PRON-REL(关系代词)(词数:8)

41、PRON-REFL-EMPH(强调反身代词)(词数:8)

42、PRON-REFL(反身代词)(词数:8)

43、PRON-SING(单数型代词)(词数:7)

44、DET-POSS(所有格限定词)(词数:6)

45、N-FAMILY(家庭成员名词)(词数:6)

46、N-PROPER-COLL(专有集合名词)(词数:6)

47、ADV-BRD-NEG(广义否定结构副词)(词数:5)

48、ADJ-COMPAR(形容词比较级形式)(词数:5)

49、PRON-POSS(所有格代词)(词数:5)

50、PRON-PLURAL(复数型代词)(词数:5)

51、AUX(助动词)(词数:4)

52、ADV-COMPAR(副词比较级形式)(词数:4)

53、ADJ-SUPERL(形容词最高级形式)(词数:3)

54、ADV-INDEF(不定副词)(词数:3)

55、ADV-SUPERL(副词最高级形式)(词数:3)

56、COMB-in-COLOUR(与颜色词构成的词)(词数:3)

57、COMB-in-ADJ(与形容词构成的词)(词数:3)

58、DET-NEG(否定限定词)(词数:2)

59、N-VAR-COLL(可变集合名词)(词数:2)

60、ADJ-UNGRADED(不能被表示程度的副词或介词词组修饰的形容词)(词数:2)

61、COMB-in-ADJ-GRADED(与能被表示程度的副词或介词词组修饰的形容词构成的词)(词数:2)

62、QUANT-PLURAL(复数数量词)(词数:2)

63、CONJ-COORD-NEG(否定并列连词)(词数:2)

64、PRON-RECIP(相互代词)(词数: