排序方式: 共有61条查询结果,搜索用时 93 毫秒
1.
2.
综合采用切分标志、分词词典和N元语法3种方法对古籍文本进行分词,并采用子串比较过滤、相邻词过滤、高频词过滤、低频词过滤等方法对分词结果进行过滤,分别以12种农业古籍和379种<广东方志物产>为语料进行了古籍分词测试.从12种农业古籍中共识别出已有词1164个,约占总词汇量的31%;未登录词2530个,占总词汇的69%.从379种<广东方志物产>资料中共识别出已有词6314个,占总词汇的8%;未登录词75 438个,则占总词汇的92%.通过对379种<广东方志物产>分词结果的分析发现,当词频等级位于区间(2000,8000)时,词频等级与频次乘积基本为常数23 000 000.这一结果说明齐夫定律在古籍文本中同样适用. 相似文献
3.
4.
古籍索引编制与一般索引编制有所不同。在古籍索引编制的过程中,古籍版本的选择是需要处理的首要技术问题,而款目内容的选择则是索引编制的重点所在。因为人名、地名、职官名、书名等实体名称在不同时期有所不同,因此人名、书名、物产名称的选择及其限定词的使用在古籍索引编制中各具特色,参照系统的编制应占有相当大的份量。同时,古籍索引的排序方法及出处表达同样不能被忽视。 相似文献
5.
当代目录学面临着衔接与融合问题,它包括传统目录学与现代目录学衔接与融合的问题,目录学理论与实践衔接与融合的问题,中西方目录学衔接与融合的问题.这也需要我们认清当代目录学研究对象的历史继承性、研究内容的拓展性与外延性、中西书目知识本质的一致性. 相似文献
6.
7.
8.
9.
10.
当代百利全书发展态势研究 总被引:4,自引:0,他引:4
文章从电子化、图文化、专门化、综合化、多元化、智能化、多样化、动态性等九个方面详细地论述了当代百科全书发展态势。 相似文献