2015年01月26日 | 作者: paperrater | 分类: 行业动态 | 来源:PaperRater论文检测系统
1、关键词的涵义
关键词(keyword)是直接从文献的题名、正文或文摘中抽取出来出的具有检索意义的语词。关键词是主题词的一种。主题词有广义和狭义之分,广义的主题词包括标题词、元词、叙词和关键词,狭义的主题词专指叙词。关键词索引语言是一种未经选优和规范化的自然语言,标题词、元词、叙词索引语言都属于受控语言,关键词索引语言与主题法其它索引语言(标题语言、元词语言、叙词语言)的主要区别即在于此。在检索语言中,所谓规范化处理主要指词类、词形(如英语中的单复数,汉语中汉字的简体字、繁体字、异体字)和词义(如同义词、近义词、多义词)的规范。比如,同义词“计算机”和“电脑”、“激光”和“莱塞”,经过规范化处理后是以选择“计算机”、“激光”作为正式主题词。由于关键词不要求在词义、词形上做严格的规范化处理,因此没有可供参照的词表,选取时比较容易,只要能表达文献的主题,除停用词表(stop-list)以外的词都可选作关键词。而其它的主题词则要经过严格的规范化处理,并都有词表(如(汉语主题词表))可供参考,选取时不仅要表达文献主题,而且要查对词表,看是不是词表中经过规范化处理的正式主题词。由此可见,关键词的选取比其它类型的主题词方便得多,标引效率较高。关键词的涵义国内学术界说法很多,主要分歧体现在关键词与主题词的关系上,试分述如下:
1.1 等同关系
认为确定文章的关键词要选用《汉语主题词表》中的正式叙词(主题词),这种观点将属于规范化语言的叙词(主题词)与属于自然语言的关键词混为一谈,是对关键词基本概念的误解,会使关键词的标引者无所适从。
1.2 整体与部分的关系
认为关键词由叙词和自由词(应为关键词)组成。叙词和关键词同属主题法系统,都是用语词作为检索标识。在关键词的标引过程中,有些词就是叙词表中的正式叙词,但在关键词索引语言中只能把它当作关键词来看待。关键词由叙词和自由词组成的提法是不妥的。
1.3 属种关系
认为主题词由标题词、元词、叙词和关键词组成,主题词和关键词是属种关系。
1.4 并列关系
认为主题词和叙词是同一概念,与关键词是并列关系。笔者认为,以上(1)、(2)两种观点与关键词的基本概念不能吻合;(3)、(4)两种观点的分歧在于对主题词概念的理解,狭义的主题词(叙词)与关键词是并列关系,广义的主题词与关键词是属种关系。
2、关键词的选词
关键词虽然不需要严格的词义和词形上的规范化处理,但关键词的选取要力求做到:简炼地使用关键词———不滥选;正确揭示主题———不错选;全面反映主题———不漏选。同时关键词选取的范围以及关键词的词类等方面都有一定的要求。
2.1 关键词选词的方法
2.1.1 抽词法
就是从题名或者文摘和全文中直接抽取关键词。如从题名《关于图书馆信息服务网络化的思考》中直接抽取“图书馆”、“信息服务”、`网络化'等作为关键词。
2.1.2 赋词法
就是依据文献题名、文摘或全文进行主题分析,凭藉标引人员的智慧并参照有关工具书,人为地提炼出能够表达主题概念的关键词,如标引“普通化学教学改革的研究与实践”这个主题概念,给出“普通化学”、“教学改革”、“高等教育”、“课程设置”、“第二课堂”、“化学教学”、“实验教学”、“教学方法”等关键词。
2.2 关键词词类的选择
关键词主要选择概念明确、含义清楚的名词和名词性词组;冠词、介词、连词、助动词、某些形容词不选作关键词;没有检索意义的通用词(如分析、影响、发展、研究、探讨、应用、评价、建议、问题等)一般也不选作关键词。比如,“应用现代教育技术优化物理课堂教学”一文,可选取“物理教学”、“课堂教学”、“现代教育技术”作为关键词,“应用”一词没有检索意义,故不选作关键词。再如,“电子出版物对信息传播模式的影响”一文,可选取“电子出版物”、“信息传播模式”、“图书馆”作为关键词。“传播”虽然是动词,但“信息传播模式”是名词性词组,故可以选作关键词。一些表示时间概念的词不能单独作为关键词,如“古代”、“现代”、“建国初期”、“新时期”、“转型期”、“21世纪”等。凡是如人名、地名、事物名称等简短单一的名词,就可直接把它作为一个关键词,如“毛泽东”、“上海”、“黄河”、“人民日报”、“生物学”、“西安事变”等。
3、复合词组的切分与保留
3.1 一个复合词组由“整体与局部”两个关键词构成时,可切分为两个词,如“汽车发动机”切分为“汽车”、“发动机”两个词。
3.2 一个复合词组由概念交叉的两个关键词构成时,切分为两个词。如“起重运输机”切分为“起重机”、“运输机”两个关键词。切分概念交叉的复合词组时,要按概念切分,不能按字面切分,如“小儿肺炎”可以切分为“小儿疾病”、“肺炎”两个关键词。
3.3 一个复合词组被切分后,产生歧义时,应保留复合词组作为一个关键词。如“黑色金属”,不能再切分成“黑色”和“金属”。
3.4 固定搭配且具有特定含义的词组和科技术语,不宜拆分开来,而应以词组和科技术语作为关键词。这样不仅可以减少关键词的数量,而且能更好地表达文献的主题,不致产生词义上的理解误差。比如,“网络环境下图书馆信息资源建设”一文,可选取“信息资源建设”、“图书馆”、“网络环境”作为关键词,但不宜将“信息资源建设”拆分为“信息资源”和“建设”,因为“信息资源建设”表达的是一个特定的概念,而“建设”无检索意义。
由上述可见,关键词虽然不是严格规范化的主题词,但也必须按照一定的规则去选词,只有这样,才能通过有限的几个词来准确、充分、简炼地揭示出文章的主题,提高主题标引的质量和文献检索的效果。