本文试从描述信息检索语言的机理入手,分析目前公安信息交流中使用的公安专业信息检索语言的特点及其存在的问题,提出编制公安专业分类主题一体化语言的建议。
一、公安专业信息检索语言
信息检索语言是根据信息交流的需要而创制的人工语言,其实质是指表达一系列概括信息内容的概念及其相互关系的概念标识系统,它可以是从自然语言中精选出来并加以规范化的一套词汇(如《公安主题词表》),也可是代表某种分类体系的一套分类号码(如《中国公安文献分类法》),还可以是代表某一类事物的某一方面特征的一套代码(如《违法犯罪信息管理代码》),用以对信息内容和信息需要进行主题标引、特征描述或逻辑分类。
信息检索语言由词汇和语法组成。词汇是指登录在类表、词表或码表中的全部标识,一个标识(分类号、检索词、代码)就是它的一个语词,而分类表、词表或码表则是它的词典;语法是指如何创造和运用那些标识(单个标识或几个标识的组合)来正确表达信息内容和信息需要,以有效地实现信息交流的一整套规则。
公安专业信息检索语言是根据公安系统信息交流的需要而创制的,适用于公安系统信息概念分析和标识的专业人工语言。随着改革开放的不断深入。公安系统各部门对信息的需求范围日益扩大,对信息内容的专业化要求不断加深,对内容相互交叉、渗透的信息需求日渐增多。面对现有的综合性词表已不能准确地处理公安专业信息,公安系统各部门的信息工作者,通过各自积极的探索,编制了若干适用于各自领域的公安专业信息检索语言。
二、公安专业信息检索语言存在的问题
目前公安信息交流基本上分为三个系统:公安业务部门的信息交流系统,公安管理部门的信息交流系统和公安教学科研部门的信息交流系统,在各自的系统内使用着不同的公安专业信息检索语言,现将主要的几种检索语言表介绍与分析如下:
《违法犯罪信息管理代码》,用于存贮和检索违法犯罪情报资料,由42个标准组成,是以刑法、刑事诉讼法和《治安管理处罚条例》为依据,参照国务院和公安部颁布的有关条令和规定,遵照国家标准局的标准,按照信息分类的原则,结合公安工作的实际需要和公安干警现有的实际工作水平制订而成。《代码》分为基本情况、体貌特征、案件部分、作案方式、重点人口管理和痕迹物证6个部分。《代码》的特点:①语词由公安各学科专家及有丰富实践经验的同志确定,语词间的逻辑关系清晰,用词准确;②在国家技术监督局的指导下完成,具有较强的科学性和规范性。就《代码》本身而言存在三个问题;①由于强调公安工作、公安干警和刑事犯罪信息工作的现有水平,使42个标准未能形成统一有机的整体;②语词的先组程度低;③概念逻辑划分不充分,新概念反映少。
《公安主题词表》,用于公安办公管理部门间的公文传递和资料管理。该《词表》基本上是按照叙词语言的原理编制而成。词表的特点:①规范了公安公文资料信息传递中的用词;②为公安公文资料信息的组织和利用提供了桥梁;③便于公安公文资料信息的计算机管理。存在的问题:①词形控制不充分;②缺少词义说明和注释;③缺少词间关系控制;④对公安专业文献的处理能力低。
《中国图书馆图书分类法》第三版《公安文献分类表》、《中国图书馆图书分类法》《公安科学文献分类表》和《中国公安文献分类法》主要在各公安情报资料部门和公安院校图书馆中使用,用于类分公安专业文献。《中国图书馆图书分类法》(第三版)《公安文献分类表》,是严格按照《中图法》(第三版)的体系结构和标识系统,对《中图法》(第三版)中有关公安类目进行细分、补充和调整而成,并增加了专类复分表、类目注释和参照说明。在此表基础上,经过进一步补充、调整和规范而又形成《中国图书馆图书分类法公安科学文献分类表》,也是《中图法》系列专业分类表之一。这两种表的共同特点是:①可以与《中图法》结合使用,保证文献收藏体系的完整性;②在类分图书文献中便于使用。以上两表存在三个问题:①由于受《中图法》体系结构的制约,使文献不能完全按照族性排列。②类号过长。③有些类号难以取齐,不能直观反映类目间的等级关系。上述两表之外的《中国公安文献分类法》是以公安文献整体为对象,按照公安科学的知识体系,以科学分类和概念逻辑划分为基础,运用文献分类学的理论与方法而建立的类表。该表将公安科学分为5个部分,21个大类。其特点是:①以公安科学为整体进行学科分类,自成体系;②使用数字标记符号,简明易记,方便实用;③增加了专用复分表和通用复分表,增加了文献标引的专指度,减少了类表的篇幅;④编制了索引,使类表具有一定的主题检索功能。
以上各表存在的共同问题:
1、编制的指导思想上缺乏整体性。从公安信息交流的整体来看,公安管理系统、公安业务系统和公安教学科研系统绝不是孤立的系统,彼此间都有信息的需求。以上各表均是为解决公安信息交流中某一特定范围内的信息交流而编制的,缺乏对公安信息交流的整体认识,仅仅解决了某一特定交流系统的需要。
2、使用上缺乏统‘性。信息检索语言作为一种用于信息交流的人工语言,必须在信息交流过程中统一使用,才能起到交流沟通的作用,否则在一个交流系统中使用多种语言只能为交流制造障碍。以公安教学科研系统为例,在类分公安专业文献中,使用着3种专业类表,这种状况不仅为将来公安信息交流的整体化带来隐患,仅对公安教学科研系统内部的信息交流而言也将是严重的障碍。
3、语言的选择和编制的技术方法比较落后。从公安专业信息检索语言的种类来看,前文列举的5种词表,可以分为体系分类语言和主题词语言,这两种语言的编制原则决定了其先天的不足。体系分类语言“集中与分散”的矛盾是由语言自身对概念层层划分而决定的;主题词语言是由以事物为中心使用无等级语词而决定的。从采用的编制技术和方法来看,基本上采用经验与专家的方法来编制词表,编制原则上不明确,语词的选定未做必要的信息保障调研,词间关系反映不充分,没有编制必要的副表。
三、编制公安专业分类主题一体化词表
从公安信息工程的长远和全局出发,公安专业信息检索语言的编制应该选择信息检索语言中更为先进的,与计算机结合更为便捷的分类主题一体化语言。简单地讲,分类主题一体化是分类法与主题法两种方法的有机结合,使一个分类系统和一个主题系统实现了完全兼容,有机地融合为一个整体,既能充分发挥各自独特的功能,又能通过配合,发挥最佳的整体效应。分类主题一体化有三层涵义:一是指编制信息检索语言的分类方法与主题方法的有机结合;二是指利用这种方法编制的信息检索语言具有分类与主题功能;三是利用分类主体一体化语言编制的检索工具或检索系统具有分类检索和主题检索的功能。分类主题一体化词表从宏观上分为两个相互联接的主题表和分类表,语词出现两次,两者之间分类号联系。
我们认为在编制公安分类主题一体化词表中要做好以下工作:
-提高对编制科学统一化的公安专业信息检索语言的认识。公安专业信息检索语言是公安信息工程的一个重要组成部分,是公安信息交流的核心,它是联结广大公安信息用户与公安信息源之间的桥梁。未来公安信息交流是否畅通,要取决于这座桥梁的设计与技术水平。编制公安专业信息检索语言是公安信息整体工程的需要,不是公安某一信息交流系统的需要,更不是某一交流系统的信息工作者能够独立完成的工作。
-编制公安专业信息检索语言必须要以强有力的组织做保障。首先必须得到领导层的强有力支持,要将其纳入到公安信息工程的整体规化中,根据整体需要制定编制原则、方式和程序。其次要有高素质的编制队伍做保障,要发挥公安各信息交流系统工作者的智慧,充分利用他们编制各种词表的经验。
-制定科学的编制方案。在制定编制方案时,要克服传统编制方法的弊端,采用系统方法借助先进有效的技术手段。首先要做好前期准备工作,一方面是要确定词表的学科和专业覆盖范围;另一方面要做好公安专业信息源的调查。在此基础上进行总体设计;充分利用现有的各种词表收词、选词;在词汇审核后进行词汇控制、编配参照系统;利用计算机技术对词汇进行排序,编成主表、辅助索引,通过试标引对词表进行修改、定稿。
-技术指导。在编制词表中对《单语种叙词表编制与发展准则IS0278 -19砷、《多语种叙词表编制与发展准则ISO-DIS5964-1978》和《文献主题标引规则GB3860-1983》的运用必须得到我国负责信息检索语言标准化的权威机构全国情报文献工作标准化技术委员会的指导。