2.2.4 网络信息分类
1.网络信息分类的原则
网络信息资源的分类体系是根据网络信息以及用户的检索需要而设置的,与纸质文献信息相比,网络信息分类有其不同的原则。
(1)直观性。网络信息是网站为了用户的检索而设立的,其类目设置不宜层次过多,必须体现信息分类的直观性,让用户对其结构一目了然。
(2)实用性。网络是面对用户的信息集合,所用的类名一般使用用户熟知的自然语言,类目层次少,结构简单易记,以便快速查找。
2.网络信息分类法的构建
经过近20年的发展,国内外互联网在网络信息分类构建方面取得了一定的经验,主要有:
(1)按需设类,突出重点,便于浏览。网站围绕用户的使用习惯而设立类目,对于与主题无关的栏目则删除或不立。网站对于栏目的设立并不完全根据纸质文献信息类目层次的设置逻辑,而更多根据信息量和访问频率。网站始终强调把最有价值的内容放到突出位置,把访问频率最高的栏目置于最醒目位置。
(2)以传统分类主题为基础,构建多维分类体系。在传统文献信息分类法基础上,根据用户浏览习惯,建立多维分类模式。比如,为了突出重点类目,可以在多个母类下重复出现这一重点类目,一个母类也可以采用多种标准进行划分。这一做法正是互联网本身超链接优势的体现——用户可以从多个入口访问。
(3)分类主题一体化,网络信息分类的着眼点是用户的信息利用需求,因此在类目设置上必须考虑信息分类法与主题词表的结合,体现分类主题一体化的融合趋势。
3.网站分类实例
(1)Yahoo!雅虎是最著名的网络分类网站,创建于1994年,对其后创建的网站在信息组织上有较大的影响,成为各大门户网的效仿对象。雅虎的信息分类并非一成不变,早期收录较多的学术信息,而目前则侧重于娱乐和生活方面,主页上的信息按主题分为19个类目:news、sports、finance、weather、autos、fantasy、shopping、makers、parenting、health、style、beauty、politics、movies、travel、tech、TV、celebrity、games。
(2)网易,也是一个分类主题一体化的网站,设有新闻、财经、科技等18个类目,每个类目下又设有众多的子类目。
当前人工智能研究领域研究重点之一是将人工智能研究领域中的文本自动分类技术应用于信息资源管理。目前,对文本进行自动分类的技术不断成熟,如基于《中图法》分类体系下的文本自动分类,其基本做法是,建立基于《中图法》的专家知识系统,包括《中图法》库、《汉语主题词表》库、分类号主题词对应库、同义词库、关键词库以及人工标引词库等若干数据库或者其中一部分,应用文本自动分类技术,通过对原始数据的有效整理,找出关键词、主题词和分类号之间隐含的概念关系,形成分类类目与标引词串的对应款目,自动生成分类号。