网站建设中的元数据、受控词表、叙词表
发布者:东郡网络 时间:2015-06-05 00:00:00网站是由一些彼此连接而且关系复杂的系统组合而成的,网页上的一个连接同时也可以是网站结构、组织、标签、导航,以及搜索系统的一部分。分别研究这些系统相当有帮助,但是,考虑它们彼此间的交互也是很很重要的,简约伦突发告诉我们整个实情。
元数据和受控词是表示一组迷人的镜头,可以让你看见系统间的关系。在很多采用元数据的大型网站中,受控词表是把系统粘在一起的黏胶。后端的叙词表则能让前段的用户感受到更无瑕且令人满意的体验。
此外,叙词表的设计可以让我们把过去和现在的差距连接起来。最初的叙词表是为了图书馆、博物馆、和政府单位而开发出来的,远在www诞生之前就已经存在。身为十堰网站建设者,我们可以善用这数十年的经验,但是,不能毫不筛选地加以复制,十堰网站建设技术人员要设计的网站和企业网络存在新的挑战,因此,需要具有创造性的解决方案。
元数据
说到元数据的定义,这元数据还真是条滑溜溜的鱼。将元数据说成是“关于数据的数据”并没有多大用处。
对数据处理而言,元数据是一种用于定义的数据,能够提供其他被某种应用软件或环境所管理的数据的相关信息或者说明。例如,元数据可以为数据说明其元素或属性(名称、大小、数据类型。等等)或者其记录或结构(长度、字段、数据列,等等),或者其先关数据(位于何处、图和联系、拥有者,等等)。元数据可能包含描述性信息,说明数据的情境、质量和状态,或者特征。
这么冗长的说明,会把我们带进认识论和形而上学的领域,但是,我们不会跳进去。相反地,让我们把交电集中于元数据在西悉尼构架中所扮演的角色。
元数据的标签用来描述文件、网页、图像、软件、视频文件、音频文件,以及其他可以改进高航和搜索的内容对象。很多网站都用到HTML的关键词〈META〉标记,这就是一个简单示例。十堰网站建设者可以自行填入任何描述内容的字眼和词汇,这些关键词不会出现在网页界面中,但是,搜索引擎可以据此搜索。
现在很多公司都可以更复杂的手法使用元数据。善用内容管理软件和受控词表,就能够建立动态的、由元数据驱动的网站,而且支持分布式内容创作方式,以及有力的导航方式。这种元数据驱动的模式,完全改变了网站构建和管理的干事。我们不再问:“我把问价你归类在何处?”我们现在可以问:“我要怎么描述这份文件?”接着,就有软件和词汇系统接受了。
受控词表
词汇控制有各式各样的形式。最模糊的说法是,受控词组表示任何一组自然语言的子集。最简单的说法是,受控词表是一份价术语清淡,按同义词环圈的形式排列,或者是一份优选术语清淡,储存在规范文档中。定义术语之间的等级关系(副上位类、下位类),就有了分类体系。建立概念之间关联的模型,就是在做叙词表,下图说明这几种不同受控词表件的关系。
因为完善的叙词表会整合所有较简单形式的关系和功能,所以,在开始深究受控词表的奥妙之前,让我们先探索这些基本类型。
同义词环圈如下图,把一组定义为等价关系的词汇链接起来,以供搜索只用。事实上,这些词通常不是真正的同义词。例如,假设你要重新设计顾客门户网站,它提供的各家公司的家用产品的评比信息。
十堰网站建设技术人员在检查搜索日志,并和用户对话值周,你将发现不同的人在寻找同样的东西时,会输入不同的术语。某人要找food processor,可能输入“blender”或者上图之中任何一个术语(或者是常见的错误拼法)。看一下网站的内容,你会发现有很多类似的情况。
也许没有优选术语,或者,至少没有良好理由去定义他们。那么,你可以善用搜索引擎建立同义词环圈。最简单的做法就是把一组等价术语放到文本文件中。当用户输入一个词汇给搜索引擎时,就拿这个词汇和文本文件进行比较。如果找到该词汇,则查询就会“扩展”,将那些等价术语都包含进来。例如,以布尔逻辑而言即为:
Dictionaey.com把叙词表定义为“同义词之书,通常含有相关词、对照词、以及反义词”,这种用法是回到高中时代的英语课程,我们从叙词表中找一些吓人的词让老师印象深刻。
我们所谓的叙词表是整合在网站或企业网内,用以改善导航和搜索效果,这和参考书有相同的传统,但是,具有不同的形式和功能。与参考书类似的是,叙词表是一种概念的语义网络,把词汇和同义词、同音异义词、反义词、上位类术语和下位类术语,以及相关关联术语链接起来。
然而,我们的叙词表形式是采取在线数据库的形式,与网站或企业网络的用户界面是紧密整合在一起的。虽然传统的叙词表可以帮我们从一个词找到好多个词,但是,我们的叙词表所做的事刚好相反。其最重要的目标是同义词管理,吧许多同义词或异形术对应到某个优选术语或概念上,是的语言的模糊性不会妨碍用户找到他们所需的东西。
叙词表构建在较简单的受控词表智商,建立这三种基本类型的语义关系模型。
从下图可知,每一个优选术语都变成其自身语义网络的中心。等价关系是同义词管理的焦点。等级关系是吧优选术语分类成类别和子类别。相关关系是提供有意义的链接,而这有意义的链接,并非由等级关系或等价关系处理。这三种关系对信息搜索和导航而言,在很多方面都很有用。
本信息来源于:东郡网络