1、特征码(attribute code)用来判断某段数据属于哪个计算机字段。共计40个字符。
2、特征码的获取不可能再是简单的取出一段代码来,而是分段的。中间可以包含任意的内容(也就是增加了一些不参加比较的掩码字节,在出现掩码字节的地方,出现什么内容都不参加比较)。这就是曾经提出的广谱特征码的概念。
3、随着网络技术和信息技术的飞速发展,网络已经成为人们获取信息的一个重要途径。现有的搜索引擎面临的最大一个问题就是返回的结果集中包含大量重复的信息。如何更有效地帮助用户获取所需要的信息,能够快速、准确地为用户提供信息。是网络信息服务面临的新课题。优化搜索结果可以采用多种手段,如通过提取网页的特征进行基于内容的信息检索。利用用户反馈的信息进一步精确检索结果,将结果集中的重复信息尽可能地消除等。