首页 > 方案案例 > 正文

大众标注在网络信息资源中的作用

2009-01-06 08:46:29  来源:传媒观察

摘要:标注是人们在阅读和使用资源时,出于需要而留下的各种类型的批注,如标签、评论、注释等。近年来,随着网络的普及,人们在不断创造信息的同时,也按照自己的需求组织各类信息,于
关键词: 网络信息资源

  标注是人们在阅读和使用资源时,出于需要而留下的各种类型的批注,如标签、评论、注释等。近年来,随着网络的普及,人们在不断创造信息的同时,也按照自己的需求组织各类信息,于是出现了大众标注(folksonomy)的概念,它是网络资源的利用者为了组织和利用某一数字资源,而自主地对该资源赋予标签的过程或结果①。相应的大众标注网站有delicious、豆瓣等,这些网站所提供的大众标注服务正在日益被越来越多的人所接受,古老而传统的标注行为因此而逐步演化成一种社会性的信息资源组织和利用方式,具有了新的应用领域和使用价值。

下面以豆瓣网站标注电影为例,探讨大众标注在网络信息资源组织和利用方面的作用及不足。

大众标注在资源揭示与资源组织方面的作用

豆瓣网站是一个于2005年上线的以书籍、电影、音乐资源为主的鼓励大众参与的网站,其所有内容及分类、筛选、排序由目前的170多万注册用户添加的“标签”、“评论”及“推荐”,以及网站幕后不断完善的算法而产生和决定。通过点击用户自发添加的“标签”、“评论”及网站提供的搜索功能,人们可以发现最适合自己需要的书籍、电影、音乐等。

每个用户可根据自己的理解创建标签,所有用户都可参与对任一资源的推荐、评论,例如:在电影《赤壁》页面,截至2008年7月30 日,豆瓣成员已经为它创建了733个标签。可以看到使用次数最多的前八个标签:吴宇森、赤壁、梁朝伟、金城武、香港电影、香港、电影、林志玲;同时还可看到给以五星、四星和三星评价的人数及用户所写的影评。

若采用传统分类法对电影《赤壁》进行标注,可以分入电影或香港电影,但不可能分入“吴宇森、梁朝伟、赤壁”这样的类目。相对于传统的资源描述方法,大众标注采用的是自然语言,即依据大众口头词汇对资源予以标记,不需专用词表,省去传统文献标引的查重、概念分析、查表选词等工作过程,用户标注时不受限制、自由发挥,可以从不同角度,以不同方式对同一对象发表自己的观点和评价,使得被标注对象的每一个部分都可能被关注到,例如:电影《赤壁》既有“香港电影”这样的标签,也有“战争”(描述内容)、“2008”(上映年度)、“搞笑”(观众感受)这样的标签。因此,大众标注对资源的揭示可以做到更全面、更彻底,形成的标注结果更为符合大众的需求。

  大众标注在资源评价和资源推荐方面的作用

与传统标引不同的是,豆瓣的标签可以标注出用户对资源的个人观点、感想等,而不仅仅局限于揭示资源本身的内容主题,比如:“好看”、“ 看不懂”、“值得收藏的欧美电影”、“感动”、“力荐”等等。显然,与豆瓣的评论和推荐一样,豆瓣的标签也具有资源评价和资源推荐的作用。

大众标注表达了用户对资源的感知度与认同度,因此,它可以成为资源评价的一个指标。从标注的数量可以说明被标注对象的受关注度,从标注的时间跨度可以说明被标注对象受关注的持久度,其他用户对标注的响应度(阅读数和回应数)、标注者在所探讨领域的权威度等都可以作为评价被标注资源的依据②。以电影《罗马假日》为例:从2005年6月至2008年8月,几乎每个月都有用户发表评论,其中“按投票排序”位于第一的评论有143人阅读,133人推荐,84人回应,充分说明了这部老电影的魅力。

豆瓣用户所给标签的使用次数、豆瓣用户的推荐,直接决定豆瓣首页的资源的内容及其排序;用户的收藏和评价有了一定积累后,网站可经自动统计为用户给出推荐。用户的收藏和评价越多,豆瓣推荐会越准确和丰富,这就促使用户积极参与和分享。

大众标注网站推荐资源有两种形式:一种是大众式推荐。根据标签数量计算出热门标签,以标签云的形式展现给用户,这种形式很直观,通过颜色深浅或字体大小,热门的、点击率高的标签被突出显示在页面上。另一种是专门式推荐。当用户标注了一定的资源之后,系统会根据用户给予资源的标签计算出用户的兴趣领域,同时根据其他用户的标注行为计算出属于该兴趣领域的资源,将它推荐给特定的个人用户。

 大众标注在资源关联方面的作用

在豆瓣网站,当用户浏览评论、标签和其他用户的收藏时,除了会发现自己感兴趣的资源及相关的其他资源,还可以发现与自己兴趣相投的人和感兴趣的各种活动,而通过这些志同道合的人或通过各种活动,又可以找到更多的好东西。

例如:在电影《赤壁》页面,点击“梁朝伟”,进入“电影搜索:梁朝伟”页面,列出所有梁朝伟的电影作品。在“喜欢《赤壁》的人也喜欢……”、“谁看这部电影?”、“喜欢这部电影的人常去的小组”等标题之下,点击可进入相关内容,如“喜欢《赤壁》的人也喜欢……”之下,列出了《功夫熊猫》、《全民超人》、《长江7号》等10部电影,点击即可进入影片介绍页面。点击“喜欢这部电影的人常去的小组”,可看到各兴趣小组的讨论话题,浏览小组所有成员及其收藏和活动,看到他们喜欢去的其他小组,你可以加入你感兴趣的小组……等等。用户还可以定制其他用户的评论或收藏,这样就可持续跟踪该用户来发现更多感兴趣的资源。

大众标注在标注者和标注对象(资源)之间直接建立了关联,同时通过资源关联到资源作者,通过使用行为关联到资源的使用者(指非标注者部分),由此形成了一种复杂的关系网络。在这个关系网络中,结点具有多进多出的特点,并通过标注之间的聚合(共享语义)在标注者内部、资源内部、资源作者内部、资源使用者内部形成同类群,通过任何一个入口都可以对整个网络进行检索和跟踪。用户可以随意对自己账户中的标签进行增删和修改。

  大众标注存在的问题及建议

大众标注所具有的参与的广泛性与标注的随意性,使得大众标注不可避免地存在一些问题。

(1)同义标签缺乏控制。大众标注采用非控词汇,由于缺少同义词控制,出现了大量的相似标签,如:“米国片”、“美国片”、“米国电影 ”、“美国电影”等,导致信息泛滥与分散,降低了用户的检索与使用效率。因此,应采取有效措施来确保用户使用规范的表达方式进行标注,例如,用户输入同义标签时,系统最好能检查出来并推荐用户使用最规范的同义词;或者系统可以提供一个从所有标签中筛选出来的优选词表,让用户从中选择标签。

(2)大量标签使用率很低。很多人使用标签只是基于当前的需要,他们一般不会考虑其他人的需要。据统计,截至2008年8月16 日,“所有豆瓣成员收藏电影用标签”的汇总已达1325页,其中过半标签均为只使用过一次。也就是说,超过大半的标签使用率非常低。庞大的标签体系,让用户浏览和查找颇为不便。

(3)标签错误。在豆瓣,《秋菊打官司》、《大红灯笼高高挂》标注为“国产动画”,《玉观音》标注为“哈利波特”等等,这样的错误比比皆是。至于一些语义模糊、让人无法理解标签,也是随处可见,如:“,。”“aaaaaaaaaaaa”。错误的标签只会误导用户,影响用户对网站资源的了解与利用。

(4)系统推荐不够完善。豆瓣用户收藏某部电影并给予标签时,系统会提供“豆瓣成员常用的标签”供用户参考,这些标签是经系统计算出来的最常用标签,但常用并不一定就是最合适的。如收藏电影《长江7号》时,豆瓣向用户推荐的“常用标签”为:“周星驰 长江七号 喜剧 香港 香港电影 电影 搞笑 2007港台 星爷俺想你了”,其中“香港 香港电影 电影”词义重复,用专指度最高的“香港电影”即可,“喜剧”和“搞笑”也只需用“喜剧”,最后一条“星爷俺想你了”,这样的标签毫无意义。所以,系统的推荐,最好有一些人工干预,避免一些不尽合理的推荐,以更好地发挥标签的作用。

(作者单位为河海大学图书馆)

——————————————————————

参考文献:

①孟连生、黄国彬、常唯:《标注及其演化研究》,《图书情报工作》,2008第1期。

②常唯:《论网络环境下用户标注的价值与应用》,《图书情报工作》,2008第1期。


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。