首页| 滚动| 国内| 国际| 军事| 社会| 财经| 产经| 房产| 金融| 证券| 汽车| I T| 能源| 港澳| 台湾| 华人| 侨网| 经纬
English| 图片| 视频| 直播| 娱乐| 体育| 文化| 健康| 生活| 葡萄酒| 微视界| 演出| 专题| 理论| 新媒体| 供稿

青海“云藏”打造全球首个藏文智能搜索引擎

2014年12月02日 21:31 来源:中国新闻网 参与互动(0)

  中新社西宁12月2日电(罗云鹏)“搜索引擎是文化与历史传承的新载体,对一国的文化安全意义重大,‘云藏’是全球首个藏文智能搜索引擎,建成后对藏文信息安全、国内外涉藏舆情监测以及重要舆情分析将提供可靠的参数和依据”。2日,青海省海南藏族自治州藏语委办主任、“云藏”引擎开发负责人才洛告诉中新社记者。

  “云藏”一词是藏文的音译词,有两层含义,其一为“上师”或“老师”,意为有求必应、有问必答;其二是将其分为单字,有“全面抓取、提取”之意。“云藏”搜索引擎是青海省少数民族事业“十二五”规划中藏文信息化建设的重要组成部分,于2013年4月启动系统平台项目建设,研发团队现有100余名工作人员,由藏文信息录入组、分词标注组和技术组3个小组组成,团队中藏族比例达84%,该搜索引擎预计将于2015年年底建设完成,2016年7月正式开通。

  “目前,中国国内如百度、搜狗等主要的搜索引擎中没有藏文搜索功能,但国外搜索引擎反而支持藏文的简单搜索,如谷歌英文版、中文版,雅虎英文版、中文版以及微软的bing搜索引擎等”,才洛说,“由于数据索引库在国外,检索到的信息准确性和内容有受制性,对应出自国内的真实和有效的信息不能被及时检索,提供的有关藏文化知识准确度不高、信息量不够”。

  据了解,“云藏”藏文搜索引擎系统平台建设项目,是一个集搜索引擎、藏文百科、自动问答为一体的大型藏文门户系统工程,将开辟新闻、网页、图片、视频、百科、文库、知道7个板块,“任何搜索引擎中,数据库的建设是最为繁琐艰巨的工作。尤其对于藏文搜索引擎来说是一项从零开始的浩大工程”。才洛介绍,“云藏”搜索引擎覆盖了文化、卫生、教育、科技、宗教、人物等诸多方面,截至目前,已录入历史、文学、宗教、医学、自然以及各类词典等25类资料,共录入12.7万条词条,字数达1197.7万字。

  “‘云藏’建成后,该系统的藏文搜索正确识别率将达95%,不仅能满足藏文网民个性化的检索需求,还将推动藏文信息全方位融入互联网世界。”才洛说,“未来使用藏文的网民输入一个词汇,就会有对应的百科知识,如果词条内容空缺,系统会提示网民自主添加,后台审核通过即可录入数据库,这种方式,将使数据库不断地丰富、扩充”。

  目前已知的藏文网页超过6700万个,初步估算,“云藏”运行初期,青、藏、甘、川、滇五省区的藏文用户数量约为120万,随着搜索引擎产品的推广和宣传,用户量将达200万。(完)

>文化新闻精选:

 
本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
[网上传播视听节目许可证(0106168)] [京ICP证040655号] [京公网安备:110102003042-1] [京ICP备05004340号-1] 总机:86-10-87826688

Copyright ©1999-2024 chinanews.com. All Rights Reserved