木盒厂家
免费服务热线

Free service

hotline

010-00000000
木盒厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

关键词过滤方案受质疑短信治理面临技术门槛

发布时间:2020-02-03 07:38:23 阅读: 来源:木盒厂家

近日,新成立的工业和信息化部宣布,已联合国务院新闻办、公安部起草了《通信短信息服务管理规定》,该规定将对短信息服务和管理问题进行系统规范,并明确禁止发送违法内容和违规发送垃圾短信行为。

从电信设备和电信业务入手治理短信,是其第一步举措;第二步,必将是与内容有关的信息“过滤”。

有关专家评说

目前的市场环境下,单靠政策很难完全清除垃圾短信,还需要强制过滤手段。这其实与垃圾短信的定义有关。通过手机用户端的定义控制垃圾短信,只有在用户反复收到,已经明确其为垃圾短信的情况下才能设置。更多的垃圾短信让你防不胜防,难辨真伪。比如,今年2月在京城大面积传播的汽油价格上涨,使北京所有加油站“车满为患”,造成了交通的极大拥堵,以致第二天,北京各大媒体纷纷辟谣,给社会造成了极大的负面影响的“谣言”短信。

对待上述情况,专家认为,必须借助内容的“过滤”技术才能有效遏制其传播。具体来讲,一方面,“过滤”技术往往建有强大的已知“知识库”,可以依靠以往经验准确定义“垃圾短信”的特征。只要符合定义特征,立刻“拦截”;另一方面,过滤的同时,本身还包含“舆情”捕捉功能,当某个信息反复出现,程短时爆发状态上升时,“过滤”技术便能准确识别出来,将其排在首位,然后再通过人工迅速判断信息真伪。一旦发现有误,立刻阻止其进一步传播和蔓延。这样“已知”和“未知”垃圾都可得到有效遏制。

目前,市场上流行的过滤技术有两种,一种是“关键词”过滤,即通过定义个别的词达到“过滤”效果,一种是“语义”过滤技术。两者技术区别在于,后者除了关键词之外,还添加了语境的分析,也就是褒贬义分析和立场判断,分析一句话到底是批评还是赞扬,肯定还是否定,从而达到准确过滤的目的,避免“错杀无辜“的现象出现。

我国语义分析专家——中科院声学所研究院黄曾阳指出,“关键词技术基于西方拉丁语系而来,西语是表音的文字,而汉语是音形义结合的文字。中文本身非常复杂,不同于西语“非此即彼”的表达方式,表述形式更为多样。用电脑模拟人脑语言感知过程,从逻辑思维角度对语义进行判断,从领域、情景、背景三方面分析得到结果,即 HNC (Hierarchical Network of Concepts 概念层次网络)理论,使中文语言处理实现了实质性的突破,消除了语言多重模糊,搜索过滤更为精准。”

北京大正语言研究院是该理论研究与应用的承担单位。据大正研究院院长陈小盟介绍“目前,该理论已经非常成熟,先后被列为国家重点科技支撑中文信息处理应用研究与系统开发项目、国家973计划项目、国家863计划项目及中科院知识创新工程等项目。实际应用的应用转换也在进行,针对垃圾短信,研究院早已研发出手机短信过滤方案,眼下正在针对电信应用做专门优化。他表示研究院愿意积极与运营商方面展开进一步的合作。”

萌汉药baby简介

丝袜制服福利

丝袜排行榜福利

夏夕福利图