您的位置:首页 > 大数据 > 人工智能

人工智能屏蔽关键词的新思路

2010-01-24 13:24 148 查看
    网络舆论导向是我国政府的首要任务(huboss 说的),网络舆论导向的首要任务是屏蔽关键词,现今的关键词屏蔽力度非常不够,这是软件设施的问题,直接原因就是程序的不智能。

     虽然政府设置了很多关键词,但还是有很多人使用各种手段来绕过关键词系统,用各种奇怪的句法来来表达自己要表达的意思,其手段大概有以下几招:

    一、打散词句,在呈连续状态的词句打散,嵌入各种符号或者与词句意思不相关的词语。比如:

            “胡  景 涛”

            “胡(草)景(靠)标”

            “人(河蟹)大(大闸蟹)代(火星蟹)表”

            “草#泥&马”

   二、同音字变换,将词语用同音字来表示,比如:

          “糊 景 韬”

          “瘟 加 包”

        

   三、拼音法,用拼音或拼音缩写表示词句,比如:

        “wo cao ni ma”

        “wen an”

        “杨j”

   四、典故法,用典故来表示,这种方式就连人类都难以识别,能够识别这类词语必须有必要的知识(知道相关典故)

        “河蟹带表”

        “胡八荣”

        “正龙画虎”

        “抢尸部队”

        “跨省”

    五、杂交转换法,同音、近意、形似。。。多次杂交而成,这种人类方式非常难识别,对智力要求太高。

         “硬盘人”       

          转化过程:         外地人 —> wd人 —> west digital人 —> 西部数据人—>硬盘人

         

       这些手段,简单、直接、易懂、难屏蔽,充分体现了我国广大人民群众的智慧力量,面对这样的高难度词句现在的识别程序很难识别出来。这是被技术所局限的,现在人工智能还很弱。

       面对这些非标的语句和表示方法,就连人类都难以判断,更别说现在的智能程序了。既然程序不能识别非标准语句,那么我们可以把网络语法规范化 ,甚至全面的构建一套新的语法标准,在一切媒体(网络、电视、教材、报纸、书本。。。。。。)上做硬性要求,凡是具有非标准语句的文章,一概不批准,一概发不出。

       面对广大人民,我们有充分的理由这样做,因为建立一套逻辑严密的语法系统对于一个国家、民族的发展意义非常之大,对科技、文化都有着很大的促进作用,所以不用考虑太多来自传统的压力(专家有招,我不详叙)。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  网络 任务