【人民报消息】中新网2月18日中国科学院声学所把网络过滤技术用于“法轮功内容审查系统”(中国科技日报宣称其技术水平在汉语语句理解方面达到国际领先水平)的消息报导后,我给声学所参与了这个系统开发的有关人员打了电话,试图弄明白他们是怎么把不可能实现的系统推出来的。 这项实际上属于通用语义立场判断系统的网络过滤技术,其基础是HNC自然语言处理技术(国家“973”计划项目G1998030506)。该技术以中科院声学所黄曾阳研究员创立的概念层次网络(简称HNC)理论为指导。HNC理论认为:自然语言理解的本质是概念联想脉络激活、扩展、浓缩、转换与存储的全过程运作。换言之,这一处理方案,使计算机能够理解自然语言的概念,在“懂”的基础上完成对自然语言的各种处理。该技术在汉语语句理解处理方面居国际领先水平(注意,这里指的是HNC技术,不是“法轮功内容审查系统”)。 我虽然不是什么专家,不过这个“法轮功内容审查系统”的描述实在是荒谬的可以,特别是竟然声称可以进行意识形态过滤,很想听听研制者是怎么解释的。电话打过去,我提出了我认为这个系统是不可能实现的理由。 一个语言概念识别系统,必须对被识别的系统有深入的理解。而对一个完整理论体系的理解,会带有研究者非常强烈的主观色彩,即不同的研究者会得出完全不同的结论。因此,采用那一种理解是最困难的。至于编程部分反倒是最简单的了。因此,在中国当前学术研究受政治干扰,基本没有研究自由的情况下,对世界重大的哲学宗教体系的研究是很落后的。比如中国宗教研究所所长就曾撰文指出对神的信仰是很可笑的(这也叫宗教研究?)。这就注定了在目前,就意识形态而言,语言概念识别系统只能在句子和段落的水平上进行最原始的识别,也就是比关键词过滤稍微好一点吧。这个识别系统当前在意识形态方面的有效应用领域是极其有限的。 当然人是最不能承认自己的研究成果是一堆废物。一位参与研制的人士很专业的和我谈起计算机语义识别的原理,用了很多我不懂的术语。我直截了当地告诉他,任何计算机系统,在当前只能是对人的识别的拙劣模仿,特别是在意识形态上(象棋这类只牵涉到机械步骤的除外)。因此,在让计算机识别前,得有人先来识别,由人喂给计算机一个标准。问题是,谁来定这个标准,谁有能力给任何一个理论体系定一个量化的标准?在我重复了三遍以后,这位终于承认这个问题超出了他的理解能力。 这还是对已经成熟了的理论体系的研究。而法轮功问题更有其独特性。最大的和这个审查系统有关的特点是,法轮功的教导,和江集团在镇压时所说的法轮功的教导完全是风马牛不相及的。因此,在建立“概念”时,第一步就遇到困难:是建立法轮功自己的概念呢,还是建立中共喉舌强加给法轮功的概念?如果使用后者,那就封不了法轮功的信息,如果用前者,那所有相关人员就必须下功夫认真研究法轮功的书籍和文章。而今天在中国,可以说根本就没有关于法轮功的研究,任何研究都不能超出官方的口径。就凭声学所这些人能研究出个什么名堂?不要说声学所,就是社科院又怎么样?其结果会是什么呢?可能有人因此而知道了法轮功的真相,这可和开发者的初衷大相径庭了。还有一种可能,就是把研究者逼上绝路。 大凡人都不愿意承认自已在有意识的做坏事,所以总要找个冠冕堂皇的理由。所以警察就闭上眼睛说自己在执行法律,所以写文章的只能对政府告诉他们的其实并不属于法轮功的“理论”来加以“批判”,他们可以不用去研究真正的法轮功是怎么回事。而要做“概念分析”,就得真的知道法轮功教人的是什么。而当他们搞清楚法轮功其实是教人做好人,而不是政府说的教人“自焚”“杀人”时,就不再有任何理由为自己的行为辩解。也就是说,他们必须明明白白的做坏人,明明白白的知道自己在助纣为虐,明明白白地把良心出卖给魔鬼。如果这个人道义尚存,那不是让他一辈子背上良心的重负?那不是把他逼上绝路? 至于产品本身,大概就是能识别一些观点和表达都非常明确的句子和短段落。再就是骗骗中新社记者那样的低能儿和“评审委员会”的官僚们,再多花一点人民的血汗钱。当然,也有可能由政府出面强迫各单位购买这一伪劣产品。不过,赚这种昧良心的钱是要还的,要还的就远远不止是这点钱了。
|