紧接着,赵小兵教授从“深度学习”的角度进一步评析了人工智能目前的发展成果与局限。人工智能的发展也大体出现了三次高潮:(1)20世纪中叶:规则推理阶段;(2)20世纪80年代:机器学习阶段;(3)21世纪初:深度学习阶段。目前,人工智能在“感知”领域有所突破,但在“认知”领域仍步履艰难。深度学习的本质是“归纳”。基于多重非线性变换的神经网络结构,机器已经可以从现象(例如文本、语音、图像)中对数据的标识进行抽象和学习,在规则明确的领域甚至做得比人类更出色,但却不能进行演绎推理,也做不到像人一样去理解语言背后的内容。例如机器可以从海量图片中提取“猫”的向量特征并识别出“猫”,但如果输入“四条腿,有胡须”却无法建构“猫”的形象。再例如机器可以回答美国总统是谁,却不能回答美国总统昨晚为什么睡不着觉。因此,深度学习不是人工智能的唯一,而只是人工智能实现人类智能的一种手段。运用机器模拟人类学习行为仍然任重而道远。
在第三部分,赵小兵教授引用比尔·盖茨所说的:“语言理解是人工智能领域皇冠上的明珠”进一步与大家探讨人工智能面临的挑战与未来。赵教授指出,由于尚未能做到语言认知,当前自然语言处理的性能取决于训练数据的质量。但考虑到语言的多样性、歧义性与对背景知识的依赖性,一方面,基于相关统计的数据驱动方法面临着鲁棒性(robust)差,经不起干扰的困境,因此难以避免“一百个谎言变成真理”的现象。另一方面,像人类一样进行“小样本学习”是自然语言处理的另一个难点。因此,人工智能目前还无法达到人类水平。人工智能的未来在推理,未来机器理解的发展趋势在于统计与推理结合,归纳与演绎融合。
最后,赵小兵教授介绍了所在机构正在承担的重点课题与工作,包括少数民族语言分词技术测评、跨语言社会舆情基础理论与关键技术研究、中国少数民族语言使用国情地图构建及国情分析(1949-2017)、少数民族语言使用国情数据库建设、蒙汉双语刑事判决文书知识图谱建设、藏汉跨语言旅游领域信息抽取及知识库建设、藏汉跨语言文本剽窃检测研究等。她还介绍,下一步工作将涵盖我国少数民族语言及部分“一带一路”沿线国家语言机器翻译、跨语言海外舆情分析与预警平台、多语言语义知识库等项目。这些工作基于自然语言处理前沿技术,将服务国家重大决策,进一步推动我国语言与智能领域的创新与发展。