网易首页 > 网易数码 > 正文

微软IJCAI2016演讲PPT:深度学习在语义理解上不再难有用武之地

0
分享至

(原标题:微软IJCAI2016演讲PPT:深度学习在语义理解上不再难有用武之地)

摘要:微软研究院在IJCAI2016第一天的Tutorial上讲述了自己将深度学习、深度神经网络应用于语义理解上的一些经验和收获。作为小娜和小冰的开发者,微软在自然预言语义理解上的造诣无疑是很高的。而早在一月就将其深度学习开发工具包CNTK开源的举动也表明微软确实希望促进人工智能的发展。这次就让我们通过Tutorial上演讲PPT的概览部分,看看微软在他们最擅长的语义识别领域会分享给我们一些什么样的经验。

我们将PPT的文字翻译直接放在了幻灯片内,有兴趣的读者可以点开大图查看,不过大家也可以直接观看我们在每张图后写下的注解,一样能帮你理解微软的意思。

微软首先介绍了深度神经网络的简要历史。经过了上图中所示技术爆发点,幻灭的低谷,生产平稳期,膨胀期望巅峰等几个阶段。终于迎来了新的高潮。

在2013年,深度学习成为了MIT评选的年度十大科技突破之一。

而对深度学习的学术研究也从2012年开始到2015年出现爆发式的增长。在NIPS 2015会议中集中爆发,典型的证据就是主会场内的相关研究参与人数有了巨大增长,相关话题的指导报告更是增加了100%还多。

2012年纽约时报的报道“科学家们在深度学习上看到了希望”被视为深度学习崛起的标志之一。

DNN是一种完全连接的深度神经网络,简单来说,先训练每个都含有一个隐含层的生产力模型,然后把它们组合成一个深度信任网络,然后添加输出并利用反向传播来训练DNN网络。

上图是微软在各种领域对基于深度学习的语义识别的应用。

今天微软要讲的这个指南的焦点,并非集中在语音识别或者图像识别上,而是语音文本的处理和理解,一共分为5部分

上图是一个需求分类问题的举例,比如输入一个问题:丹佛市中心的寿司店,但这个店属于餐馆,酒店,夜店,航班那个领域的店或者馆呢?这个是需要搜索引擎更加细化分类的。

上图给出了一个单神经元模型的原理,当输入一个X值后,函数最终会将其通过logistic回归进行分类,决定是否要给Y加上标签,并与事先准备好的标签核对。以此来完成学习的过程。

上图是单个的神经元模型,把一个数值转化为概率,然后把概率转化为一个非线性激活函数,再进行logistic回归。

在上图中,微软给出了训练模型的思路,由于是只有一个神经元组成的神经网络,因此方法比较简单,要训练的数据集是一组由二维数组组成的数对。

训练参数的过程,就是不断的更换w,使得损失函数最小。具体方式是使用随机梯度下降,将所有训练样本更新直到函数收敛。

实际问题基本不可能用单个神经元的网络就能解决。上图是一个多层神经网络的流程图,实际上也和目前绝大多数的神经网络结构类似。如果我们忽略下部的结构,只看输入层、最上面的一层隐含层和输出层,我们就会发现这正是一个单神经元神经网络的架构示意。而包含了下面的其他隐含层之后,就是一个多层神经元的结构了,将原始数据(词语向量)输入隐藏层中,经过参数w的投射生成新的向量,这个过程就称作特性生成。

可以看到,标准机器学习的过程同深度学习最大的区别,正在于特征训练的方式,传统的特征训练需要开发者手动提取特征,显得比较累。而深度学习可以自动从训练数据中学习到特征。显得灵活很多,不过代价就是函数优化和参数选择等的工作量会更重。

为什么要使用多个隐含层呢?毫无疑问的,适当增加隐藏层会让算法的效果更好。对特征的学习和转换也更灵活。类似深度学习用于图像识别时的像素 边缘 纹理 主题 局部 物体整体的过程。深度学习用于文本分析的时候也遵循了一个从字母 单词 词组 从句 句子 整个故事的过程。训练层数越多,对这些特征的描述就越精确。最终提取出来的效果也会越好。

DNN有许多中不同的表现形式,它们分别有各自的应用场景和优势。在此微软将其分为了三大类和六小类:

分类任务——通过X将Y分类标注

主要应用:多层感知机,卷积神经网络。

分级任务——通过计算X和Y的加权和进行分级。

主要应用:暹罗神经网络、深度语义相似模型

文本生成任务:由X的值生成Y

主要应用:序列对序列网络、记忆网络

在上图中,微软开始讲解一个具体的例子:深度语义相似模型(DSSM)。这种模型的处理方式是使用X和Y组成的文本流来计算语义相似度。方式是使用深度神经网络先在潜在语义空间建立一个x和y的两个特征向量。然后计算特征向量之间的余弦相似程度。

上两图是一个具体的原理图。表现了计算相似语义空间的方法,而最后一张图给出了一个基于此方法的整个卷积DSSM网络的示意图和原理说明。

总结:

深度学习曾被认为不适合用来做语义理解。主要是因为词语之间的相似程度与其含义的相似程度并无太大关系。词表的出现一定程度上解决了这个问题。而现在,深度学习在语义理解上的障碍已经基本不存在了,微软此次提供的思路也是一个很好的参考。相信应用上了深度学习的语义理解程序的表现将会有极大的提升。

相关推荐
热点推荐
30秒|四川自贡暴雨大风加冰雹 宵夜摊雨棚被大风吹翻

30秒|四川自贡暴雨大风加冰雹 宵夜摊雨棚被大风吹翻

封面新闻
2024-04-16 11:03:04
山西运城两姐妹已失联两天 当地正多方紧急寻找

山西运城两姐妹已失联两天 当地正多方紧急寻找

奔流新闻
2024-04-15 18:17:24
“低配置舰”下岗职工再就业,中国海警818型/818B型巡逻舰的故事

“低配置舰”下岗职工再就业,中国海警818型/818B型巡逻舰的故事

顾氏造船厂厂长
2024-04-16 08:00:15
效仿韦世豪!崔康熙红牌标准公布!沪媒:不听劝,为啥不能给红牌

效仿韦世豪!崔康熙红牌标准公布!沪媒:不听劝,为啥不能给红牌

建哥说体育
2024-04-15 21:53:16
不敢信!大S居家照曝光,具俊晔深夜投喂泡面,太过寒酸!

不敢信!大S居家照曝光,具俊晔深夜投喂泡面,太过寒酸!

柠檬有娱乐
2024-04-15 15:02:54
马英九这次来大陆,带来了一个“秘密消息”,信号很明确

马英九这次来大陆,带来了一个“秘密消息”,信号很明确

三姐聊时闻
2024-04-16 00:47:46
德总理访问中国,外长被留在国内,美媒:美国最大的敌人不是中俄

德总理访问中国,外长被留在国内,美媒:美国最大的敌人不是中俄

刘勇教授
2024-04-16 10:22:35
生死战!ESPN预测勇士国王附加赛胜率:勇士45.8% 国王54.2%

生死战!ESPN预测勇士国王附加赛胜率:勇士45.8% 国王54.2%

直播吧
2024-04-15 17:24:18
普京作出大调整,俄罗斯开始适应中国节奏,远东二条铁路不能再拖

普京作出大调整,俄罗斯开始适应中国节奏,远东二条铁路不能再拖

绝密探照灯
2024-04-15 15:29:51
这一夜,满身赘肉的张雨绮,把她的“中年尴尬”展现得淋漓尽致

这一夜,满身赘肉的张雨绮,把她的“中年尴尬”展现得淋漓尽致

娱乐圈笔娱君
2024-02-06 18:25:43
《跑男12》官宣定档,郑恺无缘C位白鹿升一姐,杨颖自荐飞行被拒

《跑男12》官宣定档,郑恺无缘C位白鹿升一姐,杨颖自荐飞行被拒

叶二娱评
2024-04-15 12:58:10
绝不让俄罗斯孤独奋战!5国联合宣布“出战”,北约终于知道怕了

绝不让俄罗斯孤独奋战!5国联合宣布“出战”,北约终于知道怕了

绝对军评
2024-04-12 00:15:02
文章40岁断崖式衰老,跟大女儿像爷孙,大女儿爱美爱做饭

文章40岁断崖式衰老,跟大女儿像爷孙,大女儿爱美爱做饭

红大娘娱乐
2024-04-15 01:10:48
浪5官宣全阵容:杜华又杀回来啦,还带了个杨天真!这下可热闹了

浪5官宣全阵容:杜华又杀回来啦,还带了个杨天真!这下可热闹了

娱乐圈酸柠檬
2024-04-16 03:05:51
上海,黄浦。李女士因急需用钱,拿了160万元的存单去取钱,她将存单递进窗口说明将钱全部取出来

上海,黄浦。李女士因急需用钱,拿了160万元的存单去取钱,她将存单递进窗口说明将钱全部取出来

美食阿鳕
2024-04-16 07:20:08
金像奖上,baby的尴尬被展现的淋漓尽致,离开黄晓明她真的不行了

金像奖上,baby的尴尬被展现的淋漓尽致,离开黄晓明她真的不行了

七阿姨爱八卦
2024-04-14 22:04:18
黑龙江女网红和母亲被杀害:凶手,不止婚外情男友

黑龙江女网红和母亲被杀害:凶手,不止婚外情男友

刘娜
2024-04-15 12:40:20
爸妈在家我们是兄妹,爸妈不在家我们是情侣

爸妈在家我们是兄妹,爸妈不在家我们是情侣

笙笙之歌
2024-04-12 21:38:16
“下辈子不来了”,评论区49万留言,揭露中国人最深的“隐痛”

“下辈子不来了”,评论区49万留言,揭露中国人最深的“隐痛”

第一心理
2024-04-07 19:21:46
好迷茫!广东一女子失业后还被HR骗:不争气地流下了眼泪

好迷茫!广东一女子失业后还被HR骗:不争气地流下了眼泪

唐小糖说情感
2024-04-13 12:22:57
2024-04-16 14:16:49

头条要闻

菲总统:不会让美军使用更多菲律宾军事基地

头条要闻

菲总统:不会让美军使用更多菲律宾军事基地

体育要闻

他被杨瀚森"打爆" 却有望成为NBA状元?

娱乐要闻

44岁霍建华街头骑单车,状态真好!

财经要闻

同比增5.3%!中国一季度GDP超29万亿

科技要闻

特斯拉吃老本,马斯克裁14000人,刚开始?

汽车要闻

广汽本田极湃2溜背造型 本田人间清醒!

态度原创

游戏
手机
旅游
数码
公开课

曝PS5Pro在内部被视为高端机型 两款机型会同时销售

手机要闻

iQOO Z9系列参数提前看,三款机型个个都能打

旅游要闻

“平替旅游”正让全球年轻人“疯狂”

数码要闻

小米米家智能隐形晾衣机上架:36W 高亮照明灯,众筹价 999 元起

公开课

反抗痛苦,最好的方式就是读书

无障碍浏览 进入关怀版
×