【论文翻译未完成】翻给自己看的 A Neural Probabilistic Language Model
创始人
2025-05-29 08:24:26
0

学习路线:NLP经典论文导读(推荐阅读顺序)

原文:https://jmlr.csail.mit.edu/papers/v3/bengio03a.html

参考:论文阅读:  一种神经概率语言模型神经概率语言模型论文阅读:  一种神经概率语言模型

 

一种神经概率语言模型 

【为什么要叫神经概率? 】 

统计语言模型的目标是学习同一种语言下单词序列的联合概率函数。 这本质上是困难的,因为维数灾难:在模型上被测试的单词序列极大可能和训练阶段 看到的所有单词序列都不一样。 传统但非常成功的基于n-gram的方法通过将训练集中的非常短的重叠序列连接实现了泛化。

【为什么非常短的序列连接在一起会实现泛化? 】

我们提出通过学习词的分布式表示来对抗维度灾难。 (这种方法)允许每个训练句子给模型提供关于语义相邻句子的指数级别数量的信息。 根据刚才的表述而言,这个模型同时学习(1)每个词的分布表达式 (2)单词序列的概率函数。 模型得到了泛化是因为单词序列不会被看见,除非它是由和已被看见的句子中的词的相似( 有附近的表示 )的词组成的,它得到高概率。

【最后一句话没有翻译得特别理解】

训练那么大的模型(上百万个参数)在一个合理的时间本身是一个巨大的挑战。 我们介绍了为了概率函数而用了神经网络的实验,在两个语料库上, 提出的方法极大地改善了先进的n-gram模型并且提出的方法允许利用长文本。

tips:
joint probability function - 联合概率函数
sequences of words - 单词序列
intrinsically - 本质上
generalization - 泛化
propose to - 提出
a distributed representation for words - 词的分布式表示
sequence 和 sentence - 序列和句子
inform sb about sth - 给某人提供sth信息
an exponential number 指数数量级别的
semantically neighboring sentences - 语义相同的句子
in the sense of doing 表示前文内容
report on - 介绍了
take advantage of 利用

相关内容

热门资讯

三沙群岛探秘:深潜永乐环礁 +... 三沙群岛的永乐环礁宛如南海深处的秘境,拥有绝美的海底世界与纯净的海岛风光,是深潜与露营爱好者的天堂。...
云南参团游6天多少费用,建议收... 云南,这片神奇而美丽的土地,以其独特的自然风光、丰富的文化底蕴和诱人的美食吸引着无数游客的目光。那么...
九皇山自驾游攻略:探秘川西秘境... 九皇山自驾游攻略:探秘川西秘境,畅享绝美自然风光与独特民俗文化 川西,位于四川盆地的西部,因其独特的...
河南文旅投资集团助力席岭村乡村... 今年2月,河南文旅投资集团驻村工作队进驻嵩县陆浑镇席岭村,助力乡村振兴。 工作队驻村以来,创新提出...
日照这几家宝藏店,排队也要吃 日照这几家宝藏店,排队也要吃 一、巧克力渔家 来日照吃海鲜巧克力渔家是必去的地方!作为日照的老牌海鲜...
红烧鱼的制作艺术:一道家常美味... 红烧鱼,这道家喻户晓的中式家常菜,以其独特的口感和醇厚的风味深受大众喜爱。今天,我们将一起探索红烧鱼...
黄山导游联系方式,黄山五天四晚... 计划一场亲子旅行,总是希望能给孩子留下美好而深刻的记忆。当黄山与婺源这两个名字跃入眼帘时,那份对自然...
“千八线”虐哭99%驴友!11... 核心速览 何为“千八”? 路线全长:约120公里(实际穿越约45-75公里,分段选择) 核...
创富非洲读本丨“裁缝”炼钢 湖... 编者按:山海不为远,志合者共赴。6月12日至15日,第四届中非经贸博览会将在湖南长沙举行。作为对非贸...
郴州端午假期文旅市场“热”力十... 当端午的粽香遇上童趣的欢笑,郴州的山水间便铺开了一幅文旅融合的生动画卷。 今年端午节假期,我市文化旅...
凤阳鼓楼涉事企业变更董事长 凤... 天眼查App显示,近日,凤阳大明旅游发展(集团)有限公司发生工商变更,汪园颖卸任法定代表人、董事长等...
雅安一景区高空索道雨天有人悬停... 近日,有网友在社交平台发帖称,6月2日,雅安二郎山喇叭河景区高空索道有人下雨天被悬挂半空超10分钟。...
考生即将入住 扬州监管部门“紧... 近年,乡镇高三学子提前入住考点附近酒店,方便备战高考日渐普及。大家暂别熟悉的家庭、学校环境,饮食安全...
促湾区文旅繁荣发展,穗港旅游业... 6月5日上午,由香港中国旅行社及广州市旅游协会主办的“同心同行,同创未来”穗港同业交流推介会于广州市...
沉浸式再现中国古代都城!这座博... 汉魏洛阳故城遗址博物馆6月5日揭开神秘面纱,面向公众预约开放。这座以“中”“合”“同”为核心理念的国...
重庆纯玩四天三晚人均花多少钱?... 重庆,这座充满魅力的山城,一直以来都是旅游热门目的地。它独特的地理风貌,丰富的历史文化,还有那热情好...
云南参团6日游地图及路线,看完... 云南参团6日游全攻略:跟着小朵,玩转彩云之南,不踩坑! 嘿,小伙伴们,你们是不是也对云南那片神秘而...
漓江徒步:杨堤至兴坪 20 元... 在漓江杨堤至兴坪的徒步路线中,藏着中国山水的精华与 20 元人民币背后的绝美风景。本文聚焦避开旅行团...