TOP榜写作榜手机小说

最近更新新书入库全部小说

快眼看书 >> 穿越:2014 >> 第203章 学术工具人get√

第203章 学术工具人get√

在这种概率潜在语义分析模型中,多义词被归入不同的主题下,而同义词被归入同一主题下。

这样可以避免同义词和多义词对文本相似度计算的影响。

然而,概率潜在语义分析模型的参数随着文档数量的增加而线性增长。

很容易出现过拟合和泛化不良。

这种情况很大程度又是因为维度爆炸。

因为过拟合只在高维空间中预测相对少的参数和低维空间中预测多参数这两种情况下发生。

一个为了避免维度爆炸而提出的模型却出现了维度爆炸。

多少有点悲剧。

事实上,并不是只有上述两个模型提出来。

这之后还有很多研究团队都在从模型层面的做了不同程度的尝试。

但这些模型要么是南辕北辙,不利于降维。

要么是在降维的同时又带来了新的问题。

总之,这些模型都有各种行不通的地方。

尽管伊芙·卡莉相信林灰是个天才。

但伊芙·卡莉觉得林灰也很难在前人无数次尝试的情况下找到一种全新的能够规避维度爆炸的低维模型。

伊芙·卡莉考虑了很久也没想通林灰究竟表达的是什么意思。

伊芙·卡莉把她刚才她的思考过程对林灰进行了阐述。

林灰听得很认真。

听完之后,林灰笑道:“你都想到了这么多种高维向低维转化的情形。

而且先前你也提到了机器识别文本时为了要机器识别自然语言往往将自然语言数值化。

而后为了将这些数值进行属性区分进一步进行了向量化。

既然你能明白这些,那你就应该知道涉及到自然语言处理方向的问题之所以很容易出现维度爆炸很大程度是因为原始数据就维度极高。

这种情况下我们为什么不直接从源头上解决问题对原始数据做些文章呢?”

听到林灰这话,伊芙·卡莉似乎灵魂深处被触动了一般。

伊芙·卡莉颤声道:“你的意思是说,直接对原始的高维数据进行低维化处理?

处理得到低维化数据之后,在架构模型进行语义文本相似度分析?”

和聪明人说话就是比较省时省力。

林灰想要表达的差不多就是这个意思。

现在这个时空常用的编码手段常用的还是1hot编码来说吧。

这种编码虽然再相当长的历史时期内发挥了积极作用。

但这种编码也经常带来很多麻烦事情。

前世往后几年的话,词向量按照基本都是通过分布式向量进行编码。

分布式编码相当于将原始数据投射到了一个较低维度的空间。

如此一来将原始数据从稀疏的高维空间压缩嵌入到较低维度的向量空间中。

这对于后续的处理无疑是很有帮助的。

当然了投射不是说投射就投射。

还得经过神经网路学习的训练。

至于怎么训练?

这就是纯粹技术上的事情了。

前世,词向量的分布式表示还有一个专有名词叫做词嵌入。

虽然林灰现在跟伊芙·卡莉所说的内容已然涉及到分布式词向量的部分原理。

但林灰倒也不怕伊芙·卡莉剽窃想法。

毕竟他说的只是一部分原理。

选择性的真相有时候比谎言更具误导性。

至于伊芙·卡莉能从林灰这获得多少信息,主要取决于两人的磨合程度。

其实林灰挺希望有朝一日能全部告诉伊芙·卡莉的。

因为伊芙·卡莉能够获悉全部信息的话只有一种情况。

那就是她甘愿充当林灰的工具人。

对自己的工具人自然没必要隐瞒什么。

林灰也急切需要一个纯粹的学术方面的工具人。

毕竟科研什么的能指点下方向收获论文才是最理想的。

过于深入其中的话,未必会变强,但一定会变秃。

眼前的伊芙·卡莉聪明一点就透领悟性强。

伊芙·卡莉年轻有激情,这可优秀准科研人最应该具有的素质。

最关键的是伊芙·卡莉似乎很单纯,很好骗。

这么单纯的姐姐。

不把她忽悠来肝论文似乎是不应该啊……

似乎是不用那么麻烦。

事情比林灰想象的顺利。

跟伊芙·卡莉深入聊了一会。

(ps:……省略好多字,以后有时间慢慢补充吧,补充的不算计费字数)

伊芙·卡莉似乎是下定决心一般。

鼓起勇气对林灰说道:“如果,我是说如果可以的话,我能做你的助手么?”

听了她这话,林灰似乎很犹疑的样子。

伊芙·卡莉也知道她这个请求有点冒犯。

尽管伊芙·卡莉动起这个念头有点仓促。

但伊芙·卡莉相信她内心做出的选择。

和林灰的谈话渐渐深入,伊芙·卡莉一时间似乎接触到了一个崭新的世界。

来的路上,伊芙·卡莉就感觉到林灰对他无言的呼唤:“你渴望推开那扇门么?”

此次和林灰交流,听到了林灰刚才的话语,伊芙·卡莉似乎亲眼目睹了林灰推开那扇门一般。

能同林灰一起推开那扇门的机会伊芙·卡莉自然不会放过。

看见林灰似乎很迟疑,伊芙·卡莉忙道:“我愿意签订协议,我会对你的研究成果严格保密的……”

伊芙·卡莉接着道:“我也不需要科研经费……”

一个远涉重洋万里之外赶来的学者态度恭谨到如此这般。

林灰如果不答应的话似乎显得很不尽人情。

林灰果断答应了伊芙·卡莉的请求。

协议肯定是要签的,林灰不想成果被窃取。

但科研经费以及相应报酬还是要照发的。

员工可以有用爱发电的念头。

但boss却不能真的让员工用爱发电。

那样很容易原地暴毙的。

林灰和伊芙·卡莉都有缔结学术方面合作协议的意愿。

在这种情况下,事情进展的很顺利。

林灰和伊芙·卡莉很容易就缔结好了协议。

当然,之所以能够如此顺利地缔结学术方面的合作协议除了林灰和伊芙·卡莉都有意向之外。

也是得益于这个时空世界上关于学术合作方面有一套专门的标准。

这个时空,世界上各国除了涉及到保密项目的学术方面的合作依旧延续传统惯例之外。

喜欢穿越:2014请大家收藏:(www.kuaiyankanshu.org)穿越:2014快眼看书更新速度全网最快。

穿越:2014最新章节 - 穿越:2014全文阅读 - 穿越:2014txt下载 - 猪熊的全部小说 - 穿越:2014 快眼看书

猜你喜欢: 重生之投资时代驭房之术这个导演很靠谱我有一个人才市场不要和我谈钱人到中年离婚:从庄园系统开始这个医生很稳健女主从书里跑出来了怎么办我的女友来自青丘反盗墓:开局吓跑摸金校尉基地签到三年,成为全球特种之父从手机开始的平价商业帝国让你拍宣传片,怎么都来参军了?感恩今生我有种植空间未来黑科技:从1993开始崛起带着仓库当队长金手指拍卖会龙的礼物我的蓝领生涯
完本推荐: 明克街13号全文阅读重生1977年从知青开始全文阅读相亲相出个总裁妹妹全文阅读我成了云养男友全文阅读脑海带着一扇门全文阅读逆袭1988全文阅读仙门走出的男人全文阅读穿越四合院里做倒爷全文阅读我和崇祯成了合伙人全文阅读娱乐之演员全文阅读养成系黑科技神豪全文阅读我真不想跟神仙打架全文阅读都市超凡医神全文阅读好莱坞拳王全文阅读道观养成系统全文阅读四合院:这个许大茂会打架全文阅读重返1995全文阅读闪耀互联网时代全文阅读变成血族是什么体验全文阅读我在漫威有块地全文阅读
同类新书: 直播:贫道云游全球传教仙法人在桃花源,养龙被向往曝光了开局绑定神豪系统系统让我别闲着神秘复苏之地狱轮回工地那些事大巨星奶爸反派:人在书中,女主人设全崩了致富从1978开始极黑之气从偷渡界域开始反攻怪异重生1977年从知青开始随意飘摇海上花月圆开局顶流的我怎么会糊重生从表白校花开始直播:开局获赠大白蛇闪耀互联网时代画坛全能怪咖随身空间之无限人生

穿越:2014最新章节手机版 - 穿越:2014全文阅读手机版 - 穿越:2014txt下载手机版 - 猪熊的全部小说 - 穿越:2014 快眼看书移动版 - 快眼看书手机站