编码的三个主要特征 embedding技术介绍?
浏览量:1629
时间:2021-03-14 18:04:57
作者:admin
embedding技术介绍?
嵌入技术是一种利用低维稠密向量来表示对象的方法,使向量能够表达相应对象的一些特征,向量之间的距离能够反映对象之间的相似性。
作为深度学习的一个热门研究方向,它经历了从序列样本、物理图形样本到异构多特征样本的发展过程。此外,由于嵌入式技术具有较强的信息综合表示能力和较低的在线部署门槛,进一步加快了其在工业中的应用。
怎么形象理解embedding这个概念?
嵌入可以理解为降维,或者一种映射,在这种映射中,一些复杂且难以表达的特征可以相对地用数学方法或更多的计算方法来表达。例如,把单词变成一个向量,把数字(奇偶正反实数复合性质)变成一个n维矩阵。
T3中客户分类中的类别编码怎么设置的?
对于离散的特性,如大尺寸的ID,一个热编码将导致尺寸过大和训练困难。处理这类特征的最佳方法是将其嵌入到一个固定维的实空间中。
例如,对于用户ID,在一个大数据集中可能有数以亿计的用户ID。对于这些ID,我们可以将它们映射到64维空间。模型训练实际上是在64维空间中更新用户ID和相应的嵌入向量。这样,每个用户ID可以包含的信息被包括在64维实向量中。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。