游戏更新与推荐机器学习怎样发现你心爱的音乐：音乐个性化保举背后的科学道理

栏目分类

热点资讯

音乐趋势

你的位置：娱乐畅享网 > 音乐趋势 >

游戏更新与推荐机器学习怎样发现你心爱的音乐：音乐个性化保举背后的科学道理

发布日期：2025-01-11 07:18 点击次数：136

游戏更新与推荐机器学习怎样发现你心爱的音乐：音乐个性化保举背后的科学道理

本周一，正如其它每个周一，一亿多 Spotify 用户每东谈主皆收到了一个簇新的歌单。这个叫作念每周发现的歌单内搀和了用户从未听过然而可能会心爱的 30首歌曲。着力号称神奇。

我我方是 Spotify 的超等粉丝，对每周发现尤其青睐。为什么呢？因为我以为它懂我。它比我性射中的任何东谈主皆更明晰我的音乐试吃。我很兴盛每周它皆能欢腾我的需求，一如既往地保举一些我我方长久皆不会找到或知谈会心爱的歌曲。

关于那些两耳不闻窗外事的东谈主们，请允许我先容一下我的臆造好友：

[图片讲明: 我的 Spotify 每周发现歌单]

没念念到，在这方面我不是一个东谈主，不光是我对每周发现如斯沦落 – 悉数用户群体皆趋之若鹜。这股高涨使得 Spotify 重新养息了它的重点，并在基于算法的歌单上插足了更多的资源。

Dave Howitz: @Spotfiy 每周发现的歌单对我的了解进程险些屁滚尿流，纯属到就像一个也曾与我有过一谈濒死体验的前女友一样。

Amanda Whitbred: 当今 @Spotify 的每周发现对我仍是了解到如果它当今求婚，我也会说欢喜的地步了。

自「每周发现」在 2015 年第一次上线以来，我就伏击念念知谈它是怎样运作的（而且由于我是 Spotify 公司的迷妹，我心爱假装在那儿责任并量度他们的家具）。经过三周的荒诞Google，我终于满怀感德地赢得了一些幕后的学问。

是以 Spotify 到底是怎样见效作念到给每东谈主每周挑选 30 首歌曲的？咱们先来仔细看下其它的音乐事业是怎样作念音乐保举，以及 Spotify 是怎样更胜一筹的。

在线音乐甄选事业简史

早在千禧年之初，Songza 就开动使用手动甄选为用户提供歌单。手动甄选的道理即是所谓的音乐大家或者其他裁剪会手动挑选一些他们我方认为可以的音乐作念成歌单，然后听众可以径直拿来听。（稍后，Beats 音乐也选拔了相同的战术）。手动甄选着力尚可，然而由于这种模范仅仅纯手工挑选，形态模范也比拟浅显，它并不成关切到每个听众音乐试吃的高深各别。

跟 Songza 一样， Pandora 亦然音乐甄选事业范围的早期玩家之一。它使用了一个略为更高档的模范来代替给歌曲属性手工打标签。即世界在听音乐的时候，对每首歌曲挑选一些描写性的词语来行动标签。进而，Pandora 的才能可以径直过滤特定的标签来生成包含相似歌曲的歌单。

差未几归拢时间，一个隶属于麻省理工学院媒体实验室的名叫 The Echo Nest 的音乐信息机构，汲取了一个统统不同的高档战术来定制音乐。The Echo Nest 使用算法来分析音频和音乐的文本内容，以完成音乐识别，个性化保举，歌单创建和分析等。

终末，是 Last.fm 匠心独具，选拔了另一个沿用于今的战术。那即是应用协同过滤来识别用户可能心爱的音乐。稍后本文会张开筹划更多这方面的内容。

是以说既然其他的音乐甄选事业皆已毕了保举功能，Spotify 究竟是怎样操作我方的神奇引擎，来已毕甩出竞争敌手几条街的用户试吃默契度的呢？

Spotify 的三种保举模子

事实上 Spotify 并莫得使用什么单一的改变性保举模子，而是搀和了一些其他公司使用的最好的战术来创建他们我方唯一无二的强盛发现引擎。

Spotify 使用三种主要的保举模子来创建每周发现：

协同过滤模子（即 Last.fm 最早使用的那些模子）。责任道理为分析你和其他用户的行径。天然说话措置（NLP）模子。责任道理为分析文本。音频模子。责任道理为分析原始音频声谈自己。

咱们来具体看下这些保举模子是怎样责任的！

保举模子之一：协同过滤

最初先容下布景：当许多东谈主听到协同过滤这几个词的时候，他们会坐窝联念念到 Netflix，因为它是第一个应用协同过滤来已毕保举模子的公司之一。其作念法主若是使用用户提交的电影星级来盘算保举那些电影给其他雷同的用户。

自 Netflix 将其见效应用以来，协同过滤开动快速流传开来。当今不论是谁念念已毕一个保举模子的话，一般皆会拿它行动首次尝试。

与Netflix不同的是，Spotify 并莫得用户对他们音乐的星级评价数据。Spotify 所用的数据是隐形反映的，具体来说即是咱们在线听歌的歌曲次数，以致极他迥殊信息，诸如用户是否保存歌曲到个东谈主歌单，或者听完歌曲后是否接着探访艺术家主页等。

但什么是协同过滤，到底它是怎样责任的呢？底下用一段节略对话来作念一个大要的先容。

啥情况? 原本这俩东谈主内部每东谈主皆有我方的一些歌曲偏好 – 左边的东谈主心爱歌曲 P, Q, R 和 S; 右边的东谈主心爱 Q, R, S 和 T。

协同过滤系统进而应用这些数据得出论断，

“嗯。既然你俩皆心爱沟通的歌曲 – Q，R 和 S – 那么你们可能是雷同的用户。是以你们应该会心爱另一个东谈主听过然而你还莫得听过的歌曲。”

系统然后提议右边的东谈主去体验下歌曲 P，以及左边的东谈主去体验下歌曲 T。听起来够浅显吧？

然而 Spotify 具体是怎样具体应用这个倡导，来盘算基于百万级的用户偏好从而得出数以百万计的用户歌曲保举呢？

…矩阵运算，用 Python 库即可已毕

履行中，此处说起的矩阵是极其广泛的。每行皆代表了 Spotify 的一亿四千万用户中的一员（如果你也用 Spotify，那么你亦然这个矩阵中的一滑），而每一列则代表了 Spotify 数据库中三亿首歌曲中的一首。

然后，Python 库就开动跑这个漫长而复杂的矩阵解析公式：

盘算完成后，系统会生成两种类型的向量，在此分别定名为 X 和 Y。X 为用户向量，代表单个用户的音乐试吃。Y 则为歌曲向量，代表单支歌曲的特征。

当今咱们得到了一亿四千万个用户向量，每东谈主一个，还有三亿歌曲向量。这些向量的具体内容仅仅一些单独拎出来自身并无道理道理的数字，然而在后头进行比拟时会相称有用。

为了找到那些跟我相似试吃的用户，协同过滤系统会拿我的向量跟其他用户的向量作比拟，最终会找到那些跟我最相似的用户。关于 Y 向量，亦然相同的经由 – 你可以拿一首歌的向量与其他的歌曲向量作念比拟，进而找出哪些歌曲是跟你当今正在看的歌曲最相似。

协同过滤如实着力可以，然而 Spotify 深知再添加另外一个引擎的话着力会更出色。这就到了天然说话措置出场的时候了。

保举模子之二：天然说话措置

Spotify 汲取的第二个保举模子即是天然说话措置。这些模子的源数据，正如名字所示，即是一些普通的说话笔墨 – 举例歌曲的元数据，新闻著述，博客，和互联网上的其它文本等。

天然说话措置 – 盘算机领会东谈主类说话的才能 – 自己即是一个巨大的范围，平方通过热诚分析应用编程接口（API）来进行操作措置。

天然说话措置背后的具体道理超出了本文的筹划限制，然而在此本文可以提供一些顽劣的描写：Spotify 会在网上不绝爬取博客帖子以致极它音乐关系的文本，并找出东谈主们对特定的艺术家和歌曲的批驳 – 比如说东谈主们对这些歌曲时时使用哪些形容词和说话, 以及哪些其他艺术家和歌曲也会和它们放在一谈筹划。

固然我不知谈 Spotify 怎样措置他们握取的数据，然而我可以先容下 The Echo Nest 是怎样使用它们的。他们会把数据分类成“文化向量”和“最好考语集”。每个艺术家和歌曲皆少见以千计的逐日更新的最好考语集。每个考语皆有一个关系的权重，来暗意其描写的庞杂性（浅显说即是某东谈主可能会用该考语描写某个音乐的概率）。

[ “Cultural vectors”, or “top terms”, as used by the Echo Nest. Table from Brian Whitman]

然后，与协同过滤雷同，天然说话措置模子用这些考语和权重来创建一个歌曲的抒发向量，可以用来笃定两首音乐是否相似。很酷吧？

保举模子之三：原始音频模子

最初，你可能会问这个问题：

然而，Sophia，咱们仍是从前两种模子中赢得了这样多数据！为什么还要陆续分析音频自己呢？

额，最初要说的是，引入第三个模子会进一步晋升这个仍是很优秀的保举事业的准确性。但内容上，汲取这个模子还有另外一个次要指标：原始音频模子会把新歌磋议进来。

比如说，你的创作歌手一又友在 Spotify 上刚放上了一首新歌。可能它唯独 50 次听歌记载，是以很少能有其他听众来一谈协同过滤它。与此同期，它也在网上也莫得留住些许踪迹，是以天然说话措置模子也不会在意到它。运气的是，原始音频模子并不分袂新歌曲和热点歌曲。是以有了它的襄理，你一又友的歌曲也可以和流行歌曲一谈出当今每周发现的歌单内部。

好了，到了“怎样”的部分了。咱们怎样才能分析这些看起来如斯笼统的原始音频数据呢？

…用卷积神经集聚！

卷积神经集聚相同亦然撑持面部识别的时间。只不外在 Spotify 的案例中，他们被稍作修改以基于音频数据措置而不是像素点。底下是一个神经集聚架构的例子：

[Image credit: Sander Dieleman]

这个特定的神经集聚有四个卷积层，具体为图中左侧的宽柱，和右边的稍许窄些的三根柱。输入是音频帧的时频暗意，进而团结起来酿成频谱图。

音频帧会穿过这些卷积层，经过终末一个卷积层，你可以看到一个“全局临时池”层。该层在悉数时间轴上收罗数据，并有用盘算和统计歌曲时长内的学习特征。

措置完之后，神经集聚会得出其对歌曲的领会，包括估量的时间签名，曲调，调式，球拍及音量等特征。底下即是 Draft Punk 的 “Around the World” 30 秒片断的数据图。

[Image Credit: Tristan Jehan & David DesRoches (The Echo Nest)]

最终，对这些对歌曲要津特征的领会可以让 Spotify 来决定歌曲之间的相似度，以及左证用户听歌历史来判断哪些用户可能会心爱它们。

这些基本涵盖了为每周发现提供解救的保举功课经由所依赖的三种主要模子。

[ Cassandra instances]

天然了，这些保举模子也和 Spotify 其它更大的生态系统团结在一谈，其中包括应用海量的数据存储以及相称多的 Hadoop 集群来作念保举事业的扩张，使得引擎得以盘算巨型矩阵，源源不绝的互联网音乐著述和大皆的音频文献。

我但愿本文可以对你有所启发，而且像其时它对我一样好像激起你的风趣。怀着对幕后的机器学习时间的了解和谢忱之情，当今我将通过我我方的每周发现来寻找我心爱的音乐。

游戏更新与推荐 机器学习怎样发现你心爱的音乐：音乐个性化保举背后的科学道理

游戏更新与推荐机器学习怎样发现你心爱的音乐：音乐个性化保举背后的科学道理