最新網際網路文章

Image credit: Engadget

YouTube 总是能推荐好视频给你?原来都是机器学习的威能!

推荐视频竟然占到总观看时间的 70% 之多。

Andy Yang
2017 年 11 月 2 日, 傍晚 07:03
Engadget
今天 Google 在一场以机器学习为主题的媒体聚会中,很难得地为我们揭露了一点 YouTube 背后的人工智慧是如何演进,并且找出好的视频来进行个性化的推荐。机器学习影响让推荐视频在观看时数的占比于三年内提升了三倍之多,目前已经占总观看时数的 70%(剩的 30% 大多是 embed),YouTube 首页每天都要为个别的观众推荐高达两亿支的视频。

对 YouTube 来说,视频推荐的困难主要有三点: 首先,YouTube 每分钟都有超过 500 小时的新视频被上传,如何理解每个视频的内容,与它们与其他视频的关系,是资料处理的一个挑战。其次,观看者的兴趣是持续在变动的,YouTube 要能跟上使用者的新兴趣,找出比使用者期望更抢先一步的推荐。最后,因为每个人的习惯都不同,所以训练资料的模型有很大的噪点。在这部份 YouTube 会收集你是否看完一部视频或是否按赞做为正面的反馈,而按不喜欢或提出跳出,则是会被视为负面的反馈。无论正面负面都会进一步做为了解个人习惯的方式。

具体来说,找出推荐内容利用的是 Google 在 2015 年推出的 TensorFlow,共分成两层。第一层是「候选生成模型」,利用你的观看历史、搜索历史、和一些个人资料(例如性别、年龄),从数以百万计的视频中,选出数百个在当下最符合你有可能感兴趣的视频内容;之后再将这数百个视频送入第二层的「排名模型」中,进一步用机器学习对视频和观看者的特征做比对,最后选出数十个视频推荐。所有的这些过程都在你重新整理网页的过程中进行完毕,实在是相当了不起呢。

对 YouTube 来说最大的挑战,是如何避免「大者恒大」的效应。高流量的视频在模型中有很多变数都会占有优势,使它们更容易出现在推荐视频之中,而小流量的视频就难以获得这样的注意。YouTube 持续纳入更多的考量指标来将每位观众做更细微的区分,让分众更精确,并指出每日推荐的视频总数还在持续上升,表示机器学习有挖出愈来愈小众的视频来。

最终,YouTube 的目标是让你可以尽量多看,这样 YouTube 和内容创作者才能多赚。下次大家看到 YouTube 的视频推荐时,可以注意一下它有没有变得更聪明喔!