想你所想：推荐系统团队建议获胜策略-电子工程世界

在应对重大行业挑战方面拥有大量成功经验的NVIDIA 专家分享了打造出色推荐系统的制胜诀窍

“三连胜”之战已经到了最后的冲刺关头。

在截止时间前五分钟，这支团队提交了竞赛作品，这是今年第三次也是难度最高的一次推荐系统数据科学竞赛。它叫做 RecSys，是计算机科学一个相对较新的分支，它催生了机器学习领域常用的应用程序之一，这一程序帮助数百万人找到他们想看、想买和想玩的内容。

该团队共使用了六个 AI 模型，达到了比赛规定的 20 千兆字节上限，所有这些模型都是根据他们研究 7.5 亿个数据点的经验精挑细选出来的。这次比赛有一项不同寻常的规则，要求模型必须基于一个云端 CPU 的单一内核运行，并且运行时间不能超过 24 小时。

他们按下了提交按钮，静静等待。

23 小时 40 分钟后，一封电子邮件送来捷报：他们位列榜首。

紧扣截止时间

根据 6 月 28 日正式宣布的比赛结果，这支由七人组成的NVIDIA 参赛团队第二次赢得ACM RecSys2021 挑战赛。

“这封电子邮件的到来可以说是紧扣截止时间 – 如果再晚 20 分钟，我们就超出 24 小时的运行时间了，”Chris Deotte 说道，他是参赛小组的成员之一，也是被视为线上数据科学界的奥林匹克的卡格尔比赛的大师级人物。

“我们当时真的很紧张，”BenediktSchifferer说，他是帮助设计NVIDIA Merlin框架的团队成员之一，该框架可以帮助用户快速建立自己的推荐系统。

GPU 本可以在很短的时间内完成推理工作。这支团队中常驻巴西的卡格尔比赛大师 GilbertoTitericz表示，让推理工作去适应 CPU 核心“就好像回到了远古时代”。

事实上，比赛一结束，该团队就展示了在CPU核心上花费近24小时的推理工作，在单个NVIDIA A100 Tensor Core GPU上运行只需7分钟。

在每天 4 千万个数据点中找出推荐项

在比赛中，Twitter 在 28 天内每天向参与者提供数百万个数据点，并要求他们预测用户会点赞或转推哪些推文。这是这一针对 RecSys 的领先技术会议发起的行业实力挑战，吸引了来自Facebook、Google、Spotify 等公司的优秀工程师。

图注：RecSys挑战团队的部分成员（从左上角开始，按顺时针次序依次为）：Bo Liu、BenediktSchifferer、GilbertoTitericz和 Chris Deotte。

这个学科领域真的很难，但也非常实用。推荐系统为我们的数字经济提供发展动力，通过比传统搜索更快、更智能的方式提供建议。

行业挑战赛有助于推动这一领域的发展，让每个人都能从中受益，不论他们是在为配偶寻找完美的礼物，还是尝试在网上寻找一位老朋友。

五个月，三连胜

今年早些时候，NVIDIA 团队在Booking.com 挑战赛的 40 支参赛小组中拨得头筹。他们使用数百万个匿名数据点来准确的预测了欧洲度假者最终将选择前往的城市。

今年 6 月，另一项顶级 RecSys 大赛SIGIR 电子商务数据挑战赛设置了更高的门槛。

信息检索特别兴趣小组 SIGIR 的年度会议吸引了来自阿里巴巴和沃尔玛实验室的专家。其 2021 年挑战赛提供了 3700 万个在线购物会话的数据点，并要求参赛者预测用户会购买哪些产品。

由于这场比赛与 ACM RecSys挑战赛的时间重叠，NVIDIA 团队不得不兵分两路，各有侧重地参与不同的比赛。一些团队成员在此压力下正埋头为 ACM RecSys 会议撰写论文。

“快攻”艺术

其中一只NVIDIA团队共包含五名成员，分别身处巴西、加拿大、法国和美国在每个排行榜中这只团队均排名第一或第二。能取得这样出色的整体表现，主要有两个因素。其一，他们在 Transformer 模型上下了很大功夫，这些模型是为自然语言处理开发的，并越来越多地被 RecSys所采用。其二，他们深谙轮班工作的工作方法。“在一名成员将要入睡时，另一名身处不同时区的成员就可以接手工作，”Merlin 团队负责人 Even Oldridge说。

“在一切顺利时，这种做法非常有效，我很惊讶我们在过去一年中取得的成就，这不但培养了我们的内部知识，也树立了我们在 RecSys 社区中的地位，让我们能够在 5 个月内赢得三场重要比赛。”

尊重用户隐私

这项比赛要求模型在对用户没有任何背景了解的情况下对用户进行预测，参赛者对于用户的所知仅限于其当前浏览会话。

位于圣保罗的领导 NVIDIA SIGIR 团队的 Merlin 资深研究员 Gabriel Moreira表示：“这是一项重要的任务，因为有时用户希望匿名浏览，并且一些隐私法限制了对于用户历史信息的访问。”

这场比赛标志着该团队首次在挑战赛的关键部分只使用 Transformer 模型。Moreira 的团队致力于让每一位 Merlin 客户更轻松地获享庞大的神经网络。

从三连胜到四连胜

6 月 30 日，NVIDIA在 RecSys 挑战赛取得四连胜。行业基准组织 MLPerf 宣布，NVIDIA及其合作伙伴在其所有最新训练基准测试中均创下新纪录，其中包括一个有关推荐系统的基准测试。

参赛团队描述了他们取得的成果——即在不到一分钟内训练基于 14 个NVIDIA DGX系统的推荐系统，与一年前提交的成果相比，速度加快了 3.3 倍。

分享经验心得

这些竞赛激发了新技术的创意，这些新技术被纳入像 Merlin 这样的RecSys框架，以及NVIDIA 深度学习学院所拥有的相关工具、论文和在线课程。以达到最终目标：帮助每个人取得成功。

在采访中，NVIDIA 的 RecSys 专家自由地分享了他们的技术诀窍 – 一半是艺术，一半是科学。

关于如何打造出色RecSys的专业小贴士

一种最佳实践是使用多种模型，并使其协同工作。在 ACM RecSys 挑战赛中，团队同时使用了树状和神经网络模型。一个阶段的输出成为了下一个阶段的输入，这一过程称为推叠。NVIDIA 卡格尔比赛大师团队的新成员 Bo Liu 表示：“单个模型可能会因为数据错误或收敛问题而出错，但如果把几个模型结合起来，那么力量就会无比强大。”

在线结识Recsys专家

7 月 29 日，可以在线结识来自 Facebook、NVIDIA 和 TensorFlow 的RecSys专家，进一步了解如何创建出色的推荐系统。

关于 NVIDIA

NVIDIA1999年发明的GPU驱动了PC游戏市场的增长，并重新定义了现代计算机图形、高性能计算和人工智能。NVIDIA在加速计算和AI领域的创举正在重塑交通，医疗健康和制造业等价值数万亿美元的产业，并推动了许多其他产业的增长。

关键字：NVIDIA 引用地址：想你所想：推荐系统团队建议获胜策略

上一篇：NVIDIA从云端到边缘在推理方面取得突破实现对话式AI
下一篇：Pure Storage Evergreen创新订阅服务迈向全新里程碑

推荐阅读最新更新时间：2024-11-17 16:54

英伟达Orin一旦「有事」，国产自动驾驶芯片谁能替代？

自动驾驶会有被“釜底抽薪”的风险吗？ “釜”，是AI技术迭代、智能汽车能力进化。 “薪”，则是底层最基础的高性能AI芯片。更直白地说，就是目前英伟达统治自动驾驶芯片市场的Orin。高端GPU的变故出现后，“谁能替代英伟达Orin”，成了眼下必须关注的问题。英伟达Orin，真就这么关键？目前来看，英伟达Orin无论在技术先进性、性能指标，还是量产交付能力，的确是独一份。从性能上来看，Orin采用7纳米工艺，由Ampere架构的GPU，ARM Hercules CPU，第二代深度学习加速器DLA、第二代视觉加速器PVA、视频编解码器、宽动态范围的ISP组成。同时引入了车规级的安全岛Sa

[汽车电子]

<font color='red'>英伟达</font>Orin一旦「有事」，国产自动驾驶芯片谁能替代？

英伟达 RTX 3090 Ti 经销商定价曝光：约 2.2 万元起

1 月 16 日消息，英伟达在 CES 2022 上发布了最新的 RTX 3090 Ti 旗舰显卡，但没有公布售价和开售日期。　　据 VideoCardZ 得到的消息，该卡已被分销商和一些零售商列出，定价远高于预期，价位在 3571 美元（约 22711.56 元人民币）至 4497 美元（约 28600.92 元人民币）。　　其中一张截图显示了索泰已经上市的 RTX 3090 显卡的定价，价格为 2390 欧元（约 17375.3 元人民币）。这意味着来自同一分销商的最便宜的 RTX 3090 Ti，价格比 RTX 3090 高出了 30%。　　RTX 3090 Ti 配备 10752 个 CUDA 核心和

[手机便携]

<font color='red'>英伟达</font> RTX 3090 Ti 经销商定价曝光：约 2.2 万元起

英伟达等巨头入局机器人行业人形机器人产业进入快车道

巨头们正纷纷涌向初创Figure，准备投入6.75亿美元以推动人形产业的发展。该公司正致力于研发一款名为Figure01的高度人形机器人，其外观和动作与人类极为相似，预示着人形机器人产业的爆发即将到来。近日，全球科技巨头宣布，将于3月举办名为GTC2024的大会。届时，该公司将发布在算、生成式AI和机器人技术领域取得的突破性成果，并将展出25款机器人，吸引了众多机器人领域的重量级人物参会。此外，也于2月24日发布了Opmus人形机器人的，展示了机器人在行走过程中的稳定性和流畅性。人形机器人产业正处于发展的关键阶段，特斯拉、小鹏、华为等科技巨头纷纷布局该领域，引领产业变革。在的加持下，人形机器人有望解决通用性

[机器人]

英伟达联手佛罗里达大学建造了AI超算

路透社报道，英伟达周二表示将与佛罗里达大学合作，打造全球最快的高等教育领域AI超算。这个7000万美元的项目包括英伟达提供的价值2500万美元的捐赠，包括硬件、软件和培训，另外4500万美元来自该大学及其校友Chris Malachowsky，他是英伟达的联合创始人。佛罗里达大学还将使用英伟达芯片增强其现有的超级计算机HiPerGator，并计划在2021年初使其投入使用。英伟达长期以来一直是为个人电脑提供图形芯片的供应商，但研究人员现在也在数据中心使用其芯片来加速人工智能计算工作，比如训练电脑识别图像。

[手机便携]

为游戏产业重塑新高度，NVIDIA新一代RTX 20系列

NVIDIA新一代采Turing架构3款GeForce RTX 20绘图卡整体效能表现，已获得外界进行游戏评测，整体发现最高端GeForce RTX 2080 Ti在各主要游戏评测上平均帧率表现均程度不一优于前一代GeForce GTX 1080 Ti，GeForce RTX 2080效能表现也优于预期，部分评测的平均帧率甚至优于GeForce GTX 1080 Ti。根据Fudzilla、TechSpot及AnandTech报导，GeForce RTX 2080 Ti有4,352个CUDA核心，较前一代1080 Ti增加21%，若连同Tensor及RT核心，可见2080 Ti的绘图芯片(GPU)晶粒大小增加达60%，

[家用电子]

为游戏产业重塑新高度，<font color='red'>NVIDIA</font>新一代RTX 20系列

Nvidia：游戏是最热门App，云端移动技术是未来基石

在智慧型手机、平板电脑市场不得其门而入的绘图晶片巨擘Nvidia Corp.，现在转而把焦点放到游戏装置与汽车上，认为这两大领域蕴藏了庞大商机。 CNET News 19日报导，Nvidia执行长黄仁勋(Jen-Hsun Huang)在接受专访时表示，Nvidia不再以Tegra处理器专注智慧型手机、平板电脑市场的说法并不太对，应该要以公司策略转向来看待。他说，行动市场并非只有手机一种产品，除了电视、电脑出现行动革新外，游戏、汽车也都将获得创新。他说，Android作业系统的游戏市场未来会日益重要，而Nvidia希望能专注于此；除了游戏机外，专为游戏设计的机上盒、着重游戏的平板电脑都很重要。他说，平板电脑除以设计

[手机便携]

英伟达花30亿美元打造AI芯片 8块售14.9万美元

网易科技讯 5月11日消息，据国外媒体VentureBeat报道，英伟达CEO黄仁勋今天发布了一款针对人工智能应用的雄心勃勃的新处理器：Tesla V100。该新芯片拥有210亿个晶体管，性能比英伟达一年前发布的带150亿个晶体管的Pascal处理器强大得多。它是一款很大的芯片——815平方毫米，大小约为Apple Watch智能手表的表面。它拥有5120个CUDA（统计计算设备架构）处理核心，双精度浮点运算性能可达每秒7.5万亿次。作为全球最大的图形芯片和AI芯片厂商，总部位于加州圣克拉拉的英伟达在加州圣何塞举行GPU技术大会，并发布了上述产品。黄仁勋称英伟达花了30亿美元打造这款芯片，基于8块Tesla V1

[半导体设计/制造]

NVIDIA公司否认其显卡缺陷殃及台式芯片

　　针对国外网站“Nvidia(英伟达)台式显示芯片G92及G94同样存发热缺陷”的报道，英伟达公司昨日下午辟谣说，“我们确信G9x系列全线绘图处理器产品都没有问题。” 　　国外网站TheInquirer.com近日发布消息说，英伟达有“更大的麻烦”，除了它已经承认的G84及G86系列显示芯片存在过热的问题外，有用户反映用于台式机的G92及G94同样存在这一问题。　　使用G92显示芯片的显卡包括GeForce 8800 GT、GeForce 8800 GTS、GeForce 8800 GS以及GeForce 8000系列移动显卡， G94图形显卡涉及发热故障的只有GeForce 9600 GT。如果这两款芯片的显卡也存在缺陷

[焦点新闻]

热门资源推荐
热门放大器推荐

小广播