英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图

发布者:EE小广播最新更新时间:2023-06-23 来源: EEWORLD关键字:英特尔  AI 手机看文章 扫描二维码
随时随地手机看文章

LDM3D是业界领先的可创建深度图的生成式AI模型,有望革新内容创作、元宇宙和数字体验。


英特尔研究院宣布与Blockade Labs合作发布LDM3D(Latent Diffusion Model for 3D)模型,这一全新的扩散模型使用生成式AI创建3D视觉内容。LDM3D是业界领先的利用扩散过程(diffusion process)生成深度图(depth map)的模型,进而生成逼真的、沉浸式的360度全景图。LDM3D有望革新内容创作、元宇宙应用和数字体验,改变包括娱乐、游戏、建筑和设计在内的许多行业。


英特尔研究院人工智能和机器学习研究专家Vasudev Lal表示:“生成式AI技术旨在提高和增强人类创造力,并节省时间。然而,目前的大部分生成式AI模型仅限于生成2D图像,仅有少数几种可根据文本提示生成3D图像。在使用几乎相同数量参数的情况下,不同于现存的潜在扩散模型,LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计中的标准后处理方法相比,LDM3D能够为图像中的每个像素提供更精准的相对深度,并为开发者省去了大量用于场景开发的时间。”


封闭的生态系统限制了规模。英特尔致力于推动AI的真正普及,通过开放的生态系统让更多人从这项技术中受益。计算机视觉领域近年来取得了重大进展,特别是在生成式AI方面。然而,当今许多先进的生成式AI模型只能生成2D图像。与通常只能根据文本提示生成2D RGB图像的现有扩散模型不同,LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计(depth estimation)中的标准后处理(post-processing)方法相比,LDM3D在使用与潜在扩散模型Stable Diffusion几乎相同数量参数的情况下,能够为图像中的每个像素提供更精准的相对深度(relative depth)。


这项研究有望改变我们与数字内容的互动方式,基于文本提示为用户提供全新的体验。LDM3D生成的图像和深度图能够将诸如宁静的热带海滩、摩天大楼、科幻宇宙等文本描述转化为细致的360度全景图。LDM3D捕捉深度信息的能力,可以即时增强整体真实感和沉浸感,使各行各业的创新应用成为可能,包括娱乐、游戏、室内设计、房产销售 ,以及虚拟博物馆与沉浸式VR体验等。


6月20日,在IEEE/CVF计算机视觉和模式识别会议(CVPR)的3DMV工作坊上,LDM3D模型获得了“Best Poster Award”。


 image.png


LDM3D是在LAION-400M数据集包含一万个样本的子集上训练而成的。LAION-400M是一个大型图文数据集,包含超过4亿个图文对。对训练语料库进行标注时,研究团队使用了之前由英特尔研究院开发的稠密深度估计模型DPT-Large,为图像中的每个像素提供了高度准确的相对深度。LAION-400M数据集是基于研究用途创建而成的,以便广大研究人员和其它兴趣社群能在更大规模上测试模型训练。


LDM3D模型在一台英特尔AI超级计算机上完成了训练,该超级计算机由英特尔®至强®处理器和英特尔®Habana Gaudi® AI加速器驱动。最终的模型和流程整合了RGB图像和深度图,生成360度全景图,实现了沉浸式体验。


为了展示LDM3D的潜力,英特尔和Blockade的研究人员开发了应用程序DepthFusion,通过标准的2D RGB图像和深度图创建沉浸式、交互式的360度全景体验。DepthFusion利用了TouchDesigner,一种基于节点的可视化编程语言,用于实时互动多媒体内容,可将文本提示转化为交互式和沉浸式数字体验。LDM3D是能生成RGB图像及其深度图的单一模型,因此能够节省内存占用和降低延迟。


LDM3D和DepthFusion的发布,为多视角生成式AI和计算机视觉的进一步发展铺平了道路。英特尔将继续探索如何使用生成式AI增强人类能力,并致力于打造一个强大的开源AI研发生态系统,让更多人能够使用AI技术。延续英特尔对开放AI生态系统的大力支持,LDM3D正在通过HuggingFace进行开源,让AI研究人员和从业者能对这一系统作出进一步改进,并针对特定应用进行微调。


在2023年6月18日至22日举行的IEEE/CVF计算机视觉和模式识别会议上,英特尔将发表这项研究成果。


关键字:英特尔  AI 引用地址:英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图

上一篇:英特尔发布全新硅自旋量子比特芯片Tunnel Falls,推动量子计算走向实用
下一篇:SABIC推出全新LNP™ STAT-KON™改性料,助力推进ADAS雷达技术发展

推荐阅读最新更新时间:2024-11-10 11:57

人工智能领域最重要的10大里程碑:AlphaGo征服世人
  业界媒体TechRadar发表文章,称 人工智能 (AI)是目前科技界最热门的流行语,经过几十年的研究和发展之后,科幻小说中的许多技术已经在这几年慢慢转化为科学现实。这篇文章总结了AI领域的10大里程碑。下面就随网络通信小编一起来了解一下相关内容吧。   AI技术已经成为我们生活中非常重要的一部分:AI决定了我们的搜索结果,将我们的声音转化为计算机指令,甚至可以帮助我们对黄瓜进行分类(这件事后文中会提到)。在接下来的几年里,我们将用AI驾驶汽车,回应顾客的询问,以及处理其他无数事情。   但是我们怎么走到这个阶段的?这种强大的新技术是怎么来的?下面就来看看AI技术发展的十大里程碑。    笛卡尔的理念    人工智能 的概念
[网络通信]
AI生物识别可通过笑容识别男女性别
随着智能手机上普遍都搭载了人脸识别,原本高深莫测的技术如今已经变得在普通不过了。而目前大部分人脸识别都是通过面部特征来分辨用户的性别,也就是说如果长得清秀一点的男生留了长头发就无法辨别了。近日国外一家研究机构研制出了可以通过笑容来分辨男女的人工智能,准确度大大提高。 负责这一项目的是Hassan Ugail教授说道:“有趣的是,女性认为自己的笑容更有表现力,而且我们的研究已经证实了这一点,女性有面积更广泛的笑容,嘴唇扩大的面积远远超过男性”也就是说这个程序可以根据男人和女人在微笑时的细微面部特征,就可以准确的分析出用户的性别。 据了解,该技术可以在人类微笑的瞬间测量面部肌肉的运动,并不是依赖于某一个特征来分辨,因此这项生物
[嵌入式]
<font color='red'>AI</font>生物识别可通过笑容识别男女性别
英特尔推Quark处理器背后:豪赌可穿戴市场
英特尔推微型CPU赌可穿戴市场   新浪科技 罗亮   本周二召开的年度开发者大会上, 英特尔 ( 22.81 , -0.18 , -0.76% ) 公布了面向智能手表等可穿戴设备的超小Quark处理器(Quark中文为“夸克”)。在错失了智能手机和平板电脑市场的先机之后,英特尔希望凭借这款处理器,赶上下一波技术浪潮。   对于一直在计算市场领先的英特尔而言,唯有在可穿戴设备这一有望爆发的市场上重新成为领导者,才能赢回一些应得的尊重。这是一场事关颜面的战争,同时也与英特尔的未来命运休戚相关。    卡位可穿戴市场   一年一度的英特尔信息技术峰会(Intel Developer Forum,简称IDF),从来都是英特
[手机便携]
<font color='red'>英特尔</font>推Quark处理器背后:豪赌可穿戴市场
英特尔观点:永葆创新、赋能生态、长期主义
近日,英特尔中国战略合作与创新业务部董事总经理、英特尔创新加速器总负责人李德胜和英特尔资本董事总经理、中国区总经理王天琳受邀参加2021 DEMO WORLD 世界创新峰会,并分别分享了有关企业创新、半导体行业创投和生态建设方面的观点。 本届峰会是创业邦举办的第十四届活动,今年峰会正式升级为DEMO WORLD世界创新峰会,是国内最具影响力的创新峰会之一。今年以“新文明之约”为主题,有150余位著名学者、跨国大企业与创新成长企业高层、知名投资机构参与其中,探讨创新动能激发之路,推动大企业与创新企业共建生态,共同塑造未来产业新形态。 推动生态建设保持创新 新技术快速迭代,新挑战不断降临,企业需要不断加快创新的步伐,以满足
[半导体设计/制造]
<font color='red'>英特尔</font>观点:永葆创新、赋能生态、长期主义
人工智能火爆 高通收购AI初创公司Scyfer!
继去年宣布以470亿美元收购恩智浦创下半导体行业收购记录后,近日再次传出高通将要收购荷兰机器学习初创公司Scyfer的消息。 据悉,Scyfer拥有丰富的机器学习实战经验,已在为制造业、医疗保健、金融等行业提供服务。 高通执行副总裁马特·格罗布(Matt Grob)在声明中表示:“10年前我们开始了基础性研究,目前我们的产品已支持许多AI使用案例,计算机视觉、自然语言处理及在各种设备上进行恶意软件检测等。我们正在研究更广泛的主题,比如应用于无线连接、电源管理和摄影的AI。” 高通是全球知名的 IC设计 企业,在拓墣产业研究院最近公布的2017年第二季度全球十大IC设计企业排名中位列第二,是手机IC设计领域的领头羊,旗下
[半导体设计/制造]
英特尔称有足够的半导体供应以达到全年营收目标
    据路透社报道,英特尔称有足够的半导体供应以达到全年营收目标,正优先生产个人电脑所用的芯片。此前据媒体报道根据一些产业链相关企业预计,英特尔处理器缺货要到2019年下半年才解决。 据行业人士消息称,英特尔原计划于今年推出10纳米处理器,但由于技术原因被迫推迟到明年下半。因此,今年仍将以14纳米处理器供应为主。 电脑行业依旧要看英特尔的“脸色”,因为它缺货,不仅10纳米处理器普及推迟了,整个产业链也受到影响,宏碁董事长兼CEO陈俊圣称,全球PC市场预计于今年下半年反弹,但由于英特尔14纳米处理器供货紧张,将考验品牌厂供应链管理的应变能力——实际上PC品牌厂为确保2018年下半旺季出货顺畅,近期已经开始抢货潮。
[手机便携]
格兰仕明年或推出AI芯片;腾讯出长“鹅”了
AI芯片是个筐,什么企业都能去折腾。格兰仕昨天在顺德总部宣布明年初将流片AI芯片,其合作伙伴赛昉科技同时发布了基于RISC-V开源架构的人工智能视觉处理平台,并与多家企业联手建立了“中国芯”开源芯片生态合作联盟。只要格兰仕的AI芯片没有出成果,不拿补贴,想怎么整都没人管你,市场都欢迎! 深圳腾讯玩偶厂出新产品了!鹅的中秋限定款——嫦(长)娥(鹅)。腾讯滨海大厦昨天惊现一大批“长长长鹅”。脖子被拉长的企鹅随风狂摆,取长鹅(嫦娥)谐音梗,提前庆祝中秋节。长鹅头上的“浓密秀发”也很是抢戏,长鹅的店是腾讯推出的中秋快闪店,只在中秋前夕营业两天。腾讯虽然因为游戏充钱才能变得更强被网友骂的很惨,但是搞娱乐、社交之类的,还是挺有一套的。
[手机便携]
全球人工智能与制造业融合的现状及思考
  人工智能在制造业的融合应用是促进实体经济发展的重点方向,是制造业数字化、网络化、智能化转型发展的关键领域。发达国家政府和产业界均高度重视这一趋势,近年来纷纷采取行动推进基础性研究及产业实践部署,传统的制造业生产范式正在人工智能的驱动下被进一步改变。   1、人工智能技术正在向制造业多个环节广泛渗透   随着人工智能技术在生活领域的快速传播,越来越多来自不同领域的学者及科研人员开始尝试着将制造领域的专有知识注入到人工智能模型中,并将其与制造业中的典型软件、系统及平台相集成,形成了一系列融合创新技术、产品与模式。   美国欧特克创新软件平台Fusion360   产品研发方面,美国工业设计软件巨头欧特克推出的产品创新软件平台Fu
[嵌入式]
小广播
最新网络通信文章
换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved