SIGGRAPH 2025奖项出炉:上科大、厦大入选最佳论文
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
机器之心报道
编辑:泽南、陈陈
让我们祝贺获奖者。
本周三,全球图形学领域的顶级会议SIGGRAPH公开了今年的论文奖项。
SIGGRAPH自1974年起由美国计算机协会计算机图形专业组(ACMSIGGRAPH)每年组织举办。该会议在图形图像技术,计算机软硬件等方面都有着相当高的影响力。如今,大会涵盖的技术领域包含动画、模拟、成像、几何、建模、渲染、人机交互、触觉、制造、机器人、可视化、音频、光学、编程语言、沉浸式体验、生成式人工智能和视觉计算机器学习等。
今年的SIGGRAPH大会将在8月10-14日在加拿大温哥华举行,根据此前信息,共有306篇技术论文被接收。
最佳论文奖
今年大会共评选出5篇最佳论文,国内机构收获颇丰,包括上海科技大学、华中科技大学、厦门大学、清华大学在内的机构获奖。以下是获奖及提名论文的简要介绍。
论文1:ShapeSpaceSpectra
论文地址:https ://arxiv. org/pdf/2408. 10099
机构:多伦多大学、Meta、MIT
作者:YueChang,OtmanBenchekroun,MaurizioM. Chiaramonte,PeterYichenChen,EitanGrinspu
论文作者之一常悦(YueChang),现在是多伦多大学的一名博士生,导师是EitanGrinspun教授。在攻读博士学位之前,常悦在北京大学获得了硕士学位,2019年在北京航空航天大学获得了学士学位。
论文摘要:对微分算子(如拉普拉斯算子或弹性能量Hessian矩阵)的特征分析通常局限于单一几何形状及其离散化形式,这极大的限制了ROM(reducedordermodeling)的应用范围。
本文引入了形状-空间特征分析来计算连续参数化形状家族中的特征函数。这些特征函数是通过最小化变分原理获得的。为了处理多重性点上的本征值优势交换,本文在优化过程中加入了动态重排序。该方法与离散化无关且可微分,使得其能够应用于声音合成、运动和弹性动力学模拟等领域。
论文2:CAST:Component-Aligned3DSceneReconstructionFromanRGBImage
论文地址:https ://arxiv. org/pdf/2502. 12894
机构:上海科技大学、影眸科技、华中科技大学
作者:KaixinYao,LongwenZhang,XinhaoYan,YanZeng,QixuanZhang,JiayuanGu,WeiYang,LanXu,JingyiYu
这篇获奖论文作者全部来自国内机构。此外,2024年该团队也曾获得两项SIGGRAPH最佳论文提名。
论文摘要:从单幅RGB图像恢复高质量的3D场景在计算机图形学中是一项极具挑战性的任务。当前的方法常常受限于特定领域或低质量的对象生成。
为了解决这些问题,本文提出了一种新颖的3D场景重建方法:CAST(基于单幅RGB图像的组件对齐3D场景重建)。
CAST首先从输入图像中提取物体级别的2D分割信息和相对深度数据,随后通过基于GPT的模型分析物体间的空间关系。这种方法能够理解场景中各物体间的相互关联,从而确保更连贯的三维重建结果。
然后,CAST采用遮挡感知的大规模3D生成模型,独立生成每个物体的完整几何形状,并使用掩码自编码器(MAE)和点云调节来减轻遮挡和部分物体信息的影响,确保与源图像的几何形状和纹理精确对齐。
最后,CAST采用了物理感知校正机制,利用细粒度关系图生成约束图,引导物体姿态的优化,确保物理一致性和空间连贯性。
实验表明,CAST支持开放词汇重建,在遮挡管理、物体精确对齐以及与输入的物理一致性方面表现出色,为虚拟内容创作和机器人技术开辟了新的可能性。
论文3:TokenVerse:VersatileMulti-ConceptPersonalizationinTokenModulationSpace
论文地址:https ://arxiv. org/pdf/2501. 12224
机构:GoogleDeepMind、特拉维夫大学等
论文摘要:本文提出了TokenVerse——一种利用经过预训练的文本到图像扩散模型进行多概念个性化的方法。TokenVerse可以从单张图片中分离出复杂的视觉元素和属性,同时能够无缝地即插即用地生成从多张图片中提取的概念组合。
与现有研究不同,TokenVerse可以处理包含多个概念的多张图像,也支持物体、配件、材质、姿态和光照等广泛的概念。
论文4:Vector-ValuedMonteCarloIntegrationUsingRatioControlVariates
论文地址:https ://weschang. com/publications/vvmc/vvmc. pdf
机构:加州大学圣地亚哥分校、谷歌
作者:HaolinLu,DelioVicini,WesleyChang,Tzu-MaoLi
论文摘要:方差缩减技术被广泛用于降低蒙特卡洛积分的噪声。然而,这些技术通常假设被积函数为标量值。为了解决这个问题,本文引入了比率控制变量,这是一种利用基于比率的方法而非传统的基于差分的控制变量的估计器。
论文5:TransformerIMUCalibrator:DynamicOn-bodyIMUCalibrationforInertialMotionCapture
论文地址:https ://orca. cardiff.ac. uk/id/eprint/177840/1/TIC_camera_ready. pdf
机构:厦门大学、伯恩茅斯大学、清华大学、加的夫大学
作者:ChengxuZuo、JiaweiHuang、XiaoJiang、YuanYao、XiangrenShi、RuiCao、XinyuYi、FengXu、ShihuiGuo、YipengQin
论文摘要:本文提出了一种全新稀疏惯性运动捕捉系统动态标定方法,该方法首次突破了IMU标定中严格的绝对静态假设,即坐标漂移𝑅𝐺′𝐺和测量偏移𝑅𝐵𝑆在整个运动过程中保持不变,从而显著扩展了其应用场景。
在该研究中,作者在两个宽松的假设下实现了𝑅𝐺′𝐺和𝑅𝐵𝑆的实时估计:i)矩阵在短时间窗口内变化可忽略不计;ii)人体运动/IMU读数在这样的时间窗口内具有多样性。直观地看,第一个假设减少了候选矩阵的数量,第二个假设提供了多样化的约束,这大大减少了解空间,并允许从实时的短暂IMU读数历史中精确估计𝑅𝐺′𝐺和𝑅𝐵𝑆。为了实现这一点,作者创建了配对𝑅𝐺′𝐺、𝑅𝐵𝑆矩阵和IMU读数的合成数据集,并使用基于Transformer的模型学习它们的映射。他们还设计了一个基于IMU读数多样性的校准触发器,以确保在应用我们的方法之前满足假设ii)。该工作是第一个实现隐式IMU校准、使用稀疏IMU实现长期精确运动捕捉的工作。
最佳论文荣誉提名
论文:LiftingtheWindingNumber:PreciseDiscontinuitiesinNeuralFieldsforPhysicsSimulation
作者:YueChang,MengfeiLiu,ZhechengWang,PeterYichenChen,EitanGrinspun
论文:AMonteCarloRenderingFrameworkforSimulatingOpticalHeterodyneDetection
作者:JuhyeonKim,CraigBenko,MagnusWrenninge,RyusukeVillemin,ZebBarber,WojciechJarosz,AdithyaPediredla
论文:RectangularSurfaceParameterization
作者:EtienneCorman,KeenanCrane
论文:High-PerformanceCPUClothSimulationUsingDomain-DecomposedProjectiveDynamics
作者:ZixuanLu,ZihengLiu,LeiLan,HuaminWang,YukoIshiwaka,ChenfanfuJiang,KuiWu,YinYang
论文:VariationalSurfaceReconstructionUsingNaturalNeighbors
作者:JianjunXia,TaoJu
论文:MomentBoundsAreDifferentiable:EfficientlyApproximatingMeasuresinInverseRendering
作者:MarkusWorchel,MarcAlexa
论文:ClebschGaugeFluidonParticleFlowMaps
作者:ZhiqiLi,CandongLin,DuowenChen,XinyiZhou,ShiyingXiong,BoZhu
论文:FaradayCageEstimationofNormalsforPointCloudsandRibbonSketches
作者:DanielScrivener,DanielCui,EllisColdren,MazdakAbulnaga,MikhailBessmeltsev,EdwardChien
论文:C-Tubes:DesignofTubularStructuresFromDevelopableStrips
作者:KlaraMundilova,MicheleVidulis,QuentinBecker,FlorinIsvoranu,MarkPauly
时间检验奖
今年是SIGGRAPH设立时间检验奖的第三年,大会对2013-2015年间的入选论文进行了评选,并最终选出了四篇获奖的,对业界影响深远的研究。
论文1:UnifiedParticlePhysicsforReal-TimeApplications(2014)
本文提出了一个用于实时视觉效果的统一动力学框架,该框架使用通过约束连接的粒子作为基本构建块。该框架灵活地模拟气体、液体、可变形固体、刚体以及具有双向相互作用的布料。此外,它还引入了一个基于位置动力学的并行约束求解器,解决了传统基于粒子方法长期存在的计算问题。该框架已实现众多实时应用,并被广泛应用于各个领域。
论文链接:https ://dl. acm.org/doi/10. 1145/2601097. 2601152
作者:MilesMacklin、MatthiasMüller、NuttapongChentanez、Tae-YongKim
论文2:LearningVisualSimilarityforProductDesignWithConvolutionalNeuralNetworks(2015)
该论文是首批将现代卷积神经网络(CNN)引入SIGGRAPH的论文之一,它帮助塑造了计算机图形学的未来研究方向,并成为被广泛引用的参考文献。除了实现其核心目标——在从复杂场景到孤立物体等各种图像领域进行视觉跨类别和风格感知搜索之外,它还在CNN训练方法和众包收集训练数据方面实现了关键的技术进步。
论文链接:https ://doi. org/10. 1145/2766959
作者:SeanBell、KavitaBala
论文3:MedialSkeletonofPointCloud(2013)
本文介绍了一种用于三维点云的鲁棒曲线骨架表示方法,该方法无需高质量的输入或严格的几何或拓扑约束即可准确捕捉形状中心。它为工厂、道路地图、建筑、船舶分析和建模等各种应用提供了一个极具吸引力的解决方案。至今,它仍然是该领域的重要参考文献。
论文链接:https ://dl. acm.org/doi/10. 1145/2461912. 2461913
作者:HuiHuang、ShihaoWu、DanielCohen-Or、MinglunGong、HaoZhang、GuiqingLi、BaoquanChen
论文4:Embree:AKernelFrameworkforEfficientCPURayTracing(2014)
该论文介绍了Embree系统,并详细描述了构建专业级模块化光线追踪框架所需的条件。它以简洁优雅的架构实现了卓越的性能,并提供了一个开源实现,至今已被广泛采用。该项目至今仍在活跃,并持续造福于研究社区。
论文链接:https ://dl. acm.org/doi/10. 1145/2601097. 2601199
作者:IngoWald、SvenWoop、CarstenBenthin、GregoryS. Johnson、ManfredErnst
©THEEND
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin. com