本篇文章3094字,读完约8分钟

机器的内心报道

机器的心部

未来的nba live会通过机器学习指导人物的动作吗?

20世纪90年代,《灌篮高手》风靡亚洲,承载了无数80、90后童年的回忆和梦想。 20多年过去了,《灌篮高手》早就结束了,但是关于篮球的动画技术一直在进步。 在今年的siggraph计算机图形学顶级会议上,一篇论文向我们展示了去年“灌篮高手”的样子。

这篇论文的作者来自英国爱丁堡大学和世界著名的互动娱乐软件企业的艺能( electronic arts )。 利用他们在论文中展示的做法,我们可以得到更多复杂、流畅、多样化的篮球动作。 例如,抢劫:

运球:

避免障碍:

急转弯:

怎么样,比你灵活吗?

虽然只是出了demo,但其中展示的动作的真实性已经压倒了体育的发烧友。

也有网友说要投资。

研究人员表示,这项技术可以用于电脑游戏和vr,让人们体验更真实的篮球游戏。

当然,这样好的效果不是短时间内产生的,而是作者几年的工作积累。 另外,论文的一部作品sebastian starke先生说,这个项目也是博士论文的一部分。

项目地址: github/sebastian starke/ai 4动画

论文链接: Github/Sebastian starke/AI 4动画/ Blob/master /媒体/ Siggraph _/Paper.PDF

以下是论文的详细复印件。

前言

模拟角色对象与目标物体、环境和其他角色之间多次接触的高速复杂交互具有很大的诉求。 例如,打篮球时,选手们需要进行运球等各种动作和对方进行比赛。

迄今为止,从非结构化运动捕捉库中学习到的技术在动作的扩展性、真实性、多样性方面存在限制。 首先,许多技术需要以相位( phase )等全局时间参数对动作进行排列,但当动作中包含多次异步接触时,这样做非常困难。 其次,即使动作由控制器学习,客户端通过键盘或游戏手柄提供的低维控制信号再现各种动作也存在问题。

本文的研究者提出了一种新的数据驱动框架来学习包括多次接触在内的快速动态交互 研究人员以大型一对一篮球数据库为第一例,只有一名选手做接球、运球、用妙手躲避对方选手等动作。 研究人员设计并训练了神经角色控制器,在统一的框架下学习,生成逼真的进攻和防守动作,使选手们可以轻松地从进攻转为防守。

为了使模型学习进行高速且含有许多复杂交互作用的运动(用非同步的方法快速变换运动员肢体与球或地面的接触),提出了一种被称为局部运动相位( local motion phase )的特征。

局部运动相位是指各个身体部位如何与外部物体接触。 这个特征可以通过进化战略从非结构化运动捕获数据中自动计算出来。

通过采用局部运动相位,互联网可以学习人类局部肢体部位的运动,而无需将整个身体的运动在全局相位上进行排列。 在篮球运动中,如果互动非常快,或者很多,或者很复杂的话,以全球相位将整个身体进行排列的运动会就非常困难。

为了应对低维控制信号和身体整体丰富的运动之间的模糊性,提出了能够在高电平控制信号下再现各种剧烈运动的新的生成模型。 生成控制模型可以将来自客户端的指示的抽象控制信号转换成各种激烈的控制信号,这些信号能够对应于完美的身体运动。

在系统在篮球比赛中接受大量的运动捕捉数据训练后,客户可以交互控制作用,生成快速异步的篮球妙手,如运球、阳动、抢断、防守等,这是电脑游戏和vv

该系统也可以用于学习其他接触较多的运动,如坐在椅子上、开门、四足运动等。 与以前的模型相比,该模型运行质量高,不需要人为标签。

系统概要

这个研究的深度学习框架是类似“Zhang et al .”和“starke et al .”的混合专家方案。 系统由运动预测互联网和门互联网组成。 门互联网一边计算专家的权重,一边学习如何用混合系数动态组合它们来构建运动预测互联网。 然后,根据当前角色的状态和客户端的控制命令,自回归地计算从一个帧到下一个帧的运动。

图2 :门互联网和运动预测由互联网组成的系统的架构。 门以局部运动相位为输入,计算专家混合系数,将其用于运动预测互联网的生成。 运动预测互联网以手势和客户端控制变量作为输入,预测从一个帧到下一个帧的运动。

为了使该框架能够从大型运动数据库中学习篮球动作,研究者提出了两个主要的改进:首先使用局部运动相位训练系统,然后生成控制模型,以原始的高水平客户端控制指令为输入,从而更加刺激

与各个其他物体和环境接触的骨骼的局部运动相位可以单独计算,同时对四肢的运动进行异步编码。 这与[starke et al. ]的研究完全不同,[starke et al. ]的研究假定各动作通过全局相位变量进行同步,需要定义仔细的注释过程以及动作的开始和结束的决定规则。 这些事业有时非常困难,模糊不清。 局部运动相位基于单个骨骼的接触按统一规则计算,同时便于自动计算。

图4 :单个骨骼的相位提取方法的示例。

图5 :双脚( lf、rf )、双手( lh、rh )、球( b )的局部运动相位提取示例。

另外,还引入了一种基于客户提供的粗略高电平控制信号产生各种剧烈行为的控制模型。 如果有多个动作对应同一个输入信号,基于明确性模型的简单回归就会产生平均动作,其中急剧程度几乎不变。 研究者通过引入生成模型解决了这个问题。 该生成模型以高级别的客户端控制命令和随机噪声作为输入,从中生成更激烈的控制信号序列。 这样,系统不仅可以生成高质量的动作,还可以通过非明确的方法生成变化后的动作。

图6 :控制方案的生成概述。

实验和判断

研究者用游戏手柄让角色做各种各样的动作,如下图10所示。

图10 :基于该研究的系统合成的工作格式。

可以看出,除了具有多次接触和快速动作的许多复杂角色动作外,还可以生成角色之间的交互作用,例如避开对方等动作。

研究人员在测试数据集上对该系统的肢体运动、接触精度和响应性三个方面进行了定量判断,他们通过每帧全关节恰当的立场更新之和来量化肢体动作。

下图11显示,将该研究方法与pfnn、mann和lstm进行比较后,所有行为格式均获得了较好的结果。 另外,如果这样的数据样本更稀疏,则差异会更显着。

研究人员判断选手两脚与地面的接触精度,选手的脚的高度和垂直速度低于阈值时(这种情况下应该处于接触状态),通过总结水平方向的运动,计算选手脚的滑动量。 这种方法如图12所示,脚部的滑动量最少。

如图13所示,还给出了运球动作中手和篮球的距离变化图。

角色对客户输入的响应性是角色控制中最重要的方面之一。 响应性可以通过测量达到目标速度和方向平均所需的时间,以及顾客发出输入信号后完成旋转等任务所需的平均时间来判断。 完成这些任务的平均所需时间如图14所示。

如图15所示,该研究系统在响应能力上比pfnn稍差,但响应能力比其他方法好。

如图16所示,该系统还可以合成数据集上没有的新的动作。

如图17所示,通过研究足部与地面的接触,研究人员利用局部运动相位训练了四足控制器。

研究人员还将局部运动相位应用于[starke et al. ]的目标物体/环境交互的样本。 下面的图18显示了箱子的抬起和放下,坐下后从椅子上站起来的快照和相应的局部运动相位。

原标题:“ea出品版《灌篮高手》:运球、抢断生成敏捷,有助于找回小时候的梦想。”

浏览原文信息进行推荐

英国指挥家罗素发出公开信:疫情将饱览古典音乐界

西蒙·拉特和马克·埃尔德是英国最具影响力的两位指挥家,日前,两位就音乐家在疫情期间面临的挑战写了公开信,警告如下。 ...

标题:“2020年的《灌篮高手》是什么样子?”

地址:http://www.ok-sl.com/ozdt/8714.html