Datagen从隐身中脱颖而出为计算机视觉模型创建综合数据集

慕容天志
导读 Datagen是一家总部位于以色列特拉维夫的初创公司,提供创建合成计算机视觉系统培训数据的平台,如今已从TLV Partners和Viola Ventures的1

Datagen是一家总部位于以色列特拉维夫的初创公司,提供创建合成计算机视觉系统培训数据的平台,如今已从TLV Partners和Viola Ventures的1850万美元融资中脱颖而出。该公司表示,所得款项将用于发展其研发实验室,同时将其扩展到全球新市场。

Ofir Chakon和Gil Elbaz于2018年创立的Datagen利用计算机图形和数据生成功能,通过包含2D和3D注释的数据集来模拟现实世界。通过在物理模拟器中将生成对抗网络(GAN)与增强学习驱动的类人运动算法相结合,Datagen可以提供适用于增强和虚拟现实,物联网,智能商店,机器人技术和智能汽车使用的逼真,可扩展的数据集案件。

甘肃省 是由两部分组成的AI模型,由创建样本的生成器和试图区分生成的样本与真实样本的鉴别器组成。至于强化学习,这是一种允许AI模型学习如何通过反复试验自动做出决策的技术。

收集和标记培训数据对于企业而言可能是昂贵的。例如,仅自动驾驶汽车公司每年就花费数十亿美元来收集和标记培训数据据估计,。

第三方承包商招募了成千上万的人类数据标签商来绘制和跟踪机器学习模型需要学习的注释。(正确标记的数据集提供了模型用于检查其预测的准确性并继续完善其算法的基本事实。)随着性能要求的提高,对这些数据集进行固化以使其包含正确的样本分布和频率变得越来越困难。这种流行病凸显了这些做法的脆弱性,因为越来越多的承包商被迫在家中工作,促使一些公司转向综合数据作为替代方案。

为了创建综合训练数据,Datagen与客户一起制定要求,例如相机镜头规格,照明,环境因素,人口统计分布以及注释和元数据。该过程始于从现实世界扫描或使用计算机图形软件设计的人物和物体的3D基本模型。Datagen的平台使用网格和纹理以及语义元数据创建这些模型的表示。最后,Datagen利用GAN从这些表示中采样并合成独特的模型,构建了数百万个3D资产的库,然后将这些库置于基于物理的算法中,这些算法可模拟运动并帮助缩放渲染。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!