视频:人脸和物体检测的人工智能驱动工具
了解更多关于视频人工智能的信息 流媒体的下一个事件.
阅读这段录音的完整文本:
小君海德: 视觉检测,你看到了什么,电脑? 这是一只大猩猩. 太棒了,谢谢,我不用看视频了.
所以说到视觉检测,物体检测是一个很大的问题. 你在视频中看到了什么,你有多确信你看到了?
左边的很多幻灯片都是JSON. 这是当你使用这些服务时返回的数据, 所以从开发者的角度来看, 他们会说, “嘿,服务, 请告诉我视频里有什么?“然后这些数据会带回来一些非常非常有用的信息.
在视频情报方面, 谷歌做得很好, 他们做的一件很酷的事情是他们也提供分类. 所以这就像我不仅看到了大脑,而且我还知道大脑属于器官类别. 我有80%的把握那是一个大脑.
你可以看到它在左边的JSON中表示,如果没有太过模糊的话. 我们有一个器官的分类实体, 上面说这个实体是一个大脑, 这样你就明白了. 显然,谷歌有2万个标签. 因此,谷歌有能力探测到2万个物体. 这是一个相当不错的数字.
另一件事是,最近,他们把目标跟踪引入了测试版. 所以它不仅可以在这张图片中检测到大脑, 但它可以探测到大脑, 桌子上有轮子, 它穿过了屏幕, 这是很新的东西, 它还在测试阶段.
AWS有数千个标签,但他们没有具体说明数量. 有趣的是,我们把一段视频放到AWS识别系统中, 这是他们的服务名称, 我们拿到了一张红毯首映式的唱片. 所以它是, 我想应该是E加感叹号, 人们在走路, 他们在拍她们穿着裙子什么的. 这很有趣,因为我没想到会看到这么具体的标签.
Clarifai, 正如我之前提到的, 他们有很多非常有趣的模型, 所以Clarifai, 他们有一个服装模特, 他们有一个食物模型, 旅行, 婚礼, 除了他们的一般模型. 显然,蜂巢人工智能可以检测商业广告. 流媒体在播放,突然一个商业广告播放了,哦,我看到了一个商业广告.
Valossa负责表情和伤害. 所以,如果我的手臂流血了,芬兰人工智能公司Valossa可能就能看到. 当涉及到面部时,AWS真的非常专注于面部. 所以如果你在找面孔, 如果你想知道, 嘿,我想画这样, 一个卷q型的小胡子, 这是您可能想要使用的服务. 因为它们不仅能识别人脸, 但他们知道眼睛在哪里, 的鼻子, 嘴角是. 它们还能探测到横摇、俯仰和偏航.
所有这些都在左边的JSON中表示. 你在右边看到的是, 上面写着脸,是个红色的大盒子, 这就是所谓的边界框. 边界框基本上是告诉你电脑在那里看到了一张脸.
这实际上是很多服务都没有提供的, 但我们开始提供. 所以,我认为谷歌最近开始提供边界框,以及其他一些服务. 因为你可能想对边界框信息做些有创意的事情. 除了检测人脸,很多服务还检测名人.
微软视频索引,他们说他们知道大约100万名名人. 包括演员,世界领导人,运动员等等. 你会在稍后的演示中看到. 视频索引器,为微软.
你会注意到我高亮了Blender这个词.org. So, 还有品牌检测, 微软实际上是从OCR中检测品牌, 光学字符识别. 屏幕上的文字. 他们也可以从音频中检测到它. 但如果你想要那种服务, 哦,我看到金色拱门了, 这是麦当劳, 你会想调查一下像瓦罗萨这样的公司, 蜂巢人工智能, 澄清, 或Veritone.
视频索引器做OCR,正如你在前面的例子中看到的. 在这种情况下, 你知道, 它在文本中找到了内森·维达尔, 还回去了,这样我们就不用看演职员表了, 因为我们不看演职员表, 正确的, 有时? 其他提供OCR的供应商有Veritone和AWS. 截至2018年11月,谷歌的云视频智能公司开始进行OCR测试.
相关文章
RealEyes的Jun Heider讨论了训练你的人工智能在你的组织中为其特定目的服务的重要性, 以及领先的人工智能平台允许的定制类型,这是他在2018年流媒体西部的演讲片段.
2019年3月29日
RealEyes媒体技术总监Jun Heider在2018年流媒体西部的这段视频中讨论了使用人工智能的直播分析.
3月27日2019
尽管有相反的传言,但人工智能不会使人类过时, RealEyes的Jun Heider在2018年流媒体西部大会上的演讲片段中说道.
2019年3月25日
詹森·霍夫曼报道, Citrix的Josh Gray说, 和REELY的Cullen Gallagher讨论了2018年流媒体东部培训人工智能系统的最佳实践.
11月12日2018
在2018年流媒体西部大会上,谷歌的马修·洛兰(Matthieu Lorrain)对人工智能的风险提出了警告.
11月8日2018
RealEyes技术总监Jun Heider讨论了内部自我评估的重要性,以及在选择视频人工智能平台时要考虑的用例元素.
11月1日2018
RealEyes Media技术总监Jun Heider在2018年东流媒体大会的视频片段中指出了人工智能平台领域的主要参与者.
10月29日2018
RealEyes技术总监Jun Heider在2018年流媒体东部会议上的演讲中概述了选择人工智能平台的第一步.
25 Oct 2018
来看看视频人工智能领域的四大玩家, 然后了解它们如何加快生成元数据或创建转录等耗时的任务.
10月24日2018
提及的公司及供应商