联系我们

苏州奥尔马电子科技有限公司

江苏省苏州市高新区金猫路9号B幢

丁经理

13584892482

13584892482

135848924828

【阿里云】多模态内容理解

发布者:极豹云发布时间:2022-05-19访问量:360

智能标签,是通过对视频中视觉、文字、语音、行为等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。可应用于视频智能分析、视频审核、视频搜索、视频个性化推荐,助力视频智能生产。


产品价格


智能标签

集成于视频点播产品、媒体处理产品提供叠加服务,按照实际使用量进行计费。请先开通需要使用的产品服务,以使用智能标签功能。



视频点播

按智能标签处理成功的视频文件总时长计费,单价0.3元/分钟。即对处理成功的视频文件按秒数累计,折合成分钟按量计费,不足一分钟部分不收费。


媒体处理
按智能标签处理成功的视频文件总时长计费,单价0.3元/分钟。即对处理成功的视频文件按秒数累计,折合成分钟按量计费,不足一分钟部分不收费。


精心打造的功能


多维度信息识别
从视觉、文字、语音、运行行为等多个维度对视频信息进行分析,识别视频中的人物、物体场景、地标、文字、语音等内容。

视觉识别
分析视频的视觉图像信息,识别人物、物体、场景等图像内容。

文字识别
识别视频图像中的文字,提取图像文本内容。

语音识别
分析视频中的语音信息,提取语音文本内容。

运动行为识别
分析视频动态信息,识别运动、动作、行为事件等内容。

多模态内容理解
采用多模态融合对齐、跨模态映射等技术,对媒体内容进行多模态融合识别,高效、精准理解视频内容。

多模态对齐
识别多模态间不同元素的联系和对齐关系,实现视频文字、语音、视觉等不同模态信息的对齐理解。

多模态融合
整合不同模态间的模型和特征,提高理解能力和效率,实现语音文字文本纠错能力,提升识别准确率。

多模态联合表征
将多模态信息进行整合及联合表征,实现视频内容的一体化识别。

丰富灵活的标签
结合成熟完善的媒体标签体系,根据多模态融合理解结果对媒体文件进行智能打标,输出多维度视频标签信息,同时提供灵活的标签自定义功能。

智能标签提取
标签处理集成自定义过滤、标签去重、标签合并、权重排序等算法,提供高效、准确、实用的智能打标能力。

多维度标签输出
结合融合理解结果及标签体系,输出多维度视频标签,包括视频分类标签、人物标签、物体场景标签、文本标签等。

支持自定义标签
支持地标词库注册、人脸自注册、未知人脸聚类、标签黑名单、标签热词等标签自定义功能,满足不同场景下的使用需求。


业界领先的优势


标签体系完善
综合优酷、土豆、UC海外等平台的PGC、UGC视频内容进行学习、训练,提供最全面的视频标签体系


经验成熟
利用阿里大文娱海量的媒资数据和用户行为数据,并在优酷等内部平台及外部客户平台中提供稳定服务


定制化能力
提供通用标签类目体系的同时,开放定制化的能力,支持人脸自注册、未知人脸聚类、自定义标签等扩展功能,更有针对性地帮助客户解决平台的视频处理效率问题


部署方式灵活
支持多种部署形态,支持在线调用、线下私有化部署方式,可根据业务需求选择适用的部署方案


行业实战场景


媒资检索

准确高效的媒体资源检索
通过准确丰富的视频标签体系,对视频、图像、文本等媒体文件进行内容编目,支持通过关键词或标签文本,对素材库中的内容进行快速检索,提升视频资源检索效率与准确性。


适用场景
新闻媒体
广电、新媒体等行业媒资管理


UGC平台
视频网站,短视频应用,资讯平台等应用


教育行业
教学媒体资源检索应用



个性化推荐


精准、个性化的内容推荐
根据媒体文件内容标签,结合用户信息、行为数据及用户画像分析,进行内容精准匹配,实现视频个性化推荐,解决推荐冷启动问题,提升推荐准确率。


适用场景
媒体平台
广电、新媒体行业资讯、媒体平台内容个性化推荐


UGC平台
视频网站,短视频应用内容个性化推荐


电商平台
猜你喜欢、相似商品推荐



智能广告投放

智能化、场景化的广告投放
根据媒体文件多模态内容分析及视频标签结果,自动识别广告位,与广告资源库内容进行匹配,实现广告智能投放,精准触达受众人群,提升广告转化率。


适用场景
视频网站、资讯平台
与媒体内容深度融合的场景化广告