现在,视频、直播成为互联网内容消费的重要载体,内容创作爆发,创作形式自由度高带来了许多潜在安全威胁。好消息是,AI深度模型被大规模用于多媒体内容的识别、检测、理解上,用以狙击含有不良内容的传播。为了提升检测的准确性,面向不同场景必须使用不同的AI模型。但是,由于媒体场景、细分领域多,如何才能高效生产不同AI 深度模型?
阿里安全图灵实验室高级算法专家析策认为,与大数据相似,海量模型形成的模型仓库也蕴含了巨大的潜在价值。这些预训练的深度模型已消耗了大量训练时间以及大规模高质量的标注数据等昂贵的计算资源。如果这些预训练的模型能够被合理使用,那么针对新场景的模型训练对时间以及数据的依赖就会显著降低。
就像你要打造一辆能快速穿越雪地的车,不用从头开始设计,可采用跑车的动力引擎设计,也可改装坦克的履带传动。
目前实现这一目标最流行的方法是迁移学习。浙江大学和阿里安全发现,两个预训练深度模型所提取的特征之间的迁移能力可由它们对应的深度归因图谱之间的相似性来衡量。相似程度越高,从不同的预训练深度模型中获得的特征相关性就越大,特征的相互迁移能力也就越强。而且,[AI训练师助手]还知道从什么模型迁移知识,用模型的哪个部分迁移能最好地完成任务。也就是说,他们发现了让小白模型向AI深度模型学习的高效学习方法。
[在这种方法的指导下,单个AI模型的生产周期从1个月降到1天,我们就能更快地发现不同的内容风险。]析策希望,欺凌、色情、暴力、误导等不良内容不会成为人们消费大量图像视频内容付出的代价,AI 技术可以更快地把不良内容挡在第一线。
论文地址: https://arxiv.org/abs/2003.07496
代码地址: https://github测试数据/zju-vipa/DEPARA
查看更多关于单个AI模型生产只需1天 阿里浙大 “AI训练师助手”成果被CVPR 2020接收的详细内容...
声明:本文来自网络,不代表【好得很程序员自学网】立场,转载请注明出处:http://www.haodehen.cn/did219615