注:微软该专利名为《Artificial intelligence model for composing audio scores》,主要探讨了基于输入内容。来创建音乐的方法。
该专利主要概述了以下步骤:
收集数据:收集大量的训练数据,这些数据包括许多包含视频和音频组件的视听数据集。
分析提取:分析数据集并提取不同类型的特征。例如文本视频中的颜色、形状、运动和场景等等。
关联:Copilot 会分析这些特征并寻找它们之间的相关性。例如,某些场景(如日落)通常伴随着特定类型的音乐(如平静、舒缓的旋律)。
Copilot 将通过这些特性进行训练,并利用关联系统,生成与新视频的视觉和文本特征相匹配的适当音频评分。
在现实生活中,这项技术可以用于各种应用。例如:
电影和视频制作: 自动为电影、电视节目或在线视频生成背景音乐。
广告: 创作与商业广告的氛围和信息完美契合的音乐。
游戏: 制作基于游戏视觉和动作变化的动态配乐。
虚拟现实: 通过与视觉环境相适应的音频增强沉浸式体验。
其它场景:例如可以在求婚等场景下自动匹配合适的音乐。
微软新闻推荐
win10系统推荐
系统教程推荐