AIGC实战——基于Transformer实现音乐生成
创始人
2025-01-08 13:04:49
0

AIGC实战——基于Transformer实现音乐生成

    • 0. 前言
    • 1. 音乐生成的挑战
    • 2. MuseNet
    • 3. 音乐数据
      • 3.1 巴赫大提琴组曲数据集
      • 3.2 解析 MIDI 文件
      • 3.3 分词
      • 3.4 创建训练数据集
    • 4. MuseNet 模型
      • 4.1 正弦位置编码
      • 4.2 多输入/输出
    • 5. 音乐生成 Transformer 的分析
    • 6. 多声部音乐分词
      • 6.1 网格分词
      • 6.2 基于事件的分词
    • 小结
    • 系列链接

0. 前言

Transformer 是最流行的音乐生成技术之一,因为音乐可以视为一个序列预测问题,Transformer 模型将音符视为一个个符号的序列(类似于句子中的单词),从而用于生成音乐。Transformer 模型基于先前音符预测下一个音符,生成音乐作品。在本节中,将学习如何处理音乐数据,并应用 Transformer 生成与给定训练集风格相似的音乐。

1. 音乐生成的挑战

要让机器创作出悦耳的音乐,则必须克服与文本生成中所介绍的相似的技术挑战。模型必须能够学习并再现音乐的序列结构,且能够根据一组离散概率选择下一个音符。
然而,除了文本生成所需的技术外,音乐生成还存在其他挑战,即音高和节奏。音乐通常是多声部的,即不同乐器同时演奏多个音符流,它们结合在一起形成的是和声有可能不协和(刺耳)也有可能不协和(和谐)。文本生成仅需要处理一个单一的文本流,而音乐生成则需要处理多个并行的和弦流。
此外,文本生成可以逐个单词处理。但与文本数据不同,音乐是一个多部分、相交织在一起的声音轴,这些声音不一定同时出现,不同乐器之间不同节奏的相互作用是音乐的独特魅力。例如,吉他手可能弹奏一连串快速的音符,而钢琴师则可能弹奏一个较长的持续音。因此,逐音符生成音乐是复杂的,因为我们通常不希望所有乐器同时改变音符。

2. MuseNet

本节,我们将构建一个解码器

相关内容

热门资讯

黑科技真的(WPK ios)外... 黑科技真的(WPK ios)外挂透明挂辅助插件(透视)曝光教程(2026已更新)(哔哩哔哩);1、W...
第二分钟了解!德州AI辅助工具... 第二分钟了解!德州AI辅助工具,牵手跑胡子辅助,扑克教程(真的有挂)-哔哩哔哩1、牵手跑胡子辅助系统...
黑科技ai!德州之星有机器人吗... 黑科技ai!德州之星有机器人吗,太无语了一直是真的有挂(透视)解密教程(2020已更新)(哔哩哔哩)...
黑科技透视(鱼扑克app俱乐部... 1、黑科技透视(鱼扑克app俱乐部)外挂透明挂黑科技辅助软件(透视)扑克教程(2024已更新)(哔哩...
黑科技总结(wpk逻辑)外挂透... 黑科技总结(wpk逻辑)外挂透明挂辅助插件(透视)详细教程(2023已更新)(哔哩哔哩)1、首先打开...
7分钟了解!微扑克有辅助挂吗,... 7分钟了解!微扑克有辅助挂吗,红龙扑克辅助工具,AI教程(证实有挂)-哔哩哔哩1、红龙扑克辅助工具系...
黑科技ai!德州之星辅助挂,太... 黑科技ai!德州之星辅助挂,太离谱了切实有挂(透视)教你教程(2020已更新)(哔哩哔哩);1、操作...
黑科技俱乐部(拱趴大菠萝)外挂... 黑科技俱乐部(拱趴大菠萝)外挂透明挂黑科技辅助神器(透视)2025新版教程(2023已更新)(哔哩哔...
黑科技好牌(aapoker下载... 黑科技好牌(aapoker下载)外挂透明挂辅助器(透视)辅助教程(2023已更新)(哔哩哔哩)一、a...
第五分钟了解!wepoke透明... 第五分钟了解!wepoke透明黑科技,麻友圈安全版辅助器,德州论坛(存在有挂)-哔哩哔哩1、玩家可以...