Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于数据的格式 #4

Open
NightDramatist opened this issue Feb 26, 2019 · 6 comments
Open

关于数据的格式 #4

NightDramatist opened this issue Feb 26, 2019 · 6 comments

Comments

@NightDramatist
Copy link

请问您是将音乐文件转化成什么格式来作为可以用作机器训练的数据呢,如果方便的话,还请告知。

@HaloOrangeWang
Copy link
Owner

  1. 手动标注数据,从原始的midi文件中将各个乐器成分分隔成不同的音轨,并标明每个乐器的类型
  2. 将每一首歌的每个音轨转化成以1/8拍或1/4拍为步长的数组,并全部以SQL的格式存储(这一步是自动完成的)

@aishoot
Copy link

aishoot commented Mar 6, 2019

@HaloOrangeWang 您好,首先感谢您分享这么好的作品。我也同一楼有这样的问题,就是你从.mp3格式的儿歌到格式为rawdata.db的训练数据这一步是怎么做的?可以分享相关的做法或代码吗?谢谢,我也对AI音乐创作很感兴趣的

@HaloOrangeWang
Copy link
Owner

@pchao6
首先,我使用的原始数据是mid格式,而不是mp3。(mid格式的文件中可以直接读出各个音符的信息,而mp3格式不行,所以mid格式训练起来比mp3要容易得多)。
之后,我把原始的midi文件中将各个乐器成分分隔成不同的音轨,并标明每个乐器的类型。(数据标注这部分为手工操作)。
最后,使用程序读取标注好的midi文件,在时间序列上进行离散化,并存储到sql中。(这部分对应代码中的 MakerSrc/preparation/store_raw_data.py 和 MakerSrc/interfaces/midi.py )
另注:如果你想要我手工标注好的midi文件,可以+qq1974533445来找我要。

@aishoot
Copy link

aishoot commented Mar 8, 2019

@HaloOrangeWang 好勒,感谢感谢

@NightDramatist
Copy link
Author

非常感谢

@ghost
Copy link

ghost commented Aug 26, 2020

您好,这个项目做得挺细致的,做得超好的。

  1. 问下数据标注是指标明每个乐器的类型吗?
    需不需要修改数据的内容的?

  2. 假如我拿到其他的midi的文件,可能音乐类型不是儿歌,那可以直接用这里的代码处理吗?
    或者需要把midi数据处理(包括人工处理)成怎样的形式,才能用这里的代码处理到sql,并且无缝训练新的模型?

谢谢!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants