AI 复活的那些“失落艺术”

资源分类

AI 复活的那些“失落艺术”

2019-12-19 |

99 |

原标题：AI 复活的那些“失落艺术”

来源：InfoQ 链接：https://www.infoq.cn/article/hq7ZfoT1ePV7xcCVks62

这世上总是避免不了遗憾，但终归有些美好会在“不经意间”补全。AI 技术的存在，为这种补全，提供了新的选项。

喜欢古典音乐的朋友，想必对贝多芬都有着一些了解，然而令人遗憾的是，这位扼住命运喉咙的男人，终归是在其完成《第十交响曲》的前夕，溘然长逝。不过，近期的一则消息或许让这一遗憾出现新的转机：《第十交响曲》将由人工智能完成，而这项实验的结果也将由一支完整的交响乐团在 2020 年 4 月 28 日在德国贝多芬的出生地波恩公开奏演。

你会去听 AI 续写的《第十交响曲》吗？

时值贝多芬诞辰 250 周年之际，为纪念这位伟大作曲家为人类音乐艺术留下的宝贵财富，一个国际化的团队将利用 AI 技术续写贝多芬生前未完成的《第十交响曲》。

为了还原或者说是创作经典，一群音乐学家和程序员聚在一起，通过贝多芬未完成的《第十交响曲》和《英雄》等作品的片段来训练人工智能，然后由 AI 即兴创造出《第十交响曲》剩余的部分。

Herbert von Karajan 研究所所长、项目负责人 Matthias Roeder 对《法兰克福周日新闻》说：长久以来，机器从来没完成过这样的任务，这是史无前例的一次尝试。

Roeder 还表示，该 AI 算法正在取得积极进展，它无时无刻不在变化，就像一个懵懂的小孩子在探索贝多芬的世界。但令人遗憾的是，我们并没有找到该算法的具体细节。

贝多芬谱写了著名的《第九交响曲》，家喻户晓的《欢乐颂》就是《第九交响曲》其中的一部分。有证据表明，他生前仍然还在创作《第十交响曲》。但遗憾的是，当这位德国作曲家于 1827 年去世时只留下了部分草稿和笔记。

技术角度的 AI 作曲

所谓 AI 编曲和作曲，本质上是运行一个复杂的 AI 模型，来对不同的音乐、乐器、节奏、乐理等规则进行学习和反向输出。而且 AI 作曲也并非独一无二的技术，在今年 2 月份，华为就凭借迁移到 Mate20Pro 上的 AI 模型，续写了舒伯特的《 d 小调第 8 号交响曲》，并在伦敦的一场音乐会上进行了公演。

华为工作人员阿尔内·赫克尔曼表示，利用 AI 作曲，就像教孩子学习一门语言，开始的时候，他们会犯错误，纠正后还会犯新的错误，所以需要不断地纠正、不断地重复。

OpenAI 的 MuseNet 模型

今年 4 月，OpenAI 也对外发布了一款新型深度神经网络模型 MuseNet ，该模型不但可调用 10 种不同乐器生成时长约 4 分钟的音乐作品，而且能够融合从乡村到莫扎特再到披头士等各种音乐风格。

据悉，MuseNet 并非基于人们对音乐的理解进行编曲，而是通过学习预测数十万 MIDI 文件中下一个音符，来找到和声、节奏和曲风的模式。与 GPT-2 相似，MuseNet 同样采用多功能无监督技术。GPT-2 是一种大规模 transformer 模型，经过训练即可预测音频以及文本序列中的下一个音符。

相关 Github 地址： https://github.com/MrCheeze/musenet-midi

微软小冰

小冰的起步较早，在去年 KDD 2018 大会上，微软小冰团队的论文《 XiaoIce Band: A Melody and Arrangement Generation Framework for Pop Music 》（《小冰乐队：流行音乐的旋律与编曲框架》）就获得了 Research Track 最佳学生论文。

论文中提到，微软团队设计了一种基于和弦的节奏和旋律交叉生成模型（CRMCG），可以生成带有和弦进行的旋律。而且还提出一种基于多任务学习的多乐器协同编曲模型（Multi-Instrument Co-Arrangement Model，MICA）。

另外，微软小冰的 AI 音乐才华出众，目前已发布数十首接近人类演唱水平的单曲，演唱模型迭代至第五个版本。全新的演唱模型，包括跨越多种演唱技巧的多个声音模型，并提升人工智能歌曲演绎的更高技巧和多风格化，实现了在不同的演唱技巧之间自然过渡。

相关 Github 地址： https://github.com/BennyThink/realXiaoice

AI 在行动

除了续写音乐残篇，AI 还可以从另一个方面发挥作用，比如修补名画、修复老旧照片等。

名画修补

《根特祭坛画》

著名的艺术珍品《根特祭坛画》，自完成之后便历经磨难，但在 AI 技术的加成下，名画修补成为了一件轻松的事。

在根特祭坛画的修复中，利用 X 射线图像扫描技术进行成像是常见的修复技术，但如何将混合了双面板的 X 射线图像，分离成相应单面 X 射线图像是一个巨大的挑战。为此，伦敦大学和杜克大学的研究者们，提出了一种基于卷积神经网络（CNN）的自监督框架，

这种自我监督的神经网络，可以学习如何将 RGB 图像转换为 X 射线图像，然后作为单面板的虚拟图像“重建”，然后通过最小化重建 X 射线图像的误差，比较与原始混合的 X 射线图像之间的差异，进而让模型实现这种分离。

具体细节上，他们构建了七层的 CNN ，每个卷积层之间含有批量归一化和整流线性单元（ReLU）激活层。网络的结构受到了 pix2pix 结构启发（pix2pix 使用条件对抗网络进行图像到图像转换）。

将 RGB 图像转换为 X 射线图像的神经网络结构

增强与修复照片

日前，一组林青霞的照片引起了不小的讨论，而“AI 老照片修复”也逐渐进入到大众的视野。事实上，相对于名画修补，老旧照片的修复可能相对而言较为简单。

InfoQ 在《一键高清还原老照片：全方位解读美图影像实验室 MTlab 人像画质修复技术》一文中对相关技术进行了揭秘，总结来讲，美图的相关修复技术主要是借鉴了深度学习技术，如降噪、增强、超分、强化学习等，在自研生成网络结构 BeautyGAN 的基础上，结合对抗式生成网络的前沿技术，使 BeautyGAN 具备良好的人像修复能力。

另外，美图影像实验室 MTlab 已经对外正式发布了“美图 AI 开放平台”（ ai.meitu.com ），而且据美图技术人员透露，目前的美图 AI 开放平台开放了人脸技术、人体技术、图像识别、图像处理、图像生成等几大类核心 AI 技术。这些技术可通过云端 API/ 移动端 SDK/ 定制解决方案等多种方式对外提供经过市场验证的专业 AI 算法服务。

写在后面

AI 技术的快速发展是好事，对经典、艺术的再加工亦可以实现更多的美好。但是，AI 技术本身就是一把“双刃剑”，在一切美好背后也会隐藏着“作恶之心”， Deepfake 的滥用就是一个很显而易见的例子。至于如何让这把“剑”利已不伤人，在“弥补遗憾”的同时不去“作恶”，这将是未来很长一段时间我们需要思考和解决的问题。

【作者 : 张之栋李冬梅】

一THE END一

免责声明：本文来自互联网新闻客户端自媒体，不代表本网的观点和立场。

合作及投稿邮箱：E-mail:editor@tusaishared.com

上一篇：从 ToC 到 ToB，一名程序员“连滚带爬”的自我颠覆

下一篇：如何在 python 中建立自己的逻辑回归模型

用户评价

全部评价

热门资源

应用笔画宽度变换...

应用背景：是盲人辅助系统，城市环境中的机器导航...
GAN之根据文本描述...

一些比较好玩的任务也就应运而生，比如图像修复、...
端到端语音识别时...

从上世纪 50 年代诞生到 2012 年引入 DNN 后识别效...
人体姿态估计的过...

人体姿态估计是计算机视觉中一个很基础的问题。从...
谷歌发布TyDi QA语...

为了鼓励对多语言问答技术的研究，谷歌发布了 TyDi...

智能在线

400-630-6780
聆听.建议反馈

E-mail: support@tusaishared.com