资源技术动态AI 复活的那些“失落艺术”

AI 复活的那些“失落艺术”

2019-12-19 | |  99 |   0

原标题:AI 复活的那些“失落艺术”

来源:InfoQ         链接:https://www.infoq.cn/article/hq7ZfoT1ePV7xcCVks62


这世上总是避免不了遗憾,但终归有些美好会在“不经意间”补全。AI 技术的存在,为这种补全,提供了新的选项。


喜欢古典音乐的朋友,想必对贝多芬都有着一些了解,然而令人遗憾的是,这位扼住命运喉咙的男人,终归是在其完成《第十交响曲》的前夕,溘然长逝。不过,近期的一则消息或许让这一遗憾出现新的转机:《第十交响曲》将由人工智能完成,而这项实验的结果也将由一支完整的交响乐团在 2020 年 4 月 28 日在德国贝多芬的出生地波恩公开奏演。

image.png


你会去听 AI 续写的《第十交响曲》吗?


时值贝多芬诞辰 250 周年之际,为纪念这位伟大作曲家为人类音乐艺术留下的宝贵财富,一个国际化的团队将利用 AI 技术续写贝多芬生前未完成的《第十交响曲》。


为了还原或者说是创作经典,一群音乐学家和程序员聚在一起,通过贝多芬未完成的《第十交响曲》和《英雄》等作品的片段来训练人工智能,然后由 AI 即兴创造出《第十交响曲》剩余的部分。


Herbert von Karajan 研究所所长、项目负责人 Matthias Roeder 对《法兰克福周日新闻》说:长久以来,机器从来没完成过这样的任务,这是史无前例的一次尝试。


Roeder 还表示,该 AI 算法正在取得积极进展,它无时无刻不在变化,就像一个懵懂的小孩子在探索贝多芬的世界。但令人遗憾的是,我们并没有找到该算法的具体细节。


贝多芬谱写了著名的《第九交响曲》,家喻户晓的《欢乐颂》就是《第九交响曲》其中的一部分。有证据表明,他生前仍然还在创作《第十交响曲》。但遗憾的是,当这位德国作曲家于 1827 年去世时只留下了部分草稿和笔记。


技术角度的 AI 作曲


所谓 AI 编曲和作曲,本质上是运行一个复杂的 AI 模型,来对不同的音乐、乐器、节奏、乐理等规则进行学习和反向输出。而且 AI 作曲也并非独一无二的技术,在今年 2 月份,华为就凭借迁移到 Mate20Pro 上的 AI 模型,续写了舒伯特的《 d 小调第 8 号交响曲》,并在伦敦的一场音乐会上进行了公演。


华为工作人员阿尔内·赫克尔曼表示,利用 AI 作曲,就像教孩子学习一门语言,开始的时候,他们会犯错误,纠正后还会犯新的错误,所以需要不断地纠正、不断地重复。


OpenAI 的 MuseNet 模型


今年 4 月,OpenAI 也对外发布了一款新型深度神经网络模型 MuseNet ,该模型不但可调用 10 种不同乐器生成时长约 4 分钟的音乐作品,而且能够融合从乡村到莫扎特再到披头士等各种音乐风格。


据悉,MuseNet 并非基于人们对音乐的理解进行编曲,而是通过学习预测数十万 MIDI 文件中下一个音符,来找到和声、节奏和曲风的模式。与 GPT-2 相似,MuseNet 同样采用多功能无监督技术。GPT-2 是一种大规模 transformer 模型,经过训练即可预测音频以及文本序列中的下一个音符。


相关 Github 地址: https://github.com/MrCheeze/musenet-midi


微软小冰

小冰的起步较早,在去年 KDD 2018 大会上,微软小冰团队的论文《 XiaoIce Band: A Melody and Arrangement Generation Framework for Pop Music 》(《小冰乐队:流行音乐的旋律与编曲框架》 )就获得了 Research Track 最佳学生论文。


论文中提到,微软团队设计了一种基于和弦的节奏和旋律交叉生成模型(CRMCG),可以生成带有和弦进行的旋律。而且还提出一种基于多任务学习的多乐器协同编曲模型(Multi-Instrument Co-Arrangement Model,MICA)。


另外,微软小冰的 AI 音乐才华出众,目前已发布数十首接近人类演唱水平的单曲,演唱模型迭代至第五个版本。全新的演唱模型,包括跨越多种演唱技巧的多个声音模型,并提升人工智能歌曲演绎的更高技巧和多风格化,实现了在不同的演唱技巧之间自然过渡。


相关 Github 地址: https://github.com/BennyThink/realXiaoice


AI 在行动


除了续写音乐残篇,AI 还可以从另一个方面发挥作用,比如修补名画、修复老旧照片等。

名画修补

image.png

《根特祭坛画》


著名的艺术珍品《根特祭坛画》,自完成之后便历经磨难,但在 AI 技术的加成下,名画修补成为了一件轻松的事。


在根特祭坛画的修复中, 利用 X 射线图像扫描技术进行成像是常见的修复技术,但如何将混合了双面板的 X 射线图像,分离成相应单面 X 射线图像是一个巨大的挑战。为此,伦敦大学和杜克大学的研究者们,提出了一种基于卷积神经网络(CNN)的自监督框架,


这种自我监督的神经网络,可以学习如何将 RGB 图像转换为 X 射线图像,然后作为单面板的虚拟图像“重建”,然后通过最小化重建 X 射线图像的误差,比较与原始混合的 X 射线图像之间的差异,进而让模型实现这种分离。


具体细节上,他们构建了七层的 CNN ,每个卷积层之间含有批量归一化和整流线性单元(ReLU)激活层。网络的结构受到了 pix2pix 结构启发(pix2pix 使用条件对抗网络进行图像到图像转换)。

image.png

 将 RGB 图像转换为 X 射线图像的神经网络结构


增强与修复照片


日前,一组林青霞的照片引起了不小的讨论,而“AI 老照片修复”也逐渐进入到大众的视野。事实上,相对于名画修补,老旧照片的修复可能相对而言较为简单。


InfoQ 在《一键高清还原老照片:全方位解读美图影像实验室 MTlab 人像画质修复技术》一文中对相关技术进行了揭秘,总结来讲,美图的相关修复技术主要是借鉴了深度学习技术,如降噪、增强、超分、强化学习等,在自研生成网络结构 BeautyGAN 的基础上,结合对抗式生成网络的前沿技术,使 BeautyGAN 具备良好的人像修复能力。


另外,美图影像实验室 MTlab 已经对外正式发布了“美图 AI 开放平台”( ai.meitu.com ),而且据美图技术人员透露,目前的美图 AI 开放平台开放了人脸技术、人体技术、图像识别、图像处理、图像生成等几大类核心 AI 技术。这些技术可通过云端 API/ 移动端 SDK/ 定制解决方案等多种方式对外提供经过市场验证的专业 AI 算法服务。

image.png

写在后面

AI 技术的快速发展是好事,对经典、艺术的再加工亦可以实现更多的美好。但是,AI 技术本身就是一把“双刃剑”,在一切美好背后也会隐藏着“作恶之心”, Deepfake 的滥用就是一个很显而易见的例子。至于如何让这把“剑”利已不伤人,在“弥补遗憾”的同时不去“作恶”,这将是未来很长一段时间我们需要思考和解决的问题。

【作者 : 张之栋 李冬梅】

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:从 ToC 到 ToB,一名程序员“连滚带爬”的自我颠覆

下一篇:如何在 python 中建立自己的逻辑回归模型

用户评价
全部评价

热门资源

  • 应用笔画宽度变换...

    应用背景:是盲人辅助系统,城市环境中的机器导航...

  • GAN之根据文本描述...

    一些比较好玩的任务也就应运而生,比如图像修复、...

  • 端到端语音识别时...

    从上世纪 50 年代诞生到 2012 年引入 DNN 后识别效...

  • 人体姿态估计的过...

    人体姿态估计是计算机视觉中一个很基础的问题。从...

  • 谷歌发布TyDi QA语...

    为了鼓励对多语言问答技术的研究,谷歌发布了 TyDi...