全球约95%的电子书暂无有声书版本

近日，瑞典流媒体大鳄Spotify与Bookshop.org网站开启合作，英美地区手机用户扫描Spotify应用程序即可购买Bookshop.org网站的实体书，Spotify同时新增“页面匹配”（Page Match）功能，实现读者不同版本阅读的自由切换。Spotify平台的“有声书概要”（Audiobook Recaps）功能，可向用户发送听书内容的文字总结，从收听中断位置继续进行纸书阅读。加拿大数字发行巨头德玛克公司（De Marque）也在探寻文本与音频之间无缝切换的方式，帮助消费者发现阅读目标，再通过沉浸式阅读获得对文本的深刻理解。

有声书连续10多年两位数增长的态势能否延续？流媒体巨头为何不断加强有声书市场布局？AI技术将如何改变有声书市场的发展轨迹？

德玛克公司总裁马克·布歇（Marc Boutet）在刚刚结束的伦敦书展上表示，故事最初就是通过口口相传传播开来的。在他看来，有声书在吸引那些事务繁忙、想以听书方式节省时间的读者方面更有优势。

据统计，过去15年，全球有声书市场已成长为年产值70多亿美元（2024年数据）的产业，其中北美贡献26亿美元；欧洲贡献近15亿美元；中国贡献10亿美元，其他国家和地区贡献近20亿美元。未来几年，AI工具将助力中文、印地语、西班牙语等音频开发不足的语言的有声书数量增加。目前全球有声书品种不到200万种，而纸书和电子书有1亿—1.5亿种，与之相比，有声书仍有巨大的市场空间。到2030年预计全球有声书市场将达到350亿美元。

法兰克福书展官网前不久发布了委托西班牙Dosdoce.com公司撰写的《AI与音频：AI如何重塑有声书行业》（AI and Audio: How Artificial Intelligence is Redefining the Audiobook Industry）白皮书，分析了音频行业的市场格局，以及AI带来的机遇与挑战。

白皮书通过调研发现，过去一年，出版界对AI工具的态度从2024年的“怀疑”转向“谨慎乐观”。全球已开发160多种AI驱动的音频工具和解决方案，其主要功能包括：创建合成语音引擎，为有声书、播客提供多语种同步翻译，在宣传推广有声内容方面实现技术突破，在有声内容出版前和出版后应用自动化流程。虽然AI工具在复杂流程管理和编辑环节实现了自动化，大大降低了时间和运营成本，但这至少需要两到三年的适应期。AI工具的广泛应用也增加了新的工作环节：其生成的内容需要人工审核，出版机构对员工的工作技能有更高要求，如AI增强型内容生成、数据驱动营销、AI音频策略以及将项目管理融入业务流程，这些都需要强大的分析和战略能力。

Dosdoce.com网站联合创始人哈维尔·塞拉亚（Javier Celaya）表示，当所有音频专业人士都使用相同的AI工具时，人类的灵感和创造力将成为差异化因素。

AI工具应用进入关键节点

白皮书调研阶段，撰写者采访了40多家处于行业前沿的出版机构、音频工作室、数字发行企业和流媒体平台。他们一致认为，未来10年AI很可能从根本上改变我们访问和消费各类文化内容的方式，将对长期存在的版权法和收入机制提出挑战。

出版业正进入一个关键节点，即AI驱动的出版解决方案可以帮助出版商扩大有声书规模、拓展分销机会并创造新的收入来源。AI工具可以帮助创作者和制作人撰写手稿、生成声音、编辑音频、设计封面、起草节目笔记、将内容翻译成多种语言，甚至推荐下一步该制作什么内容。人声与机器生成音频之间的界限正在迅速消失。

白皮书还绘制了“AI驱动的全球音频工具与服务图谱”（Global Audio AI Driven Tools & Services Map），汇总了AI介入音频行业的6种业务：音频制作和服务、合成语音引擎、声音设计服务、营销服务、音频内容分销渠道，以及翻译服务。

从地域看，美国位居AI工具和服务开发商数量首位，占样本数量的40%，欧洲紧随其后，占比38%。亚洲增长较快，占比10%，拉丁美洲占比7%。

从业务类型看，音频制作和服务业务居领先地位，占样本数量的44%，其次是合成语音引擎公司，占样本数量的27%。声音设计服务占比13%。之后依次是：营销服务（7%）、音频内容分销渠道（5%）以及翻译服务（4%）（见图）。

全球约95%的电子书暂无有声书版本

业务量最大的是音频制作和服务业务。越来越多的音频工作室，在使用人声制作音频的同时，整合各种AI工具，如瑞典的EarSelect、美国的FlightStory、德国的Goaudio、西班牙的MiVoz、埃及的Arabookverse Studios等，并围绕制作流程提供手稿预处理、后期自动化检查等增值服务。

业务量第二的是合成语音引擎，如ElevenLabs、MS Azure和Google，以及聚合多个第三方模型的集成式公司。美国语音引擎公司占样本数量的58%，欧洲占比28%，其他国家和地区占比14%。

业务量第三的是声音设计服务。由于音频小说制作市场蓬勃发展，这类工具的使用日益增多，旨在吸引那些希望收听带来“观看”电视剧或“玩”电子游戏般特效的音频故事的新听众。

营销服务位居业务量第四位，Shimmr、Wondercraft和Clube de Autores等服务可以帮助出版商和作者优化音频内容推广流程，以提高市场知名度。

从可供数量看，英语有声书80万种，德语有声书近30万种，西班牙语有声书约4.5万种，法语有声书2.5万种，意大利语有声书近2万种。Bookwire音频副总裁维德尔·巴尔·卡（Videl Bar Kar）表示，全球约95%的电子书（510万种图书）没有有声书版本。未来AI合成语音的有声书将发挥更重要的作用。

AI为有声书内容提质增效

毋庸置疑，流媒体公司处于推动AI技术应用的最前沿。Bookwire业务发展主管埃里克·巴尔托莱蒂（Eric Bartoletti）表示，将在现有业务基础上增加目录创建，借助新的AI驱动推荐技术为听众匹配下一本好书。

Audible公司首席内容官雷切尔·吉亚扎（Rachel Ghiazza）表示，将继续投资于原创内容，为创作者提供不同的有声书制作方式，同时为翻译服务提供可选的人工审核，以捕捉不同文化的细微差别。未来将在AI工具中添加更多语言、口音和角色扮演，以更好地服务全球多元化的有声书受众。

出版机构积极跟进，将AI技术应用于出版流程中，为其业务创新发展带来新的可能性。法国阿歇特图书集团旗下有声书出版品牌Audiolib执行总监洛尔·萨热（Laure Saget）表示，在决定将哪些图书制成有声书时，AI可以提供优化策略，让编辑受益。AI降低了有声书前期和后期制作成本，缩短了制作时间，从而让有声书与纸书同步发行。

企鹅兰登有声书业务部全球总裁兼发行人阿曼达·达谢尔诺（Amanda D'Acierno）表示，他们优化了转录和校对等任务，自动触发工作流程提醒，并起草发音指南和人物分析等准备材料。每个环节都遵循“始于人工，终于人工”这一关键原则，由专职人员进行审核。

麦克米伦首席商务官詹姆斯·朗（James Long）表示，通过AI驱动的合成语音创新，新的可能性正在出现，可以提供独特且丰富的聆听体验。

AI正在打破长期以来阻碍图书国际影响力和语言多样性的障碍。哈珀·柯林斯国际外语业务CEO兼首席数字官尚塔尔·雷斯蒂沃-阿莱西（Chantal Restivo-Alessi）表示，他们利用AI合成语音技术和人工审核，可以将过去因经济原因无法开发的系列图书制成多语种有声书。

阿拉伯Arabookverse公司联合创始人兼首席商务官艾哈迈德·雷维赫勒（Ahmed Rewihel）表示，在AI支持下，他们可以根据听众兴趣推荐合适的书籍，使用AI合成语音技术制作有声书，将阿拉伯语故事传播到全球。

Storytel首席内容兼出版官海伦娜·古斯塔夫松（Helena Gustafsson）表示，AI可以增强并优化流程，但提供愿景、情感智能和关键判断力的仍应是人类创作者，这些要素定义了引人入胜的内容。出版商和创作者要在竞争激烈的全球格局中蓬勃发展，未来应利用AI放大人类的创造力，而非取代它。

Audible将通过与亚马逊开展战略合作进军11个国际市场，以本土化语言向当地读者推荐图书并提供当地货币支付的便利。该公司还启动一项新订阅计划，面向更多国家推行低价有声书，从而吸引新兴市场的家庭成员。对于服务多元受众的平台来说，用当地听众熟悉的声音提供内容至关重要。Spotify有声书编辑兼出版总监苏珊娜·加尔维斯（Suzanne Galvez）表示，AI技术为创新跨格式阅读和收听体验带来了更多可能性。

AI助力有声书营销推广

在营销方面，AI驱动的分析工具可以提供对消费者行为的深刻洞察，从而实现有针对性的营销活动，还可以自动优化新闻通讯、社交媒体发帖和定向广告等营销材料，确保它们能与特定受众群体产生共鸣。

创建元数据使音频内容发现和营销更智能。出版机构使用集成式AI工具撰写图书概要、识别关键词和元数据或在社交媒体发帖，大大简化了营销工作流程。西班牙行星出版集团（Grupo Planeta）大众市场与数字部门主管桑托斯·帕拉齐（Santos Palazzi）表示，他们通过丰富的元数据提高目录可见性，更精准地触达目标人群，同时促进小众题材和地区方言的发展。但制作元数据必须确保文本的高质量，要说服经纪人和作者允许使用AI语音克隆技术传播其内容。

儿童有声书近年来以惊人的速度增长，得益于儿童音频内容收听设备（如Yoto、Tonies、MyCube Histories等）的涌现以及AI工具的应用，让幼儿无需成人介入即可访问有声书。Yoto内容总监杰斯·塔兰特（Jess Tarrant）表示，该公司正在基于其原创作品测试AI翻译工具和数字语音技术，将开发新的语言版本。品质是重中之重，她还强调指出，如果大量低质量的AI生成有声书持续泛滥，可能对消费者信心构成威胁。

为打造有吸引力、多元化的收听体验，音频流媒体和分销平台纷纷投入巨资，以创建先进、公平、包容的系统，通过AI推荐工具引导听众获得个性化内容。如播客平台Pocket FM为创作者提供从剧本和语音生成到声音设计、多语言本地化等全流程服务，奈飞平台将生成式AI用于屏幕画面制作、搜索、互动广告等领域，德国书籍摘要订阅服务公司Blinkist则提供多语种音频开发与内容摘要等服务。

英国Shimmr创始人兼CEO纳迪姆·萨德克（Nadim Sadek）指出，目前最大的挑战在于，当叙事由算法控制时，如何保持人类讲故事的亲密性。我们面临着失去来自真实声音的信任风险。

校对：马葵

编辑：林晨

复审：张维特

终审：倪成

全球约95%的电子书暂无有声书版本