近日,瑞典流媒体大鳄Spotify与Bookshop.org网站开启合作,英美地区手机用户扫描Spotify应用程序即可购买Bookshop.org网站的实体书,Spotify同时新增“页面匹配”(Page Match)功能,实现读者不同版本阅读的自由切换。Spotify平台的“有声书概要”(Audiobook Recaps)功能,可向用户发送听书内容的文字总结,从收听中断位置继续进行纸书阅读。加拿大数字发行巨头德玛克公司(De Marque)也在探寻文本与音频之间无缝切换的方式,帮助消费者发现阅读目标,再通过沉浸式阅读获得对文本的深刻理解。
有声书连续10多年两位数增长的态势能否延续?流媒体巨头为何不断加强有声书市场布局?AI技术将如何改变有声书市场的发展轨迹?
德玛克公司总裁马克·布歇(Marc Boutet)在刚刚结束的伦敦书展上表示,故事最初就是通过口口相传传播开来的。在他看来,有声书在吸引那些事务繁忙、想以听书方式节省时间的读者方面更有优势。
据统计,过去15年,全球有声书市场已成长为年产值70多亿美元(2024年数据)的产业,其中北美贡献26亿美元;欧洲贡献近15亿美元;中国贡献10亿美元,其他国家和地区贡献近20亿美元。未来几年,AI工具将助力中文、印地语、西班牙语等音频开发不足的语言的有声书数量增加。目前全球有声书品种不到200万种,而纸书和电子书有1亿—1.5亿种,与之相比,有声书仍有巨大的市场空间。到2030年预计全球有声书市场将达到350亿美元。
法兰克福书展官网前不久发布了委托西班牙Dosdoce.com公司撰写的《AI与音频:AI如何重塑有声书行业》(AI and Audio: How Artificial Intelligence is Redefining the Audiobook Industry)白皮书,分析了音频行业的市场格局,以及AI带来的机遇与挑战。
白皮书通过调研发现,过去一年,出版界对AI工具的态度从2024年的“怀疑”转向“谨慎乐观”。全球已开发160多种AI驱动的音频工具和解决方案,其主要功能包括:创建合成语音引擎,为有声书、播客提供多语种同步翻译,在宣传推广有声内容方面实现技术突破,在有声内容出版前和出版后应用自动化流程。虽然AI工具在复杂流程管理和编辑环节实现了自动化,大大降低了时间和运营成本,但这至少需要两到三年的适应期。AI工具的广泛应用也增加了新的工作环节:其生成的内容需要人工审核,出版机构对员工的工作技能有更高要求,如AI增强型内容生成、数据驱动营销、AI音频策略以及将项目管理融入业务流程,这些都需要强大的分析和战略能力。
Dosdoce.com网站联合创始人哈维尔·塞拉亚(Javier Celaya)表示,当所有音频专业人士都使用相同的AI工具时,人类的灵感和创造力将成为差异化因素。
AI工具应用进入关键节点
白皮书调研阶段,撰写者采访了40多家处于行业前沿的出版机构、音频工作室、数字发行企业和流媒体平台。他们一致认为,未来10年AI很可能从根本上改变我们访问和消费各类文化内容的方式,将对长期存在的版权法和收入机制提出挑战。
出版业正进入一个关键节点,即AI驱动的出版解决方案可以帮助出版商扩大有声书规模、拓展分销机会并创造新的收入来源。AI工具可以帮助创作者和制作人撰写手稿、生成声音、编辑音频、设计封面、起草节目笔记、将内容翻译成多种语言,甚至推荐下一步该制作什么内容。人声与机器生成音频之间的界限正在迅速消失。
白皮书还绘制了“AI驱动的全球音频工具与服务图谱”(Global Audio AI Driven Tools & Services Map),汇总了AI介入音频行业的6种业务:音频制作和服务、合成语音引擎、声音设计服务、营销服务、音频内容分销渠道,以及翻译服务。
从地域看,美国位居AI工具和服务开发商数量首位,占样本数量的40%,欧洲紧随其后,占比38%。亚洲增长较快,占比10%,拉丁美洲占比7%。
从业务类型看,音频制作和服务业务居领先地位,占样本数量的44%,其次是合成语音引擎公司,占样本数量的27%。声音设计服务占比13%。之后依次是:营销服务(7%)、音频内容分销渠道(5%)以及翻译服务(4%)(见图)。

业务量最大的是音频制作和服务业务。越来越多的音频工作室,在使用人声制作音频的同时,整合各种AI工具,如瑞典的EarSelect、美国的FlightStory、德国的Goaudio、西班牙的MiVoz、埃及的Arabookverse Studios等,并围绕制作流程提供手稿预处理、后期自动化检查等增值服务。
业务量第二的是合成语音引擎,如ElevenLabs、MS Azure和Google,以及聚合多个第三方模型的集成式公司。美国语音引擎公司占样本数量的58%,欧洲占比28%,其他国家和地区占比14%。
业务量第三的是声音设计服务。由于音频小说制作市场蓬勃发展,这类工具的使用日益增多,旨在吸引那些希望收听带来“观看”电视剧或“玩”电子游戏般特效的音频故事的新听众。
营销服务位居业务量第四位,Shimmr、Wondercraft和Clube de Autores等服务可以帮助出版商和作者优化音频内容推广流程,以提高市场知名度。
从可供数量看,英语有声书80万种,德语有声书近30万种,西班牙语有声书约4.5万种,法语有声书2.5万种,意大利语有声书近2万种。Bookwire音频副总裁维德尔·巴尔·卡(Videl Bar Kar)表示,全球约95%的电子书(510万种图书)没有有声书版本。未来AI合成语音的有声书将发挥更重要的作用。
AI为有声书内容提质增效
毋庸置疑,流媒体公司处于推动AI技术应用的最前沿。Bookwire业务发展主管埃里克·巴尔托莱蒂(Eric Bartoletti)表示,将在现有业务基础上增加目录创建,借助新的AI驱动推荐技术为听众匹配下一本好书。
Audible公司首席内容官雷切尔·吉亚扎(Rachel Ghiazza)表示,将继续投资于原创内容,为创作者提供不同的有声书制作方式,同时为翻译服务提供可选的人工审核,以捕捉不同文化的细微差别。未来将在AI工具中添加更多语言、口音和角色扮演,以更好地服务全球多元化的有声书受众。
出版机构积极跟进,将AI技术应用于出版流程中,为其业务创新发展带来新的可能性。法国阿歇特图书集团旗下有声书出版品牌Audiolib执行总监洛尔·萨热(Laure Saget)表示,在决定将哪些图书制成有声书时,AI可以提供优化策略,让编辑受益。AI降低了有声书前期和后期制作成本,缩短了制作时间,从而让有声书与纸书同步发行。
企鹅兰登有声书业务部全球总裁兼发行人阿曼达·达谢尔诺(Amanda D'Acierno)表示,他们优化了转录和校对等任务,自动触发工作流程提醒,并起草发音指南和人物分析等准备材料。每个环节都遵循“始于人工,终于人工”这一关键原则,由专职人员进行审核。
麦克米伦首席商务官詹姆斯·朗(James Long)表示,通过AI驱动的合成语音创新,新的可能性正在出现,可以提供独特且丰富的聆听体验。
AI正在打破长期以来阻碍图书国际影响力和语言多样性的障碍。哈珀·柯林斯国际外语业务CEO兼首席数字官尚塔尔·雷斯蒂沃-阿莱西(Chantal Restivo-Alessi)表示,他们利用AI合成语音技术和人工审核,可以将过去因经济原因无法开发的系列图书制成多语种有声书。
阿拉伯Arabookverse公司联合创始人兼首席商务官艾哈迈德·雷维赫勒(Ahmed Rewihel)表示,在AI支持下,他们可以根据听众兴趣推荐合适的书籍,使用AI合成语音技术制作有声书,将阿拉伯语故事传播到全球。
Storytel首席内容兼出版官海伦娜·古斯塔夫松(Helena Gustafsson)表示,AI可以增强并优化流程,但提供愿景、情感智能和关键判断力的仍应是人类创作者,这些要素定义了引人入胜的内容。出版商和创作者要在竞争激烈的全球格局中蓬勃发展,未来应利用AI放大人类的创造力,而非取代它。
Audible将通过与亚马逊开展战略合作进军11个国际市场,以本土化语言向当地读者推荐图书并提供当地货币支付的便利。该公司还启动一项新订阅计划,面向更多国家推行低价有声书,从而吸引新兴市场的家庭成员。对于服务多元受众的平台来说,用当地听众熟悉的声音提供内容至关重要。Spotify有声书编辑兼出版总监苏珊娜·加尔维斯(Suzanne Galvez)表示,AI技术为创新跨格式阅读和收听体验带来了更多可能性。
AI助力有声书营销推广
在营销方面,AI驱动的分析工具可以提供对消费者行为的深刻洞察,从而实现有针对性的营销活动,还可以自动优化新闻通讯、社交媒体发帖和定向广告等营销材料,确保它们能与特定受众群体产生共鸣。
创建元数据使音频内容发现和营销更智能。出版机构使用集成式AI工具撰写图书概要、识别关键词和元数据或在社交媒体发帖,大大简化了营销工作流程。西班牙行星出版集团(Grupo Planeta)大众市场与数字部门主管桑托斯·帕拉齐(Santos Palazzi)表示,他们通过丰富的元数据提高目录可见性,更精准地触达目标人群,同时促进小众题材和地区方言的发展。但制作元数据必须确保文本的高质量,要说服经纪人和作者允许使用AI语音克隆技术传播其内容。
儿童有声书近年来以惊人的速度增长,得益于儿童音频内容收听设备(如Yoto、Tonies、MyCube Histories等)的涌现以及AI工具的应用,让幼儿无需成人介入即可访问有声书。Yoto内容总监杰斯·塔兰特(Jess Tarrant)表示,该公司正在基于其原创作品测试AI翻译工具和数字语音技术,将开发新的语言版本。品质是重中之重,她还强调指出,如果大量低质量的AI生成有声书持续泛滥,可能对消费者信心构成威胁。
为打造有吸引力、多元化的收听体验,音频流媒体和分销平台纷纷投入巨资,以创建先进、公平、包容的系统,通过AI推荐工具引导听众获得个性化内容。如播客平台Pocket FM为创作者提供从剧本和语音生成到声音设计、多语言本地化等全流程服务,奈飞平台将生成式AI用于屏幕画面制作、搜索、互动广告等领域,德国书籍摘要订阅服务公司Blinkist则提供多语种音频开发与内容摘要等服务。
英国Shimmr创始人兼CEO纳迪姆·萨德克(Nadim Sadek)指出,目前最大的挑战在于,当叙事由算法控制时,如何保持人类讲故事的亲密性。我们面临着失去来自真实声音的信任风险。
校 对:马 葵
编 辑:林 晨
复 审:张维特
终 审:倪 成

本篇文章来源于微信公众号: 中国出版传媒商报
1、推书网发布的文章《全球约95%的电子书暂无有声书版本》为推书网注册网友“纸书堆”原创或整理,版权归原作者所有,转载请注明出处!
2、推书网文章《全球约95%的电子书暂无有声书版本》仅代表作者本人的观点,与本网站立场无关,作者文责自负。
3、推书网一直无私为图书馆转载发布活动及资讯动态。对于不当转载或引用本网内容而引起的民事纷争、行政处理或其他损失,推书网不承担责任。
4、本文转载链接:https://tuibook.com/readhb/65999.html





