跳转到主要内容

iGenius

通过基于云的创新技术合成语音

寻找声音

寻找声音

箭头
创建脚本

创建脚本

箭头
访问云录制

访问云录制

=

由 AI 提供支持的 Crystals Syntheiszed Voice

Crystal人工智能驱动型合成语音

Crystal是谁?

Crystal是由增强智能公司iGenius开发的虚拟数据智能顾问,旨在帮助更多商务人士在人工智能的支持下,更快地做出更明智的决策。 作为一款能够连接多种数据源的工具,Crystal让用户能够以自然的语言提出问题,仿佛在与同事对话一样,从而彻底改变了用户的数据与分析体验。

有了Crystal,用户能够显著减少在数据探索上所花费的时间,从而将更多精力投入到根据最相关的洞察采取行动上。 这一优势不仅增强了组织各层级的决策自主权、丰富性和扩展能力,还提高了运营效率,并推动了收入的增长。 iGenius与TransPerfect创博的人工智能数据解决方案部门创博数据,以及音频/视频部门MediaNEXT展开合作,共同开发并推出了Crystal这一独特的定制合成语音服务。

以创新攻克难关

项目启动之际正值疫情最为严峻的时期,众多工作室被迫关闭,语音人才被困家中,媒体行业陷入停滞。当时,iGenius急需录制Crystal的语音,但可选方案十分有限。 该公司最终选择了TransPerfect创博提供的基于云的混合式录制解决方案:StudioNEXT。 得益于这一平台,语音人才得以在家中舒适的环境下进行录制,无需通勤至工作室、使用专业设备,也无需与他人接触。 团队完全能够通过这种基于云的内部技术来合成Crystal的语音,并进行剪辑和制作,从而满足iGenius的特定项目要求。

塑造语音

我们需要采集配音演员的一系列录音来训练语音合成引擎,进而开发Crystal的语音。 这些录音最终被输入到一个人工智能模型中,该模型基本上模拟了口语的概率模型,将每个句子视为一个声音序列。 接着,我们开发了一种算法,从语言学语料库中筛选出一个标准化的语料库,用以塑造Crystal的语音。 我们完全依靠内部软件和远程环境,实现了实际语音与人工智能技术的无缝融合。

 

对我们团队而言,至关重要的是倾听客户的心声,洞察他们的需求,并主动进行研究,以便深入理解客户的业务领域,从而满足甚至超越客户的期望。 能够与创博数据和MediaNEXT携手合作,为客户提供令人满意的解决方案,无疑是一次卓越的合作体验。

TransPerfect创博数据科学家Fred Bane

语音AI

• • • • 搭建文本与语音之间的桥梁 • • • •

寻找声音

第1步— 语音

对于虚拟顾问而言,声音即是其品牌形象的化身。 尽管Crystal没有实体形象,但她的声音必须能够营造出一种特定的感受和氛围,以便在第一时间给人留下深刻印象。 我们依托MediaNEXT和创博数据丰富的语言与语音人才资源,来打造合成语音。iGenius精心挑选了多样化的语音样本,涵盖不同语音人才与风格。 iGenius综合考量了各种选择、语调变化和语言风格,最终确定了希望塑造的Crystal形象。

创建脚本

第2步— 脚本

创博数据与iGenius携手合作,共同确定了脚本的总长度、句子总数、每个句子的持续时间,以及最为关键的一点——语料库中音素的特定平衡,确保其与英语音素的整体分布相吻合。

访问云录制

第3步— 录制

我们与Crystal的配音演员Jennifer携手合作,在StudioNEXT的支持下,实现了完全远程环境下的脚本演绎。 利用云录制工具包,Jennifer可以灵活地登录和登出,无需担心忘记中断的地方,因为所有录制内容都已自动上传至云端。 尽管这是Jennifer的一次新尝试,且她所在的建筑周围环绕着施工噪音,但她能够将设备带到安静的地点,轻松完成项目的录制工作。

iGenius研发部门主要负责为我们的主打产品Crystal创建定制化的合成语音。 通过与Transperfect创博旗下创博数据的客户经理Sofia Silva——也是我的LinkedIn好友——取得联系,我们成功将构想付诸实践。 得益于与创博数据和MediaNEXT的紧密合作,我们满怀信心地创建了一个包含均衡语音句子和相应高品质音频片段的大型数据集,从而能够训练出一款具备文本转语音功能的高性能AI模型。

Marco Bocchio,博士,iGenius机器学习与数据科学团队 负责人

卓越成果

iGenius一直致力于寻找一种理想的声音,以期助力增强客户的数据探索、分析及整体体验。 通过Crystal,该公司能够向客户提供一种合成人工语音服务,助力客户以自然流畅的方式与该语音工具进行互动,仿佛与同事间的交流一样无异。 iGenius、创博数据和MediaNEXT通力合作,借助定制化的混合式解决方案,成功将合成语音的概念转化为实际应用。

创博数据汇聚了全球逾 1,000,000 名成员,以及超过 250 种语言的语言专家。 创博数据既依托于自身构建的平台,也能够使用客户或第三方的工具。 这样一来,您的数据尽在掌控。

申请咨询。