OKI冲电气开启您的梦想

China

  • Global Site
  • Contact
  • Sitemap
  • Japanese Site

 


現在位置: Home > 新闻发布 2008 > 冲电气开始提供再现自己声音的语音合成软件「Polluxstar®」


新闻发布

冲电气开始提供再现自己声音的语音合成软件「Polluxstar®」

响应用户非此莫属的声音需求

2008年7月24日 -- 冲电气工业株式会社(OKI)报道,即日起开始提供连语气、语调等特征也非常接近自然嗓音进行发声朗读,能再现自己声音的软件「Polluxstar」。通过个人电脑等使用「Polluxstar®」,可以避免用无个性的机械合成音发声,实现用具有本人讲话气氛、个性的「自己的声音」进行交流沟通。

冲电气以实现充实着无所不在网络服务的「e社会®(注1)」为己任。为了实现这一目标,我们认为无论为谁「以所需的形式」提供「所需的信息」至关重要。而且,不单纯提供信息传输手段,还能同时实现传递感情、共鸣的丰富多彩的交流沟通环境非常必要。

冲电气长期以来积极研究开发为语音通信提供后盾的技术,在VoIP(注2)、CTI(注3)市场占据相当高的份额,拥有骄人业绩。在将文本数据转换成语音数据的语音合成技术(TTS:Text-To-Speech)领域也进一步超越了以往技术,积极进行既实现清晰易听,同时还能体现本人个性的语音技术开发。

语音是最基本的交流沟通手段之一,不单纯是用语言表达意思,还承担着传递「非此人莫属」(本人性)的重要责任。但是,为了通过计算机等机械实现不仅能将预先指定的文章,而且还能将日常生活中常用的各种各样的语言作为自然讲话进行再现,大量收集正确发音的语音数据等,构筑语音数据库必须付出大量时间和劳力。为此,冲电气以一般人按普通发声规律不一定完全正确的语音数据,在不勉为其难的收录量下也能再现「自己的声音」为目标积极推进研究开发工作。该项研究成果表明,可以构筑高效稳定的语音数据库,成功实用化了再现「自己的声音」的技术。

在验证再现「自己的声音」于实际生活中到底有多少价值的过程中,大阪艺术大学执教于信息工学的牧泉教授给予了大力协助。冲电气在牧教授因病必须摘除声带的手术前,收录了他的语音数据,并将这些语音数据编入自己的声音软件「Polluxstar」提供牧教授使用。牧教授从2008年4月开始使用本软件上的「自己的声音」,在大学里重新开始授课,同年7月全部完成了2008年度上学期的教学课程。并且在实际生活中他也积极灵活运用该软件,为验证该软件的可用性及面向实用化找出存在的课题给予了协作。结果证明「Polluxstar」软件已经达到了在普通人的日常生活中也能有效使用的水平。而且,在向普通人提供该软件之前,作为商品进一步完善了功能。

冲电气对于因疾病等原因失声的人士,作为代替这些人发声,支援其本人及家庭成员生活的工具,开始销售「Polluxstar」软件。本公司认准运用个人特性的声音必将发挥重要作用,准备通过在各个领域扩大该软件的应用范围,积极推进不断丰富语音交流的语音合成技术的开发。

Polluxstar简介

  • 软件技术指标

    输入数据:汉字与日语假名混合型文本
    输出数据:16kHz 16bit 线性PCM 单声道
    合成音质:指定1个说话者(收录语音)

  • 软件动作环境

    OS:Windows® XP、Windows Vista®
    CPU:Intel® Core™2Duo 处理器2GHz以上(推荐)
    内存:空余内存512MB以上(推荐)
    HDD:空余容量1GB以上

  • 语音收录

    收录量:总计约相当于60分钟的语音数据
    收录内容:冲电气标准原稿、用户指定原稿

  • 标准价格

    面向个人用PC版:100万日元(消费税另付)

    • 提供1个说话者的语音数据库和再现此语音的软件。不包括硬件(PC)。
    • 包括语音收录、语音数据库制作费用。但是,语音收录场所的确保及移动所需费用另外收费。
    • 对于企业等业务用途另行商谈。

主要特点

  1. 以合理的成本制作能再现自己声音的语音数据库

    为了完美再现本人的语调・气氛,必须高效收集充足的语音数据,并且将之数据库化。用于语音合成的语料库TTS技术(注4),是在国际电气通信基础技术研究所(ATR)开发的面向大规模语料库的语音合成技术(注5)中,结合了冲电气自主开发的面向小规模语料库的数据库技术的技术,既能保持非常逼真的自然嗓音感,又能以合理的成本提供再现「自己的声音」的Polluxstar软件。包括收录语音在内,构筑语音数据库所需时间约为1个月。

  2. 广泛支持日常生活用语

    日常生活中使用的言词、语调因人而异。在预先准备的讲稿中加入客户固有的原稿,可以加强该客户特有的语调气氛。而且,可以事先登录客套话、对亲朋好友的称呼等最能表现此人特点的特定词组语音数据。从输入的文字串中识别已登录的词组,原样输出此语音数据。通过这些方法,可以消除与合成音的音质差距,再现能体现本人个性的自然而微妙的语气。

  3. 在日常生活中方便实用的用户界面

    以大量验证试验等获得的经验为基础,实现了在日常生活中切实可用的语音合成用户界面。加上以聊天软件为特点的能实时从键盘输入文章的功能,只要预先登录经常使用的语言技巧、事先决定了内容的文章,根据文本列表(Text Feeder),只需单击就能实现语音输出。还能支持一对一的对话、众人前的演讲等不同使用情况。

Polluxstar名称的来历

Polluxstar是根据双子座的两颗星星之中的弟弟普鲁克斯(Pollux)星星命名的。蕴含着重视你的声音,并且制作如你的孪生兄弟一样,能代替你说话的软件的寓意。

用语解释

  • 注1:e社会

    冲电气提倡的以遍布全球的网络为基础,超越时间和空间的限制,打破国家、地区以及文化不同的障碍,实现一个一切社会活动以“个人”为中心, 平等、安全、准确地进行信息交流的社会。

  • 注2:VoIP(Voice over Internet Protocol)

    将语音数据包化,通过IP网进行传输的技术。

  • 注3:CTI(Computer Telephony Integration)

    将计算机与电话集成,使业务高效化,提高顾客满意度的技术总称。

  • 注4:语料库TTS技术(TTS:Text-To-Speech)

    从预先收录的说话者的语音数据中,以音素为单位选择最适合的波形组合,直接连接的语音合成技法。

  • 注5:面向大规模语料库的语音合成技术

    国际电气通信基础技术研究所(ATR)开发的,能获得非常逼真的自然嗓音感的语音合成手法(开发代码:XIMERA)。

关于冲电气工业株式会社

冲电气工业株式会社创立于1881年,是日本最早的电子通信产品生产厂家。总公司在东京。126年来,冲电气以“开启您的梦想”(英文:Open up your dreams)为品牌标语,朝着国际化企业飞跃的目标奋斗!在信息通信一体化系统、半导体电子元器件领域、打印机事业上,为广大用户提供着高质量、技术先进的最佳解决方案,为e社会充实无所不在服务作贡献。
详细资料请参阅冲电气中文网页:http://www.oki.com/cn/

  • e社会、Polluxstar是冲电气工业株式会社的注册商标。
  • Windows、Vista是美国微软公司在美国、日本及其他国家的注册商标或商标。
  • Intel、Intel Core是英特尔公司在美国及其他国家的商标或注册商标。
  • 其他本文所提及的公司名称、商品名称均为各公司的商标或注册商标。
关于本报道的报道机关的咨询地址:
中国
咨询地址: 冲电气工业株式会社 北京事务所
联系电话: 010-5825-7700
其他地区
咨询地址: 冲电气工业株式会社 公共关系部
联系电话: +81-3-3580-8950
  • 记载在本版本中的公司名称、产品名称等固有名词为每个公司的商标或注册商标。

返回页首