tts语音文件是什么

?勋.? 2024-05-28 12:03:09
最佳回答
tts就是text to speech,文本转语音,文本朗读,差不多是一个意思。在语音系统开发中经常要用到。  目前市场上的tts很多,实现方式也各式各样,有的很昂贵,如科大讯飞,据说当初得到863计划的资助,有很高的技术;有的相对便宜,如捷通华声, **talk;也有免费的,如微软的tts产品。  相对于asr(automatic speech recognition,自动语音识别)来说,实现一个tts产品所需要的技术难度不算大,在我看来也就是个力气活。  要是让我们来做一个能够把汉语句子朗读出来的tts,我们会怎么做呢?  有一种最简单的tts,就是把每个字都念出来,你会问,岂不要录制6千多个汉字的语音?幸运的是,汉语的音节很少,很多同音字。我们最多只是需要录制: 声母数×韵母数×4,(其实不是每个读音都有4声),这样算来,最多只需要录制几百个语音就可以了。  在合成的时候需要一张汉字对应拼音的对照表,汉字拼音输入法也依赖这张表,可以在网上找到,不过通常没有4声音调,大不了自己加上,呵呵,要不怎么说是力气活呢。  这样做出来的tts效果也还可以,特别是朗读一些没有特别含义的如姓名,家庭住址,股票代码等汉语句子,听起来足够清晰。这要归功于我们伟大的母语通常都是单音节,从古代的时候开始,每个汉字就有一个词,表达一个意思。而且汉字不同于英语,英语里面很多连读,音调节奏变化很大,汉字就简单多了。  当然,你仍然要处理一些细节,比如多音字,把“银行”读成“yin xing”就不对了;再比如,标点符号的处理,数字、字母的处理,这些问题对于写过很多程序的你,当然不难了。  国内的一些语音板卡带的tts,不管是卖钱的还是免费的,大体都是这样做出来的,也就是这样的效果。  如果要把tts的效果弄好一点,再来点力气活,把基本的词录制成语音,如常见的两字词,四字成语等,再做个词库和语音库的对照表,每次需要合成时到词库里面找。这样以词为单位,比以字为单位,效果自然是好多了。当然,这里面还是有个技术,就是分词的技术,要把复杂的句子断成合理的词序列,也有点技术。这也要怪新文化那些先驱们,当初倡导白话文,引进西文的横排格式、标点符号的时候,没有引进西文中的空格分词。不过即使分词算法那么不高效,不那么准确,也问题不大,如前面所说,汉字是单音节词,把声音合起来,大体上不会有错。  至于增加一些衔接处的“词料”,弄一些修饰性的音调,我认为是无关紧要的,对整体的效果改进不是太大。  市面上商品化tts一般还**,请个粤语播音员录音,把上面的力气活重做一遍就是了。  再说句题外话,很多人觉得录音最好找电台、电视台的播音员,其实找个你周围的女同事来录制,只要吐字清晰就可以了。在某种情况下,寻常声音比字正腔圆的新闻联播来得可爱。  再来说说文本的标识,对于复杂文本,某些内容程序没有办法处理,需要标识出来。比如,单纯的数字“128”,是应该念成“一百二十八”还是“一二八”?解决办法通常是加入xml标注,如微软的tts:"<context id = "number_cardinal">128</context>"念成“一百二十八”,"<context id = "number_digit">128</context>"将念成“一二八”。tts引擎可以去解释这些标注。遗憾的是,语音xml标注并没有形成大家都完全认可的标准,基本上是各自一套。  再说说tts应用编程,微软的tts编程接口叫sapi,是com接口,开发起来还是有点麻烦,还好msdn的网站上资料很全面。微软的tts虽然免费,但其中文角色目前是个男声,声音略嫌混浊,感觉不爽。  国内一般的厂家提供api调用接口,相对比较简单,可以方便地嵌入应用程序中去。  商品化的tts还有个并发许可限制,就是限制同时合成的并发线程数,我觉得这个限制用处不大。无论哪种tts,都可以将文本文件转换成语音文件,供语音卡播放。大部分应用句子比较短小,一般不会超过100个汉字,合成的时间是非常短的,弄个线程专门负责合成,其它应用向该线程请求就是了,万一句子很长,把它分解成多个短句子就是了,播放的速度总是比合成的速度慢。  也很多应用是脱机合成,没有实时性要求,就更不必买多个许可了。  更多情况下,我们甚至没有必要购买tts,比如语音开发中常见的费用催缴,拨通后播放:“尊敬的客户,您本月的费用是:212元”,前面部分对所有客户都一样,录一个语音文件就是了,而数字的合成是很简单的,你只要录制好10个数字语音,再加上十,百,千,万,再加上金钱的单位“元”。 20210311
汇率兑换计算器

类似问答
  • 这个语音软件兼职是真的吗?
    • 2024-05-28 02:47:12
    • 提问者: 未知
    最近看到的,有人推荐我,不知道是真是假 我经历过,这个兼职是骗人的,大家千万不要信!为了让大家明白这个兼职应聘的**过程,下面我会把我的经历告诉大家。一开始大家会在朋友圈,微信群,...
  • ptp文件是什么文件啊?
    • 2024-05-28 18:07:15
    • 提问者: 未知
    ptp是英语“图片传输协议(picture transfer protocol)”的缩写。ptp是最早由柯达公司与微软协商制定的一种标准,符合这种标准的图像设备在接入windows xp系统之后可以更好地被系统和应用程序所共享,尤其在网络传输方面,系统可以直接访问这些设备用于建立网络相册时图片的上传、网上聊天时图片的传送等。
  • 抖音uik是什么,是软件么
    • 2024-05-28 10:14:19
    • 提问者: 未知
    你好!凤凰城美国怎么感觉发货的那份手机是他就是他就是看过这个看上哪个是的可快干什么哈哈先来后到的感觉一下帮忙怎么会处理好想买个仙女辛苦鼓掌鼓掌鼓掌鼓掌没话费经常...
  • 语音软件销售有前途吗?
    • 2024-05-28 22:46:43
    • 提问者: 未知
    这种智能语音呼叫的,都是卖给那些打骚扰电话的公司,如...个人主要享受智能语音技术带来的成果,而并不会为此专门买单,比如百度语音、讯飞语音等,我们一般只是下载app等...
  • 有什么不收钱的讲股市的语音软件啊?
    • 2024-05-28 13:30:19
    • 提问者: 未知
    电视台财经频道。
  • 求文档: 法语音标
    • 2024-05-28 15:42:42
    • 提问者: 未知
    字母表(l’alphabet)大写小写音标大写小写音标大写小写音标大写小写音标aa[a]hh['a∫]oo[o]uu[y]bb[be]ii[i]pp[pe]vv[ve]cc[se]jj[ʒi] qq[ky]ww[dublve]dd[de]kk[ka]rr[εr]xx[iks]ee[ә] ll[εl]ss[εs]yy[igrεk]ff[εf]mm[εm]tt[te]zz[zεd]gg[ʒe]...
  • 如何纠正英语发音(不是口音,是发音)?
    • 2024-05-28 11:11:17
    • 提问者: 未知
    题主学英语发音的历程和大部分国人无异,小学英语老师-大城市如深圳、长沙等除外-语音水平和语音教学水平都不咋地。小县城老师的发音更是捉襟见肘。而而他们又是我们发音...
  • 该如何用verilog语言编写载入语音信号.w**e文件的代码?
    • 2024-05-28 12:43:58
    • 提问者: 未知
    altera软件能新建一个w**e文件,在这里面弄就可以了,不知道verilog能不能写波形文件,软件已经弄好了,你就直接使用不就好了么
  • 语音同一性司法鉴定是什么
    • 2024-05-28 00:20:05
    • 提问者: 未知
    语音同一性司法鉴定是什么语音同一性鉴定又称声纹鉴定、话者识别鉴定,说话人鉴定和嗓音鉴定,指通过比较、分析,对声像资料记载的语音的同一性问题所进行的科学判断。在司法实践中,鉴定人员...
  • 表音文字(英语为例)和象形文字(汉语为例)哪个更有优势,为什么?
    • 2024-05-28 14:13:34
    • 提问者: 未知
    表音文字(英语为例)和象形文字(汉语为例)哪个更有优势,为什么?只有“象形”是远远不够的;汉字的形成有六种方法;常见的除了“象形”以外,还有“形声、指代”等等。...
汇率兑换计算器

热门推荐
热门问答
最新问答
推荐问答
新手帮助
常见问题
房贷计算器-九子财经 | 备案号: 桂ICP备19010581号-1 商务联系 企鹅:2790-680461

特别声明:本网为公益网站,人人都可发布,所有内容为会员自行上传发布",本站不承担任何法律责任,如内容有该作者著作权或违规内容,请联系我们清空删除。