共计 3064 个字符,预计需要花费 8 分钟才能阅读完成。
———————————–2023年——————————-
20230527更新
版本:1.7
时隔3个月,更新下近期大家反应的问题,
主要合成稳定性问题、原字数限制问题、转圈圈问题等。
五万字合成截图:
49999个文字 合成一个2小时50分钟的音频。
调整后不确定在win7上是否可用,如果win7 不能使用 ,请还继续使用1.6版本。
下载地址:一点红语音合成1.7.zip: http://pan.gelimao.com/f/41781271-865070463-603ddc
20230219
又是一个周末时间,抽空给语音合成,开放一个牛逼的功能:语音混合。
版本:1.6
主要更新内容,开放语音混合功能,在之前版本也开发了一功能,但始终没有开放出来,主要因为这个功能需要你提前对需要混合的音频进行处理,因为不同比特率无法混合,所以也就没有开放这个功能。
还好经过几个漫长的夜晚,扒拉了好多资料,总算是找到了解决办法。于是乎在这个周末,开始搞起来,嗯,不到一天的时间吧,算是完事了。
重点介绍下
1、混合功能:对主音频文件,添加背景音乐。一个有声小说 加个背景音乐听起来会更生动吧。
2、该功能是无损音质的,你添加的背景音乐和主音频,都会经过重新采样,音频重采样使用双声道模式(保留原音频立体声效果),对两个音频混合时依然使用双声道采样,比特率512 ,格式为高保真波形文件wav格式。
3、主音频文件可以批量添加。他们之间可能没有任何关系,批量生成时,会生成不同的音频文件,只是他们拥有相同的背景音乐。(不再限制 比特率和格式)
4、界面功能按钮说明
两个加添、两个清除:一目了然 是操作音频添加和删除的;
左下角两个音量:控制混合声音比例的,默认值(背景音乐比主音乐)为:1比9 效果应该是最佳的。除非你需要背景音乐很大。
是否截断背景音乐:主要针对背景音乐的,如果不勾选的话,混合后的音频长度是混合时两个音频中时长最长的那个长度。勾选的话,混合后的音频时长会以音频的长度为主,并截断背景音乐;如果你的背景音乐时长小于
主音频长度,勾玉不勾都是无意义的。
自动拼接:暂不可用。你可以先手动在音频拼接中提前拼接好你的背景音乐。
开始生成:就是生成嘛。
音频文件:就是混合后的音频文件
1.6下载链接 https://www.123pan.com/s/9KtDVv-Ii97A提取码:52pj
喜欢的请免费评个分,支持下作者。还有优秀评选支持下,谢谢!
废话多了上图
20230214
紧急更新!
程序版本1.5
主要解决问题 :
由于Window服务更新问题,导致程序打开后一直转圈圈,无法启动主界面的现象。
另外屏蔽了azuretts 接口,貌似被不坏好意的人恶意整欠费了。
其他功能不变。
打不开转圈圈的,都下载这个吧。
1.5下载链接:https://www.123pan.com/s/9KtDVv-Ht97A提取码:52pj
[color=rgba(0, 0, 0, 0.85)]
@风之暇想 已调整
20230210 PC端语音合成更新,如下:
1、调整UI界面大小,因为很多笔记本打开后,看不全界面,调整后我自己在1366*720笔记本 上测试显示正常。
2、调整文本框内容字体大小,之前文字太小了,看起来有点费眼。我调整到了11号字体。之前为9号字。
3、增加论坛出处。
最新界面
@风之暇想
2023.01增加安卓端
祝大家新年快乐!!!!
春节期间,本来想做一个MACOS 上语音合成。因为Net 平台 出了个MAUI 框架 ,是跨端的(win macoc android ios)然后学习了几天。
因为我的电脑是安装的是一个双系统,黑MacOs 和 win10,发现在Macos 上开发很不适应,所以就在Win10了做了开发。然后就没法生成MacOs 和ios应用了。
那就开始现学现卖,经过两三天的不懈努力,先打包了Android版本。
兼容安卓5.1 以上所有版本,所以文件就有点大了30多兆。
我测试一加6 安卓8 和小米11 安卓12 两个版本
界面
一加截图
小米11截图
软件功能简述
1、界面还是比较简洁的,毕竟先学现买,华丽的也做不出来。
2、字数限制问题5000字,为什么要限制,防止商用吧,依然采用分段合成。依据文中句号进行分割,大概200字左右 合成一次临时文件,最后合并成一个Mp3 文件。
3、关于存储目录问题,目前开始合成按钮 生成的音频文件 存在于 Android/data/redone7.reone7/music 下。为什么设置这么复杂 ?主要因为存储权限问题,安卓11以上版本,即使获取了存储权限,但系统依然拒绝存放文件。安卓10以下应该是没有这个问题的。之前我将目录设置到了根目录 ReOne7 下,在一加手机上,没有问题,程序打包后发小米手机,死活不行,我的小米11(android 12),让我折腾了好久。才发现安卓11以上版本获取外部存储不好搞。也就放弃了 最终采用程序所在目录 。高版本的手机想方面取音频文件 可以下载Es文件管理器。-
4、配音主播使用抖音上最最流行的几个人物吧,云溪、云扬、云健、晓北、晓妮、晓晓、( 晓辰 、晓墨) 两个不稳定。
5、按钮说明 主播声音 :选择哪一个主播 可以试听主播声音;开始合成:用于生成音频文件。删除:用于删除刚刚生成的音频文件;分享:调用系统分享功能,你可以将刚生成的音频文件分享到微信好友等。
6、最最重要的事,喜欢作者的软件 不妨打个赏支持下。
更新下安卓端链接 还是原来的程序。因为原链接被和谐了。如果下载过了就不要重复下载了
上链接:
https://www.123pan.com/s/9KtDVv-z797A 提取码:AG2u
———————————————2022年————————————–前段时间写的一个语音合成软件,本来想着通过写程序挣点生活费,事与愿违。
根据论坛要求去除了本人所有信息。
我也不是大家所谓的程序员,就是公司一个普通员工,工资低的可怜。之前在论坛发的东西,好多人称呼大神。感觉很不好意思,惭愧 啊!
所谓兴趣是最好的老师,这句话确实没错。我自2016年开始自学编程,启蒙语音就是易语言,因为报毒,所以放弃了。又学了 Python Java VB uniapp flutter Net 等,学的很杂,
什么东西都想去写写试试,所以也就成就了现在,博而不精!
我写的程序呢 都是下了班 晚上没事写的,有的程序可能要写上一个月,一般都是周末前一天熬夜写。
好了 废话多了。上程序界面吧
主页–励志文字
Edge文本转语音
AzureTTS
语音模型,方便熟悉声音吧
语音拼接 —-拼接多个音频使用的
关于
说下软件特色,理论上来说,Edge接口合成时,是没有字数和时长限制的,因为我程序里面是没有限制的。
Edge接口的合成是将文本按照段落划分200字左右,进行分段合成,合成文件会放到软件temp 文件夹下。最后将所有语音文件自动拼接到一起生成mp3文件,并删除临时文件夹内容。我自己测试2万字的文本,生成一个大概40分钟的语音时长,是没有问题的。
语音处理部分,仅写了一部分,语音拼接和混合,这部分网络上的其他语音合成软件并不提供该功能。因为我也没太多时间去弄那些东西。
AzureTTS 界面生成的文本 自动ssml 标签,也是为了 小白方便使用。
其他的 就自测吧。
有问题在该贴下回复下 我看到会及时回复大家。