更新日志:- 10.11增加文稿匹配功能
- 10.15改进字幕识别精准度 实现短音频精准时间码匹配(长音频表现不尽人意)
- 10.25增加自定义分行 并且分行后时间码依然准确
- 10.29修复FCPXML生成过程的帧计算
- 11.10改进字幕识别算法 支持15分钟内长音频识别
- 11.12改进字幕识别分段逻辑 避免出现超长字幕
- 11.12改进文稿匹配时间码精度 目前做到短音频高精度的文稿匹配 (长音频表现不太行)
- 11.30改进长音频识别时间码准确度,和剪映保持一致。字幕识别和文稿匹配精度都得到大幅提升
- 12.1增加字幕识别字幕手动重新分行 字幕文本校对修改功能,修复错乱和崩溃bug,已可以正常使用
已知bug以及解决方法1、低系统版本可能会存在界面问题 手动拉一下界面大小或者全屏化 13.0系统界面 标签页显示不全 15.0系统界面初始化正常2.AI配音 语音模型的风格标签可能无效 如有相关需求,请到微软Azrue门户网站资源管理面板(也就是订阅密钥显示的界面,下文有详细教程)点击SpeechStudio进行有声内容创作,解锁全完体的Azrue语音服务 3.FCPXMl生成后导入是固定的项目名称,如果在同一个项目中导入两次以上本软件生成的FCPXMl,记得选择保留两者 4.文稿匹配的参考文本也就是配音稿,请先进行预处理再粘贴到界面的参考文本框中,最终生成字幕会以参考文本的分行来确定字幕的分行,生成后无法重新修正分行信息,所以发起识别请求前请先做好参考文本分行,按照中国影视制作的字幕标准,每一行字幕不要超过17字 5.字幕识别完成后,需要先修正分行信息后才能点击生成字幕,修正分行时无法编辑和校对字幕,所以请先仔细确定分行信息是否符合预期,生成字幕后无法返回编辑分行信息。 ⚠️打开软件第一件事就是去设置界面填写密钥和区域 获取教程在下面等会记得看。本界面未填写的话只能当一个SRT转FCPXML软件使用⚠️
 AI配音的音色和情感选择我要去网页一个个看源码一个个粘贴 有些音色情感有二十几个 太麻烦了,我只将最热门的晓晓多语言和云泽添加了情感情绪选择。输入文本 选择音色 情感后 调节语速(1.2X最佳),点击生成语音会直接保存在下载目录。最大支持10000字文本内容转录,超出的将生成失败  字幕识别面板 其实是不支持MP3的,只支持Wav。虽然加了自动转换格式功能 但是还是自己先转换成Wav最好。特别是长语音。 最大支持15分钟内的音频识别 (SDK限制 不是我限制的),不支持长音频自动分段。 该界面支持SRT转FCPXML 拖入SRT后可以编辑字幕  识别字幕会根据语音的停顿处自动分行,如果分行结果你不满意,可以通过回车键分行,行首删除键和上一行合并。更有最牛逼的功能 自定义字典,可以一键去除标点符号 啊哦额语气词,也可以自己新增常错的词条一键纠正 自定义词条是可以永久保存的 下次打开也还在。  编辑好识别的内容后可以选择导出SRT或者Fcpxml,注意fcpxml一定要和你项目和素材帧速率匹配 特别要分清楚到底是29.97还是30,绝大数人 相机上设置的30P/60P 实际拍摄的素材是29.97/59.94都不知道 还怪别人识别的字幕对不上。 另有一个牛逼的功能 就是生成的fcpxml可以导入剪映电脑版 是的 我这个软件还能和剪映协作 我这是从剪映嘴里抢食啊 
以下是Azrue订阅密钥获取教程Azrue密钥获取需要用到Visa信用卡,可以直接向各大银行申请,发放没有门槛,任何人都可以申请,手上有信用卡的可以直接打银行电话要求更换为Visa信用卡。订阅密钥只是用信用卡验证账户有效性,不会收费
一路点下去就是注册和订阅,个人信息填写的可以不填真实信息,但是要填存在的信息,不存在的城市街道和邮编会导致订阅失败,可以填中国大陆地区的信息,电话那一栏可以乱填,勾选使用别的号码验证即可使用大陆手机号码接收验证码  提交之前打开你的手机银行APP,看一下是否有7元以上额度,是否开启境外无卡支付,提交后会扣1美元也就是7元进行真实性验证,后面会退回来,完成下面的步骤拿到密钥后可以在手机APP上关闭境外支付(某些银行例如兴业开启境外支付后还要设置额度才能正常交易) 
完成注册后登录后点击创建资源  在项目选择中选择 Ai+机器学习中的语音  简单如图设置一下即可创建语音服务资源库  创建完成后回到主页 点击刚才创建的资源组  区域我选择的是UK SOUTH将上面复制的密钥和位置信息填入软件的设置中 
免费套餐 每月50万字额度AI配音 每次10000字上限 字幕识别和文稿匹配每月共5小时免费配额 如果你和他人共享密钥 请注意使用量
软件下载链接:通过网盘分享的文件:Azrue语音服务12.1.zip
链接:
本软件仅支持MacOS12.4以上任意Mac 不支持Windows
注册了 Azrue 后在线也能使用 AI 配音朗读功能 调整参数还比我的软件多很多 推荐在有声内容创作中进行(该功能仅支持 EDGE 和谷歌浏览器)
 
|