|
50家元
群主您好,大家好,我想请人帮我做一个音频自动匹配字幕文字的脚本的工具软件,你这个文字动画的脚本能否细化一下,
1.增加一个输入配音的参考的音频,采集参考音频里的这个人多说话的这个腔调,然后做为机器配音的一个音源;
2.增加一个文本转语音的这个朗读配音功能,就是说,根据参考音源,把输入到电脑上的文字(或者,用手机拍照的图片,提取文字之后)进行机器配音,配出来的风格腔调,与参考音频风格一样,而且产生一个音频文件,作为下一步文稿匹配的材料;配完音之后,要再反向,把这个音频进行识别文字,也就是自动打轴,要精确,不仅要识别出一行的时间长度,还要精确到一个字的时间长度K值,及,声音的分贝值,生成一个细节化的音频波纹图,我要达到这个要求的的目的是,我的学生将来学着来读这个课文,能学到原始的每个字的读音技巧,跟学跟读,要准确到每个单词的时长及分贝要与原来的完全一致,要达到复刻的这个标准;
3.文本转动画,增加一个文稿,被配音配出来的音频,进行时间码匹配,并且被匹配到音频的时间码之后,文稿就变成了字幕,字幕的字体字号,能否设置统一格式,及放大后自动换行,做卡拉ok效果(就是声音说到哪个单词或汉字,那个单词或汉字,就自动同步变成红色,这样有助于学习认字,准确学习读音),然后导出为SRT或ass格式字幕,及mp4格式视频,及音频。
我是想用这个工具软件,来取替我现在的这个手工操作。
(再简单描述一下我的想法,我要作的事情是,一,我给你一个音频,MP3,你要用你弄出来的这个工具软件,能把我给你的这个音频导入你这个工具软件进去之后,把我给你的这个音频的声色,腔调,这个人的发音的特点,包括停顿,包括转音,给提取出来,给机器人,学习,将来机器人,配音,配出来的就也这个我发给你的这个样品的音频的音色,腔调,发音的特点,要保持一致,二,我后面,再用一个其他的英语的文稿,你用你作出来的软件,来给这个我新给你课文配好音,配出来的音的感觉,与我给你的样品音频的基本上让人听到,好象是同一个人在读这个课文,三,有了这个新配音出来的音频,再去作与我提供你的那个文稿,作一个声音与音频的时间码上的对应与匹配,相当于剪映电脑版的那个文稿对齐的功能一样,这样,文稿就有了时间属性,就是字幕了,这个文稿,导出来,就是一个SRT格式,就是有时间码的文稿了,我之前的那个文稿,是WORD的, 是没有时间码的,四,最后一步,就是把文字作成是我给你的那个视频一样,字是大字号,好几行,自动换行,而且字是会随着发音而变红的,也就是卡拉OK效果,五,我要作的这个工具软件,是一个批量处理的,一个人一天能处理几十篇甚至上百篇的文字动画,及配音出来的,当然这里还是要有人工干预,人工调轴,文本校对的一个过程,因此,效率只能是相对提升,无法作到绝对化。但是比自己手工一步一步去作,要快很多了。)
如果以上能做,多少钱,我想做一个,谢谢,我qq:199483611。
有意者,请随意加我!
谈好合作意向,签合同,付定金。
|
|