第一百四十九章 TT智译

前朝的孤 / 著投票加入书签

紫气阁 www.ziqige6.com,最快更新科技衍生最新章节!

    凡语要想彻底颠覆社交领域,做Facebook、Twitter的终结者,仅凭当下的完美翻译远远不够。

    还需要更进一步,拥有更多的卖点!

    当下社交软件的交互,不仅局限于传统的文字,更是包含视频、语音等等。

    更重要的是,互相之间的综合交互,例如语音和文字之间的转译。

    因此,凡人论坛或者凡语,要颠覆整个领域,逃不过与时俱进。

    视频交互容易解决,没多少难度,然而语音就不同了。

    尽管当下智能语音输入软件颇多,但精准度以及模糊识别一直是个大问题。

    当用户对着语音输入法,兴奋地说了一堆话,结果识别错误颇多,掉字连连,甚至连语义都扭曲了。

    至于那些不标准的普通话,以及方言,结果更是惨不忍睹。

    说是鸡肋都不为过。

    更何况王凡要求的更高!

    他想要将一种语言的语音,翻译成另一种语言的语音。

    完美实现不同语言之间的对话交互,而不是单纯地局限在文字上的完美交互。

    例如英语和华夏语的对话交互。

    这需要将英语的语音,转为英文。然后完美翻译成华夏文,再度读出来,变成华夏语,从而传递给另一个人。

    反义亦然。

    整个过程要确保准确无误,尤其是第一个过程,语音到文字,一旦出现错误,后面整个过程都会出现问题。

    而两种文字的完美翻译,当下已经实现,至于最后的文字到语音的阅读,那更不是问题。

    只是如此精准地将语音识别,这种近似“智能”的过程,王凡凭自己的力量当然搞不定。

    即便当下全球领先的巨头,依旧局限在“模糊识别”的不精确阶段。

    不过通过科技衍生系统,一切都将与之不同。

    王凡亲自挑选了一些语音识别软件,讯飞、千度、灵犀、云之声、GoogleNow、Siri以及微软Cortana。

    一番比较,各有千秋。

    讯飞、千度、灵犀等,比较适合华夏,但对国际方面的处理不太给力。

    而GoogleNow、Siri以及微软Cortana,则擅长国际,很多华夏方面的做不到位。

    一番权衡,王凡最终选择了GoogleNow,这款综合性比较优越的语音识别软件。

    在此基础上,王凡衍生出一款新的语音识别软件——TT智语。

    一番测试,这款语音识别软件的强大让王凡赞不绝口。

    不仅能智能识别华夏语、英语、俄语、法语等常用语言,还能识别俚语。

    即便王凡对着TT智语爆粗口,都能智能识别或模糊转译。

    之所以有些模糊转译,是因为很多方言或者粗口,太过“高端”,当下还没有具体的汉字与之对应,连我们都写不出。

    不过很快王凡发现了问题,对于普通话或者近乎普通话,智能识别准确率几乎百分百。

    但对于方言音频的识别,有些差强人意,准确率只有百分之九十左右。

    尽管这一比例已经很高,足够用户使用。但作为系统出品的黑科技,还是有些不够看。

    另外,对于方言音频的识别,会出现两个版本。

    例如智能识别《咱们屯里人》时候,出现了两个结果。

    一个是标准的普通话版,一个是直接识别的版本:偶滴老嘎,就组在则个屯。偶系则个屯里,土生土长滴羊……

    而且联网状态时,普通话版本处于优先等级。断网状态,直接识别版本处于优先等级。

    但当王凡选择直接识别版本后,结果无论联不联网,都是直接识别版本处于优先等级。

    之后王凡又试验了一些其他的方言音频,同样如此。

    只是随着不断他的尝试,和选择,TT智语识别变地愈加准确,方言正确比率已经提升到97%!

    而且版本选择都是直接识别版本!

    王凡忍不住感叹,TT智语识别不仅识别能力强,更能不断完善、进步。

    通过记录、分析用户的习惯,被动扩充方自己的言语音库,使得识别结果更符合使用者的要求,方言识别准确率也逐步提升。

    例如王凡选定直接识别版本,其他的方言音频也都会优先呈现直接识别版本。

    而对于方言的识别精度,也从90%增加到97%。

    为了验证自己的猜想,王凡又找了些方言音频让TT智语测试。

    对于不对的地方或者模糊的地方,他同样进行纠正或做出偏好选择。

    随着时间的推移,

    97.5%,97.9%,98.2%,98.4%,98.5%……

    方言识别准确率不断提升,只是提升的幅度,明显越来越小。

    最后过了两个小时,依旧没有从98.7增加到98.8。

    尽管98.7%这一数据已经比较令人满意,只是之后的增幅实在是小的可怜。

    无奈之下,王凡只能暂时放弃。

    略微休息,王凡开始思考,语言智能识别软件有了,完美翻译软件也有了,只剩下语音朗读软件。

    这种软件技术含量很低,应用市场上一大片。

    王凡找了几个,却不太满意。

    要么是冷冰冰的机器语言,要么是有限的几个明星的声音,例如郭老师、志玲姐,还有机器猫……

    于是王凡再度衍生了一个同声朗读软件。

    这个同声,是指朗读时,完美模拟之前录入的声音。甚至连语气、语速都模拟的惟妙惟肖。

    例如,刘德华唱屯里人,最后再完美模拟刘德华的声音,进一步朗读出来。

    最终王凡又将TT智能语音识别、完美翻译、同声朗读,三者合一,成为一个新的软件——TT智译。

    TT智译,可以完美地将一种语言的声音,转译成另一种语言的声音。

    整个过程,说话人的语义、语气、语速、语音都近乎丝毫不差。

    更过分的是,反应速度惊人,整个过程基本实现秒译!

    王凡选定希伯来语输出,接着对TT智译说了声:新年快乐,猴年大吉!

    TT智译立即模仿者王凡的声音、语气,用希伯来语回道:猴年大吉。

    这让他有种恍惚的感觉,似乎一下子精通了希伯来语。

    王凡疲惫地抬起头,窗外夜色正浓,时间已经到了深夜……

    ————

    PS:新年快乐,猴年大吉!三更拜年。(第一更!)

    感谢爱上撒旦12、大三木、企鹅的哥哥、greenc、小说很小、账号密码表、房价很会、仁心无天、杰杰together、糖水他哥、北极的天龙、宇宙f、漂扬的风等人的打赏。以及紫藤树花、辉星、我爱水分等人的推荐支持。谢谢。

    春节期间不仅正常更新,还加更,连春晚都没看,一直码字,求推荐票安慰……