2)10、电子声带_你是黑科技大佬你不早说!
字体:      护眼 关灯
上一章 目录 下一章
  ”

  楼清焰顿时发现:“这是我的声音?”

  “这是大家投票决定的。”谢晋揶揄地看过来。

  不知为何,被点破心思之后,他反倒觉得楼清焰有点亲切。

  “还行,挺自然的。”

  “这是ai算法的功劳。”谢晋说,“我们设计了一种深度学习算法,软件会对音源库进行特征提取,用提取出来的特征信息进行训练,最终,为每组音源库生成独一无二的数据模型。基于这个模型,合成语音会自然许多。”

  “这还不是最理想的。最理想的那种合成语音,不用组合人声,是凭借ai算法的高智能,凭空生成声音。不过……”

  “不过你们没这个技术。”楼清焰说。

  他想了想,描述道:“声音的本质是震动,在音响里就是膜片的震动,这种震动由电磁场引起,而电磁场的控制方式,是线圈通不通电。通电为1,不通电为0。”

  “所以,计算机声音的本质是一串二进制数,是不同排列组合的1和0。这叫做数字信号。”

  “最理想的语音合成,不是组合音节,而是直接组合数字信号。”

  楼清焰:“我说的对吗。”

  谢晋实实在在地惊讶了。

  他一直以为楼清焰是个不学无术的纨绔,就算所有人都搞懂了计算机原理,他也不可能搞懂的那种。

  没想到他真的懂。

  楼清焰还没说完,他继而道:“理论上,ai软件通过深度学习,可以掌握数字信号的规律,构建一个数据模型,再基于模型生成语音。”

  “但是,这需要一个大前提——机器学习算法能直接从数字层做特征提取。”

  他问道:“能吗?”

  谢晋服了,这人为啥总是一下子问到最关键的地方。

  “现在确实没这个技术。我们设计的特征提取算法,主要瞄准声音的波形表现,频率、相位这些。”他简单地说。

  楼清焰又说:“不止缺这一个技术吧。做了特征提取,知道怎么归纳总结吗?知道怎么训练模型吗?会写算法吗?设想过这个计算量有多庞大吗?”

  谢晋:“……”

  楼清焰发觉有点说过了,遂拍拍他肩膀,鼓励道:“不过你们已经做得很好了,能达到这个程度非常了不起……嗯,下一步工作是什么?”

  谢晋:“……”看出来你是在敷衍了。

  “软件的构造有点臃肿,只有在工作站上才能流畅运行,下一步先考虑优化问题。”

  “好的。”楼清焰也就是随口一问。

  他不在意软件本身,得知已经有了ai语音合成的雏形,他来这趟的目的就已经达成了。

  谢晋研发的这款电子声带,其实还是提前录制人声,再进行排列组合。只不过基于ai算法训练的数据模型,会对音频波形进行修改,让声音变得流畅自然,更加真实。

  这款软件的局限性在于算法。音频领域的特

  请收藏:https://m.57tyc.com

(温馨提示:请关闭畅读或阅读模式,否则内容无法正常显示)

上一章 目录 下一章