Liu Shouda coder

hts misc

2016-05-10

hts 相关记录

聚类结果

image

第一次聚类结果。 每个hmm由于

聚类参数

image

  • 设置了thr,停止阈值之后,不再考虑mdlf。若thr设置为000,则会参考mdlf的值,确定结束分裂时机。
  • 对于mgc来说,thr取值应该在1000左右。但是这个值对于str不合适。会使得聚类的数目非常小。所以如果要精细调整则可以分别对mgc,str设置阈值。否则使用一个全局的参数mdlf来控制树的高度。
  • thr设置不同的值,最终体现在HHEd的命令上。一下分别是thr取值分别为1000和000的情况,试比较:

    TB 1000.00 mgc_s2_ {*.state[2].stream[1-1]}

    TB 0.00 mgc_s2_ {*.state[2].stream[1-1]}

    如果取值为0,则靠mdlf来控制。

  • mocc 节点最少出现次数。这个值越大,则会导致分裂的数目越小。

mdl实验

问题: 直接使用mdlf的值来控制树的高度会使得mgc,str的分裂程度不同。虽然数量级大致相同,但是会有几倍的差距。f0的分类程度大概是mgc的3倍。是否是由于这个原因导致了声音的剧烈波动?一个现象:1000句的labixx的mgc,str节点只有300个左右。lf0却有3000多个。

大白700句,mgc,str,lf0的状态都是200多。导致声音很平?

解决方案: 尝试分别设置其停止分裂阈值,使得其分裂结果更加平衡,是否可以改进结果。

在120句labixx的调整结果:

%thr  = ('mgc' => '1000',
         'lf0' => '50',
         'str' => '100',
         'dur' => '20');

以上参数值越小,聚类数目越多。

通过参阅论文发现,设置最小出现次数和likelihood最小增长值,是传统最大似然的做法。在mdl中不需要设置这些。


上一篇 random forest

下一篇 text rank

Content