第385章 超大规模集成神经网络

但如果经过第一级网络的识别,判断归属于汉字大类,那么处理起来就稍微复杂一些了。

江寒将5000个左右的常用汉字,划分成了4000个子集。

然后使用自组织聚类神经网络,设计了一个拥有4000个输出的分类器。

少部分子集只含有一个元素,意味着分类到这些子集中的汉字,可以直接输出识别结果。

大部分子集里含有230个元素,这意味着还需要送入第三级网络,进一步进行分类。

如果该子集中的元素,只有23个,那么就送进一个单字分类器中,识别出最终结果。

多于3的话,就送入细分类网络模块,进一步分类。

循环进行前两步,直到每个子集的元素个数都小于等于3,然后逐一送入单字分类器中,输出最后的结果。

这就是这个集成网络的整个工作流程,其中使用了数百个中型神经网络。

这些神经网络在设计上,基本大同小异,所以编程难度并不高。

麻烦的是,每个神经网络,都得单独训练,而这需要大量的算力。

好在他早就在高新区地下的机房里,准备好了十几台高性能服务器。

江寒将程序设计出来,然后连同训练数据,一起上传到了那些服务器中。

十几台服务器全力运转,差不多一两天就能完成训练。

Back to Top