第385章 超大规模集成神经网络
但如果经过第一级网络的识别,判断归属于汉字大类,那么处理起来就稍微复杂一些了。
江寒将5000个左右的常用汉字,划分成了4000个子集。
然后使用自组织聚类神经网络,设计了一个拥有4000个输出的分类器。
少部分子集只含有一个元素,意味着分类到这些子集中的汉字,可以直接输出识别结果。
大部分子集里含有230个元素,这意味着还需要送入第三级网络,进一步进行分类。
如果该子集中的元素,只有23个,那么就送进一个单字分类器中,识别出最终结果。
多于3的话,就送入细分类网络模块,进一步分类。
循环进行前两步,直到每个子集的元素个数都小于等于3,然后逐一送入单字分类器中,输出最后的结果。
这就是这个集成网络的整个工作流程,其中使用了数百个中型神经网络。
这些神经网络在设计上,基本大同小异,所以编程难度并不高。
麻烦的是,每个神经网络,都得单独训练,而这需要大量的算力。
好在他早就在高新区地下的机房里,准备好了十几台高性能服务器。
江寒将程序设计出来,然后连同训练数据,一起上传到了那些服务器中。
十几台服务器全力运转,差不多一两天就能完成训练。