第394章 超参数全自动搜索

超参数进行一些微调。

每当完成一轮训练,还会按照既定的规则,自动从各个方面进行评分。

比如,在梯度下降的过程中,模型是否收敛、收敛速度如何?

不能收敛的网络,根本无法训练,也就毫无价值,如果收敛速度过慢,训练起来也会缺少效率。

此外,网络模型在验证集中的表现,泛化能力、识别准确度、网络的稳健性……

最后,将每次训练完成后,人工神经网络的综合得分,统合到一起,从高到低排一下序。

通过最后生成的表格,就可以选认适的超参数组合了。

为了让这个超参数搜索程序,获得更高的工作效率,还需要事先指定超参数的搜索范围。

范围太大的话,会导致搜索时间过长,可能会等不及出结果;如果范围太,又很可能找不到合格的超参数取值。

这个搜索范围,可以看做ASSP本身的超参数,无法自动搜寻,只能凭经验设定。

好在江寒已经训练过许多次人工神经网络,有着十分充足的经验。

他将ASSP和深度CNN的代码融合之后,连同训练数据、验证数据,全都上传到霖下数据处理中心的服务器里。

差不多两之后,ASSP就能得到初步的成果。

至于整个CNN网络的训练,那可就有的等了。

原始数据是12万多条,增广到2048倍之后,就是2亿4千5百万余条数据!

数据量实在太庞大了,即使使用了GPU来提速,至少也需要5~7,才能完成初步的训练。

江寒让程序跑起来之后,就走出了实验室。

打算回到游戏工作室里,休息一下,然后去主持面试。

刚喝了两口水,手机忽然响了起来。

来电是夏如虹的,江寒连忙接了起来,叫了声:“阿姨。”

“你在哪了?”夏如虹声音温婉。

“17楼办公室。”江寒回答。

夏如虹打这个电话,主要是讨论写字机器饶销量和分成。

写字机器人上市的时候,已经接近年底,所以截止2012年12月31日,只卖出了30多万台。

按照当初的约定,%销售额的分成。

机器饶出厂价是每台558元,%,30万台……

江寒随便心算了一下,就得出了答案:580多万。

这就比较让人愉快了。

有了这笔钱,星空那边的钱,暂时就不急着动用了。

这样也能避免不少汇兑、税费之类的损失……

Back to Top