上次说的 seaplane,这不就来了吗!
说实话,也确实没什么好说的,除了这里面的贵物变多了…因为有太多四不像的了,我觉得对于模型理解自己生成的是 seaplane 的话应该是下面有个横线就算是。反正我是觉得这个任务的生成模型做的不是太好,生成的效果太差了。
所有 train 和 test 的代码都在这个 commit 中了,泛化测试没做太多,不过效果应该还行,毕竟数据太多了。
一开始数据有很多分错的样本,这给模型带来了很大的困扰,导致准确率较高的时候其实已经 overfit 了。炼丹这东西,确实需要点经验来找到一个合适的点进行,或许后续我可以写一个 Grid Search ?
这次做的方法其实和上次差不多,主要是这次直接做了个 model factory,这样可以有了新任务,采集一部分是数据,进行标注,训练,测试,部署,直接一套全做下来就 ok 了
其实对于 hcaptcha challenger 中的 solution 结构都是差不多的,几乎没什么改变,除了上次 elephant 那个需要加一个 filter。后续估计会继续建设我的 model factory 了,基本不会改变太多,除非到模型泛化能力跟不上的地步,比如过于精细的图片?才会考虑去改 model 的结构。
就这样吧,下面是 @QIN2DIM 做的 demo