拖更的二周年
2020年不太普通,有疫情,有我喜欢的科比的意外逝世。就个人来说,也经历了第一次在比赛里拿到一点成绩,也第一次硬着头皮研究模型在实际应用中怎么变好。胖过,又瘦了。比较浑浑噩噩的过,所以也没怎么管博客,不知不觉,就拖到了现在。
二周年过去好几个月,今天突然想起来写了,原因也是有点搞笑。很长一段时间非常焦虑,因为各方面都相当于在原地踏步,只是我一直在做鸵鸟。天天熬夜,其实就是觉得明天会更差。今天甚至焦虑到开始搜索怎么克服懒惰😂。我觉得有一篇回答说得挺好的,就是人其实都是奋进期和怠惰期交替进行的,天生的。优秀的人只是对怠惰期控制得很短,可能是一晚上就能又斗志昂扬?觉得自己懒惰其实没什么,你尽可能地让自己的怠惰期短一点就好了。越早醒悟到怠惰了一段时间,就越好。
回头望望自己这段不长不短的人生,好像确实是这样子。读书期间就是,努力一段时间,考得比较好了,就累了开始放纵。直到成绩下滑到不能接受,就再次奋进。
这极大地缓解了我的焦虑,因为我之前觉得只有我是这样只能一阵子勤奋的人,原来大家都是在反复的坚持失败的痛苦中,还能继续选择下一次的坚持,真棒。
说远了,回过头去看了看一年多前写的一周年,还是觉得这一年虽然收获没有期望的大,但也不小。从只参加了一次比赛,到这一年参加了大大小小5个比赛,也获得了一些成绩。算法的研究也从读论文,学术数据集跑跑别人的训练代码和算法,到自己去想尽办法(数据集,调参,新的思路,等等)来让模型落地。前半部分因为比赛的关系,重识别做得多一点。后面公司需求,做肢体冲突的检测和静默活体检测,近期则是解决行人检测模型应用时的误报问题(虚检)。
边写边回顾这一年,最大的收获应该还是思想上的。
首先是关于论文,因为毕竟是转行,而且研究生生涯偏工程性质,曾经迷信于学术论文,觉得工作中的问题都能从论文里找到答案。但活体这么几个月的折腾下来,真的觉得不一定。学术论文大部分都是基于一个比较小的范围(某个数据集、某种场景),研究有什么新方法、新思路能得到一点提升。这个提升在大部分论文里本身也不大,更别提有时候作者本身为了论文能中,选取对比的对象也有待商榷。做研究的人这样做无可厚非,但是做算法落地的人一定要开拓思路,不能局限在学术界的研究范围里。活体方向我阅读了近一两年的40多篇论文,大部分都是使用纯脸部图片进行研究。其中一大半从论文看到的数据就可以判断对落地没有帮助,剩余的大概对其中5、6篇的方法,用于了自己的数据集进行尝试。没有一个能稳定提升最终效果的,有的能稍微提升,有的能稳定训练加速收敛。更多时候还是基于自己的想法去实验,去调参,但也不自觉的就一直坚持只用纯脸部。最后跳出了纯脸部这个囹圄,才得到了一点突破。
但不是说论文不重要,不管是入门一个方向,还是持续跟踪方向上的最新进展,甚至是让自己保持阅读保持思考,都很重要。
其次是关于数据。之前面对模型落地中碰到的种种问题,经常冒出来的念头就是加数据训练。而现在我感觉,首先不是所有问题都能通过加数据解决,或者说通过加数据来达到期望效果的成本过高。其次,数据的采集、标注、迭代管理都很重要。
总之,未来要多看,多想,多总结,一年一次还是长了点,每个月想想写写,还是很有必要的。生活上呢,热爱生活,别懒,少看直播、抖音,战棋不要天天下。中午别人午休的时候多看看论文,写写博客,写点随笔,少玩论坛。认定了一个方向就要朝前走。