Ramon：我如何在计算机视觉顶级会议CVPR上发表论文

Scalers点评：两个月前，成长会的Ramon(S290)收到了计算机视觉顶级会议CVPR论文录取的通知，而且是口头报告。CVPR在计算机视觉领域属于三大顶级会议之一，具有较高的影响力，对于一名在校博士生，能在这个会议上能发表论文，是很不错的一件事情。于是我请Ramon特意撰文，分享了这篇论文从想法到获得成果的一路历程。这篇文章比较长，但是却让我感慨良多。一方面让我想到自己在读研究生期间的经历，科研的生活仿佛历历在目；另外一方面，里面那段关于熬夜赶论文，不到截止不停工的精神，自己也是感同身受。正是因为在科研领域许许多多研究人员夜以继日的持续投入，才能有我们信息领域的科技发展。

另外还要说的一点是，Ramon也是成长会机器学习小组组长。我们机器学习小组最近完成了Stanford的在线机器学习课程，下一步即将启动深度学习的任务，如果你对这一领域有兴趣，欢迎来参加。详细情况参见

ScalersTalk成长会深度学习研习计划招募启动

以往机器学习小组日志参见

ScalersTalk成长会机器学习小组第10~11周学习笔记

ScalersTalk成长会机器学习小组第9周学习笔记

首先做一个自我介绍，我是Ramon（公众号RamonsVoice），中山大学在读博士生（直博第五年），2013年到2014年间在香港理工大学计算学系交流访问。主要的研究方向为计算机视觉、智能多媒体以及机器学习。

我在2015年的时候，通过朋友圈的文章分享知道了ScalersTalk的公众号，当时觉得S君能够把很多简单的问题写出深度，确实难能可贵，所以也就持续关注了下去。2016年是我的毕业年，决心进一步改变自己，于是加入了成长会。我现在是成长会机器学习小组的组长，和一群热爱机器学习、有点学术情结的小伙伴在深度学习的路上不断践行。

今天主要来说说我在去年完成CVPR论文的一些感受与认识（CVPR是国际计算机视觉与模式识别会议的简写，会议的主要内容是计算机视觉与模式识别技术。CVPR是计算机视觉领域三大国际顶会之一，另外两个是ICCV和ECCV），也算是一次复盘了吧。

有很多朋友觉得完成CVPR论文并获得口头报告是件很牛的事情。我也承认，在非学术圈的人看来，取得这样的论文成绩，已经算是牛人了。但是放眼全球计算机科学的发展，一篇顶会的文章，一次会议的口头报告，甚至是一次学术大奖，真的不值得拿出来炫耀。因此说，我在学术圈里就是一个平凡的不能再平凡的博士研究生。

说回今天的分享，虽然我以前也在一些顶级会议和期刊的论文发表过论文，但是这篇论文还是对我影响很大，于是决定把整个文章发表前后的感悟写下来，算是一种总结，也算是对我来发展的一种鞭策.

介绍下整个CVPR论文的完成过程

整个论文的idea要追溯到2015年的3月。当时我刚刚完成了IEEE Trans. on Image Processing论文的写作。这个期刊不错，算是图像处理领域顶级期刊了（当然现在这篇论文已经正式发表了，而且短时间内的引用率也还算可以）。由于当时深度学习已经在多个信息研究领域取得了巨大的成功，所以相关领域之间的融合现象也越发明显。

比如当时斯坦福大学LiFeifei教授的团队就发表了多篇有关自然语言与图像内容匹配的文章，并将相关的技术用于图像内容描述的自动生成任务上，取得了较为成功的结果。由于我的研究方向本来就比较偏向场景图像的内容理解，因而导师还是希望我在类似的问题上有所突破。

于是长达2个月的调研与实验工作就这样开始了。我们本想利用以前研究的模型在新的问题上进行一下尝试，如果效果不错，就进一步改进完善。这样做的主要原因有三个（1）我们认为以前研究的模型比较适合这个新问题，稍加改进就可以迁移过来（2）我们以前的模型和斯坦福大学团队的模型完全是两个路子，在学术新颖性上是可行的（3）我们在原有模型的参数调节等方面积累了很多经验，可以帮我们快速进入新的问题。

但是就是这样的心态让我们陷入了新问题的泥潭。在自然语言处理方面我们明显是菜鸟，太多的不可知和不可控汹涌的冲向了我和另一个师弟，最终我们以失败结束了这个新课题的尝试。

接下来的一段时间参与了一个车辆检索的项目，时间不知不觉就到了暑假。感觉问题一直这样拖着也不是事。于是和导师约谈了几次，导师对我们的进度也不是很满意。不过他还是给出了很中肯的建议：既然自然语言理解的不够深入，就还是回归到计算机视觉的传统问题上来，比如说层次化的场景解析任务。

但是我们要思考下能不能从Li Feifei团队的研究中“偷”一些有用的思想回来。其实Feifei 团队论文的核心思想很显著，就是局部上的精准匹配。例如自然语言中的一个单词和图像中的一种视觉内容的有效匹配。这样回到传统的视觉任务—层次化的场景解析，传统对整个任务的研究集中在推理场景中的各个部件的关系，进而构建起层次化的表达模型，如图1所示。

那么Feifei组的工作解决了图片中的物体与自然语言中的单词的匹配。那我们能不能实现场景的层次关系和语言的结构关系进行匹配呢？带着这样的问题，我们开始了与以前课题相关却又完全不同的研究。这里需要解释下语言中的结构，比如说主谓宾就是一种结构，两个名词和他们的关系形成的一种结构。我们还可以把主语和宾语替换成从句，每个从句又有他们自己的结构。这种结构的不断累加就形成了最终句子的层次结构。

图1, 基于传统概率模型的场景层次化结构解析

我们很快发现了Recursive Neural Network（RNN）这种神经网络结构，前两年的工作已经用它做过自然语言的结构化解析，也用它做过图片的语义标注。很适合我们的问题，于是我们在原有RNN的基础上进行了改进，添加了基于结构节点的关系预测，也就是说当我们发现图像中的两个物体可能存在一种交互关系时，模型就会分给他们较大的结构组合分数，要求这两个物体组合成一个整体。同时会在这个整体的基础上对两个物体之间的交互关系进行预测。

模型很快设计完成了，经过和老师的几次讨论细节也逐渐打磨清楚了。同时导师还让另一个实践能力很强的师弟也加入我们，共同完成这个项目。当然我们这个模型还有一些其他的贡献，比如它是一个弱监督的问题等等。由于过于细节就在这里不一一讨论了。

很快我们有了一些初步的结果，于是开始写论文。这里还有个小插曲，我一开始认为我们的模型有一些推理在里面，因而写成了概率表达。结果被导师批得一无是处：不懂就不要乱写。我承认概率模型是我的痛点，现在也正在恶补。最终我们还是换回了普通损失函数的表达。

其实我们的工作也不是就这样一帆风顺下去了，中间实验有很多卡壳的地方，比如说我们的问题很多经典的数据集上是做不了的，于是筛选和处理数据集花了不少功夫。还有自然语言表述的多义性问题，也给我们带来了很多困扰。以至于到交稿前3天，我们还在补实验结果。当遇到实验问题时的那种艰辛与无助，可能只有经历过的人才能够真正理解吧。值得庆幸的是，当时我虽然没有加入成长会，但是已经在关注S君的文章了。在出活问题上，已经算是摆正了态度的。心态的转变，在一定程度上也提升了我的抗压能力。

最后一晚当然是通宵。因为很多国际会议还是跟着美国或者英国的时间走的，他们晚上12点交稿，也就意味着我们要早上8点多。没办法，谁让人家是现代科学的发源地，谁让人家是当代尖端技术的聚集地呢。依稀记得那天晚上快5点的时候上演了惊心动魄的一幕。一个和我们合作的哈工大老师在帮我校订论文，突然他说有个地方应该是写错了，可能要大改。凌晨5点了，别看还有3个多小时才deadline，对于大改问题来说，这简直是噩梦！我看了那个老师提的意见，应该是对我们工作理解有偏差。于是我把优化部分的内容又给他讲了一遍，总算通过了，通过了，过了….

这个词我在心中重复的次数绝对大于3遍。清晨，从实验室出来，看着本科的孩子们匆匆走向课室，我丝毫没有3年前熬夜赶论文后的轻松与愉悦。因为这样的过程已经成为了生活的一部分。调整一天后，我来到实验室，打开Arxiv去了解最近的研究进展，这预示着新一轮的战斗又要打响了。

四个月后，我们接到了论文的最终接收通知。由于我们论文的评审成绩比较好，一个accept，两个weakly accept。同时，实验结果和论文撰写也受到了评审们的肯定。因此论文被评为了大会口头报告论文。这一点倒是超出了我们的心意预期，所以在接到结果的那一瞬，还是兴奋感十足的。

通过这次论文的发表，我对有些问题的认识又加深了一步，同时也有了一些新的思考。接下来，我将从科研方法、科研心理两个方面说说我的感悟。

科研方法上的感悟:

1. 问题要前沿、落脚要踏实

曾经看过斯坦福大学Li Feifei 老师有关优秀研究的介绍。在文章的开篇Feifei就摆出了计算机视觉领域的一个残酷事实：

每年有超过1000+的计算机视觉论文被发表，只有5到10篇值得阅读并被记住

因此说每一项研究的开展、每一份论文的创作都应该有一个超凡的目标：真正地推动计算机视觉领域的发展。所以当你构思和开展你的工作时，你需要以最严苛的方式不断地问自己：

在将来，我的工作会定义或者重塑某一问题、领域、技术吗？

通过Feifei老师的话我们不难看出，一个好的课题应该是真正能够推动学科发展的；是跳出研究本身，站在学术发展的长河中，去引领学科进步的。所以说，问题的前瞻性在整个学术研究活动中就显得尤为重要。但并不是说前瞻性的问题就一定要利用一个很高大上的新理论去解决，而是应该从问题本身出发，去探求改进、连接、完善现有技术的途径，从而脚踏实地的把问题解决。

我想，这一点对于计算机视觉这样的应用型领域还是很重要的。其实现阶段智能学科的研究本来就更加侧重于技术层面的创新。从技术的起源来看，它植根于人类生存和进化的需要（这里补充一下，科学源于对自然奥秘的兴趣和精神追求。科学与技术的融合与相互促进是第二次工业革命之后的事情了）。因此挖掘和定义领域内的问题，并利用一系列行使有效的手段去解决这些问题，从而促进人们的生产生活，这才应该是智能学科的出发点与立足点。

就拿我们这次CVPR的论文来说，我们主要利用神经网络实现了图片的结构化表达。这一过程是图像内容智能分析的一个重要环节。说到结构化表达，早期的很多工作是在做语言的结构化表达，例如区分出语言中的名词、动词等，那么两个名词以及他们之间的动词就构成了一种关系结构。结构化表达的研究对于图像还是很有意义的，因为图像中所包含的信息很多，但是这些信息又很难简单的进行结构化处理。传统的方法都是构建一定的规则，然后通过统计的方法对图像内容的结构进行推断。但这些方法中，构建规则的过程较为复杂，可以应用的场景也极为有限。我们则使用了在各种智能问题上有突出效果的神经网络解决了这一问题。我想这也是这篇论文能够获得口头报告的原因之一吧。

2. 团队合作很重要

很多时候科学研究是存在竞争性的，如果我们团队不率先完整这项工作，很有可能就被国外的团队占了先机。但是我们也需要看到，智能领域的研究现在逐渐出现了融合的态势：自然语言处理、音频处理、视觉处理在通过一种相互交融，相互促进的态势发展。因而为了完成一个较为复杂的课题，往往需要有不同背景知识和能力的人相互配合。

这个时候团队合作的好坏就显得尤为重要了。如果配合的好，大家不仅可以相互讨论问题的解决方法，同时在遇到困难的时候还可以相互鼓励，彼此成为心灵上的支撑。如果配合的不好，那么往往是每个人只看到自己的任务，对于其他的、责任界定模糊的问题，则抱着一种“事不关己、高高挂起”的态度。团队成员之间的沟通成本也会大大提升，最终影响整个项目的进度。

我觉得确立好的团队合作有两个层次的问题需要解决，第一是团队成员的筛选，第二是个人的心态调整。

（1）针对第一点，如果在不考虑每个人的能力前提下，尽量和那些解决问题为导向的人合作，而不是那些以赚取个人利益为导向的人合作。这一点说的有点功利，但是也是我们不得不去面对的问题。如果一个人仅仅是侧重事后的利益分成，那么对整个课题的投入必定大打折扣。当然这并不是说不去提利益，毕竟每个人的工作都应该有其对应的价值体现。尤其像一些科研课题，每个人负责一块，可能任何一个人的缺失，都会对最终论文的发表造成影响。但是也绝对不可能所有都是第一作者。有效的合作应该是在大家彼此信任的基础上，冲着共同的目标去前进，至于利益的划分还是往后放放吧。因为有时候，通过一个成功的课题所学习到的东西，往往比作者的排名顺序要重要的多。

（2）针对第二点，我想说的是，一旦合作开始，就要调整好自己的心态。以最大的参与度投身到整个课题的研究过程中。不要对产生的问题进行责任设限，就如同这个课题都需要被你一个人解决一样。这样做的好处主要有两点：首先，你可以通过和其他成员的合作了解更多的知识，学习他们知道的，你却不明白的内容；再者，你的不断向前是可以感染和影响周围人的工作态度的，一旦组员相互之间的带动力产生了，协作的效率将变得很高。

3. 不要放弃每个细节

不要放弃每个细节，说的就是做科研，尤其是应用学科中的科研，需要一种工匠精神（工匠精神，是指工匠对自己的产品精雕细琢，精益求精的精神理念）。这里我重点说一个例子，记得当时还剩3天的时候，我们的实验和论文写作基本已经收尾了。但是经过和另一个师弟的讨论后，我们觉得有一个小点没有在实验部分得到有效的验证。这时候，这个实验做不做成为了一个问题。做会很紧张，很辛苦，同时还要顶住导师push的压力。不做似乎也并不影响我们论文的完整性，因为此时最核心观点已经得到了实验的有效验证。同时我们还可以一起愉快地把论文改了。最终我们决定还是要做，至少保证在确定的能力下、有限的时间内，把实验做到最充分。其实还原到当时的情境下，要做到这一点真的挺难的，精神压力真的很大，应付交差的心理会随时涌现。

写到这里，我不禁想起了Scalers最近的一篇文章：从学生到职场的最大障碍是“学生气”。这里所谓的“学生气”就是说做事出活缺乏必要的专业性与职业气质，面对压力，不能控制自己的情绪，最终直接影响了工作的开展。其实我也做过一些还不错的会议和期刊的评审，当你站在评审的角度去审视别人的论文时，真的会不自觉的对小的瑕疵敏感起来，你会不自觉地去设想一些可能的模块的组合，并且急切的想知道这样组合下的结果。如果说当时我们不去完善那些实验，我想我们不会获得一个accept，两个weakly accept的成绩，更不会获得口头报告的资格。

我们再跳出具体的课题，来说说一个研究方向上那些对细节的不离不弃。很多时候这种不离不弃被人们称作刷performance。也就是说稍微改进一些细节，提高一到两个百分点的准确率就发一篇论文。有些人习惯于做这样的工作，并且乐此不疲；有些人则对类似的工作嗤之以鼻，认为是雕虫小技。我不是很鼓励这样去刷论文（其实是我弱爆了，刷不出效果），但是这样的工作确实有它的现实意义的。很多应用问题的研究讲求的是研究上的加速度，尤其是对那些技术上快要成熟的问题（比如人脸识别），只有performance尽可能快地被刷出来，才能有效地催生出相应的应用产品。所以从这个角度看，做一些细节上的打磨工作，也没什么不对。

4. 每个工作都是拼搏出来的

“每篇CVPR都是拼出来”，这是我研究生第一年的时候，我导师说的让我印象最深的一句话。这一句话道出了中国年轻一代研究人员在与西方研究团队争夺学术地位过程中的心酸（我们现在还处于劣势）。当然我也用近乎整个研究生阶段去不断地检验整句话的正确性。这里的“拼”有两个层次的含义，一个是时间上的争分夺秒，另一个是接受有挑战课题的勇气。

前者需要我们去合理分配任务、认真规划时间，争分夺秒地去完成相应的研究任务。原因很简单：“当你想到一个绝佳的idea时，世界上至少已经有三个人有过类似的想法了”。我们不可能让别人不去想，更不可能控制别人不去做。我们能把握的只有我们自己。给大家说一个我自己的例子，2015年的CVPR，我做了一个还不错的工作，但就是因为当时拖拖拉拉，论文在写作方面还是有很多不足的，最终的结果也是比较悲剧的。于是我和导师修改了一下，转投了期刊IEEE Trans. on Image Processing。转投不久就发现Arxiv挂出了两篇几乎和我们想法一样，被CVPR15接收的论文。后续期刊评审的意见当然是和这两篇文章进行比较，我耗费了近乎整个暑假去调整参数，就为了那零点几个百分点的优势。没办法，这就是人家拼了我没有拼的结果，这就是学术研究中的先发优势。

Arxiv是美国国家科学基金会和美国能源部资助,于1991年8月由美国洛斯阿拉莫斯国家实验室建立的电子预印本文献库。

后者说的是面对学术问题，我们需要有不断接受挑战，不断向上攀登的勇气。发过论文的小伙伴应该都有这样的感觉，当你在一个小的领域有了一定的成果的时候，如果要跳到一个更有挑战的方向上是很有难度的。对比一下不难发现，如果坚持以前的小领域，可以很快发一系列论文；而跳转新的方向就需要重新分析问题、重新做调研、重新研究技术细节、重新设计实验，同时整个课题的风险也会更高。但科研训练的过程不就是为了不断重复后者的过程，让我们成为一个成熟的、具有独立研究能力的科研人员，进而不断去承担更为挑战的研究任务吗。记得15年年末的时候，一个在CMU计算机系读博士的朋友回来广州续办签证。和他一起吃饭，说起他的研究课题，他说他导师会要求他每个课题都做不同的领域。而且我看他论文的时候，会明显发现，每一个课题都会更加有意思，但是同时技术挑战也会更大。“敢于接受和面对挑战”，我想这也是CMU培养出来的计算机学科人员更加具有行业竞争力的一个原因吧。

科研心理上的感悟:

其实科研上的很多感悟和S君文章中提到的内容有很大重合。我是今年元旦加入成长会的。当我去完成“刷文章”的任务的时候，真的如同看到一个懂自己的人。一篇接一篇地读过去，我在有些问题上有了更为深刻的认识，在另一些问题上则是因为共鸣的存在，而产生的感动。因为我知道，成长路上，我并不孤单。

1. 最后一公里的坚持

相信听过S君成长课程的小伙伴一定会对“最后一公里”这个问题印象深刻。当时S君举了一个很有意思的例子。大概是说在电力的整个输送过程中，电能损失最大的、技术环节最多的，都集中于最后一公里上。其中的道理并不难理解，为了能够让千家万户能够用电，在电力传输的最后一公里往往需要不断的变压、分流。每个环节必须严丝合缝，才能保证最终用户的用电稳定与用电安全。

对应到学术研究中，道理是相类似的。研究的早期环节包含了文献的调研、方法的设计、基础实验和论文草稿的撰写。后期的环节则多数涉及到实验的完善和论文的校订。而最后这两个环节往往又直接决定了你的想法能否通过学术论文发表的形式，让众人所知。学术研究的本质是一个发现或创造的过程，既然是发现就需要通过技术手段验证它的真实性，既然是创造，就要模拟环境证明它的有效性。因而在时间允许的情况下，应该尽可能地实现实验的全覆盖。同时论文的撰写也很重要，它的核心意义在于让后来者了解工作的核心价值，明确工作的主要方法。论文打磨的好坏一方面将决定评审对工作价值的评判，另一方面将决定工作在未来的传播能力。

当然在学术研究中，最后一公里的坚持是有难度的，尤其是对成长中的研究者更是如此。试想一下，你辛辛苦苦完成的论文，却被导师痛批逻辑混乱，要求反复修改；在会议论文提交deadline来临之前，却被导师要求调整图表；自认为写的还不错的期刊，评审却在实验环节吹毛求疵，反复蹂躏你的玻璃心。以上这些情境都是在我们认为工作基本完成的前提下，被导师或者评审要求再前进一步。这些要求看似是刁难，实则是因为我们段位不够，很多细节没有处理好所导致。因此说，最后一公里上所遇到的荆棘并不可怕，可怕的是缺少一颗勇敢面对的心。

2. 不要对自己的工作有过高的期盼

7天连锁酒店（现隶属与铂涛酒店集团）董事长郑南雁先生是我的校友，记得郑先生有一次回学校来做报告，说了成长过程中通常会经历的四个阶段，即不知道自己不知道、知道自己不知道、不知道自己知道、以及知道自己知道。对于一个持续行动者来说，想要习得一项技能或者是完成一个较为宏大的系统性工程时，前两个阶段需要持续的时间大约为1到1.5年。这样是为什么博士在第三年的时候好像突然就能出很多工作了，因为他们正在处于一个从“知道自己不知道”向“不知道自己知道”的过渡过程（他们在学术研究的过程中逐渐成熟了起来）。而后续两个阶段所需要的时间可能会更长。

多数研究者在具备了一定研究能力之后，将在很长一段时间处于第二到第三阶段的过渡过程中。与到达了第四阶段的人（具有较为明确的研究方向和较为完备的研究体系）不同，这个阶段的小伙伴基本是摸着石头过河，有时候有那么一点感觉，有时候却又被突如其来的挫折砸的怀疑自己、怀疑学术研究本身。

这也是我为什么说不要对自己的工作有过高的期盼。一切顺其自然，重点放在工作的打磨，以及自身学术能力的建设上来。换做S君的话就是注重构建自己的学习系统和成长系统。我坚信那些有价值的工作，终归是会被评审发现的。就拿这次CVPR的论文来说，我和合作的小伙伴并没有想到会是口头报告，我们觉得很有可能徘徊在weakly accept 和 borderline 之间。甚至我们已经在想如果不中，要做什么改进，要投什么期刊的事情。没有过高的期盼，只是朴素的做事，幸福反而来的很突然。

3. 没有工作是完美的，不要因为不完美而不去做

“世界是被不完美推进的。”虽然对每个人来说，去追求好的、完美的工作结果是十分重要的一件事情。但是我们也必须学会去面对那些潜在的不够完美的事情。这一点在我上大学之后更是尤为凸显。我来自祖国的西部，虽然是省会城市，但从小的教育依然以填鸭式的应试教育为主。这种教育给我们带来一种二值化的思维模式，对就是对，错就是错。在思维的培养方面，更是缺乏那种迭代优化、逐步完善的训练。解决实际问题的思路也更加侧重自底向上，而不是自顶向下。这样的教育有一个很不好的地方，就是在解决较为庞杂的问题的时候，根本抓不住重点，找不到突破口。这也造成了我本科阶段，知识点还算牢固，但是遇到大的project就完全抓瞎。久而久之，养成了一种做不好的事情不去做的心态。

其实这也算是拖延症的一种了，因为事情并没有因为逃避而消失，该要解决的问题终究是要解决的。视而不见只不过是因为害怕自己做不好、害怕自己不擅长、害怕做的过程太煎熬、害怕投入巨大却没有回报等等。事实上，“不完美”才是生活中的常态，把“不完美”逐步打造成“完美”的过程才是突破困局，不断提升自己的必由之路。因此说，不要因为“不完美”而放弃做事锻炼自己的机会。

这里我说说这次CVPR的例子。我们一开始和老师讨论这个课题以后，其实不是很想做。因为牵涉的技术点太多了，需要去梳理的内容就很多。同时先前没有类似的工作，从评价指标到实验设计都是从0到1的过程。就包括实现的模型和我们最初idea设想的也是有差距的。有的部分是因为想不到好的技术手段去解决，所以没有添加到最终的模型中；有的部分则是因为实验无法验证其有效性，所以只能忍痛割爱。但是这并没有影响我们工作的新颖程度。同时先前idea中没有解决的问题也成了我们进一步研究和探索的目标。

4. 去除对每一个人的偏见

“生活中是否对人对事会有偏见？”这一点其实是成长会入会帖中的一个问题。也就是写完成长帖的那一刻，我开始关注自己在生活和工作中的那些偏见。其实，对于还不够成熟的学术工作者来说，带有偏见的去为人处事是很可怕的，甚至是毁灭性的。因为一旦加上了有色眼镜，你的眼光就局限在了某些点上，只能看到自己脑补出来的世界了。

说说我个人的情况吧，过去一年我最大的偏见在于一度认为导师以前想做一些所谓的big idea，不够脚踏实地。认为那些idea很难做出来，导师太急于求成，想一下产生影响力。所以当时我们讨论完CVPR的工作之后，我是很排斥这个idea的。我当时有很多小的idea，可以在以前工作的基础上，快速出成果，但是导师一直说我的idea不够好，不让我去做。当时一度觉得导师很不踏实，有点急功近利。这也致使后续的几次讨论，一旦导师提出较大的修改意见，我就会认为他很不切实际，至于意见的内容如何，听进去的就少之又少了。

后来，我加入了成长会，发现了偏见这个问题。伴随着CVPR的顺利接收，我也在不断分析自己产生这种偏见的原因：第一，可能确实是我没有导师的格局大，面对前沿性问题的时候，判断力有限。第二，我面对困难问题的时候不太自信（可能是科研素养还不够）。因为博士早几年一直处于自己摸索的阶段，碰了很多壁，因而认为科研不可太冒进。担心会在水深的地方“淹死”。这虽然历练了我独自总结归纳和分析的能力，使得我从事课题研究的时候可以步步为营。但是也局限了我，使我不敢接受有挑战的课题。

所以说，去年我觉的幸运的三件事就是：（1）关注了ScalersTalk公众号并加入了成长会（2）当初没有因为偏见而放弃课题（3）随着在成长会的不断自我发现，意识到了偏见的存在，并积极尝试去克服它。

林林总总写了近万字，算是对去年CVPR工作的一个梳理，也是对接下来工作的一种鞭策吧。“博学、审问、慎思、明辨、笃行”是Ramon大学时的校训，我也会谨记这几点，努力在自己的成长路走得漂亮。Ramon深知互联网上藏龙卧虎，学术圈里更是牛人林立。故言语如有偏颇不足之处，还望各位前辈提点，各位同仁指正。

ScalersTalk成长会 – 持续行动，刻意学习 – ScalersTalk Wonderland

与本文相关的文章

与本文相关的文章

订阅