快,学会学习(二十四)

科研方法之顶层架构

上一篇博客提到了科研方法,并且我在文中说到了顶层架构。

顶层架构其实源于架构的相关知识,首先是架构的顶层设计,需要明确系统包含哪些个体,明确个体运作和写作的规则。而系统则是各个相互协同且彼此一起运行的实体,彼此关联的个体组成的。而这些个体则可以是子系统/模块/组件等

那么我要说的科研知识的顶层架构则是:

科研知识的架构在我眼里分成三部分,一个是构建基础的基础知识,一个是构成宽广面的延伸知识,一个是追求最终目标的深度知识。基础知识与构成宽广面的延伸知识相互配合构成支撑深度知识的基础。如果类比的话,这三个都是科研知识的子系统,但是科研上的成果又极度依赖于深度知识


那么我们怎么整体而且完整地架构呢?这也是一个比较复杂的学习技巧。

构建书单

首先我们需要搜集到大量该领域的相关书籍,也就是你当前想要研究的领域的书籍。但是你也有可能会碰到找不到书籍的情况,就例如我想构建一个完整的 NLP 书单却没办法在各个子领域上找到足够多的书籍一样。这个时候你也许就需要先进行下一步。

在这一步中你获取了足够精良的一批书单之后。你首先要做的并不是阅读。而是通过年份以及查询相关的评价,先分成三部分:

  • 可看的
  • 可仔细看的
  • 可反复研读的

一般都是从上至下不断地包合。

然后你还不能开始,因为你需要开始构建自己的基础知识,从刚刚已经建立的可看的书单里面抽取出其中你认为可能是最浅显的一本书籍。然后根据根据术语表,查看自己不理解的术语

而这个就是你的这个领域的基础。

然后开始研读其中可看的一部分。在阅读过程中获取到的知识点拿来构建知识体系:快,学会学习(二)

然后将知识体系彼此联系起来。——这来源于主题阅读

然后就可以继续下一步了。

构建体系

在上述,你已经开始将知识体系互相联系起来了。所以你已经开始有了一个大概,但是模糊的概念。

你需要手动去做实验或者自己亲手去输出了。

这个过程由自己的导师或者自己理性判断时间的花销并且执行之后。开始拿出可以仔细看的书。

这个过程就是通过可以仔细看的书来验证自己的知识的准确性了。

然后你要利用到第一阶段你所建立起来的知识体系。接着,准备填充自己的知识点。

接着,你需要做的是——被测试。

如果你是打算写作的话。可以开始准备选题并且交选题报告了。

这个阶段是一次平稳期。然后你就可以开始架构的最后一个步骤了。

这个阶段的你,已经对理论实践以及基础理论都已经足够清晰,此时你的专业领域也已经足够宽广,但是这个时候,你就开始缺少深入的方法论了。

在研究一个内容的时候,要很科学地进行,一些浅薄的意见:

如果你对AI的某个子领域感兴趣,向该领域的高年级研究生请教本领域最重要的十篇论文是什么,如果可以,借过来复印。最近,出现了很多精心编辑的有关某个子领域的论文集,尤其是 Morgan-Kauffman出版的。

有关AI的期刊有很多,幸运的是,只有一部分是值得看的。最核心的期刊是Artificial Intelligence,也有写作”the Journal of Artificial Intelligence “或者”AIJ”的。AI领域真正具备价值的论文最终都会投往AIJ,因此值得浏览每一年每一期的AIJ;但是该期刊也有很多论文让人心烦。Computational Intelligence是另外一本值得一看的期刊。Cognitive Science也出版很多意义重大的AI论文。Machine Learning是机器学习领域最重要的资源。IEEE PAMI(Pattern Analysis and Machine Intelligence)是最好的有关视觉的期刊,每期都有两三篇有价值的论文。International Journal of Computer Vision(IJCV)是最新创办的,到目前为止还是有价值的。Robotics Research的文章主要是关于动力学的,有时候也有划时代的智能机器人论文。IEEE Robotics and Automation偶尔有好文章。 而 AAAI 等就算了。

每年都应该去翻阅其他院校出版的AI技术报告,并选出自己感兴趣的仔细加以阅读。

读论文时要牢记一个问题,“我应该如何利用该论文?”“真的像作者宣称的那样么?”“如果……会发生什么?”。理解论文得到了什么结论并不等同于理解了该论文。理解论文,就要了解论文的目的,作者所作的选择(很多都是隐含的),假设和形式化是否可行,论文指出了怎样的方向,论文所涉及领域都有哪些问题,作者的研究中持续出现的难点模式是什么,论文所表达的策略观点是什么,诸如此类。

将阅读与程序设计联系在一起是很有帮助的。如果你对某个领域感兴趣,在阅读了一些论文后,试试实现论文中所描述的程序的 Demo 版本。这无疑会加深理解。


当与很熟悉本领域的人讨论自己的思想时,他们很可能不直接评价你的想法,而是说:“你读过某某吗?”这并不是一个设问,而是建议你去阅读某份文献, 它很可能与你的想法有关系。如果你还没有读过该文献,从跟你交谈的高手那里得到该文献的详细信息,或者直接从他那里借一份拷贝下来。

当你读到某份让你感到很兴奋的论文,复印五份送交给对之感兴趣的其他五个人。他们可能会反馈回来很好的建议。

本实验室有很多针对不同子领域的非正式(持续发展的)论文讨论组,他们每星期或每两星期聚会一次,对大家阅读完的论文进行讨论。

有些人并不介意别人去翻看他们的书桌,也就是说,去翻阅他们堆在书桌上的不久要阅读或者经常翻阅的论文。你可以去翻翻看,有没有自己感兴趣的。当然了,首先要得到主人的许可,要知道有些人确实反感别人翻自己的东西。去试试那些平易近人的人。

同样,有些人也并不介意你翻看他们的文件柜。实验室中可是有很多学问精深的人,他们的文件柜里也是有好多宝贝。与利用学校图书馆相比,这通常是更快更可靠的寻找论文的方式。

只要自己写下了些东西,将草稿的拷贝分发给那些可能感兴趣的人。(这也有一个潜在的问题:虽然AI领域的剽窃很少,但也确实有。你可以在第一页写上“ 请不要影印或者引用”的字样以做部分防范。)大部分人并不会阅读自己收到的大部分论文,因此如果只有少数人返回评论给你,也不用太在意。你可以如此反复几次——这是期刊论文所必需的。注意,除了自己的导师,一般很少将两次以上的草稿送给同一个人。

当你写完一篇论文后,将论文的拷贝送给那些可能感兴趣的人。别以为人家自然而然地就会去阅读发表论文的期刊或者会议录。如果是内部的出版物(备忘录和技术报告)就更不容易读到了。

你保持联系的人越是各式各样,效果就越好。尝试与不同研究组,AI实验室,不同学术领域的人交换论文。使自己成为没有联系的两个科研组交流的桥梁,这样,很快的,你的桌子上就会冒出一大摞相关的论文。

如果某篇论文引用了自己感兴趣的某些东西,做好笔记。维护一份自己感兴趣参考文献的日志。到图书馆去看看能不能找到这些论文。如果要了解某个主题的发展轨迹,可以有意地去做一张引用的“参考文献”图。所谓的参考文献图,是指引用组成的网:论文A引用B和C,B引用C和D,C引用D,等等。注意那些被经常引用的论文,这通常是值得阅读的。参考文献图有奇妙的性质。一个是经常有研究同一主题的研究组相互不了解。你搜索该图,突然发现了进入另一部分的方式,这通常出现于不同学校或者不同方法存在的地方。尽可能了解多种方法是很有价值的,这总比非常深入的了解某一种方法更好。


写完一篇论文后,删掉第一段或者头几句话。你会发现那是与内容无关的一般性话语,更好的介绍语句在第一段最后或者第二段的开头。

如果你等做完所有的工作后才开始写作,会失去很多。一旦开始了某个科研项目,要养成这样的习惯:写作解释当前工作进展或者每几个月学习所得的非正式论文。

从你的研究笔记中的记载开始。花两天的时间写下来——如果你花的时间更长,说明你是一个完美主义者。将论文与你的朋友分享。写的是草稿——不是为了被引用的那种。将论文复制数十份,送给那些感兴趣的人(包括你的导师)。与写正式论文相比,这样做具有很多相同的好处(评论,理清思路,写作练习等等),而且从某种意义上讲,付出无需那么多。经常地,如果你做得不错,这些非正式论文以后可以作为正式论文的骨干内容,也就是从AI实验室的Working Paper成为一篇期刊文章。


研究方法学定义了什么是科研活动,如何开展研究,如何衡量研究的进展,以及什么叫做成功。AI的研究方法学是个大杂烩。不同的方法论定义了不同的研究学派。

方法是工具。使用即可,不要让他们来使用你。不要把自己陷于口号之中:“AI研究需要牢靠的基础”,“哲学家只会高谈阔论,人工智能则需要拼搏”,“在问为什么之前,先搞清楚计算的是什么”。实际上,要在人工智能领域取得成功,你必须擅长各种技术方法,还必须具备怀疑的态度。例如,你必须能够证明定理,同时你还必须思考该定理是否说明了什么。

很多优秀的AI篇章都是巧妙地在几种方法论中取得平衡。例如,你必须选择一条在太多理论(可能与任何实际问题都无关)和繁琐的实现(把实际的解决方法表达得语无伦次)之间的最佳路线。你经常会面临区分“干净”和“肮脏”的研究决策。你应该花时间将问题在某种程度上形式化吗?还是保持问题的原始状态,此时虽然结构不良但更接近实际?采用前一种方法(如果可行的话)会得到清晰确定的结果,但这一过程往往是繁琐的,或者至少不会直接解决问题。后者则有陷入各种处理的漩涡之中的危险。任何工作,任何人,必须作出明智的平衡。

有些工作象科学。你观察人们是怎样学习算术的,大脑是如何工作的,袋鼠是如何跳的,然后搞清楚原理,形成可检验的理论。有些工作象工程:努力创建一个更好的问题解决器或者算法。有些工作象数学:跟形式化打交道,要理解属性,给出证明。有些工作是实例驱动的,目标是解释特定的现象。最好的工作是以上几种的结合。

方法具有社会性,看看别人是如何攻克类似难题的,向别人请教他们是如何处理某种特殊情况的。

——— 来自于MIT人工智能实验室 & Me


以上就是这次博客的全部内容,其中有一大部分是引用别人的内容。所以字数有点虚高,这次主要说的就是科研的顶层架构。

谢谢阅读。

本文作者: Bon
本文地址https://bonxg.com/p/77.html
版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC-SA 3.0 CN 许可协议。转载请注明出处!

# Aon
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×