CWYAlpha

Just another WordPress.com site

Thought this was cool: 被knitr包给震撼到了

leave a comment »


在食神这部电影中,薛家燕以极为夸张的方式表现了黯然销魂饭有多么好吃。各位可脑补一下这个场景,然后将赞叹的对象换成knitr包。knitr包是谢益辉创建的一个用于生成动态报告的R语言扩展包,和它相类似的功能在之前是由Sweave来完成的。关于Sweave的用处,谢大牛曾经在统计之都写过一个专门的文章。并由此引出了“可重复性研究”(Reproducible Research)这个概念。

可重复性研究本质上是要求研究过程的开源和透明。所有的数据分析过程,从数据获取、转换处理到分析,最后生成报告,均由一份代码文件描述完成。这样的做法不仅使用户本身能从重复性工作中抽身出来,也能使其它人分享你的研究过程,并从中获益。knitr包就是能让用户在这一份文档中同时写Latex代码和R代码,并使之完美结合。在knitr官网上,也详细提供了这个扩展包的由来、特点以及各种示范帮助。

使用knitr生成报告并不难,象我的话,使用环境是windows7+CTeX套装+RStudio+R+knitr。先在RStudio的Sweave选项中设置用knitr来解释Rnw文档。然后新建一个Rnw文件,可同时编写LaTex和R代码。Rnw文档中的R代码由Chunk来标记注明。点击compile PDF就可以生成最终的报告。报告中对R代码会自动进行语法高亮,R运行的结果也自然附上。当然你可以在Chunk中进行设置,隐藏代码或是运行结果。

只要有一定R语言基础和LaTex的基础,knitr很容易掌握,笔者研究了大半天就捣鼓出来一个还过得去的PDF(用散点图示范ggplot2的核心概念)。各位若感兴趣,可以到这里下载这个PDF文件,以了解knitr的效果。原始代码在此

从R-blogger网站上看,knitr包广受关注和好评,而且在即将开始的第五届R语言会议中,统计之都的魏太云也将向各位介绍knitr包的特点。敬请期待吧!

from 数据科学与R语言: http://xccds1977.blogspot.com/2012/05/knitr.html

Written by cwyalpha

五月 23, 2012 在 11:54 上午

发表在 Uncategorized

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s

%d 博主赞过: