最近这一年来,一直在纠结于各种编程语言,从硕士的matlab到R,然后是perl, shell, awk和sed。最后碰到一个做生物实验的访问学者,和我说他都用python分析数据,好吧,看来python我是得必须学了。
这本书主要讲了两个东西numpy和pandas,本质上就是R的vector和dataframe。由于自己是从R和shell转来的,所以看的时候一直都在与R进行比较,比较的过程中,发现自己真的是变懒了很多。
R中的几乎所有的函数都支持向量的输入,而python中的函数大部分只支持标量的输入。所以用python实现相同的功能时,就得多加一个for循环,或是用map什么的,总之是得多加点什么。但就是这么一点细微的差别,有时却让我无法忍受,为什么他就不能写一个向量版的呢,为什么它就不是再简单一点呢。
但是不得不承认,python写脚本要比用shell写强多了。shell的特点是语言精炼,但是语法奇怪,而且函数库极少,对大型系统的构建不是很好。python在语法上稍复杂,但是还是可以接受。
网上好多人都在说,python在数据分析领域正在超越R。自己感觉在数据分析领域python很难超越R,但python的长处在于其广。很多时候,人们更多的是只想待在一种语言里罢了
PS: 今天在实验室里面看这本书,实验室的博后和另外一博士在讨论HMM的数据分布... 哎,差距真不是一般的大啊,偶什么时候才能到那个阶段