Skip to main content
The Kai Way

大三的课程

这个学期的有几门比较贴近实际的课程(有些废话,因为大三了嘛),比如数据挖掘和数据仓库,分布式系统,和服务器配置。

数据挖掘和数据仓库就是把一些现有的数据进行整合,然后抽取到数据仓库中,之后在作一些分析和报告的技术。其中在前后两个阶段都是难点,都是涉及了领域知识,中间做数据仓库相对简单。第一个阶段就是要对现有数据库中的数据作整合,这整合因为数据不同同步,或数据语义有差别,所以需要对领域知识有一个比较好的理解,然后在输出成元数据。最后一个阶段就是按照需求来作数据分析了,这个也是需要结合领域知识。这个就是大概了吧。

老师讲课讲得不错,很清楚的展示上面讲的东西。其实我很多东西有兴趣,只是限于时间不够精力不够不能学那么多,这个数据仓库也只是了解一下就OK了。

讲到数据库,看了豆瓣的开发者http://www.dbanotes.net/的blog,感觉现在由于长尾,小型数据库也开始受到重视,比如MySQL,风光地被SUN收购了。另,BS Ms的心理又来了:不喜欢Ms的SQL Server,好像学校的老师都是拿这个来作实验和讲课。