最初由 ohisit 发布
自学当然也可以,不过说实话,我还是建议你去正规的学校学,并且尽力寻找co-op的机会.否则data-Warehouse学出来你也很难找到工作,事实上无论data-base,datamining还是data-warehouse都要建立在海量数据的基础上,光理解工具的用法和概念是远远不够的,没有数据你根本不可能在使用中发现问题(那些百十兆的小数据根本不可能发现真正的问题). 尽管就算在正规学校中也很难拿到实际的数据,毕竟比自己找好一些.
还有,就软件来说可能的话还是学Oracle或者DB2吧,虽然其他的从根本原理上类似,毕竟在具体的解决方法上还是很不同的(比如对与仓库概念的实现,元数据的管理和保护上DB2以及IBM为其开发都后续挖掘产品上采用的解决方法就与Oracle或者SQL2000不同).
还有,数据仓库对硬件设施要求很高,要是自学的话也要保证自己的机器足够好(没有最好只有更好). 尤其是作为data-warehouse来说CS的结构是必须的,而自学的话你必须把自己的机器既作Server又作client,要求应该是相当的高.同时却因为在同一台机器上而很难实践很多概念以及发现问题.比如实现ODBC的连接以及大量数据传输时可能出现的问题可能都不会被发现.还有,很多基于一台机器开发的前端程序的实用性是很难说的(毕竟在一台机器上运算速度是很快的).
总之这个东西想要自学不是不可以,但对资源的要求很高.我当初也是自学的,进公司后因为业务需要自己学,但是公司的环境很好,有server以及内部局域网以及客户提供的真实数据,.
个人意见,仅供参考.