前言
這篇博客是建立在上一篇<a href="http://www.lxweimin.com/p/5e30a6f24d59">ubuntu15.10下nutch2.2.1+mysql搭建爬蟲平臺</a>基礎上的。勸懵逼的小伙伴看一下。
nutch配置的區別
- 修改conf/nutch-site.xml
<property>
<name>storage.data.store.class</name>
<value>org.apache.gora.hbase.store.HBaseStore</value>
<description>Default class for storing data</description>
</property>
- 修改 conf/gora.properties
gora.datastore.default=org.apache.gora.hbase.store.HBaseStore
gora.sqlstore.jdbc.driver=org.hsqldb.jdbc.JDBCDriver
gora.sqlstore.jdbc.url=jdbc:hsqldb:hsql://localhost/nutchtest
gora.sqlstore.jdbc.user=youth
gora.sqlstore.jdbc.password=
- 修改ivy/ivy.xml
<dependency org="org.apache.gora" name="gora-hbase" rev="0.3" conf="*->default" />
####結語
剩下的又是漫長的等待,這個月想自己建一個maven,把常用的jar都放進去
####預告
下一篇<a href="http://www.lxweimin.com/p/4979d6eb4ea7">nutch2.2.1與solr4.5.1的整合</a>