Eclipse下运行启动Heritrix1.14.4(JRE1.7)
Eclipse下运行启动Heritrix1.14.4(JRE1.7)
前面我们知道了如何通过执行Heritrix官方提供的jar包去启动Heritrix,庆幸的是,Heritrix是完全开源的,所以我们可以将Heritrix的源码直接导入Eclipse去运行它。
首先解压heritrix-1.14.4-src.zip到任意盘符,这里我直接解压到桌面,解压后你会看到如图的目录结构:
src下毫无疑问是源码文件,lib是Heritrix依赖的jar包。Testdata文件夹里存放的是测试文件,可以忽略。
然后我们可以打开Eclipse,新建一个Java Project取名为heritrix1(名字随便取),如图:
将heritrix-1.14.4-src\src\java下的org,com,st3个目录copy到刚新建的Project的src下,
源码复制进去后有很多代码报错,是因为我们还没有添加jar依赖,首先在project里新建一个folder取名lib用于存放依赖的第三方jar包,如图:
将heritrix-1.14.4\lib下的所有jar包全部copy到刚刚新建的lib下,如图:
选中全部jar,然后add to build path,如图:
然后新建一个source folder取名为conf(名字随便取,不一定要叫conf),如图:
将heritrix-1.14.4\src\conf下的所有文件及文件夹全部copy到新建的conf源码文件夹下,如图:
然后继续新建一个source folder 取名为resources,如图:
然后resources下新建一个org.archive.util包,如图:
然后将heritrix-1.14.4\src\resources\org\archive\util下的tlds-alpha-by-domain.txt文件copy到刚刚新建的org.acchive.util包下,如图:
然后将heritrix-1.14.4\src下的webapps整个目录复制到当前project的根目录下,如图:
然后在eclipse中打开heritrix.properties配置文件,稍作修改,如图:
这一切工作完成后,在Eclipse界面里按下ctrl + shift + T,然后查找Heritrix类,如图:
然后你就可以鼠标右键Run as运行它来启动Heritrix啦,运行后如果你在控制台看到下面的提示信息,即表明Heritrix启动成功啦!
03:29:06.761 EVENT Starting Jetty/4.2.23
03:29:06.868 WARN!! Delete existing temp dir C:\Users\ADMINI~1\AppData\Local\Temp\Jetty_127_0_0_1_8080__ for WebApplicationContext[/,jar:file:/D:/Documents/heritrix/webapps/admin.war!/]
03:29:07.555 EVENT Started WebApplicationContext[/,Heritrix Console]
03:29:07.732 EVENT Started SocketListener on 127.0.0.1:8080
03:29:07.732 EVENT Started org.mortbay.jetty.Server@6ce253f1
Heritrix version: 1.14.4
然后你访问http://localhost:6789就可以访问Heritrix的Web后台啦!在Eclipse下运行启动Heritrix就介绍到这儿了。
Linux下启动heritrix:
cd /usr/local/heritrix-1.14.4/bin
./heritrix --admin=admin:admin -b 192.168.1.242
win下启动heritrix了:
将heritrix解压到本地硬盘
.修改/heritrix/conf/heritrix.properties中的内容
heritrix.cmdline.admin = ->heritrix.cmdline.admin = 用户名:密码
heritrix.cmdline.port = 8080 ->heritrix.cmdline.port = 8080 指定端口
.将heritrix/conf/jmxremote.password.template拷贝到heritrix根目录下,
并修改其中的内容
monitorRole @PASSWORD@ ->monitorRole 用户名
controlRole @PASSWORD@ ->controlRole 用户名
将文件改名为jmxremote.password,同时将文件的安全属性改为只读,
不改在后边启动的时候也会提示修改。
heritrix --admin=admin:admin
前面我们知道了如何通过执行Heritrix官方提供的jar包去启动Heritrix,庆幸的是,Heritrix是完全开源的,所以我们可以将Heritrix的源码直接导入Eclipse去运行它。
首先解压heritrix-1.14.4-src.zip到任意盘符,这里我直接解压到桌面,解压后你会看到如图的目录结构:
src下毫无疑问是源码文件,lib是Heritrix依赖的jar包。Testdata文件夹里存放的是测试文件,可以忽略。
然后我们可以打开Eclipse,新建一个Java Project取名为heritrix1(名字随便取),如图:
将heritrix-1.14.4-src\src\java下的org,com,st3个目录copy到刚新建的Project的src下,
源码复制进去后有很多代码报错,是因为我们还没有添加jar依赖,首先在project里新建一个folder取名lib用于存放依赖的第三方jar包,如图:
将heritrix-1.14.4\lib下的所有jar包全部copy到刚刚新建的lib下,如图:
选中全部jar,然后add to build path,如图:
然后新建一个source folder取名为conf(名字随便取,不一定要叫conf),如图:
将heritrix-1.14.4\src\conf下的所有文件及文件夹全部copy到新建的conf源码文件夹下,如图:
然后继续新建一个source folder 取名为resources,如图:
然后resources下新建一个org.archive.util包,如图:
然后将heritrix-1.14.4\src\resources\org\archive\util下的tlds-alpha-by-domain.txt文件copy到刚刚新建的org.acchive.util包下,如图:
然后将heritrix-1.14.4\src下的webapps整个目录复制到当前project的根目录下,如图:
然后在eclipse中打开heritrix.properties配置文件,稍作修改,如图:
这一切工作完成后,在Eclipse界面里按下ctrl + shift + T,然后查找Heritrix类,如图:
然后你就可以鼠标右键Run as运行它来启动Heritrix啦,运行后如果你在控制台看到下面的提示信息,即表明Heritrix启动成功啦!
03:29:06.761 EVENT Starting Jetty/4.2.23
03:29:06.868 WARN!! Delete existing temp dir C:\Users\ADMINI~1\AppData\Local\Temp\Jetty_127_0_0_1_8080__ for WebApplicationContext[/,jar:file:/D:/Documents/heritrix/webapps/admin.war!/]
03:29:07.555 EVENT Started WebApplicationContext[/,Heritrix Console]
03:29:07.732 EVENT Started SocketListener on 127.0.0.1:8080
03:29:07.732 EVENT Started org.mortbay.jetty.Server@6ce253f1
Heritrix version: 1.14.4
然后你访问http://localhost:6789就可以访问Heritrix的Web后台啦!在Eclipse下运行启动Heritrix就介绍到这儿了。
Linux下启动heritrix:
cd /usr/local/heritrix-1.14.4/bin
./heritrix --admin=admin:admin -b 192.168.1.242
win下启动heritrix了:
将heritrix解压到本地硬盘
.修改/heritrix/conf/heritrix.properties中的内容
heritrix.cmdline.admin = ->heritrix.cmdline.admin = 用户名:密码
heritrix.cmdline.port = 8080 ->heritrix.cmdline.port = 8080 指定端口
.将heritrix/conf/jmxremote.password.template拷贝到heritrix根目录下,
并修改其中的内容
monitorRole @PASSWORD@ ->monitorRole 用户名
controlRole @PASSWORD@ ->controlRole 用户名
将文件改名为jmxremote.password,同时将文件的安全属性改为只读,
不改在后边启动的时候也会提示修改。
heritrix --admin=admin:admin
正文到此结束
- 本文标签: 暂无相关标签
- 本文链接: https://www.jimmy2k.top/article/169
- 版权声明: 本文由JimmyZ的个人博客原创发布,转载请遵循《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权