bbs 论坛数据抓取.rar
bbs 论坛数据抓取,bbs 论坛数据抓取 源代码+论文页数:44字数:21727内容摘要 随着搜索引擎技术的迅速发展,网络上越来越庞大的信息量,对垂直搜索引擎的需求也越来越强烈,本文就是为构建海事领域的一个垂直搜索引擎获取有关bbs数据的一个应用程序的具体实现的详细阐述。以及搜索引擎常用方法的简述。本论文首先介绍了开发该系统的目的、背景,...
该文档为压缩文件,包含的文件列表如下:
内容介绍
原文档由会员 伊丽莎 发布
BBS 论坛数据抓取 源代码+论文
页数:44
字数:21727
内容摘要
随着搜索引擎技术的迅速发展,网络上越来越庞大的信息量,对垂直搜索引擎的需求也越来越强烈,本文就是为构建海事领域的一个垂直搜索引擎获取有关bbs数据的一个应用程序的具体实现的详细阐述。以及搜索引擎常用方法的简述。
本论文首先介绍了开发该系统的目的、背景,接着通过对比分析当前的网上数据抓取技术,介绍了开发本系统所使用的技术,之后重点介绍了本系统的功能需求和功能模块的划分、数据库设计和功能模块的实现。最后阐述了开发本系统的收获和本系统的待完善之处。
本系统分为两个模块:搜索模块、bbs数据抓取和论坛管理模块。
本论文设计与实现的BBS网上数据抓取系统是采用基于B/S结构的php+mysql+apche方式,采用php面向对象技术和MySQL数据库技术进行设计与实现的,具有功能强大、性能优越、安装部署简单、安全体系完备等优点,并具有良好的可扩展性、可移植性和可维护性。
目 录
1 引言 1
1.1 选题背景和意义 1
1.2 研究内容 1
1.3 论文章节安排 1
2 相关技术介绍 2
2.1搜索引擎技术简单介绍[15] 2
2.1.1搜索引擎发展历史 2
2.1.2 搜索引擎分类介绍 3
2.1.3 搜索引擎工作原理 4
2.2 数据抓取技术介绍 6
2.2.1 网络爬虫原理 6
2.3 系统的开发平台 8
2.3.1 系统开发模式 8
2.4 系统开发工具及技术简介 9
2.4.1 PHP简介 9
2.4.2数据库系统MYSQL 10
2.4.3 Apache简介 11
2.4.5 Javascript 11
2.5 正则表达式简介[16] 12
2.5.1 什么是正则表达式 12
2.5.2正则表达式入门 12
2.5.3正则表达式的元字符 13
2.5.4正则表达式的字符转义和重复 15
2.5.5字符类 15
3 BBS论坛数据抓取系统的分析 17
3.1 BBS论坛数据抓取系统可行性分析 17
3.1.1 经济可行性 17
3.1.2 技术可行性 17
3.2 BBS网上数据抓取系统需求分析 17
3.2.1开发环境 17
3.2.2功能需求 18
3.3 BBS网上数据抓取系统的设计 19
3.3.1 BBS网上数据抓取系统的总体设计 19
3.3.2 BBS网上数据抓取系统的详细设计 19
3.4 BBS网上数据抓取系统的数据库设计 27
3.4.1数据库概念结构设计 27
3.4.2数据库逻辑结构设计 27
3.4.3数据库的生成 30
4 BBS网上数据抓取系统的实现 32
4.1 公共页面的实现 32
4.1.1 网站首页 32
4.1.2 管理员操作界面实现 32
4.1.3 新增论坛功能模块实现 33
4.1.4编辑论坛信息功能模块实现 33
4.1.5获取论坛数据功能模块实现 33
4.1.6获取论坛版块功能模块实现 34
4.1.7获取论坛帖子功能模块实现 35
5 BBS网上数据抓取系统关键技术研究与分析 37
5.1 连接数据库 37
5.2 正确获取论坛版块和帖子标题问题 38
6 结论 39
6.1论文总结 39
6.2不足与展望 39
参考文献 41
参考文献
[1] Elliott White III Jonnathan D.Eisenhamer 著 王军翻译PHP5in Pracetice
[2] 龚泰宁。PHP5轻松开发Web网站。北京希望电子出版社,2006年5月
[3] 邵丽萍等编。网站编程技术。清华大学出版社,2005年
[4] 邹天思 PHP从入门到精通 清华大学出版社 2008年
[5] 作者 Luke Welling Laura Thomson 翻译 武欣 PHP 和MYSQL WEB开发(原书第4版) 机械工业出版社 2009年。
[6] 张洪伟。Tomcat web开发及整合应用。清华大学出版社,2006年
[7] 作者 聂庆鹏 毛书朋 王志乐 PHP+MYSQL 动态网站开发与全程实例 清华大学出版社 2007年 2008年
[8] 作者 Sirovich.J Darie。C 翻译 邓少鹍 搜索引擎优化高级编程( PHP版)清华大学出版社
[9] 作者 泽瓦斯 Zervaas.Q。 澳大利亚PHP Wed2.0开发实战 人民邮电出版社 (2008-10出版)
[10] 张家境。MySQL与电子商务实战。人民邮电出版社,2001年
[11] 萨师煊,王珊。数据库系统概论。高等教育出版社,2000年
[12] 作者 梁斌 走进搜索引擎 电子工业出版社2007-01
页数:44
字数:21727
内容摘要
随着搜索引擎技术的迅速发展,网络上越来越庞大的信息量,对垂直搜索引擎的需求也越来越强烈,本文就是为构建海事领域的一个垂直搜索引擎获取有关bbs数据的一个应用程序的具体实现的详细阐述。以及搜索引擎常用方法的简述。
本论文首先介绍了开发该系统的目的、背景,接着通过对比分析当前的网上数据抓取技术,介绍了开发本系统所使用的技术,之后重点介绍了本系统的功能需求和功能模块的划分、数据库设计和功能模块的实现。最后阐述了开发本系统的收获和本系统的待完善之处。
本系统分为两个模块:搜索模块、bbs数据抓取和论坛管理模块。
本论文设计与实现的BBS网上数据抓取系统是采用基于B/S结构的php+mysql+apche方式,采用php面向对象技术和MySQL数据库技术进行设计与实现的,具有功能强大、性能优越、安装部署简单、安全体系完备等优点,并具有良好的可扩展性、可移植性和可维护性。
目 录
1 引言 1
1.1 选题背景和意义 1
1.2 研究内容 1
1.3 论文章节安排 1
2 相关技术介绍 2
2.1搜索引擎技术简单介绍[15] 2
2.1.1搜索引擎发展历史 2
2.1.2 搜索引擎分类介绍 3
2.1.3 搜索引擎工作原理 4
2.2 数据抓取技术介绍 6
2.2.1 网络爬虫原理 6
2.3 系统的开发平台 8
2.3.1 系统开发模式 8
2.4 系统开发工具及技术简介 9
2.4.1 PHP简介 9
2.4.2数据库系统MYSQL 10
2.4.3 Apache简介 11
2.4.5 Javascript 11
2.5 正则表达式简介[16] 12
2.5.1 什么是正则表达式 12
2.5.2正则表达式入门 12
2.5.3正则表达式的元字符 13
2.5.4正则表达式的字符转义和重复 15
2.5.5字符类 15
3 BBS论坛数据抓取系统的分析 17
3.1 BBS论坛数据抓取系统可行性分析 17
3.1.1 经济可行性 17
3.1.2 技术可行性 17
3.2 BBS网上数据抓取系统需求分析 17
3.2.1开发环境 17
3.2.2功能需求 18
3.3 BBS网上数据抓取系统的设计 19
3.3.1 BBS网上数据抓取系统的总体设计 19
3.3.2 BBS网上数据抓取系统的详细设计 19
3.4 BBS网上数据抓取系统的数据库设计 27
3.4.1数据库概念结构设计 27
3.4.2数据库逻辑结构设计 27
3.4.3数据库的生成 30
4 BBS网上数据抓取系统的实现 32
4.1 公共页面的实现 32
4.1.1 网站首页 32
4.1.2 管理员操作界面实现 32
4.1.3 新增论坛功能模块实现 33
4.1.4编辑论坛信息功能模块实现 33
4.1.5获取论坛数据功能模块实现 33
4.1.6获取论坛版块功能模块实现 34
4.1.7获取论坛帖子功能模块实现 35
5 BBS网上数据抓取系统关键技术研究与分析 37
5.1 连接数据库 37
5.2 正确获取论坛版块和帖子标题问题 38
6 结论 39
6.1论文总结 39
6.2不足与展望 39
参考文献 41
参考文献
[1] Elliott White III Jonnathan D.Eisenhamer 著 王军翻译PHP5in Pracetice
[2] 龚泰宁。PHP5轻松开发Web网站。北京希望电子出版社,2006年5月
[3] 邵丽萍等编。网站编程技术。清华大学出版社,2005年
[4] 邹天思 PHP从入门到精通 清华大学出版社 2008年
[5] 作者 Luke Welling Laura Thomson 翻译 武欣 PHP 和MYSQL WEB开发(原书第4版) 机械工业出版社 2009年。
[6] 张洪伟。Tomcat web开发及整合应用。清华大学出版社,2006年
[7] 作者 聂庆鹏 毛书朋 王志乐 PHP+MYSQL 动态网站开发与全程实例 清华大学出版社 2007年 2008年
[8] 作者 Sirovich.J Darie。C 翻译 邓少鹍 搜索引擎优化高级编程( PHP版)清华大学出版社
[9] 作者 泽瓦斯 Zervaas.Q。 澳大利亚PHP Wed2.0开发实战 人民邮电出版社 (2008-10出版)
[10] 张家境。MySQL与电子商务实战。人民邮电出版社,2001年
[11] 萨师煊,王珊。数据库系统概论。高等教育出版社,2000年
[12] 作者 梁斌 走进搜索引擎 电子工业出版社2007-01