
会员
网络数据采集技术:Java网络爬虫实战
更新时间:2020-09-29 15:50:25
最新章节:9.4 本章小结开会员,本书免费读 >
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
网络数据采集技术:Java网络爬虫实战最新章节
查看全部- 9.4 本章小结
- 9.3 WebMagic的使用
- 9.2 WebCollector的使用
- 9.1 Crawler4j的使用
- 第9章 网络爬虫开源框架
- 8.9 本章小结
- 8.8 截取验证码
- 8.7 隐藏浏览器
- 8.6 动态加载JavaScript数据(操作滚动条)
- 8.5 模拟登录
同类热门书
最新上架
- 会员
Docker与Kubernetes容器虚拟化技术与应用
Docker是目前流行的容器平台。作为开发、发布和运行应用程序的开放平台,Docker为快速发布、测试和部署应用程序提供了一整套技术和方法。《Docker与Kubernetes容器虚拟化技术与应用》主要围绕容器生态体系中的核心组件Docker和Kubernetes展开,介绍了容器的组成及相关概念、容器系统架构和运行原理,重点剖析了Docker和Kubernetes两大工具的核心概念、组成和工作原理计算机9.6万字 - 会员
Java+OpenCV高效入门
OpenCV作为一个应用广泛的开源计算机视觉库,正在受到越来越多的关注。目前OpenCV的各类教程基本上以Python和C++为主,基于Java的OpenCV书籍则少之又少,本书旨在弥补这一空白。本书共13章,前4章是基础部分,包括OpenCV概述和安装配置、数字图像基础及图像基础操作等内容;第5到11章则包括了图像的几何变换、图像平滑、形态学操作、直方图、边缘检测与轮廓、霍夫变换、特征点检测和匹计算机6.9万字 - 会员
智能优化算法与MATLAB编程实践
《智能优化算法与MATLAB编程实践》介绍了国内外新研发的10种智能优化算法,对每种算法的灵感来源、实现过程、函数编程、案例应用都进行了细致描述并给出详细的MATLAB代码,使读者快速掌握智能优化算法的学习和应用方法。全书共分为12章,前10章分别介绍10种智能优化算法的原理、MATLAB实现、具体函数寻优求解过程和应用案例;第11章列举了23种衡量智能优化算法性能的常见测试函数,并给出MATLA计算机6.1万字 性能之道:分布式系统全栈性能优化
这是一本从点、线、面、体4个维度深度解读分布式系统性能优化方法的专业工具书,更是一套全栈性能优化解决方案。全书融合了5位长期(最长有近30年工作经验)从事软件开发及优化工作的一线专家的实践经验和深刻理解,不仅从理论层面深入解读了性能优化的本质,还从软件开发整体流程的角度构建性能优化体系和评估策略。本书共分为17章。第1~4章主要介绍作者对性能优化的理解以及性能优化体系及评测方法。第5~9章对网络、计算机23.3万字- 会员
图解Java数据结构与算法(微课视频版)
《图解Java数据结构与算法:微课视频版》系统、全面地介绍数据结构的基础理论与算法设计,精选数据结构考研习题和各类典型例题进行讲解,案例和课后习题丰富,突出对数据结构算法实践能力的培养。本书算法均采用Java语言实现,示例代码可直接上机运行。《图解Java数据结构与算法:微课视频版》共分11章,内容包括数据结构与算法概述,线性表,栈和队列,串、数组和广义表,树,图,查找算法,排序算法,分治算法,贪计算机12.8万字 - 会员
Java Web开发从0到1
自20世纪以来,互联网的发展已经堪称日新月异,人们的工作、生活、学习等各个方面越来越离不开互联网Web应用。JavaWeb是Web应用中成熟度高、普及率高、适用性广的开源技术,几乎所有Web应用程序都需要具备JavaWeb技术能力。本书分为5篇,共17章。第1篇介绍Web开发与JavaWeb开发,包括体系结构、相关技术、开发环境等;第2篇介绍JSP语言基础,包括JSP的基本概念、JSP指令、JSP计算机10.3万字 - 会员
AI辅助编程Python实战:基于GitHub Copilot和ChatGPT
本书系统地介绍了如何利用AI助手Copilot和ChatGPT来提升Python编程的效率和质量。本书从AI助手的基础概念讲起,逐步深入到代码组织、阅读、测试、提示工程等关键技能,并引导读者通过实践掌握如何拆解复杂问题、查找和修复bug、自动化任务处理及开发计算机游戏。本书不仅提供了丰富的实例和练习,还探讨了AI助手的潜力和局限,以及未来的发展趋势,是希望在编程领域融入AI技术的读者的理想选择。本计算机17.2万字 - 会员
Django 5企业级Web应用开发实战(视频教学版)
《Django5企业级Web应用开发实战:视频教学版》精选当前简单、实用和流行的Django实例代码,帮助读者学习和掌握Django5框架及其相关技术栈的开发知识。本书系统全面、内容翔实、重点突出、通俗易懂,基本涵盖Django5框架应用开发的所有技术。《Django5企业级Web应用开发实战:视频教学版》共分为13章,内容包括Django框架基础与环境搭建、常用配置、模型、视图与路由、模计算机15.9万字 - 会员
Python科学与工程数据分析实战
本书以Python3.10.7为平台,以实际应用为背景,通过概述+算法+经典应用的形式,深入浅出地介绍Python数据分析的相关知识。全书共9章,主要内容包括Python概述、科学计算库、开源科学集、数据分析利器、数据分析的可视化、基于回归的数据分析、基于分类的数据分析、基于聚类的数据分析、数据特征分析等。通过学习本书,读者可领略到Python的简单、易学、易读、易维护等特点,同时也可感受到利用计算机10.1万字