网站首页企业百科 产品百科 技术百科 人物百科

大数据技术及行业应用

我有新说法
147 0
大数据技术的广泛应用使其成为众多行业技术进步、促进效益增长的关键支撑技术。根据数据处理的时效性,大数据处理系统可分为批式(batch)大数据和流式(streaming)大数据两类。其中,批式大数据又被称为历史大数据,流式大数据又被称为实时大数据。

目录

大数据技术及行业应用内容简介

其中首章简明地介绍了大数据的基本理论,辨析了相关的重要概念和理念。接下来的三章,从私有平台、虚拟化平台、综合性平台等层面系统介绍了现有的成熟技术方法。最后七章是本书的重点,依次剖析了大数据技术在图算法、环境科学、药物数据聚类、电子商务、社交网络、文本挖掘与情感分析、电力系统控制等领域的具体应用。[1]

大数据技术及行业应用作品目录

第1章大数据相关概念
1.1什么是大数据?
1.2大数据有多大?
1.3大数据是一种思维方式
1.4大数据思维的应用案例
1.5大数据是如何产生的?
1.6美国和中国的大数据产业生态系统
1.7如何学习大数据技术
本章小结
参考文献
第2章搭建私有大数据处理平台
2.1FreeBSD操作系统安装
2.2基础软件安装
2.2.1安装Java运行环境
2.2.2安装bash
2.3Hadoop安装配置
2.3.1系统规划
2.3.2配置conf/masters、conf/slaves文件
2.3.3Hadoop安装
2.4Hadoop开发环境配置
2.4.1编译Hadoop—eclipse—plugin—1.1.2.jar插件
2.4.2eclipse配置
2.4.3测试
2.5Hadoop升级
2.6Zookeeper安装
2.6.1在FreeBSD上安装Zookeeper
2.6.2启动并测试Zookeeper
2.7HBase安装配置
2.8FreeBSD上网配置
2.8.1VPN上网配置
2.8.2网页认证上网配置
2.9配置杀毒软件
本章小结
第3章大数据平台虚拟化解决方案
3.1Ubuntu上安装Docker
3.1.1Docker简介
3.1.2Docker安装
3.1.3Docker镜像相关命令
3.1.4Docker容器相关命令
3.1.5Dockerfile创建镜像
3.1.6Docker实现Spark集群
3.1.7Docker集中化Web界面管理平台shipy
3.1.8DockerUI
3.2OpenStack搭建
3.2.1下载工具和镜像
3.2.2配置网桥
3.2.3安装fuel
3.2.4安装OpenStack平台
3.2.5使用OpenStack平台
本章小结
参考文献
第4章大数据平台解决方案
4.1大数据平台比较
4.2CDH大数据平台搭建
4.2.1ClouderaManager安装
4.2.2添加服务
4.3HDP大数据平台搭建
4.3.1部署Ambari
4.3.2用Ambari_web部署HDP平台
本章小结
第5章Spark在大数据处理中的应用
5.1Spark集群搭建
5.1.1Scala在Ubuntu下的安装和配置
5.1.2Spark集群搭建
5.1.3Spark集群启动测试
5.2Spark—shell统计社交网络中节点的度
5.2.1启动HDFS和Spark
5.2.2运行Spark—shell
5.2.3统计社交网络中节点的度
5.3SparkGraphX
5.3.1属性图
5.3.2图操作
5.3.3构建图
5.3.4图计算相关算法
5.3.5GraphX图计算实例
本章小结
参考文献
第6章大数据技术在环境科学中的应用
6.1大气环境科学的数值模式的介绍
6.1.1气象模式
6.1.2区域空气质量模式
6.2高分辨率实时观测的大数据
本章小结
参考文献
第7章大数据在DrugBank药物数据库聚类方面的应用
7.1简介
7.2开发环境及编程语言
7.3算法设计
7.3.1算法设计流程
7.3.2相似度的计算
7.4算法实现
7.4.1文件的解析
7.4.2对靶标、作用酶的分析
7.4.3对分子中原子百分比的处理过程
7.4.4结果的整合
7.4.5最终结果展示
本章小结
参考文献
第8章大数据在电子商务数据分析中的应用
8.1研究现状
8.2相关技术及概念
8.2.1网络爬虫
8.2.2HtmlUnit工具包
8.2.3Mahout
8.2.4朴素贝叶斯算法
8.2.5文档向量
8.2.6TF—IDF改进加权
8.2.7中文分词
8.3需求分析
8.3.1系统功能
8.3.2系统界面
8.4概要设计
8.4.1系统模块设计
8.4.2数据库设计
8.5详细设计
8.5.1用户登录模块
8.5.2爬虫管理模块
8.5.3算法管理模块
8.5.4用户管理模块
8.6系统测试
8.6.1训练集准备
8.6.2新数据准备
8.6.3训练模型
8.6.4数据分类
8.6.5分类结果分析
本章小结
参考文献
第9章大数据技术在社交网络研究中的应用
9.1社区发现研究简介
9.2社区发现相关研究工作
9.2.1相关工作
9.2.2研究动机
9.3模型与问题的形式化
9.3.1社区森林模型
9.3.2问题形式化
9.4骨干度算法
9.4.1骨干度算法框架
9.4.2算法的时间复杂度
9.4.3算法比较
9.5实验分析
9.5.1数据集
9.5.2一个特定人际关系网络的测试
9.5.3Zachary的空手道俱乐部测试
9.5.4美国大学橄榄球队
9.5.5安然电子邮件公司数据集
9.5.6DBLP合作网络
9.5.7结论
本章小结
参考文献
第10章大数据技术在文本挖掘和情感分类中的应用
10.1研究综述
10.1.1基于产品特征的观点挖掘研究
10.1.2产品评论结构化信息抽取方法
10.1.3评论信息分类相关研究方法
10.2评论文本的结构化信息抽取
10.2.1产品特征抽取
10.2.2基于关联规则抽取评论的隐式特征
10.2.3基于监督学习抽取评论的隐式特征
10.3情感分类研究综述
10.3.1基于词典与语言规则进行情感分类
10.3.2观点挖掘结果归纳
10.4算法评估结果与分析
10.4.1隐式特征抽取实验结果及分析
10.4.2篇章粒度情感分类实验结果及分析
10.4.3语句粒度情感分类实验结果及分析
本章小结
参考文献
第11章大数据技术在电力系统中的应用
11.1一种云可视化机网协调控制响应特性数据挖掘方法
11.1.1技术领域
11.1.2背景技术
11.1.3方案内容
11.2基于电力数据分析的河北南网电力市场化风险对冲方法
11.2.1电网对发电侧市场化风险对冲分析
11.2.2电网对用电侧市场化风险对冲分析
11.2.3基于方差偏离规律的统计套利对冲方法
本章小结
附录FreeBSD操作系统安装
参考资料


目录
×

是否已完成本次百科编辑