电商门户 互联网+国家战略智库
·设为首页 ·我要投稿 ·生意宝 ·生意社 ·官方微信 ·专题
综合
SAAS  |跨境
钢铁网 上市|化塑
大宗品 工业|B2B
零售
B2C|海淘 时尚|珠宝
三农|母婴 女性|食品
美妆|百货 生鲜|鞋服
O2O
房产|教育 团购|餐饮
社区|家居 汽车|差旅
医疗|婚嫁 智能|影视
金融
电商金融 保险|支付
众筹|P2P 政策|企业
消费|理财 银行|征信
智库
报告|数据 法规库
研报|案例 企业库
百科|运营 论文库
人物
网红|专家 企业家
人才|培训 微博库
快评|明星 记者库
服务
法律|维权 淘宝|曝光
营销|物流 传媒|导航
思维|品牌 微商|会议
当前位置:首页 > > 互联网研究 > 电商书籍推荐:《大数据架构和算法实现之路:电商系统的技术实战》

电商书籍推荐:《大数据架构和算法实现之路:电商系统的技术实战》

http://www.100ec.cn  2017年08月11日10:40  中国电子商务研究中心 人才招聘 产品服务

大数据架构和算法实现之路:电商系统的技术实战  》

  作者简介

  机器学习和大数据挖掘领域的技术专家和管理者。在上海交通大学获得计算机科学与工程博士学位,先后在微软亚洲研究院,eBay中国研发中心,1号店和飞牛网工作。“微软学者奖”获得者,IBM中国首届“ExtremeBlue天才孵化计划”成员。有超过10年的学术创新和实际研发的经验,成功孵化了10多项关键算法,发表了20多篇国际学术论文,拥有10多项国际专利及申请。目前是《计算机工程》杂志的特邀审稿专家,参与撰写的互联网图书《玩转电商》已经于2014年出版。

  目  录

  推荐序

  前言

  引子1

  第一篇支持高效的运营

  第1章方案设计和技术选型:分类5

  1.1分类的基本概念6

  1.2分类任务的处理流程7

  1.3算法:朴素贝叶斯和K最近邻8

  1.3.1朴素贝叶斯8

  1.3.2K最近邻9

  1.4分类效果评估10

  1.5相关软件:R和Mahout 12

  1.5.1R简介12

  1.5.2Mahout简介13

  1.5.3Hadoop简介14

  1.6案例实践17

  1.6.1实验环境设置17

  1.6.2中文分词18

  1.6.3使用R进行朴素贝叶斯分类22

  1.6.4使用R进行K最近邻分类37

  1.6.5单机环境使用Mahout运行朴素贝叶斯分类39

  1.6.6多机环境使用Mahout运行朴素贝叶斯分类47

  1.7更多的思考58

  第2章方案设计和技术选型:聚类60

  2.1聚类的基本概念60

  2.2算法:K均值和层次型聚类61

  2.2.1K均值聚类61

  2.2.2层次型聚类62

  2.3聚类的效果评估64

  2.4案例实践66

  2.4.1使用R进行K均值聚类66

  2.4.2使用Mahout进行K均值聚类69

  第3章方案设计和技术选型:因变量连续的回归分析74

  3.1线性回归的基本概念74

  3.2案例实践76

  3.2.1实验环境设置76

  3.2.2R中数据的标准化78

  3.2.3使用R的线性回归分析81

  第二篇为顾客发现喜欢的商品:

  基础篇

  第4章方案设计和技术选型:搜索94

  4.1搜索引擎的基本概念94

  4.1.1相关性95

  4.1.2及时性97

  4.2搜索引擎的评估100

  4.3为什么不是数据库103

  4.4系统框架104

  4.4.1离线预处理104

  4.4.2在线查询107

  4.5常见的搜索引擎实现108

  4.5.1Lucene简介108

  4.5.2Solr简介113

  4.5.3Elasticsearch简介120

  4.6案例实践123

  4.6.1实验环境设置123

  4.6.2基于Solr的实现123

  4.6.3基于Elasticsearch的实现154

  4.6.4统一的搜索API 175

  第三篇为顾客发现喜欢的商品:高级篇

  第5章方案设计和技术选型:NoSQL和搜索的整合195

  5.1问题分析195

  5.2HBase简介196

  5.3结合HBase和搜索引擎203

  5.4案例实践204

  5.4.1实验环境设置204

  5.4.2HBase的部署205

  5.4.3HBase和搜索引擎的集成211

  第6章方案设计和技术选型:查询分类和搜索的整合219

  6.1问题分析219

  6.2结合分类器和搜索引擎219

  6.3案例实践225

  6.3.1实验环境设置225

  6.3.2构建查询分类器226

  6.3.3定制化的搜索排序229

  6.3.4整合查询分类和定制化排序236

  第7章方案设计和技术选型:个性化搜索245

  7.1问题分析245

  7.2结合用户画像和搜索引擎245

  7.3案例实践249

  7.3.1用户画像的读取250

  7.3.2个性化搜索引擎253

  7.3.3结果对比260

  第8章方案设计和技术选型:搜索分片267

  8.1问题分析267

  8.2利用搜索的分片机制269

  8.3案例实践271

  8.3.1Solr路由的实现271

  8.3.2Elasticsearch路由的实现278

  第9章方案设计和技术选型:搜索提示283

  9.1问题分析283

  9.2案例实践:基础方案284

  9.2.1Solr搜索建议和拼写纠错的实现284

  9.2.2Elasticsearch搜索建议和拼写纠错的实现286

  9.3改进方案291

  9.4案例实践:改进方案294

  第10章方案设计和技术选型:推荐303

  10.1推荐系统的基本概念305

  10.2推荐的核心要素306

  10.2.1系统角色306

  10.2.2相似度307

  10.2.3相似度传播框架307

  10.3推荐系统的分类307

  10.4混合模型311

  10.5系统架构312

  10.6Mahout中的推荐算法313

  10.7电商常见的推荐系统方案314

  10.7.1电商常见的推荐系统方案314

  10.7.2相似度的计算317

  10.7.3协同过滤319

  10.7.4结果的查询320

  10.8案例实践321

  10.8.1基于内容特征的推荐321

  10.8.2基于行为特征的推荐341

  第四篇获取数据,跟踪效果

  第11章方案设计和技术选型:行为跟踪369

  11.1基本概念370

  11.1.1网站的核心框架370

  11.1.2行为数据的类型371

  11.1.3行为数据的模式372

  11.1.4设计理念374

  11.2使用谷歌分析375

  11.3自行设计之Flume、HDFS和Hive的整合378

  11.3.1数据的收集——Flume简介378

  11.3.2数据的存储——Hadoop HDFS回顾382

  11.3.3批量数据分析——Hive简介383

  11.3.4Flume、HDFS和Hive的整合方案386

  11.4自行设计之Flume、Kafka和Storm的整合386

  11.4.1实时性数据分析之Kafka简介386

  11.4.2实时性数据分析之Storm简介388

  11.4.3Flume、Kafka和Storm的整合方案390

  11.5案例实践391

  11.5.1数据模式的设计392

  11.5.2实验环境设置392

  11.5.3谷歌分析实战394

  11.5.4自主设计实战之Flume、HDFS和Hive的整合401

  11.5.5自主设计实战之Flume、Kafka和Storm的整合410

  11.6更多的思考424

  后记425

  中国电商图书馆围绕电商、互联网金融、O2O三大主题,不定期发布最新最热的各类电商书籍:包括移动电商、网络零售、网络支付、P2P、众筹、淘宝网店、物流仓储、电商营销等,为读者购买电商类图书提供专业的推荐与参考,是全国最大的电商图书入口平台。    

  中国电子商务研究中心“互联网+”智库系列丛书已出版《互联网+:跨界与融合》、《互联网+:产业风口》、《互联网+:普惠金融》、《互联网+:海外案例》、《Uber:开启“共享经济”时代》。中心本着“开放共赢”的理念,欢迎各大图书出版商、图书类电商的推荐与合作,敬请关注www.100ec.cn/zt/dsts/。(编选:中国电子商务研究中心)



    9月19日,中国电子商务研究中心发布《2017年(上)中国电子商务市场数据监测报告》(全文下载:www.100ec.cn/zt/17jcbg1)。报告发布了2017上半年中国电子商务及各细分领域发展现状等,包括:B2B电商、零售电商、生活服务电商、跨境电商等。涉及的主要电商平台包括:1)B2B电商平台:阿里巴巴、慧聪网、环球资源、上海钢联、焦点科技、生意宝、环球市场、金泉网、金银岛等。2)零售电商平台:天猫、京东、唯品会、苏宁易购、国美在线、1号店、亚马逊中国、当当网、聚美优品等。3)生活服务电商平台:美团、饿了么、携程、去哪儿、猫眼电影、百度外卖、艺龙、驴妈妈、淘票票、飞猪、摩拜单车、易到用车、同程旅游、蚂蜂窝、途牛旅游、艺龙旅行、穷游网、百合网、洗衣邦、滴滴出行等。4)跨境电商平台:亚马逊、eBay、全球速卖通、敦煌网、Wish、大龙网、跨境通、小笨鸟、价之链、通拓科技、傲基电商、有棵树、兰亭集势、洋码头、天猫国际、宝贝格子、苏宁海外购、聚美优品、京东全球购、亚马逊海外购、1号店全球进口、国美海外购、蜜芽、宝宝树、美囤妈妈等。

「关键字」黄申 大数据 机器学习
版权声明
   (1)凡本中心注明“来源:中国电子商务研究中心”或带有中国电子商务研究中心水印LOGO的所有文字、图片、音频、视频及其他任何形式的作品 ,其版权均属中国电子商务研究中心所有,任何媒体、网站或个人未经本中心协议授权不得转载、链接、转贴或以其他方式复制发布/发表。已与本中心协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国电子商务研究中心”,违者本中心将依法追究责任。
   (2)转载或引用本中心内容必须是以新闻性或资料性公共免费信息为使用目的的合理、善意引用,不得对本中心内容原意进行曲解、修改,同时必须保留本中心注明的“稿件来源”,并自负版权等法律责任。
   (3)对于不当转载或引用本中心内容而引起的民事纷争、行政处理或其他损失,本中心不承担责任。
   (4)凡本中心注明“来源:xxx(非中国电子商务研究中心)”的文/图等稿件,均转载自其它媒体、网站与机构,其转载目的在于传递更多信息,并不代表本中心赞同其观点和对其真实性负责,请读者仅作参考,并请自行核实相关内容,如其他媒体、网站或个人从本网下载使用,必须保留本网注明的“稿件来源”,并自负版权等法律责任。
   (5)关于本中心发布的用户投诉稿件,信息均由用户通过本中心投诉通道提供,本中心不对其真实性负责,若内容真实性有误,请与本中心联系,本中心将在核实后进行处理。
   (6)对不遵守本声明或其他违法、恶意使用本中心内容者,本中心保留追究其法律责任的权利。
   (7)如因作品内容、版权和其它问题需要同本中心联系的请发送相关内容至邮箱:news@netsun.com)
   此版权声明解释权归中国电子商务研究中心所有。
生态型企业:更多>>
图书出版
  • 电商报告
  • 投诉曝光
  • 热点专题
曝光专区:更多>>
有以下事宜,请联系:NEWS@netsun.com  详情点击
新闻发布 投稿爆料 案例分享 数据报告
有以下事宜,请联系:BD@netsun.com
广告投放 培训演讲 微信合作 会议合作
有以下事宜,请联系:B2B@netsun.com
专家申报 政府课题 园区招商 跨境电商
以下企业,请联系:B2C@netsun.com
B2C电商 服务商 品牌商 仓储物流
以下企业,请联系:JR@netsun.com
银行金融 支付 P2P 理财 众筹 VC/PE
以下企业,请联系:O2O@netsun.com
O2O 餐饮外卖 在线医疗 旅游出行
以下人士,请联系:TOUSU@netsun.com
网购投诉 律师/司法 媒体记者 网络安全
行业/频道: 产品/服务: 数据/研究: 导航/平台:
政府 全球电商 部委|省市 法规|会议 信息化
零售 B2C|传统 网购|团购 C2C|品牌 开放平台
行业 B2B|外贸 O2O|物流 营销|移动 互联网
金融 金融|支付 上市公司 P2P|基金 投融资
专家认证 融资顾问 法律顾问
电商培训 政府顾问 园区服务
广告|营销 会议服务 报告订制
媒体服务 记者服务 会员入驻
数据|报告 图书|案例
运营实战 分析师|专家
信息图|人物 互联网研究
B2B研究 B2C研究
政策文件 法律求助
投诉维权 曝光台
企业库 B2B导航
网购导航 打折促销
关于我们 联系我们 商务合作 投稿撤稿 友情链接 免责声明 人才招聘 独家专题 中心微信
中国电子商务研究中心 版权所有