2020-04-10 ElasticSearch 本地elasticsearch-head插件的安装与使用 上一篇谈到在Ubuntu16.04中安装elasticsearch,这一篇我们来谈谈如何在本地机器中安装elasticsearch-head插件,进行ES可视化管理 环境配置 Node JS版本... 阅读全文…
2020-04-09 ElasticSearch Ubuntu16.04离线安装Elasticsearch(单机版) 软件配置 Ubuntu版本:16.04 jdk版本:1.8.0_211 Elasticsearch版本:5.6.8 新建elasticsearch用户创建用户在root用户下执行下述命令 1u... 阅读全文…
2020-04-08 Redis Ubuntu16.04离线安装redis(单机版) 本教程适用于linux系统无法联网的情况,并且是在root用户下进行安装配置的 软件配置 Ubuntu版本:16.04 Redis版本:4.0.2 安装教程判断linux系统中是否有gcc环境... 阅读全文…
2020-03-14 Scala Scala基础 REPLScala解释器读到一个表达式,对它进行求值,将它打印出来,接着再继续下一个表达式。这个过程被称作“读取-求值-打印”循环(read-eval-print loop),即REPL var... 阅读全文…
2020-03-08 Python python爬虫简单实例-爬取17K小说网小说 什么是网络爬虫?网络爬虫(Web Spider),又被称为网页蜘蛛,是一种按照一定的规则,自动地抓取网站信息的程序或者脚本。 爬虫流程 先由urllib的request打开Url得到网页html... 阅读全文…
2020-02-19 Machine Learning 机器学习—交叉验证 交叉验证是机器学习的重要概念。 为了能够让模型更加稳定,需要用数据集的不同子集进行反复的验证。如果只是对特定的子集进行微调,最终可能会过度拟合(overfitting)模型。 过度拟合是指模型... 阅读全文…
2019-09-24 Hadoop Hadoop Streaming中reduce的多路输出 上一章说到,Hadoop Streaming能使用任何编程语言编写MR程序,使MR计算框架不再拘泥于Java这一单独的语言,但是这也有一定的局限性,比如说Hadoop Streaming需要有该... 阅读全文…
2019-09-22 Hadoop Hadoop Streaming详解 刚来公司的时候就发现大家都在使用Hadoop Streaming 来执行任务,当时还在想名字里有Streaming,Hadoop也拿来做实时计算工具了吗?后来发现原来只是我学得太少,对编程工具的... 阅读全文…
2019-08-12 Python Python学习笔记07 convert_types.py 脚本中保存了一个列表,列表中存放的是pv行为,如:[‘离线动作-列表页-到这里去 1’,’离线动作-图区-搜周边 2’,’离线动作-图区-到这里去 ... 阅读全文…
2019-08-05 Python Python学习笔记06 Python JSONJSON函数使用 JSON 函数需要导入 json 库:import json json.dumps:将 Python 对象编码成 JSON 字符串 json.loads... 阅读全文…