花费 180ms 找到20条记录
1 scala访问redis数据库代码实现
2018年05月15 - 首先添加jedis的jar: ```xml redis.clients jedis 2.7.3 ``` 接下来就是直接贴代码了,请看如下scala class,非常简单: ```java import java.util import x.x.x.x.Redis
2 centos安装squid简单步骤搭建代理服务器
2018年04月14 - 一、系统环境 操作系统:CentOS release 6.7 (Final) SELINUX=disabled HTTP Service: stoped 二、安装Squid服务 2.1 检查squid软件是否安装 ```shell rpm -qa|grep squid ``` 2.2 如果未安装,
3 使用Hive中的UDAF实现GROUP_CONCAT函数合并ARRAY数组类型
2018年04月04 - 我们知道Hive提供了聚合连接函数concat_ws,该函数无法连接ARRAY类型。所有,在实际的开发过程中有可能需要聚合连接ARRAY类型。比如说,同一个用户的标签进行group by后,进行连接,并去重。 所以,借助于Hive的UDAF函数,我们实现类似的临时函数功能。 废话不多说,直接
4 使用Google guava实现本地缓存+netty对外提供服务
2018年03月28 - 在某些情况下我们需要使用本地缓存来加载一些小型数据,比如说一些配置数据。如果去查Mysql或者redis数据库需要走网络协议。这些数据可以加载到内存随时供Java程序调用。 接下来实现的是使用google的guava实现本地缓存,另外需要提供给其它服务使用的话,还可以使用netty对外发布服务
5 linux下Mysql导出数据到文件的方法
2018年03月21 - linux下Mysql导出数据到文件的方法 ```sql mysql -h host -u user -P port -p -e 'select xxx from xxx where xx = x' < /xxx/xxx/xxx/sss.txt ``` 导出到文件,如果有多个字段的话,可以使用con
6 数据库表设计和存储(包括hbase,solr等)
2018年03月13 - ### 一、Hbase内容主表结构和操作 #### 1.1 hbase表[post]创建代码 ```mysql create 'itdaan:post',{NAME=>'a',VERSIONS=>1},{NAME=>'b',VERSIONS=>1},{SPLITS=>['01','02','03'
7 网页爬虫富文本内容判重及余弦相似度判定
2018年03月12 - 我们知道很多文章爬取下来有可能是转载的,很多用户只是在文章开头和结尾加上原文的出处,这样的内容会存在很多重复的文章。 按理来说,文章与文章之间的相似度比较可以使用余弦定理来判断,但是爬虫,不可能将爬取到每一篇文章都在库中进行一次相似度比较。这就需要我们找到与库中有相同特点的文章再使用定理进行判
8 hbase映射表map类型过滤数据的问题
2018年03月08 - #### hbase映射表map类型过滤数据的问题 在试用hbase的映射表过程中,如果是映射了一个列族作为一个map类型,假如名称就叫:tags。在hbase中的数据格式大概为: ```json {"123":"1","234":"1","345":"1"} # 123,234,345 是列名 1
9 线性回归小结(转)
2018年03月02 - 线性回归小结   线性回归可以说是机器学习中最基本的问题类型了,这里就对线性回归的原理和算法做一个小结。 1. 线性回归的模型函数和损失函数   线性回归遇到的问题一般是这样的。我们有m个样本,每个样本对应于n维特征和一个结果输出,如下:   ​   我们的问题是,对于一个新的(​), 他所
10 Spark Standalone Cluster模式安装和配置
2018年03月02 - ### 1、手动启动一个spark集群 启动standalone的master节点 ```shell ./sbin/start-master.sh ``` 一旦启动后,master会打印一个spark的地址,例如:spark://HOST:PORT。这个地址可以作为SparkContext的m

 
© 2014-2018 ITdaan.com 粤ICP备14056181号