花费 318ms 找到34条记录
Hbase备份和还原
2018年07月02 - hbase表备份 data soft hbase bin hbase org.apache.hadoop.hbase.mapreduce.Export itdaan:org file: data hb
机器学习算法之聚类算法Kmeans并找出最佳K值的Python实践
2018年03月02 - Kmeans聚类算法的大概流程是: 从样本中随机找出K个样本作为中心点 求所有样本到这些样本的距离,按照最短的进行归类 求每个聚类中的样本的元素的平均值,作为新的中心点 继续 , ,知道所有样本再也无
逻辑回归算法的应用:LookAlike人群扩散的基本流程
2018年06月05 - LookAlike按照字面上的意思大概就是,寻找相似特征的用户。 http: image.techweb.com.cn upload roll .jpg 例如:广告主给了我们一批购买了宝马汽车的用户,
大数据平台监控服务及自动重启脚本
2019年03月13 - 我们知道大数据平台有很多服务datanode,namenode,nodemananger,resourcemanager等等,这些服务可能会在跑任务的过程中直接退出,那么我们如何监控这些服务并重启服务
centos安装squid简单步骤搭建代理服务器
2018年04月14 - 一 系统环境 操作系统:CentOS release . Final SELINUX disabled HTTP Service: stoped 二 安装Squid服务 . 检查squid软件是否安装
网页爬虫富文本内容判重及余弦相似度判定
2018年03月12 - 我们知道很多文章爬取下来有可能是转载的,很多用户只是在文章开头和结尾加上原文的出处,这样的内容会存在很多重复的文章。 按理来说,文章与文章之间的相似度比较可以使用余弦定理来判断,但是爬虫,不可能将爬取
爬取天眼查企业信息表存储
2018年06月07 - 创建hbase表结构 sql create itdaan:org , NAME a ,VERSIONS , NAME b ,VERSIONS , SPLITS , , , , , , , , , a
解决SecureCRT粘贴奇数个中文字乱码的问题
2019年01月11 - 遇到很奇怪的问题 当在SecureCRT粘贴偶数个中文汉字时,显示是不乱码的,但是粘贴奇数个汉字却乱码。 无奈的解决办法: 比如我们要粘贴:你好吗 吗 字会乱码,这时我们使用退格删掉乱码的 吗 字以及
机器学习之逻辑回归算法的算法代码及应用场景
2018年06月01 - 应用场景 . 点击率 转换率预估 PCTR 和 PCVR . 查找look alike人群 通过一部分人群的特征查找另外一部分人 scala实现的逻辑回归算法: scala import java.t
Hive使用UDAF自定义聚合函数
2018年02月28 - 在使用Hive进行数据处理时,经常会用到group by语法,但对分组的合并操作,hive没有MySQL支持得好: group concat DISTINCT 要连接的字段 Order BY ASC

智能推荐
 
© 2014-2019 ITdaan.com 粤ICP备14056181号  

赞助商广告