花费 136ms 找到48条记录
1 数据建模前的数据探索工作
2019年04月24 - 数据建模前的数据探索工作主要验证特征的缺失率,唯一值等,用于过滤是否可以入模的因子。 ```python import pandas as pd import numpy as np from pandas import DataFrame import matplotlib as mpl imp
2 linux下自行搭建私有云kodexplorer
2019年04月23 - kodexplorer是一款开源的私有云框架,可以通过它实现个人网盘的功能,如果拥有一个性能不错的VPS,那么就可以摆脱奇慢无比的百度云等网盘啦!最近百度网盘还发出申明,说要限制使用空间。用别人的东西就是要遵守别人的规则,使用非常的顺心。 如果搭在VPS上,可以用作个人的网盘使用。kodexplo
3 机器学习线上预测流程和方案
2019年03月18 - ​ 我们知道模型通过离线方式训练出来后,怎么进行预测呢?如何在线上实时打分。 ​ 我们可以将模型结果转为一种叫pmml的格式文件,然后交由openscoring的Web 服务组件来进行线上打分预测。openscoring是一套解决方案(官网是openscoring.io),gi
4 大数据平台监控服务及自动重启脚本
2019年03月13 - ​ 我们知道大数据平台有很多服务datanode,namenode,nodemananger,resourcemanager等等,这些服务可能会在跑任务的过程中直接退出,那么我们如何监控这些服务并重启服务呢?接下来总结一些这方面的监控脚本以备不时之需。 #### 1、Datanode监控
5 redis集群安装及维护
2019年03月12 - 先准备好redis和ruby的安装包:redis-4.0.2.tar.gz、ruby-2.4.2.tar.gz、redis-4.0.0.rc1.gem 1、安装Redis ```shell tar -zxvf redis-4.0.2.tar.gz mv redis-4.0.2 redis cd
6 使用Hive SQL计算TF-IDF的方法和流程
2019年03月11 - TF-IDF的公式: ![](https://img-blog.csdn.net/20180503143424518) 逆向文件频率 (inverse document frequency, IDF) IDF的主要思想是:如果包含词条t的文档越少, IDF越大,则说明词条具有很好的类别区分能力
7 这几年为什么Python在中国突然就火了起来了?
2019年03月09 - Python这个东西在中国,大概是从2017年末开始,突然就火了起来的。 此前,对于Python,乃至编程,绝大多数程度上都是专业人士的话题,在普通大众层面上起不了波澜。 这几年为什么Python在中国突然就火了起来了? 创一个小群,供大家学习交流聊天 如果有对学python方面有什么疑惑问题的
8 没有任何编程基础可以直接学习python语言吗?学会后能够做什么?
2019年03月01 - 很明确的说 python非常适合没有任何编程基础的人入门。。 目前应用最多的:全栈开发、数据分析、运维开发,今天我们就以这三个重点的岗位来做一下自学Python的规划,希望你在学之前就能有结果的来走得更远。 很多人在问,python学了之后能做些什么? 既然你没有碰过 Python ,不知编程
9 python是什么语言?哪些人适合学习Python?
2019年02月28 - 众所周知,Python 是一门更注重可读性和效率的语言,这两个天然优势让其在IT界里备受青睐,吸引了不少目光。相信找到这篇文章的你,肯定也是为Python的魅力所倾倒。 那么Python是什么语言呢? Python是纯粹的自由软件, 源代码和解释器CPython遵循 GPL(GNU Genera
10 linux批量修改文件后缀
2019年01月21 - linux批量修改文件后缀 linux批量修改文件后缀 linux批量修改文件后缀 linux批量修改文件后缀 ```shell find ./*/ -name "*.log.done" | awk -F "." '{print $2}' | xargs -i -t mv ./{}.log.done

 
© 2014-2019 ITdaan.com 粤ICP备14056181号