Tonyqzy

大概是做算法与数据挖掘的


  • 首页

  • 分类

  • 关于

  • 归档

  • 标签

3.7 合并数据集:Concat Append

发表于 2019-11-14
本文源码请见我的GitHub 12import numpy as npimport pandas as pd 12345def make_df(cols, ind): '''一个简单的DataFrame创建函数''' data = {c: [str(c) + str(i) for i in ind] for c in cols} return pd.DataF ...
阅读全文 »

铁农民进城记

发表于 2019-10-27

对于住在一个四五线小山村的我们,平常是很难有机会进城的。想要进城首先你得过组织层面这一关,其次还要搞明白你来干什么。 听说上海有个大牛蛙这个师傅活儿比较多,每年都能叫来国内顶级安全团队开大会。前两年都有师傅去现场,羡慕得不行, 今年这个机会终于轮到我了。

阅读全文 »

hexo 迁移记录

发表于 2019-10-08
最近打算将主力机换为Windows,于是做了一下数据迁移的工作。Mac比较的一点就是有Time Machine功能,外接硬盘或者nas备份一下就可以了。我没啥要backup的主要是一些照片和文档,生产环境这东西相当年买来的时候自己没用过Linux就开始瞎捣鼓填了不少坑,环境也装点的乱起八糟还不如从头开始。 有一件比较重要的事情是我的博客得搬出来。hexo真的是好文明。 step1:copy出5个重 ...
阅读全文 »

Hello World

发表于 2019-10-08
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub. Quick ...
阅读全文 »

Mac下进行Tensorflow可视化的问题

发表于 2019-06-14
最近主要在用Mac来进行日常学习,之一直在Windows平台进行模型训练,毕竟还有块Nvidia GForce 960M,可以用CUDA跑跑。 我主要使用Tensorflow搭建模型,Tensorflow进行可视化主要使用Tensorboard这个工具。windows下在命令行使用 1tensorboard --logdir = path/to/your/directory 可以开启指定目录下的日 ...
阅读全文 »

3.6 层级索引

发表于 2019-04-26
本文源码请见我的GitHub 这个是用来解决三位思维数据等高维度的问题。 实践中通过层级索引hierarchical indexing 配合多个不同的等级 可以将高位转为一维或者二维的低维度数据 12import numpy as npimport pandas as pd 3.6.1 多级索引Series1234#用一个元组表示索引index = [('California', 2000), ( ...
阅读全文 »

3.5 缺失值处理

发表于 2019-04-25
本文源码请见我的GitHub 3.5.1 选择处理方法|一般有两种方法:一种方法是通过覆盖全局的掩码表示缺失值,另一种方法是标签值表示缺失值 掩码:可能是一个与原装数组维度相同的完整布尔类型数组,也可能是一个用比特表示有缺陷的局部状态。 标签 可能是一个具体的数字,也可能是一些极少出现的形式,也有可能是全局的值。 3.5.2 Pandas 的缺失+值1.None:Python对象类型的缺失值 o ...
阅读全文 »

3.4 Pandas数值计算

发表于 2019-04-25
本文源码请见我的GitHub 12import pandas as pdimport numpy as np 3.4.1 通用函数:保留索引123rng = np.random.RandomState(42)ser = pd.Series(rng.randint(0,10,4))ser 0 6 1 3 2 7 3 4 dtype: int32 12df =pd.DataFr ...
阅读全文 »

3.3 数据取值与选择

发表于 2019-04-24
3.3 数据取值与选择本文源码请见我的GitHub 3.3.1 Series数据选择方法12345#1.将Series看作字典import pandas as pdimport numpy as npdata = pd.Series([0.25,0.3,0.4,0.5], index = ['a', 'b', 'c', 'd'])data a 0.25 b 0.30 c 0.4 ...
阅读全文 »

3.2 Pandas对象简介

发表于 2019-04-23
本文源码请见我的GitHub  12import numpy as npimport pandas as pd 3.2.1 Series对象12#series对象是一个带索引数据构成的一维数组。 可以用一个数组创建Series对象data = pd.Series([1,2,3,5,7]) 1data 0 1 1 2 2 3 3 5 4 7 dtype: int64 ...
阅读全文 »
123
Tony Qin

Tony Qin

Major in Machine Learning

28 日志
8 标签
RSS
GitHub E-Mail Weibo
  • M12R3DX
  • CO0ONTTY
  • M00yy
  • wangyz
© 2019 Tony Qin
由 Hexo 强力驱动
主题 - NexT.Mist