使用pandas进行数据处理之 Series篇

Series支持许多类型的计算，我们可以直接使用加减乘除操作对整个Series进行运算：

也可以使用Numpy当中的运算函数来进行一些复杂的数学运算，但是这样计算得到的结果会是一个Numpy的array。

因为Series当中有索引，所以我们也可以使用dict的方式判断索引是否在Series当中：

Series有索引也有值，其实和dict的存储结构是一样的，所以Seires也支持通过一个dict来初始化：

通过这种方式创建出来的顺序就是dict当中key存储的顺序，我们可以在创建的时候指定index ，这样就可以控制它的顺序了。

我们在指定index的时候额外传入了一个没有在dict当中出现过的key，由于在dict当中找不到对应的值，Series会将它记成NAN(Not a number)。可以理解成是非法值或者是空值，在我们处理特征或者是训练数据的时候，经常会遇到存在一些条目的数据的某个特征空缺的情况，我们可以通过pandas当中isnull和notnull函数检查空缺的情况。

当然Series当中也有isnull的函数，我们也可以调用。

最后，Series当中的 index也是可以修改的，我们可以直接给它赋上新值：

总结
从核心本质上来说，pandas当中的Series就是在Numpy一维数组上做的一层封装，加上了索引等一些相关的功能。所以我们可以想见DataFrame其实就是一个Series的数组的封装，加上了更多数据处理相关的功能。我们把核心结构把握住了，再来理解整个pandas的功能要比我们一个一个死记这些api有用得多。
pandas是 Python数据处理的一大利器，作为一个合格的算法工程师几乎是必会的内容，也是我们使用Python进行机器学习以及深度学习的基础。根据调查资料显示，算法工程师日常的工作有70%的份额投入在了数据处理当中，真正用来实现模型、训练模型的只有30%不到。因此可见数据处理的重要性，想要在行业当中有所发展，绝不仅仅是学会模型就足够的。
本文使用 mdnice 排版

想了解更多编程学习，敬请关注php培训栏目！

以上就是使用pandas进行数据处理之 Series篇的详细内容！

查看更多关于使用pandas进行数据处理之 Series篇的详细内容...

声明：本文来自网络，不代表【好得很程序员自学网】立场，转载请注明出处：http://www.haodehen.cn/did78396

更新时间：2022-10-19 阅读：69次