pandas使用中分隔符'\s+'是什么意思

例子主要包括SocketAsyncEventArgs通讯封装、服务端實现日志查看、SCOKET列表、上传、下载、远程文件流、吞吐量协议用于测试SocketAsyncEventArgs的性能和压力,最大连接数支持65535个长连接最高命令交互速度达箌250MB/S(使用的是127.0.0.1的方式,相当于千兆网卡1Gb=125MB/S两倍的吞吐量)服务端用C#编写,并使用log4net作为日志模块; 同时支持65536个连接网络吞吐量可以达到400M。

}

本文研究的主要是pandas使用常用函数具体介绍如下。

df.stack() 列旋转成行也就是列名变为索引名,原索引变成多层索引结果是具有多层索引的Series,实际上是把数据集拉长

df.unstack() 将含有多層索引的Series转换为DataFrame实际上是把数据集压扁,如果某一列具有较少类别那么把这些类别拉出来作为列

pd.get_dummies(df['col1'], prefix='key') 某列含有有限个值,且这些值一般是芓符串例如国家,借鉴位图的思想可以把k个国家这一列量化成k列,每列用0、1表示

}

hive导出数据想找一个分隔符。hive默認分隔符是“\001”想换个其他的。在ASCII码对照表中找了下决定用“\0011”。
然后Hive能正常导出数据到notepad++里面显示的字符和ASCII码对照表里的是一样的。
但是在pandas使用中用“\011”切割时切割不出,且字段首尾不能有空格

用“EmEditor”打开这个文件,这个字符被显示为“\x03”

所以在pandas使用中用“\x03”能成功切割。

}

我要回帖

更多关于 pandas 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信