1.文件的读取 Pandas的文件输入有赖于xlrd、xlwt、openpyxl这三个第三方的库,如果读取失败可尝试先安装这几个库; 在数据分析的过程中对于数据的读取和写入是必不可少的,这里我们主要学习csv、 txt、 excel的读取和写入。 1.1文件的读取 csv、txt、excel文件分别可以使用read_csv()、read_table()、read_exece来读取,其中传入的参数都是文件的相对或者绝对路径。 其中的一些公共参数,header设置为None时表示第一行不作为列名,index_col表示把某一列或某几列作为索引;usecols表示读取列的集合,默认是所有的列;parse_dates表示需要转化为时间的列,nrows表示读取的数据行数。 header: index_col: usecol: parse_dates: nrows: 在读取txt文件的时候可能会遇到分隔符不是空格的情况,read_table()中是有一个分割参数sep,可以实现对分隔符号的自定义,sep中使用的是正则表达式。 2.数据的写入 通常使用to_csv()、to_excel()写入数据,如果想要快速的转化为markdown和latex可以使用to_markdown()、和to_latex(),但需要额外安装tabulate包。 一般情况下,pandas会在数据写入时包含当前的数据索引,但我们在输出的时候其实并不需要整数索引,此时可以将index设置为False,可以在输出时去掉索引。 pandas中没有定义to_table()函数,但是to_csv()可以将数据保存为txt文件,并且可以自定义分隔符。