第1关:将超市销售excel文件根据商品的类别筛选存储
任务描述
本关任务: 超市销售数据如图所示
建立excel文件“类别销售”,根据不同类别建立多个工作表,将相同类别的销售信息存放在相应的工作表中。
相关知识
为了完成本关任务,你需要掌握:1.读取excel文件,2.筛选dataframe数据,3.将数据写入工作簿和工作表
从excel文件读入数据
pd.read_excel(filename,sheet_name=0,header=0,index_col=None,names=None,dtype=None) filename:指定电子表格的具体路径 sheet_name:指定需要读取电子表格中的第几个sheet,既可以传递整数也可以传递具体的Sheet名称 header:是否需要将数据集的第一行用作表头,默认为是需要的 index_col:指定哪些列用作数据框的行索引(标签) names:如果原数据集中没有字段,可以通过该参数在数据读取时给数据框添加具体的表头 dtypes:通过字典的形式,指定某些列需要转换的形式
向excel文件写入数据
DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, encoding=None) excel_writer : 文件路径或现有的ExcelWriter sheet_name :字符串,表的名称。默认“Sheet1” na_rep : 字符串,默认‘ ’,缺失数据表示方式 float_format : 字符串,默认None。格式化浮点数的字符串 columns : 列表,要写入的列 header : 布尔或字符串列表,默认为Ture。如果给定字符串列表,则它是列名。 index :布尔,默认的Ture。行名(索引) index_label : 字符串或序列,默认为None。 注意:通过ExcelWriter写入后要同执行save()保存。
DataFrame
唯一值函数
筛选数据 Pandas的.loc参数可以对多列数据进行筛选,并且支持不同筛选条件逻辑组合。
常用的筛选条件包括等于(==),不等于(!),大于(>),小于(=) ,小于等于(