一、概要
1. 简介
pandas 是Python数据分析工具链中最核心的库,可用于数据读取、清洗、分析、统计、输出等,适用于处理结构化数据(如表格型数据)。
2. 核心设计理念
- 标签化数据结构:提供带标签的轴
- 灵活处理缺失数据:内置NaN处理机制
- 智能数据对齐:自动按标签对齐数据
- IO工具:支持CSV、Excel、SQL等多种数据源
- 时间序列处理:原生支持日期时间处理和频率转换

| 特性 | Series | DataFrame |
|---|---|---|
| 维度 | 一维 | 二维 |
| 索引 | 单索引 | 行索引 + 列名 |
| 数据存储 | 同质化数据类型 | 各列的数据类型可以不同 |
| 类比 | Excel 单列 | Excel Sheet |
| 创建方式 | pd.Series([1, 2, 3]) | pd.DataFrame({'col': [1, 2, 3]}) |
评论 (0)