จัดการข้อมูลด้วย pandas เบื้องต้น

- phyblas.hinaboshi.com

จัดการข้อมูลด้วย pandas เบื้องต้น

บทความส่วนนี้เขียนขึ้นเพื่อสอนการใช้ pandas เนื้อหาเรียบเรียงจากหนังสือและตามเว็บ

ตัวอย่างต่างๆในบทความเหล่านี้ส่วนใหญ่ใช้ข้อมูลโปเกมอน ซึ่งส่วนใหญ่นำมาจาก http://hinaboshi.com/ruamraichuepokemon และลิงก์ภายในนั้น

บทที่ ๑: ซีรีส์ ※ pd.Series บทที่ ๒: เริ่มต้นสร้างและใช้งานเดตาเฟรม ※ pd.Dataframe .ix[] .loc[] .iloc[] .astype บทที่ ๓: การอ่านข้อมูลจากไฟล์และเขียนลงไฟล์ ※ pd.read_csv pd.read_table .to_csv บทที่ ๔: การคัดกรองข้อมูล ※ [] .isin บทที่ ๕: การจัดการกับข้อมูลที่ว่าง (NaN) ※ .isnull .notnull .dropna .fillna บทที่ ๖: การจัดการกับข้อมูลที่ซ้ำซ้อน ※ .duplicated .drop_duplicates .unique บทที่ ๗: การจัดเรียงข้อมูล ※ .reindex .sort_values .sort_index บทที่ ๘: การคำนวณและจัดการข้อมูลตัวเลข ※ .add .sub .mul .div .floordiv .mod .pow .eq .ne .gt .lt .ge .le .min .max .idxmin .idxmax .sum .mean .median .var .std .count .rank .describe บทที่ ๙: การจัดการข้อมูลพร้อมกันทั้งตาราง ※ .map .applymap .apply บทที่ ๑๐: การกำหนดดัชนีใหม่และการใช้ดัชนีหลายตัว ※ .set_index .reset_index .swaplevel .xs บทที่ ๑๑: การแปลงไปมาระหว่างแถวและคอลัมน์ ※ .stack .unstack บทที่ ๑๒: การรวมข้อมูลเป็นตารางเดียว ※ pd.concat .append บทที่ ๑๓: การเชื่อมตารางข้อมูล ※ pd.merge .join บทที่ ๑๔: การจัดกลุ่มข้อมูล ※ .groupby บทที่ ๑๕: การใช้ฟังก์ชันจัดการกับข้อมูลที่จัดกลุ่มแล้ว ※ .groupby().apply .groupby().agg บทที่ ๑๖: การแบ่งข้อมูลเป็นช่วงตามค่าตัวเลข ※ pd.cut pd.qcut บทที่ ๑๗: การจัดการกับข้อมูลสายอักขระ ※ .str[] .str. บทที่ ๑๘: การจัดการกับ json ※ pd.read_json .to_json pd.io.json.json_normalize บทที่ ๑๙: การจัดการกับตารางข้อมูลใน html และดึงข้อมูลจากเว็บไซต์ ※ pd.read_html .to_html บทที่ ๒๐: การอ่านเขียนข้อมูลจากฐานข้อมูล sql ※ pd.read_sql pd.read_sql_table pd.read_sql_query .to_sql

Last updated