新聞中心
在Python中,pandas庫是一個非常強大的數(shù)據(jù)處理工具,它提供了DataFrame這個數(shù)據(jù)結構,用于處理和分析表格數(shù)據(jù)。DataFrame是一個二維的、大小可變的、潛在的異質的表格數(shù)據(jù)結構,它是Python編程語言中pandas庫的一部分。DataFrame是Python編程語言中pandas庫的一部分,它是Python編程語言中pandas庫的一部分。

創(chuàng)新互聯(lián)長期為上1000+客戶提供的網(wǎng)站建設服務,團隊從業(yè)經驗10年,關注不同地域、不同群體,并針對不同對象提供差異化的產品和服務;打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為廣漢企業(yè)提供專業(yè)的網(wǎng)站設計制作、網(wǎng)站設計,廣漢網(wǎng)站改版等技術服務。擁有十年豐富建站經驗和眾多成功案例,為您定制開發(fā)。
創(chuàng)建DataFrame
1、從字典創(chuàng)建
可以使用字典來創(chuàng)建一個DataFrame,其中字典的鍵將成為列名,而字典的值將成為列中的數(shù)據(jù)。
import pandas as pd
data = {
'name': ['Alice', 'Bob', 'Cathy'],
'age': [25, 30, 35],
'city': ['New York', 'San Francisco', 'Los Angeles']
}
df = pd.DataFrame(data)
2、從列表創(chuàng)建
可以使用列表來創(chuàng)建一個DataFrame,其中每個子列表將成為一行。
data = [['Alice', 25, 'New York'],
['Bob', 30, 'San Francisco'],
['Cathy', 35, 'Los Angeles']]
df = pd.DataFrame(data, columns=['name', 'age', 'city'])
3、從其他DataFrame創(chuàng)建
可以使用現(xiàn)有的DataFrame來創(chuàng)建一個新的DataFrame,可以選擇性地指定行和列的范圍。
df_new = df[['name', 'age']]
4、從文件創(chuàng)建
可以使用read_csv、read_excel等函數(shù)從文件中讀取數(shù)據(jù)并創(chuàng)建DataFrame。
df = pd.read_csv('data.csv')
常用操作
1、選擇行和列
可以使用列名或索引值來選擇行和列。
選擇列 df['name'] 選擇行 df.loc[0]
2、篩選數(shù)據(jù)
可以使用布爾表達式來篩選數(shù)據(jù)。
篩選年齡大于30的人 df[df['age'] > 30]
3、排序數(shù)據(jù)
可以使用sort_values函數(shù)對數(shù)據(jù)進行排序。
按年齡升序排序 df.sort_values(by='age')
4、分組和聚合數(shù)據(jù)
可以使用groupby函數(shù)對數(shù)據(jù)進行分組,然后使用聚合函數(shù)(如sum、mean等)對分組后的數(shù)據(jù)進行聚合。
按城市分組,計算每個城市的平均年齡
df.groupby('city')['age'].mean()
5、合并和連接數(shù)據(jù)
可以使用merge、concat等函數(shù)將多個DataFrame合并成一個。
合并兩個DataFrame,按名字列進行連接 pd.merge(df1, df2, on='name')
常用函數(shù)
1、描述性統(tǒng)計
可以使用describe函數(shù)獲取數(shù)據(jù)的描述性統(tǒng)計信息,如計數(shù)、平均值、標準差等。
df.describe()
2、缺失值處理
可以使用dropna、fillna等函數(shù)對缺失值進行處理。
刪除包含缺失值的行 df.dropna() 用平均值填充缺失值 df.fillna(df.mean())
3、字符串操作
可以使用str屬性對字符串列進行操作,如替換、分割等。
將名字中的空格替換為下劃線
df['name'] = df['name'].str.replace(' ', '_')
pandas庫中的DataFrame是一個非常實用的數(shù)據(jù)結構,可以幫助我們輕松地處理和分析表格數(shù)據(jù),通過掌握上述常用操作和函數(shù),我們可以更高效地處理數(shù)據(jù),從而更好地支持數(shù)據(jù)分析和建模工作。
標題名稱:python中dataframe函數(shù)用法
本文地址:http://m.fisionsoft.com.cn/article/dpddhgo.html


咨詢
建站咨詢
