一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第3天,点击查看活动详情。
列表获取元素最后一个值的方法
list1 = [1, 2, 3, 4, 5]
print(list1[len(list1)-1])
print(list1[-1])
将object转换成日期型
pd.to_datetime(df['date'])
查看自己的python版本
import platform
print(platform.python_version())
dataframe某一列的去重值及数量
python连接远程MySQL数据库
import pymysql
db=pymysql.connect(host=“xxxxx”,
user="xxxx",
passwd='xxxx',
db="xxxx")
cursor=db.cursor()
sql = "SELECT * FROM xx"
cursor.execute(sql)
results = cursor.fetchall()
print ( results)
数据导出为csv文件
outputpath = 'df.csv'
df.to_csv(outputpath, sep = ',', encoding='utf-8' )
计算TGI
def calculate_group_tgi(df, covariate, outcome, groupvar=None):
if groupvar == None:
df['virtual_group'] = 1
groupvar = ['virtual_group']
res = pd.DataFrame()
for c in covariate:
grp = groupvar + [c]
size_total = df.groupby(groupvar).size().reset_index(name = 'size_total')
size_group = df.groupby(grp).size().reset_index(name = 'size_group')
查看pandas 版本 :
pandas.__version__
查看版本的另一种方式:
import pandas as pd
pd.show_versions()
获取 dataFrame 的信息
df.info()
head和tail:取出两端数据行
df.head(3)
df.tail(3)
unique和nunique:显示唯一值
df['Physics'].nunique()
df['Physics'].unique()
describe和info:数据描述
print(df.describe(percentiles=[.05, .25, .75, .95]))
print(df['Physics'].describe())