计算每周交易频率

65 阅读1分钟

清洗数据并且计算每周交易频率,对交易频率排序 `import pandas as pd

读取CSV文件

df = pd.read_csv('dep_transaction_fx_20240226.csv')

删除完全重复的行(即所有列都相同的行)

df_unique = df.drop_duplicates() df = df_unique

确保所有日期都是datetime类型

df['TRAN_DT'] = pd.to_datetime(df['TRAN_DT'])

设置截止日期和交易日期的格式

df['AS_OF_DT'] = pd.to_datetime(df['AS_OF_DT']) df['TRAN_DT'] = pd.to_datetime(df['TRAN_DT'])

创建一个新的列来表示每周的开始日期

df['week_start'] = df['TRAN_DT'].dt.to_period('W')

按CUST_ID和week_start分组,计算每周的交易频率

weekly_transactions = df.groupby(['CUST_ID', 'week_start'])['TRAN_ID'].count().reset_index(name='frequency')

计算每个客户的年平均交易频率

average_frequency = weekly_transactions.groupby('CUST_ID')['frequency'].mean().reset_index()

对客户按照平均交易频率从大到小排序

average_frequency_sorted = average_frequency.sort_values('frequency', ascending=False)

输出排序结果

print(average_frequency_sorted)`

画图初步看一下频率这回事

对交易数据聚类分析

做货币对分析看下啥情况