清洗数据并且计算每周交易频率,对交易频率排序 `import pandas as pd
读取CSV文件
df = pd.read_csv('dep_transaction_fx_20240226.csv')
删除完全重复的行(即所有列都相同的行)
df_unique = df.drop_duplicates() df = df_unique
确保所有日期都是datetime类型
df['TRAN_DT'] = pd.to_datetime(df['TRAN_DT'])
设置截止日期和交易日期的格式
df['AS_OF_DT'] = pd.to_datetime(df['AS_OF_DT']) df['TRAN_DT'] = pd.to_datetime(df['TRAN_DT'])
创建一个新的列来表示每周的开始日期
df['week_start'] = df['TRAN_DT'].dt.to_period('W')
按CUST_ID和week_start分组,计算每周的交易频率
weekly_transactions = df.groupby(['CUST_ID', 'week_start'])['TRAN_ID'].count().reset_index(name='frequency')
计算每个客户的年平均交易频率
average_frequency = weekly_transactions.groupby('CUST_ID')['frequency'].mean().reset_index()
对客户按照平均交易频率从大到小排序
average_frequency_sorted = average_frequency.sort_values('frequency', ascending=False)
输出排序结果
print(average_frequency_sorted)`
画图初步看一下频率这回事
对交易数据聚类分析
做货币对分析看下啥情况