java实现基于物品的协同过滤算法

1,042 阅读2分钟

前言

最近学校的课题就是一个基于物品的协同过滤算法,自己亲手实现了一把,github中自带数据库和各种包,导出即可运行,另有一篇本人当时的课题报告,写的会比本篇详细的多,所以在这里简述一下,感兴趣的朋友直接去github下载一下即可。觉得有帮助的话记得给颗星星哦~

GitHub : github.com/a1097304791… (里面有详细的项目报告哦~ 第三章为算法分析内容)

本人写的是一个论文管理系统,可以理解为文章管理系统,针对用户的不同兴趣动态地为其推荐文章。

简述

“中工知网”论文管理系统的核心在于推荐系统,这也是本系统相比于其他论文管理系统的亮点所在。“中工知网”论文管理系统采用了目前最主流的推荐算法——基于物品的协同过滤算法。

推荐算法的Class

package util;

import dao.LikeDao;
import dao.PaperDao;
import dao.UserDao;
import entity.Like;
import entity.Paper;
import entity.User;
import java.util.*;

public class ItemSimilarity {
    public static void main(String[] args) {
        //测试小Demo
        System.out.println("请输入用户希望推荐的用户id : ");
        Scanner input = new Scanner(System.in);
        int uid = input.nextInt();
        ArrayList<Paper> v = recommend(uid);

        System.out.println("正在生成针对用户id为"+uid+"的推荐...");
        for(int i = 0; i < v.size(); i++)
            System.out.println("第"+(i+1)+"个推荐: 题目:"+v.get(i).getTitle()+"");
    }

    //通过计算余弦相似度并取TopN, 返回为uid的用户生成的5个推荐文章
    public static ArrayList<Paper> recommend(int uid){
        UserDao userdao = new UserDao();
        PaperDao paperdao = new PaperDao();
        LikeDao likedao = new LikeDao();

        ArrayList<Like> likeLists;                                       //其他用户喜欢的论文列表

        ArrayList<User> users = userdao.getAllUsers();                   //所有用户列表
        ArrayList<Paper> papers = paperdao.getAllPapers();               //所有论文列表
        int[][] curMatrix = new int[papers.size()+5][papers.size()+5];   //当前矩阵
        int[][] comMatrix = new int[papers.size()+5][papers.size()+5];   //共现矩阵
        int[] N = new int[papers.size()+5];                              //喜欢每个物品的人数

        for(User user: users){
            if(user.getUid()==uid) continue;                    //当前用户则跳过

            likeLists = likedao.findLikesByUser(user.getUid()); //当前用户的喜欢列表

            for(int i = 0; i < papers.size(); i++)
                for(int j = 0; j < papers.size(); j++)
                    curMatrix[i][j] = 0;                               //清空矩阵

            for(int i = 0; i < likeLists.size(); i++){
                int pid1 = likeLists.get(i).getPid();
                ++N[pid1];
                for(int j = i+1; j < likeLists.size(); j++){
                    int pid2 = likeLists.get(j).getPid();
                    ++curMatrix[pid1][pid2];
                    ++curMatrix[pid2][pid1]; //两两加一
                }
            }
            //累加所有矩阵, 得到共现矩阵
            for(int i = 0; i < papers.size(); i++){
                for(int j = 0; j < papers.size(); j++){
                    int pid1 = papers.get(i).getPid(), pid2 = papers.get(j).getPid();
                    comMatrix[pid1][pid2] += curMatrix[pid1][pid2];
                    comMatrix[pid1][pid2] += curMatrix[pid1][pid2];
                }
            }
        }


        TreeSet<Paper> preList = new TreeSet<Paper>(new Comparator<Paper>() {
            @Override
            public int compare(Paper o1, Paper o2) {
                if(o1.getW()!=o2.getW())
                    return (int) (o1.getW()-o2.getW())*100;
                else
                    return o1.getCnt()-o2.getCnt();
            }
        }); //预处理的列表

        likeLists = likedao.findLikesByUser(uid);       //当前用户喜欢的论文列表
        boolean[] used = new boolean[papers.size()+5];  //判重数组
        for(Like like: likeLists){
            int Nij = 0;                         //既喜欢i又喜欢j的人数
            double Wij;                          //相似度
            Paper tmp;                           //当前的论文

            int i = like.getPid();
            for(Paper paper: papers){
                if(like.getPid() == paper.getPid()) continue;
                int j = paper.getPid();

                Nij = comMatrix[i][j];
                Wij = (double)Nij/Math.sqrt(N[i]*N[j]); //计算余弦相似度

                tmp = paperdao.findPaperById(paper.getPid());
                tmp.setW(Wij);

                if(used[tmp.getPid()]) continue;
                preList.add(tmp);
                used[tmp.getPid()] = true;
            }
        }

        ArrayList<Paper> recomLists = new ArrayList<>();      //生成的推荐结果
        for(int i = 0; preList.size()>0 && i<5; i++){
            recomLists.add(preList.pollLast());
            preList.pollLast();
        }
        if(recomLists.size()<5){
            //推荐数量不满5个, 补足喜欢数最高的文章
            recomLists = paperdao.findTopNPapers(recomLists);
        }

        return recomLists;
    }
}



以下为内容摘要(Word没法直接复制 T_T) 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述

在这里插入图片描述