如何通过 SQL 查询找出每篇文章被哪些用户看过,这些用户还看了哪些其他文章,并统计浏览次数最多的文章?

如何通过 SQL 查询找出每篇文章被哪些用户看过,这些用户还看了哪些其他文章,并统计浏览次数最多的文章?

一个 sql 请教

问题:

想通过 sql 查询计算每篇文章被哪些用户看过,这些用户还看了哪些其他文章,并统计浏览次数最多的文章。

步骤:

第一步:已有一张表记录每个用户浏览过的文章(带 id)。

第二步:需要计算每篇文章被哪些用户看过(用户集合)。

第三步:找出这些用户集合中每个用户又浏览了哪些其他文章(使用相同初始表)。

第四步:对这些文章进行统计,计算出现次数最多(关联度最高)的文章。

答案:

方案 1:异步任务统计

对于数据量较大的情况,建议使用异步任务定期统计数据,避免对数据库造成负担。

方案 2:sql 实现

如果非要使用 sql 实现,可以参考以下代码:

-- 页面访问日志表 CREATE TABLE `read_log` ( `content_id` int, `uid` int )  -- 每个页面的访问用户访问过的页面在这些用户下的访问次数统计 select l.content_id as l_content_id, -- 每个需要统计的页面ID, -- l.uid_list as '访问过 每个需要统计的页面ID 的用户组', t.content_id as t_content_id, -- 访问过 每个需要统计的页面ID 的用户组 仿问过的需要统计pv的页面ID count(t.uid) as pv from read_log t join ( select content_id, group_concat(distinct uid, '') as uid_list from read_log group by content_id ) l on find_in_set(t.uid, l.uid_list) group by l.content_id, t.content_id order by l.content_id, pv desc;
登录后复制

注意:

如果需要只取前 n 条数据,需要对结果集进行进一步筛选。

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容