CWYAlpha

Just another WordPress.com site

Thought this was cool: 做了个电影推荐器(用movielens的dataset)

leave a comment »


今天用了半天的时间做了个很土鳖的电影推荐器,用的数据是movielens的100k的数据包。

地址是http://movielens.sinaapp.com

一、出发点

最近开始学习使用脚本语言,用过一段时间python。但想做个简单的推荐系统方面的web应用,我的空间和SAE空间目前都只支持PHP,再加上PHP上手比较简单,语法和C++风格很像,所以就选择用php。包括之前做的那个博客相关文章的推荐器以及今天做的这个电影推荐器,都是为了巩固下最近所学的php以及前段时间学的推荐算法。

二、简单的功能

这个电影推荐器是用c++离线对数据集做了相似度计算以及topN的计算,然后把计算结果存入线上的数据库。

大家可以输入数据集中的用户id,可以得到两部分的结果:

(1)和这个用户品位相似的三个用户。

(2)推荐给这个用户的三部电影。

由于数据集中信息量有限,没有做用户的信息展示,只做了一个简单的电影的信息展示。

用的图片是微博上的头像和豆瓣电影的电影海报。

三、算法

这个推荐器的算法用了user-based cf。

在计算相似度的时候采用了三种方法:(1)余弦方法(2)皮尔逊相关法(3)修正余弦法

在计算推荐结果的过程中,得到了用户的相似度矩阵,作为一个结果输出,可以帮助用户发现口味相似的好友。

四、待改进的地方

这个推荐器就是一个练习php的产物,最近刚刚用php不久,所以整个用起来功能十分简单,UI也很烂。

这个是用现有的数据集,所以推荐的实际意义不大。以后有机会的话,我想做个真正的web应用,带一个完整的推荐系统,包括反馈功能在内。

from 阿俊的博客: http://somemory.com/myblog/?post=39

Written by cwyalpha

五月 22, 2012 在 3:09 上午

发表在 Uncategorized

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s

%d 博主赞过: