Stars
本系统是我的毕业设计项目,题目为“基于用户画像的电影推荐系统的设计与实现”。主要是以Django作为基础框架,采用MTV模式,数据库使用MongoDB、MySQL和Redis,以从豆瓣平台爬取的电影数据作为基础数据源,主要基于用户的基本信息和使用操作记录等行为信息来开发用户标签,并使用Hadoop、Spark大数据组件进行分析和处理的推荐系统。管理系统使用的是Django自带的管理系统,并使…
Data pipeline performing ETL to AWS Redshift using Spark, orchestrated with Apache Airflow
A reproducible workflow for DIA mass spectrometry data analysis using DIANN on Linux.尝试利用linux系统建立一套完整的,初步的DIANN的数据分析流程
Hadoop, HDFS, MapReduce, Hive, Pig, Java, Eclipse(Maven), Ubuntu(Linux commands)
Sentiment Analysis and Data Visualization
Analysis of Medicare data, using Python scripts that ran in Linux command line, to find a correlation between drugs prescribed to treat dementia and the income of the population
An on-line movie recommender using Spark, Python Flask, and the MovieLens dataset
Cross-platform real-time collaboration client optimized for business and organizations.
SQL data analysis & visualization projects using MySQL, PostgreSQL, SQLite, Tableau, Apache Spark and pySpark.
基于Spark的电影推荐系统,包含爬虫项目、web网站、后台管理系统以及spark推荐系统
Curated list of project-based tutorials