Raw Real World Data

This repository contains raw datasets collected from real-world sources that can be used for practicing data analysis, exploratory data analysis (EDA), and building data projects. The goal is to work with messy, imperfect, and realistic data, similar to what analysts encounter in real business environments.

Many tutorials and courses provide clean and well-structured datasets, but real-world data is rarely that simple. These datasets are intentionally kept raw or minimally processed so analysts can practice the full workflow: cleaning data, transforming it, exploring patterns, and generating insights.

Purpose

The objective of this repository is to:

Practice real-world data analysis workflows
Work with imperfect and unstructured datasets
Improve skills in SQL, Python (Pandas), and spreadsheets
Develop strong exploratory data analysis (EDA) habits
Generate insights that can support decision-making, case studies, and portfolio projects

Possible Analyses

These datasets can be used to explore questions such as:

What patterns or trends exist in the data?
What anomalies or outliers can be identified?
How can the data be cleaned and transformed?
What insights could influence decision-making?
What visualizations best communicate the findings?

Tools You Can Use

You can analyze these datasets using tools such as:

SQL
Python (Pandas, NumPy)
Jupyter Notebook
Excel or Google Sheets
Data visualization tools such as Tableau or Power BI

Who This Repository Is For

This repository may be useful for:

Data analysts practicing real-world datasets
Students learning data analysis and exploratory data analysis
Developers experimenting with data processing
Anyone interested in exploring and generating insights from raw data

Contribution

If you have interesting real-world datasets or improvements, feel free to contribute by submitting a pull request.

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.DS_Store		.DS_Store
README.md		README.md
akamai_jobs.csv		akamai_jobs.csv
bhphotovideo_camera_price_brands.csv		bhphotovideo_camera_price_brands.csv
bikemart_mountain_bike_2.csv		bikemart_mountain_bike_2.csv
bizquest_business_for_sale_small-dataset.csv		bizquest_business_for_sale_small-dataset.csv
cars_dot_com_cars_inventory_general.csv		cars_dot_com_cars_inventory_general.csv
cars_dot_com_medium_ra4_list.csv		cars_dot_com_medium_ra4_list.csv
cars_dot_com_rav4_2_small_dataset.csv		cars_dot_com_rav4_2_small_dataset.csv
cars_dot_com_rav4_small_set.csv		cars_dot_com_rav4_small_set.csv
citrus_heights_house_data.csv		citrus_heights_house_data.csv
cleaned_craigslist_cars.csv		cleaned_craigslist_cars.csv
cloudflare_jobs.csv		cloudflare_jobs.csv
costco_deals_1000.csv		costco_deals_1000.csv
costco_while_supply_last_deal.csv		costco_while_supply_last_deal.csv
craigslist_sfbay_remote_jobs_200.csv		craigslist_sfbay_remote_jobs_200.csv
eventbrite_events_in_sf.csv		eventbrite_events_in_sf.csv
gpu_amazon_price.csv		gpu_amazon_price.csv
hnm_mens_sale.csv		hnm_mens_sale.csv
homes_dot_com_citrus_heights_1.csv		homes_dot_com_citrus_heights_1.csv
homes_dot_com_folsom.csv		homes_dot_com_folsom.csv
homes_dot_com_pittbusg_ca.csv		homes_dot_com_pittbusg_ca.csv
homes_dot_com_rancho_cordova.csv		homes_dot_com_rancho_cordova.csv
homes_dot_come_discovery_bay.csv		homes_dot_come_discovery_bay.csv
homes_dot_come_walnut_creek.csv		homes_dot_come_walnut_creek.csv
indeed_data_analyst_remote.csv		indeed_data_analyst_remote.csv
indeed_data_analyst_remote_job_150.csv		indeed_data_analyst_remote_job_150.csv
indeed_web_scraping_data.csv		indeed_web_scraping_data.csv
lexus_rx_350_cars_dot_com.csv		lexus_rx_350_cars_dot_com.csv
manifold_prediction_market_dataset_1000_records.csv		manifold_prediction_market_dataset_1000_records.csv
nike_mens_dataset.csv		nike_mens_dataset.csv
polymarket_small_dataset_finance_category.csv		polymarket_small_dataset_finance_category.csv
priceline_rental_vechile_small_dataset.csv		priceline_rental_vechile_small_dataset.csv
producthunt_feburary.csv		producthunt_feburary.csv
ram_price_amazon_dataset.csv		ram_price_amazon_dataset.csv
rancho_cordova_homes.csv		rancho_cordova_homes.csv
realtor_info_sf_1000.csv		realtor_info_sf_1000.csv
scramento_car_dealership_info.csv		scramento_car_dealership_info.csv
simplyhired_remote_2_190_rows.csv		simplyhired_remote_2_190_rows.csv
simplyhired_remote_jobs_small_158_dataset.csv		simplyhired_remote_jobs_small_158_dataset.csv
target_sale_item_price.csv		target_sale_item_price.csv
thenorthface_sale.csv		thenorthface_sale.csv
traderjoes_list_of_all_foods_1300_records.csv		traderjoes_list_of_all_foods_1300_records.csv
united_deals_tickets_from_san_francisco.csv		united_deals_tickets_from_san_francisco.csv
updated_data_jobs_ziprecruiter.csv		updated_data_jobs_ziprecruiter.csv
used_cars_craiglist.csv		used_cars_craiglist.csv
used_mountainbike_small_dataset.csv		used_mountainbike_small_dataset.csv
wellfound_data_related_jobs_startups_1039_records.csv		wellfound_data_related_jobs_startups_1039_records.csv
wellfound_startup_jobs_latest_update_3_18.csv		wellfound_startup_jobs_latest_update_3_18.csv
wine_price_usa_2026_march.csv		wine_price_usa_2026_march.csv
ycombinator_list_of_startup_2026_2025_2024_3_years_1000_records.csv		ycombinator_list_of_startup_2026_2025_2024_3_years_1000_records.csv
zara_for_men_dataset.csv		zara_for_men_dataset.csv
zara_special_price.csv		zara_special_price.csv
ziprecruiter_remote_job_data.csv		ziprecruiter_remote_job_data.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Raw Real World Data

Purpose

Possible Analyses

Tools You Can Use

Who This Repository Is For

Contribution

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

Raw Real World Data

Purpose

Possible Analyses

Tools You Can Use

Who This Repository Is For

Contribution

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages